petav » Ср мар 04, 2015 3:36 pm
			
			
			Лог идет на центральный syslog сервер. Там анализируется на отклонения, к примеру
Код: Выделить всё
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (90 C) hit the 'fanboost' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] fan management: automatic
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (95 C) hit the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (92 C) went below the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (87 C) went below the 'fanboost' threshold
и сигнализируется. Так же syslog отправляется в реальном времени, вероятность зацепить "нужное" сообщение для диагностических целей выше.
Многие считают, что можеть быть  и не надо все знать,  сломался терминал, поставил другой, но мое видение этой проблемы, что надо заранее узнавать какие отклонения наблюдаются и принимать привинтивные меры. Хранить можно пару дней, к тому же только KERNEL или прочие regexp.
Сюда же мониторинг SNMP, для этих же целей. 
Соглашусь, что это для больших инсталяций в существующую инфраструктуру. Для маленких кликабельного конфигуратора wtware наверное выше крыши.
 
			
			
							Лог идет на центральный syslog сервер. Там анализируется на отклонения, к примеру
[code]
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (90 C) hit the 'fanboost' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] fan management: automatic
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (95 C) hit the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (92 C) went below the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (87 C) went below the 'fanboost' threshold
[/code]
и сигнализируется. Так же syslog отправляется в реальном времени, вероятность зацепить "нужное" сообщение для диагностических целей выше.
Многие считают, что можеть быть  и не надо все знать,  сломался терминал, поставил другой, но мое видение этой проблемы, что надо заранее узнавать какие отклонения наблюдаются и принимать привинтивные меры. Хранить можно пару дней, к тому же только KERNEL или прочие regexp.
Сюда же мониторинг SNMP, для этих же целей. 
Соглашусь, что это для больших инсталяций в существующую инфраструктуру. Для маленких кликабельного конфигуратора wtware наверное выше крыши.