Мы — долго запрягаем, быстро ездим, и сильно тормозим.

FreeBSD
  настройка
  подсчёт трафика
  программы
  почтовые системы
  Шелезяки
  UPS APC-1500
  NetMos NM9845
  cisco & syslog
  LAN card`s test
  HDD & UDMA100
  S.M.A.R.T.
  D-Link DE-200TP
  Marvell 88E8053
  D-Link DGE530T
  КПК + FreeBSD
  D-Link DWL-G520
  SkyLink-CDMA
  Atheros AR5007EG
  BlueTooth mouse
  Asus Eee PC
  atacontrol
  SkyStar-2+SlonAx
  TT budget S-1401
  SiS*Mirage*1 на D201GLY2
  NetXtreme BCM5722
  snd_hda
  Peoplenet + C-motech (3G)
  freebsd + huawei 162 gsm modem
  tw_cli
  pc_speaker
  Canon/gphotofs
  Охранная система на FreeBSD+LPT
  Даешь 220 в LPT
  Мелочи
  Файловая система
  WWW
  Security
  system
  Games Servers
  X11
  Programming
Очумелые Ручки
OpenBSD
Cisco


www.lissyara.su —> статьи —> FreeBSD —> Шелезяки —> S.M.A.R.T.

Мониторинг состояния жёсткого диска при помощи smartmontools

Автор: lissyara.


    Когда я думал, что посыпался диск, и смотрел вывод инфы по диску от atacontrol то в этом самом выводе заметил, что для диска отключен S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology). Странно, ибо я его обычно включаю. Заодно и задумался о мониторинге и предупреждении таких вещей. Естественно, для дисков, на эту роль годился тока S.M.A.R.T. Поиск в портах подсказал утилиту - smartmontools, за отсутствием альтернатив, её и будем юзать :)
/usr/home/lissyara/>cd /usr/ports/sysutils/
/usr/ports/sysutils/>make search name='smart'
Port: smartmontools-5.36
Path: /usr/ports/sysutils/smartmontools
Info: S.M.A.R.T. disk monitoring tools
Maint: martines@rochester.rr.com
B-deps: gettext-0.14.5_2 gmake-3.80_2 libiconv-1.9.2_2
R-deps:
WWW: http://smartmontools.sourceforge.net
/usr/ports/sysutils/>
/usr/ports/sysutils/>cd /usr/ports/sysutils/smartmontools
/usr/ports/sysutils/smartmontools/>make && make install && make clean
................................................
................................................
smartmontools has been installed
To check the status of drives, use the following:
 /usr/local/sbin/smartctl -a /dev/ad0 for first ATA drive
 /usr/local/sbin/smartctl -a /dev/da0 for first SCSI drive
To enable monitor of drives, you can use /usr/local/sbin/smartd
A sample configuration file has been installed as
/usr/local/etc/smartd.conf.sample
Copy this file to /usr/local/etc/smartd.conf and edit appropriately
To have smartd start at boot
 echo 'smartd_enable="YES"' >> /etc/rc.conf
===> Installing rc.d startup script(s)
................................................

Для начала проверил, а включен и поддерживается ли у меня S.M.A.R.T.:
/usr/home/lissyara/>atacontrol cap ad0
Protocol ATA/ATAPI revision 7
device model Maxtor 2F020L0
serial number F1B8KTWE
firmware revision VAM51JJ0
cylinders 16383
heads 16
sectors/track 63
lba supported 40718160 sectors
lba48 not supported
dma supported
overlap not supported
Feature Support Enable Value Vendor
write cache yes yes
read ahead yes yes
Tagged Command Queuing (TCQ) no no 0/0x00
SMART yes yes
microcode download yes yes
security yes no
power management yes yes
advanced power management yes no 0/0x00
automatic acoustic management yes yes 192/0xC0 192/0xC0
/usr/home/lissyara/>

На домашней машине всё включено и работает. Пробуем команду, что инсталлятор предлагает в конце инсталляции:
//>/usr/local/sbin/smartctl -a /dev/ad0
smartctl version 5.36 [i386-portbld-freebsd6.1] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Maxtor Fireball 3 family
Device Model: Maxtor 2F020L0
Serial Number: F1B8KTWE
Firmware Version: VAM51JJ0
User Capacity: 20 847 697 920 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Sat May 13 20:53:46 2006 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
 was completed without error.
 Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
 without error or no self-test has ever
 been run.
Total time to complete Offline
data collection: (1261) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
 Auto Offline data collection on/off support.
 Suspend Offline collection upon new
 command.
 Offline surface scan supported.
 Self-test supported.
 No Conveyance Self-test supported.
 Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
 power-saving mode.
 Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
 No General Purpose Logging support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 21) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED RAW_VALUE
 3 Spin_Up_Time 0x0027 234 234 063 Pre-fail Always 4665
 4 Start_Stop_Count 0x0032 253 253 000 Old_age Always 760
 5 Reallocated_Sector_Ct 0x0033 253 253 063 Pre-fail Always 0
 6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail Offline 0
 7 Seek_Error_Rate 0x000a 253 252 000 Old_age Always 0
 8 Seek_Time_Performance 0x0027 252 245 187 Pre-fail Always 45773
 9 Power_On_Minutes 0x0032 222 222 000 Old_age Always 22h+55m
 10 Spin_Retry_Count 0x002b 253 252 157 Pre-fail Always 0
 11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail Always 0
 12 Power_Cycle_Count 0x0032 252 252 000 Old_age Always 632
192 Power-Off_Retract_Count 0x0032 253 253 000 Old_age Always 264
193 Load_Cycle_Count 0x0032 253 253 000 Old_age Always 2556
194 Temperature_Celsius 0x0032 253 253 000 Old_age Always 43
195 Hardware_ECC_Recovered 0x000a 253 252 000 Old_age Always 25884
196 Reallocated_Event_Count 0x0008 253 253 000 Old_age Offline 0
197 Current_Pending_Sector 0x0008 253 253 000 Old_age Offline 0
198 Offline_Uncorrectable 0x0008 253 253 000 Old_age Offline 0
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age Offline 0
200 Multi_Zone_Error_Rate 0x000a 253 253 000 Old_age Always 0
201 Soft_Read_Error_Rate 0x000a 253 253 000 Old_age Always 0
202 TA_Increase_Count 0x000a 253 253 000 Old_age Always 0
203 Run_Out_Cancel 0x000b 253 253 180 Pre-fail Always 0
204 Shock_Count_Write_Opern 0x000a 253 253 000 Old_age Always 0
205 Shock_Rate_Write_Opern 0x000a 253 253 000 Old_age Always 0
207 Spin_High_Current 0x002a 253 252 000 Old_age Always 0
208 Spin_Buzz 0x002a 253 252 000 Old_age Always 0
209 Offline_Seek_Performnce 0x0024 181 180 000 Old_age Offline 0
 99 Unknown_Attribute 0x0004 253 253 000 Old_age Offline 0
100 Unknown_Attribute 0x0004 253 253 000 Old_age Offline 0
101 Unknown_Attribute 0x0004 253 253 000 Old_age Offline 0
SMART Error Log Version: 1
ATA Error Count: 1
 CR = Command Register [HEX]
 FR = Features Register [HEX]
 SC = Sector Count Register [HEX]
 SN = Sector Number Register [HEX]
 CL = Cylinder Low Register [HEX]
 CH = Cylinder High Register [HEX]
 DH = Device/Head Register [HEX]
 DC = Device Command Register [HEX]
 ER = Error register [HEX]
 ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 1 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was in an unknown state.
 After command completion occurred, registers were:
 ER ST SC SN CL CH DH
 -- -- -- -- -- -- --
 04 51 50 40 97 03 00 Error: ABRT
 Commands leading to the command that caused the error were:
 CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
 -- -- -- -- -- -- -- -- ---------------- --------------------
 ef fe 00 00 00 00 00 00 00:02:17.120 SET FEATURES [Reserved for CFA]
 ec 00 01 01 00 00 00 00 00:02:17.072 IDENTIFY DEVICE
 c3 e4 00 00 00 00 00 00 00:02:17.056 [VENDOR SPECIFIC]
 ef 42 c0 00 00 00 00 00 00:02:17.040 SET FEATURES [Enable AAM]
 c3 3d 00 00 00 00 00 00 00:02:16.992 [VENDOR SPECIFIC]
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
 1 0 0 Not_testing
 2 0 0 Not_testing
 3 0 0 Not_testing
 4 0 0 Not_testing
 5 0 0 Not_testing
Selective self-test flags (0x0):
 After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
//>

Пашет :) Море инфы, большей частью непонятной... Ладно, топаем рихтовать конфиг, но для начала надо его скопировать из примера:
/usr/local/etc/>ll | grep smart
-r--r--r-- 1 root wheel 4890 13 май 20:37 smartd.conf.sample
/usr/local/etc/>cp smartd.conf.sample smartd.conf
/usr/local/etc/>ll | grep smart
-r--r--r-- 1 root wheel 4890 13 май 20:54 smartd.conf
-r--r--r-- 1 root wheel 4890 13 май 20:37 smartd.conf.sample
/usr/local/etc/>

После чего приводим его примерно к такому виду:
# файл конфигурации smartd. Содержит девайсы, по одному на строку.
# За подробностями в `man smartd.conf`
# Опция DEVICESCAN заставляет `забить` на все устройства,
# что будут явно перечислены далее, и при запуске просканировать
# ATA и SCSI девайсы. Для найденных устройств будут применены
# нижеперечисленные директивы. Для большинства пользователей
# рекомендуется закоментировать эту линию и явно перечислить
# устройства нуждающиеся в мониторинге.
#DEVICESCAN
# Пример для чётко указанного диска. Мониторятся все параметры,
# включен автоматический онлайн-сборщик данных(?), всё намониторенное
# сохраняется. Короткий тест гоняется каждый день с двух до трёх
# ночи, длинный по субботам, с трёх до четырёх.
#/dev/ad0 -a -o on -S on -s (S/../.././02|L/../../6/03)
# Мониторить статус SMART, логи ошибок ATA, лог самопроверки, и
# отслеживать изменения во всех атрибутах кроме 194 (температура)
#/dev/ad0 -H -l error -l selftest -t -I 194
# Тихий тест. Рапортует на мыло лишь в случае, если S.M.A.R.T. выдаёт
# ошибку, и (в случае ошибки) шлёт на мыло отчёт.
#/dev/ad0 -H -m admin@lissyara.su
# Для моих дисков:
/dev/ad0 -a -m admin@lissyara.su -o on -S on -s (S/../.././22|L/../../6/23)
/dev/ad4 -a -m admin@lissyara.su -o on -S on -s (S/../.././22|L/../../6/23)
# Директивы этого конфига. За подробностями - в `man smartd.conf`
#
# -d TYPE Тип устройства: ata, scsi, marvell, removable, 3ware,N
# -T TYPE допустимое отклонение: normal, permissive
# -o VAL разрешены/запрещены автономные тесты (on/off)
# -S VAL разрешено/запрешено автосохранение аттрибутов (on/off)
# -n MODE Не проверять. Один из режимов: never, sleep, standby, idle
# -H Мониторить SMART статус. Уведомлять тока при ошибках.
# -l TYPE Мониторить логи SMART. Режимы: error, selftest
# -f Монитор отказа для любых атрибутов 'Usage'
# -m ADD Слать мыло с варнингами для -H, -l error, -l selftest, и -f
# -M TYPE Изменение поведения отсыла е-майлов (смотрите ман)
# -s REGE Запустить тест когда дата совпадает с регулярным выражением
# -p Сообщать о изменениях в 'Prefailure' атрибутах
# -u Сообщать о изменениях в 'Usage' атрибутах
# -t Эквивалентно -p и -u директивам
# -r ID Также сообщать 'RAW' значения атрибутов ID с -p, -u или -t
# -R ID Следить за изменениями в атрибуте ID 'Raw' значения -p, -u or -t
# -i ID Игнорировать атрибут ID для -f директивы
# -I ID Игнорировать атрибут ID для -p, -u или -t директивы
# -C ID Рапортовать если счётчик `ждущих` секторов не равен нулю
# -U ID Рапортовать если счётчик `некорректируемых` секторов не равен нулю
# -v N,ST Mодифицировать метку для атрибута N (для нестандартных атрибутов)
# -a Дефолт: эквивалентно -H -f -t -l error -l selftest -C 197 -U 198
# -F TYPE Для ошибок в прошивке. Значения: none, samsung
# -P TYPE Предустановки для диска: use, ignore, show, showall

Дальше рихтуем /etc/syslog.conf, вносим такие строки:
# S.M.A.R.T.
local2.* /var/log/smartd.log

После чего пробуем запустить, предварительно создав файл для логов, велев перечитать syslogd свой конфиг, и внеся соответствующие строки в /etc/rc.conf:
/usr/local/etc/>echo 'smartd_enable="YES"' >> /etc/rc.conf
/usr/local/etc/>echo 'smartd_flags="-l local2 --interval=300"' >> /etc/rc.conf
/usr/local/etc/>touch /var/log/smartd.log
/usr/local/etc/>killall -1 syslogd
/usr/local/etc/>mv rc.d/smartd rc.d/smartd.sh
/usr/local/etc/>/usr/local/etc/rc.d/smartd start
Starting smartd.
/usr/local/etc/>
/usr/local/etc/>ps -ax | grep smart
26640 ?? I 0:00,01 /usr/local/sbin/smartd -p /var/run/smartd.pid -c /usr
30693 p0 L+ 0:00,02 grep smart
/usr/local/etc/>

Переименовывать стартовый скрипт приходится по причине, что у меня он отказался запускаться на всех машинах... Конечно, новые веяния это хорошо - но что-то оно не всегда срабатывает :) При запуске руками - всё нормально, а при перезагрузке - не подымается :( Интервал 300 - это частота опроса в секундах. По дефолту - раз в полчаса... Редко... Короче, в логе имеем примерно такое:
/usr/local/etc/>cat /var/log/smartd.log
May 14 12:33:44 lissyara smartd[17779]: smartd version 5.36 [i386-portbld-freebsd6.1] Copyright (C) 2002-6 Bruce Allen
May 14 12:33:44 lissyara smartd[17779]: Home page is http://smartmontools.sourceforge.net/
May 14 12:33:44 lissyara smartd[17779]: Opened configuration file /usr/local/etc/smartd.conf
May 14 12:33:44 lissyara smartd[17779]: Configuration file /usr/local/etc/smartd.conf parsed.
May 14 12:33:44 lissyara smartd[17779]: Device: /dev/ad0, opened
May 14 12:33:44 lissyara smartd[17779]: Device: /dev/ad0, found in smartd database.
May 14 12:33:44 lissyara smartd[17779]: Device: /dev/ad0, enabled SMART Attribute Autosave.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad0, enabled SMART Automatic Offline Testing.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad0, is SMART capable. Adding to "monitor" list.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad0, opened
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad0, found in smartd database.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad0, is SMART capable. Adding to "monitor" list.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, opened
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, not found in smartd database.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, enabled SMART Attribute Autosave.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, enabled SMART Automatic Offline Testing.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, is SMART capable. Adding to "monitor" list.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, opened
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, not found in smartd database.
May 14 12:33:45 lissyara smartd[17779]: Device: /dev/ad4, is SMART capable. Adding to "monitor" list.
May 14 12:33:45 lissyara smartd[17779]: Monitoring 4 ATA and 0 SCSI devices
May 14 12:33:46 lissyara smartd[17781]: smartd has fork()ed into background mode. New PID=17781.
May 14 12:33:46 lissyara smartd[17781]: file /var/run/smartd.pid written containing PID 17781

Всё нормально. Выжидаем и смотрим что получилось:
May 14 19:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 34
May 14 20:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 35
May 14 22:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 34
May 14 22:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 35
May 14 23:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 14 23:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 34
May 14 23:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 14 23:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 66 to 67
May 14 23:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 35
May 14 23:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 66 to 67
May 15 00:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 68
May 15 00:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 68
May 15 00:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 68 to 67
May 15 00:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 34
May 15 00:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 68 to 67
May 15 01:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 15 01:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 35
May 15 01:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 15 03:14:43 lissyara smartd[93605]: Device: /dev/ad0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 64 to 63
May 15 03:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 66 to 67
May 15 03:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 34
May 15 03:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 66 to 67
May 15 03:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 15 03:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 34 to 35
May 15 03:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 15 04:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 66 to 67
May 15 04:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 66 to 67
May 15 05:14:43 lissyara smartd[93605]: Device: /dev/ad0, starting scheduled Short Self-Test.
May 15 05:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 15 05:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 15 05:14:44 lissyara smartd[93605]: Device: /dev/ad4, starting scheduled Short Self-Test.
May 15 05:44:43 lissyara smartd[93605]: Device: /dev/ad0, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 63 to 64
May 15 06:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 66 to 67
May 15 06:14:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 66 to 67
May 15 06:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 15 06:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 15 07:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 66 to 67
May 15 07:44:44 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 66 to 67
May 15 08:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 67 to 66
May 15 08:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 35 to 31
May 15 08:44:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 67 to 66
May 15 09:14:43 lissyara smartd[93605]: Device: /dev/ad4, SMART Usage Attribute: 194 Temperature_Celsius changed from 31 to 34

Мда... поведение ad4 мне совсем не нравится... Конечно, на этой машине ничего особо ценного на нём не хранится, но всё-таки...
Остаётся ждать писем :) (Письма будут тока в случае ошибок)

P.S. Под 4.11 не завелось... Ругается:
/usr/local/etc/rc.d/>/usr/local/sbin/smartd -d -c /usr/local/etc/smartd.conf
smartd version 5.36 [i386-portbld-freebsd4.11] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

Opened configuration file /usr/local/etc/smartd.conf
Configuration file /usr/local/etc/smartd.conf parsed.
Device: /dev/ad0, opened
ATA support is not provided for this kernel version. Please ugrade to a recent 5-CURRENT kernel (post 09/01/2003 or so)
Device: /dev/ad0, not ATA, no IDENTIFY DEVICE Structure
Unable to register ATA device /dev/ad0 at line 27 of file /usr/local/etc/smartd.conf
Unable to register device /dev/ad0 (no Directive -d removable). Exiting.
/usr/local/etc/rc.d/>

Придётся поискать что-то другое :(



Ссылка на обсуждение: http://forum.lissyara.su/viewtopic.php?f=8&t=716.

размещено: 2006-05-15,
последнее обновление: 2006-08-11,
автор: lissyara

оценить статью:

lisergey, 2007-11-24 в 23:27:22

настроил себе такую тему, теперь на душе спокойнее.

чтобы понимать смысл параметров, рекомендую описалово
http://ru.wikipedia.org/wiki/S.M.A.R.T.
и на анг (более полное)
http://en.wikipedia.org/wiki/Self-Monitoring%2C_Analysis%2C_and_Reporting_Technology

Bell_ringer, 2008-04-24 в 23:34:50

Говорят, что ребята из Гогля перелапатили сотни серверов и пришли к выводу что S.M.A.R.T. в большинстве случаев молчит накануне смерти HDD

Алекс, 2009-02-03 в 15:58:14

А статус массивов, которые созданы gmirror можно мониторить?  А то у меня ошибки при попытке указать /dev/mirror/gm0

Raven2000, 2009-02-25 в 14:49:42

Лех обновить пора ;)
Хотя бы касательно логов.

# cat /etc/rc.conf  | grep smart
smartd_enable="YES"
smartd_flags="--interval=300"

# cat /etc/syslog.conf |grep smart
!smartd
*.*   /var/log/smartd.log

gonzo111, 2010-08-12 в 12:30:09

еще забыл про

newsyslog.conf
/var/log/smartd.log  644    2    500     *       JC

gonzo111, 2010-09-03 в 10:43:05

хочу обратить внимание на параметр -n MODE
который по дефолту стоит в режиме  never

согласно ману,я так понимаю что периодический скан смарт атрибутов вызывает просыпание винта и вывод из режимов  OFF, SLEEP, and STANDBY что не лучшим образом скажется на его долговечности

потому возможно лучше поставить -n standby,10,q
разрешить пропустить 10 тестов если винт спит и не сообщать в логи дабы он не проснулся (если это винт системный)  

gonzo111, 2010-09-06 в 10:57:42

Мониторинг винт USB Trancend (внутри чип USB JMicron ,винт SAMSUNG HM251JX )

/dev/da0 -d sat -n idle,25 -a -m artem@k.dp.ua -o on -S on -s (S/../../1/5|L/../../4/23)
Глянуть смарт атрибуты и инфу
smartctl  -P use  -x /dev/da0  | more

BlackCat, 2010-09-12 в 7:24:57

Альтернативный способ мониторинга:
user@host$ grep smart /etc/periodic.conf
daily_status_smart_enable="YES"
daily_status_smart_devices="AUTO"

aprogrammer, 2014-04-01 в 11:57:20

Огромное спасибо за статью. Только мало написано об отправке писем, дебаге запуска демона. Можно чуток от сюда взять - http://sysadmin.te.ua/linux/smartd.html

sc, 2014-11-18 в 19:41:49

> P.S. Под 4.11 не завелось... Ругается:
При смене ядра smartmontools нужно перекомпилировать


Оставьте свой комментарий:
Ваше имя:   *
e-mail:  
жирный
наклонный
подчёркнутый
ссылка
цвет
Нынешний год:   *
 


Хостинг HOST-FOOD

2014-07-27, lissyara
gmirror

Удалённое создание софтверного зеркала средствами gmirror, на диске разбитом с использованием gpart. Использование меток дисков для монтирования разделов.
2013-08-20, zentarim
Scan+Print server FreeBSD 9

Настройка сервера печати и сервера сканирования под управлением операционной системы FreebSD 9 для МФУ Canon PIXMA MP540
2011-11-20, BlackCat
Разъём на WiFi-карту

Делаем съёмной несъёмную антену на WiFi-карте путём установки ВЧ-разъёма
2011-09-14, manefesto
Настройка git+gitosis

Настройка системы контроля версия исходного кода в связке git+gitosis+ssh
2011-08-14, zentarim
Wi-FI роутер + DHCP + DNS

Настройка Wi-Fi роутера на Freebsd 8 + DNS сервер + DHCP сервер: чтобы Wi-Fi клиенты были в одной подсети с проводными, проводные и беспроводные клиенты получали адреса автоматически по DHCP, кэширующ
2011-06-15, -ZG-
Охранная система на FreeBSD+LPT

В этой статье описана попытка реализации простой охранной системы на базе FreeBSD с подключением к ней охранных устройтсв на LPT порт и видеорегистрацией.
2011-03-13, terminus
ng_nat

Описание работы ng_nat, практическое использование, достоинства и недостатки в сравнении с ipfw nat
2011-02-20, Капитан
Nagios+Digitemp

Статья описывает создание системы оповещения о превышении температуры в специальных помещениях на основе Nagios с использованием программы Digitemp.
2011-02-17, Le1
Zyxel Configuration

Скрипт для массового изменения конфига свичей Zyxel. Берет из файла iplist список ip-шек, заходит последовательно на каждый и выполняет комманды из файла commands, записывая происходящее в лог файл.
2011-02-16, fox
hast carp zfs ucarp cluster

HAST (Highly Available Storage), CARP, UCARP, ZFS, Cluster настройка и одаптация плюс личные размышления…
2011-02-04, BlackCat
Восстановление ZFS

История о том, как был восстановлен развалившийся RAIDZ ZFS-пул (перешедший в FAULTED) с помощью скотча и подручных средств. Или о том, какие приключения ожидают тех, кто не делает резервных копий.
2011-02-03, Капитан
1-Wire

Статья описывает самостоятельное изготовление контроллера DS9097 для съёма показаний с датчиков температуры DS1820 с помощью программы Digitemp.
2011-01-28, Капитан
Температура в серверной

Статья описывает построение системы наблюдения за температурой в помещении серверной с использованием программы Digitemp и выводом графиков в MRTG
2011-01-21, m4rkell
Syslog server

Как то буквально на днях, у нас завалилось, что то в еве) или не в еве не суть. Суть в том, что когда захотели снять логи с хостов esx обнаружили, что хранят эти негодяи логии только за последнии сутк
2011-01-11, Fomalhaut
cvs, svn, portsnap

Обновление сорцов системы через CVS и SVN, портов - CVS и portsnap. Обновление через Proxy-сервер.
2011-01-07, lissyara
Canon/gphotofs

Монтирование цифровых фотоаппаратов Canon (PTP) как файловой системы, автоматизация этого процесса через события devd и внешние скрипты.
2010-12-13, Al
IPSec

Описание принципов работы IPSEC и способов аутентификации.
2010-12-07, manefesto
FreeBSD on flash

Было принято решении переехать на USB Flash и установить минимальный джентельменский набор для работы своего роутера. Делаем =)
2010-12-05, Fomalhaut
root ZFS, GPT

Инструкция по установке FreeBSD с использованием в качестве таблицы разделов GPT и в качестве основной файловой системы - ZFS
2010-09-05, Cancer
Настройка аудиоплеера на ximp3

Цели: Простенький аудиоплеер, для того что бы тетя продавец в магазине утром пришла нажала на кнопку Power и заиграла в зале музыка, так же был доступ по сети, общая шара куда можно заливать музыку, к
2010-08-31, Cancer
Установка и настройка OpenVPN

На днях появилась задача - объединить головной офис и 3 филиала в одну сеть через интернет посредством OpenVPN, чтобы люди могли подключаться через RDP к базам 1С на серверах.
2010-08-25, manefesto
freebsd lvm

Использование linux_lvm для работы с LVM разделами из-под FreeBSD. Проблемы которые возники при монтирование lvm раздела
2010-04-30, gonzo111
proftpd file auth&quota

Proftpd - квоты и авторизация из файлов, без использования базы данных и/или системных пользователей
2010-04-22, lissyara
tw_cli

Пошаговая инструкция по восстановлению RAID на контроллере 3ware, из которого выпал один диск. Настройка мониторинга состояния рейда и отчётов о его состоянии на email.
2010-04-14, fox
MySQL Master+Master

MySQL (Master Master) and (Master Slave) Как настроить репликацию…
2010-03-22, Mufanu
named 9.7.0

Система доменных имен (Domain Name Service, DNS) - одна из тех незаметных, закулисных программ, которым не уделяется и половины того внимания, которого они заслуживают.
2010-03-09, terminus
DNS zones

Краткий ликбез про управление DNS зонами. Примеры проведения делегирования прямых и обратных DNS зон.
2010-03-09, aspera
Squid+AD (group access)

Настройка прокси сервера SQUID с автроризацией пользователей в AD. Разделение пользователей на группы
2010-03-02, BlackCat
Шлюз: Часть 4

Настройка дополнительных сервисов: синхронизация времени (OpenNTPD), клиент DynDNS.org.
2010-03-01, BlackCat
Шлюз: Часть 3

Настройка DHCP и DNS серверов для работы внутри частной сети, c поддержкой внутренних (частных зон) DNS, а так же интеграция DHCP и DNS сервисов.
2010-03-01, BlackCat
Шлюз: Часть 2

Конфигурация МСЭ pf для проброса портов с изменением порта назначения и без, а так же поддержки активного режима FTP и ограничения максимального размера сегмента
2010-03-01, BlackCat
Шлюз: Часть 1

Быстрая настройка шлюза/маршрутизатора с установлением PPPoE-соединения, поддержкой NAT и DNS-forwarding.
2010-02-23, Morty
darkstat

Простая считалка траффика, со встроенным веб-сервером. Очень маленькая, может делать отчеты трафика по хостам, портам, протоколам, а также строить графики
2010-01-23, gonzo111
squid+sams+sqstat

Пилим squid и sams - примеры конфигов с объяснениями. Установка SqStat.
2009-12-19, schizoid
mpd5 + radius + ng_car + Abills

Настройка pppoe-сервера с биллинговой системой Abills и шейпером ng_car
2009-11-16, lissyara
UFS->ZFS

Удалённая миграция с UFS на ZFS. Загрузка с раздела zfs. Настройка для работы с малым количеством памяти под архитектурой i386.
2009-11-13, gx_ua
fusefs-ntfs

Установка, настройка и использование fusefs-ntfs, драйвер NTFS, предназанченного для монтирования NTFS разделов под FreeBSD
2009-11-12, Morty
LiveCD

Создание собственного LiveCD с необходимыми вам изменениями, автоматизирование данного процесса, а так же вариант скоростной сборки СД.
2009-09-27, lissyara
Samba как PDC

Контроллер домена - аналог M$ NT4 домена под самбой, без использования LDAP и прочей хиромантии. Просто и быстро =)
2009-08-30, terminus
ipfw nat

Подробное руководство по ipfw nat, сложные случаи конфигурации.
2009-08-24, levantuev
HotSpot

Установка Hotspot системы в общественное заведение.
2009-08-18, lissyara
diskless

Создание бездисковых терминалов под управлением FreeBSD - с загрузкой по сети. Используются для старта rdesktop и подключения к виндовому серверу терминалов.
2009-07-29, BAV_Lug
Видеонаблюдение

Настройка бюджетного варианта видеонаблюдения на удаленном объекте
2009-07-22, Cancer
OpenLDAP адресная книга

Настройка и создание адресной книги на базе OpenLDAP + phpLDAPadmin
2009-06-30, SergeySL
AimSniff

Руководство по созданию системы мониторинга ICQ-переписки на базе AimSniff, использующей базу данных MySQL для хранения и Web-интерфейс WAS (Web Aim Sniff) для просмотра перехваченных сообщений
подписка

    вверх      
Статистика сайта
Сейчас на сайте находится: 12 чел.
За последние 30 мин было: 73 человек
За сегодня было
12918 показов,
1680 уникальных IP
 

  Этот информационный блок появился по той простой причине, что многие считают нормальным, брать чужую информацию не уведомляя автора (что не так страшно), и не оставляя линк на оригинал и автора — что более существенно. Я не против распространения информации — только за. Только условие простое — извольте подписывать автора, и оставлять линк на оригинальную страницу в виде прямой, активной, нескриптовой, незакрытой от индексирования, и не запрещенной для следования роботов ссылки.
  Если соизволите поставить автора в известность — то вообще почёт вам и уважение.

© lissyara 2006-10-24 08:47 MSK

веселые картинки развлекательные гифки интресные факты смешные видео смешные истории из соцсетей

Время генерации страницы 2.0063 секунд
Из них PHP: 99%; SQL: 1%; Число SQL-запросов: 77 шт.
У Вас отключено GZIP-сжатие в браузере. Размер страницы 139908