Рубрики
HDD \ SSD \ ISO \ CD-ROM \ LVM \ FS \ RAID \ Диск

smartctl \ S.M.A.R.T. \ проверка диска

Ссылки:

https://ru.wikipedia.org/wiki/S.M.A.R.T.

Условия:

Для работы SMART есть некоторые предварительные условия.

Диск должен поддерживать систему SMART. 
Чтобы определить, так ли это, выполните, например, команду hdparm -I /dev/sdx.

Диск должен быть внутренним или иметь тип eSata. 
С внешними дисками, подключаемыми через USB или Firewire, функции SMART, к сожалению, не используются.

Если жесткий диск управляется через аппаратный контроллер RAID, функции SMART могут применяться только в отдельных случаях (подробности в справке mar smartctl но параметру -d).

Стоит обратить внимание:

> Большее значение параметра лучше
< Меньшее значение параметра лучше

04 --- Start/Stop Count            --- < ---   Полное число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) 
                                               — счётчик включения режима энергосбережения. 
                                               В поле raw value хранится общее количество запусков/остановок диска.

05 --- Reallocated Sectors Count   --- < ---   Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» 
                                               и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки 
                                               — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. 
                                               Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов.
                                               Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.

09 --- Power-on Time Count         --- < ---    Число часов (минут, секунд — в зависимости от производителя), проведённых во включенном состоянии. 
         (Power-On Hours)                      В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure).

BB --- Reported UNC Errors	   --- < ---     Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.

DD --- G-Sense Error Rate	   --- < ---     Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара.

Все значения:

> Большее значение параметра лучше
< Меньшее значение параметра лучше

01 --- Raw Read Error Rate          --- < ---   Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.
                                                Для всех дисков Seagate, Samsung (семейства F1 и более новые) и Fujitsu 2,5″ это — число внутренних коррекций данных, 
                                                проведенных до выдачи в интерфейс, следовательно на пугающе огромные цифры можно реагировать спокойно.

02 --- Throughput Performance      --- > ---    Общая производительность диска. Если значение атрибута уменьшается, то велика вероятность, что с диском есть проблемы.

03 --- Spin-Up Time                --- < ---    Время раскрутки пакета дисков из состояния покоя до рабочей скорости.
                                                Растет при износе механики (повышенное трение в подшипнике и т. п.), также может свидетельствовать о некачественном 
                                                питании (например, просадке напряжения при старте диска).

04 --- Start/Stop Count            --- < ---   Полное число циклов запуск-остановка шпинделя. У дисков некоторых производителей (например, Seagate) 
                                               — счётчик включения режима энергосбережения. 
                                               В поле raw value хранится общее количество запусков/остановок диска.

05 --- Reallocated Sectors Count   --- < ---   Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» 
                                               и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки 
                                               — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. 
                                               Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов.
                                               Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.

06 --- Read Channel Margin        ----------   Запас канала чтения. Назначение этого атрибута не документировано. В современных накопителях не используется.

07 --- Seek Error Rate            --- < ---    Частота ошибок при позиционировании блока магнитных головок. Чем их больше, тем хуже состояние механики и/или поверхности жёсткого диска. 
                                               Также на значение параметра может повлиять перегрев и внешние вибрации (например, от соседних дисков в корзине).

08 --- Seek Time Performance      --- > ---    Средняя производительность операции позиционирования магнитными головками. 
                                               Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.

09 --- Power-on Time Count        --- < ---    Число часов (минут, секунд — в зависимости от производителя), проведённых во включенном состоянии. 
         (Power-On Hours)                      В качестве порогового значения для него выбирается паспортное время наработки на отказ (MTBF — mean time between failure).

0A --- Spin-Up Retry Count        --- < ---    Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной. 
                                               Если значение атрибута увеличивается, то велика вероятность неполадок с механической частью.
      
0B --- Recalibration Retries      --- < ---    Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной. 
                                               Если значение атрибута увеличивается, то велика вероятность проблем с механической частью.

0C --- Device Power Cycle Count   ---------    Количество полных циклов включения-выключения диска.

0D --- Soft Read Error Rate       --- < ---    Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению. 
                                               Все ошибки имеют не механическую природу и указывают лишь на неправильную разметку/взаимодействие 
                                               с диском программ или операционной системы.

B8 --- End-to-End error	         --- < ---     Данный атрибут — часть технологии HP SMART IV — означает, что после передачи данных через кэш-память 
                                               чётность данных между хостом и жестким диском не совпадает.

BB --- Reported UNC Errors	 --- < ---     Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.

BC --- Command Timeout           --- < ---     Количество прерванных операций в связи с HDD тайм-аут. Обычно это значение атрибута должно быть равно нулю, и, 
                                               если значение гораздо выше нуля, то, скорее всего, там будут какие-то серьезные проблемы с питанием или окисленные кабели для передачи данных.

BE --- Airflow Temperature (WDC) --- < ---     Температура воздуха внутри корпуса жёсткого диска. Для дисков Seagate рассчитывается по формуле (100 — HDA temperature). 
                                               Для дисков Western Digital — (125- HDA).

BF --- G-sense error rate	 --- < ---     Количество ошибок, возникающих в результате ударных нагрузок. 
                                               Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, 
                                               падения и даже неаккуратную установку диска в корпус компьютера.

C0 --- Power-off retract count    --- < ---    Число циклов выключений или аварийных отказов (включений/выключений питания накопителя).

C1 --- Load/Unload Cycle          --- < ---    Количество циклов перемещения блока магнитных головок в парковочную зону / в рабочее положение.

C2 --- HDA temperature            --- < ---    Здесь хранятся показания встроенного термодатчика для механической части диска — банки (HDA — Hard Disk Assembly). 
                                               Информация снимается со встроенного термодатчика, которым служит одна из магнитных головок, обычно нижняя в банке. 
                                               В битовых полях атрибута фиксируются текущая, минимальная и максимальная температура. 
                                               Не все программы, работающие со SMART, правильно разбирают эти поля, так что к их показаниям стоит относиться критически.

C3 --- Hardware ECC Recovered     --- < ---    Число коррекции ошибок аппаратной частью диска (чтение, позиционирование, передача по внешнему интерфейсу). 
                                               На дисках с SATA-интерфейсом значение нередко ухудшается при повышении частоты системной шины — SATA очень чувствителен к разгону.

C4 --- Reallocation Event Count	  --- < ---    Число операций переназначения. В поле «raw value» атрибута хранится общее число попыток переноса информации 
                                               с переназначенных секторов в резервную область. Учитываются как успешные, так и не успешные попытки.

C5 --- Current Pending Sector Count --- < ---  Число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, 
                                               но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. 
                                               В случае успешного последующего прочтения сектора он исключается из числа кандидатов. 
                                               В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения (remapping).
                                               Рост значения этого атрибута может свидетельствовать о физической деградации жёсткого диска.

C6 --- Uncorrectable Sector Count --- < ---    Число не корректируемых (средствами диска) секторов. В случае увеличения числа ошибок, 
                                               велика вероятность критических дефектов поверхности и/или механики накопителя.

C7 --- UltraDMA CRC Error Count	  --- < ---    Число ошибок, возникающих при передаче данных по внешнему интерфейсу в режиме UltraDMA (нарушения целостности пакетов и т. п.). 
                                               Рост этого атрибута свидетельствует о плохом (мятом, перекрученном) кабеле и плохих контактах. 
                                               Также подобные ошибки появляются при разгоне шины PCI, сбоях питания, сильных электромагнитных наводках, а иногда и по вине драйвера.
                                               Возможно причина в некачественном шлейфе. Для исправления попробуйте использовать SATA шлейф без защёлок, 
                                               имеющий плотное соединение с контактами диска.

C8 --- Write Error Rate          --- < ---     Показывает общее количество ошибок, происходящих при записи сектора. 
       Multi-Zone Error Rate                   Показывает общее число ошибок записи на диск. 
                                               Может служить показателем качества поверхности и механики накопителя.

C9 --- Soft read error rate      --- < ---     Частота появления «программных» ошибок при чтении данных с диска. 
                                               Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска 
                                               по вине программного обеспечения, а не аппаратной части накопителя.

CA --- Data Address Mark errors	 --- < ---     Number of Data Address Mark (DAM) errors (or) vendor-specific.

CB --- Run out cancel	         --- < ---     Количество ошибок ECC.

CC --- Soft ECC correction       --- < ---     Количество ошибок ECC, скорректированных программным способом.

CD --- Thermal asperity rate     --- < ---     Number of thermal asperity errors.
       (TAR)	

CE --- Flying height             ---------     Высота между головкой и поверхностью диска.

CF --- Spin high current         --- < ---     Величина силы тока при раскрутке диска.

D0 --- Spin buzz                 ---------     Number of buzz routines to spin up the drive.

D1 --- Offline seek performance	 ---------     Производительность поиска во время офлайновых операций (Drive’s seek performance during offline operations.)

DC --- Disk Shift                --- < ---     Дистанция смещения блока дисков относительно шпинделя. В основном возникает из-за удара или падения.
                                               Единица измерения неизвестна. При увеличении атрибута диск быстро становится неработоспособным.

DD --- G-Sense Error Rate	 --- < ---     Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара.

DE --- Loaded Hours              ---------     Время, проведённое блоком магнитных головок между выгрузкой из парковочной области
                                               в рабочую область диска и загрузкой блока обратно в парковочную область.

DF --- Load/Unload Retry Count   ---------     Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки.

E0 --- Load Friction             --- < ---     Величина силы трения блока магнитных головок при его выгрузке из парковочной области.

E1 --- Load Cycle Count	         --- < ---     Количество циклов перемещения блока магнитных головок в парковочную область.

E2 --- Load ‘In’-time            ---------     Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.

E3 --- Torque Amplification Count --- < ---    Количество попыток скомпенсировать вращающий момент.

E4 --- Power-Off Retract Cycle   --- < ---     Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.

E6 --- GMR Head Amplitude        ---------     Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).

E7 --- Temperature               --- < ---     Температура жёсткого диска.

F0 --- Head flying hours         ---------     Время позиционирования головок.

FA --- Read error retry rate     --- < ---     Число ошибок во время чтения жёсткого диска.