187 атрибут нескорректированные ecc кодом ошибки
Что такое SMART HDD (жёсткого диска) и что нужно делать, если компьютер выдаёт надпись «smart status bad backup and replace».
Во всех современных накопителях последних лет абсолютно любого производителя присутствует система SMART (self-monitoring, analysis and reporting technology - технология предупреждения, анализа и самопроверки) жесткого диска, очень тесно связанная с функционированием накопителя.
Современные технологии SMART осуществляют: мониторинг различных параметров состояния диска, сканирование поверхности жесткого диска с дальнейшей автоматической заменой нечитаемых секторов и занесение их в error-log, т.н. список, где номера этих секторов хранятся в виде таблицы, периодическое повторное сканирование "ненадежных" секторов из error-log и, если система определяет, что данный сектор исправен - то исключает его из данного списка и он становится доступен на поверхности для пользовательской информации (но также помечается для дальнейшей перепроверки при следующем сканировании поверхности), либо, если сектор не прочитывается несколько раз подряд, не переписывается, то он отправляется в следующий дефект-лист,именуемый у разных производителей по-разному, но имеющий одинаковое предназначение - этот лист является как бы посредником между error-log таблицей и финальным G-листом, где дефект уже будет занесен в G-лист навсегда, станет отображаться в SMART, в строке current pending sectors/offline UNC sectors.
Из статуса current pending поврежденный сектор после очередной перепроверки на "живучесть", если не прошел чтение/запись, то окончательно отправляется в статус переназначенных и там уже остается. Диск в дальнейшей работе его уже не использует, не тестирует повторно на чтение/запись.
В строке reallocated sector count изменяется значение с N на N+1.
Если накопитель имеет уже серьёзные повреждения, то при загрузке компьютера может выводиться надпись: «smart status bad backup and replace». Это значит, что статус SMART жёсткого диска изменился из состояния GOOD в состояние BAD, на диске как минимум имеются BAD-блоки и состояние диска продолжает ухудшаться. Пользователю рекомендуется сохранить свои данные, если они ещё доступны для чтения и заменить жёсткий диск на новый.
SMART ВЫГЛЯДИТ ТАК:
Выводится в виде таблицы со следующими столбцами:
ID – ИДЕНТИФИКАЦИОННЫЙ НОМЕР ПАРАМЕТРА
Name – выводимое программой имя параметра
VAL – НОРМАЛИЗОВАННОЕ ЗНАЧЕНИЕ ПАРАМЕТРА (НОРМАЛИЗОВАННОЕ ЗНАЧИТ, В ДАННОМ СЛУЧАЕ, ЧТО ВНУТРЕННЕЕ (RAW) ЗНАЧЕНИЕ ПАРАМЕТРА ПРЕОБРАЗОВАНО ПО ОПРЕДЕЛЁННОМУ АЛГОРИТМУ ДЛЯ БОЛЕЕ УДОБНОГО И ПОНЯТНОГО ПРОСМОТРА ЗНАЧЕНИЯ. НАПРИМЕР, ВНУТРЕННИЙ ПАРАМЕТР ВСЕГДА УВЕЛИЧИВАЕТСЯ И МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЕ В НЕСКОЛЬКО ТЫСЯЧ ЕДИНИЦ, А ВЫВОДИМОЕ ЗНАЧЕНИЕ ИЗМЕНЯЕТСЯ ОТ 100 ДО 0 И ОТОБРАЖЕНИЕ ВНУТРЕННЕГО ДИАПАЗОНА ИЗМЕНЕНИЯ ПАРАМЕТРА НА ВЫВОДИМЫЙ И ЕСТЬ, В ДАННОМ СЛУЧАЕ, НОРМАЛИЗАЦИЯ)
Wrst – худшее значение параметра за отрезок времени время
Thresh – пороговое значение, при достижении которого диск рекомендуется заменить
РАССМОТРИМ, КАКИЕ СУЩЕСТВУЮТ ПАРАМЕТРЫ В СИСТЕМЕ SMART. НАБОР ОТСЛЕЖИВАЕМЫХ ПАРАМЕТРОВ ЗАВИСИТ ОТ ПРОИЗВОДИТЕЛЯ ДИСКА И НЕ ВСЕ ИЗ ПЕРЕЧИСЛЕННЫХ БУДУТ ПРИСУТСТВОВАТЬ В ВАШЕМ СЛУЧАЕ.
Атрибуты SMART:
1 Raw read error rate - количество ошибок при считывании секторов с пластин.
2 Throughput Performance - общая производительность диска в относительных единицах.
3 Spin-up time - время раскрутки пластин от нуля до номинальной скорости вращения в миллисекундах
4 Number of spin-up times - количество циклов раскрутки/остановки пластин; отражает механический ресурс диска из-за ограниченного количества циклов запуска/останова.
5 Reallocated sector count - параметр отражает количество запасных секторов; когда диск находит ошибку чтения/записи/проверки, он переназначает плохой сектор на хороший из запасной зоны; нормализованное значение атрибута уменьшается по мере убывания запасных секторов; RAW-значение показывает количество преназначенных секторов, которое в норме должно быть ноль; на SSDRAW значение показывает количество неисправных блоков флеш-памяти.
6 Read Channel Margin - данный атрибут не используется в современных накопителях.
7 Seek error rate - количество ошибок позиционирования магнитных головок.
8 Seek Time Performance - средняя скорость позиционирования привода магнитных головок на указанный сектор; в SSDпараметр не используется
9 Power-on time - ожидаемое время жизни диска, основанное на времени, проведённом во включённом состоянии; нормализованное значение уменьшается со 100 до 0, связано с ресурсом диска; уменьшение этого параметра косвенно говорит о состоянии механики диска
10 Spin-up retries - количество попыток раскруток пластин при условии, что первая попытка была неудачная; считается с момента начала использования; на SSD не используется
12 Start/stop count - ожидаемое время жизни, основанное на количестве пусков/остановов пластин; каждый диск имеет ограниченное количество пусков/остановов, параметр уменьшается со 100 до 0; RAW значение показывает число включений/выключений
13 Soft Read Error Rate — у одних производителей этот параметр описывается, как указывающий на количество ошибок, не восстановленных ECC, а у других наоборот - восстановленных
100 Erase/Program Cycles - общее количество циклов чтения/записи для всей флеш-памяти за весь срок службы; SSD имеет ограничение на количество циклов чтения/записи, конкретное значение зависит от типа и производителя микросхем флеш-памяти
103 Translation Table Rebuild - количество событий перестроения внутренней таблицы адресов блоков при её повреждении и восстановлении; RAW значение показывает актуальное количество данных событий
170 Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков
171 Program Fail Count - количество случаев неудавшейся записи блока флеш-памяти
172 Erase Fail Count - количество случаев неудавшейся операции стирания блока флеш-памяти
173 Wear Leveller Worst Case Erase Count - максимальное количество операций стирания, произведённых над блоком флеш-памяти
178 Used Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков
180 Unused Reserved Block Count - описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество неиспользованных резервных блоков
183 SATA Downshifts - показывает, как часто требовалось понизить скорость передачи по SATA (с 6Гб/c до 3Гб/с или 1.5Гб/с) для успешной передачи данных, при уменьшении значения атрибута следует заменить кабель
184 End-to-End error - количество ошибок, возникших в буфере диска; часть технологии HP SMART IV; может свидетельствовать о неисправности RAM-буффера диска
185 Head Stability - по атрибуту нет достоверной информации
186 Induced Op-Vibration Detection - по атрибуту нет достоверной информации
187 Reported UNC error - количество нескорректированных ошибок чтения
188 Command timeout - количество невыполненных диском команд из-за истечения времени ожидания
189 High Fly writes - количество ошибок записи, вызванных неправильной высотой полёта магнитной головки над поверхностью
190 Airflow temperature - температура воздуха внутри гермоблока HDD
191 G-Sense Errors - указывает сколько раз диск прерывал работу из-за ударов или вибрации
192 power-off retract cycles - количество неожиданных пропаданий питания, когда оно пропадало прежде, чем была получена команда на отключение диска; у hdd срок службы при неожиданном отключении значительно меньше, чем при нормальном; у ssd есть риск потери таблицы внутреннего состояния при неожиданном пропадании питания
193 load/unload cycles - количество перемещений бмг между зоной парковки и зоной данных; значение уменьшается от 100 до 0, raw содержит актуальное количество перемещений
194 hda temperature- температура блока магнитных головок
195 hardware ecc recovered- количество ошибок чтения, скорректированных кодом коррекции ошибок
196 reallocation events - общее количество переназначений секторов, включает и off-line сканирование и обычную работу
197 current pending sectors- количество нестабильных секторов, ожидающих перепроверки и, возможно, переназначения
198 offline scan unc sectors- количество плохих секторов, найденных диском при фоновом самосканировании; ухудшение этого параметра говорит о быстрой деградации поверхности
199 ultra dma crc errors- количество ошибок при передаче данных между диском и материнской платой; при ухудшении этого параметра стоит заменить кабель
200 write error rate - частота возникновения ошибок при записи
202 data address mark errors - количество ошибок при поиске запрошенного сектора
203 run out cancel - количество ошибок, вызванных неверной контрольной суммой при попытке коррекции ошибки
204 soft ecc corrections - количество ошибок, скорректированных кодом коррекции
206 flying height - девиация высоты полёта головки над поверхностью относительно оптимального значения; если головка слишком низко, она может повредить поверхность, если слишком высоко - увеличивается количество ошибок чтения
207 spin high current - величина тока, требуемая для раскрутки пластин
209 offline seek performance - производительность подсистемы поиска при выполнении off-line сканирования
220 disk shift - расстояние, на которое сместился пакет пластин относительно теоретического положения в результате механического повреждения или перегрева
227 torque amplification count - показывает сколько раз требовалось подавать увеличенный ток для раскрутки пластин
230 gmr head amplitude - амплитуда колебаний головок бмг
233 media wearout indicator - остаток ресурса памяти в ssd
240 head flying hours- время, проведённое головками в зоне пользовательских данных; значение уменьшается, обычно от 100 до 0
241 total lbas written - количество 512-и байтных блоков, записанных за всю жизнь устройства
242 total lbas read - количество 512-и байтных блоков, считанных за всю жизнь устройства
250 read error retry rate
Сложность интерпретации значений smart состоит в том, что ни на количество, ни на тип, ни на значения, ни на единицы измерения отслеживаемых параметров нет единого стандарта. поэтому реализация smart всегда зависит от конкретного производителя. нормализацию raw-значений в показатели атрибутов все делают по-своему, а результатом является статус проверки smart good или bad. поэтому достоверный вывод о состоянии диска можно сделать только проверив его поверхность какой-либо диагностической программой. но если нужно быстро оценить состояние диска и возможные проблемы, нужно обратить внимание на несколько основных, самых информативных атрибутов.
Наиболее важные аттрибуты smart:
5 reallocated sectors count - количество переназначенных секторов; рост значения этого атрибута свидетельствует об ухудшении состояния поверхности диска
7 seek error rate - частота ошибок позиционирования бмг (блока магнитных головок); чем больше, тем хуже состояние механики и поверхности жёсткого диска
11 recalibration retries - количество неудачных попыток калибровки бмг;
184 end-to-end error - количество ошибок возникших в буфере диска
187 reported unc errors - количество нескорректированных ошибок чтения
191 g-sense error rate - количество ударов диска во время работы
196 reallocation event count - общее количество переназначенных секторов
197 current pending sector count - количество нестабильных секторов, кандидаты в бэды, чем больше, тем хуже диск
198 uncorrectable sector count - количество плохих секторов, найденных при off-line сканировании, чем их больше, тем хуже поверхность
199 ultradma crc error count - количество ошибок передачи между диском и компьютером, при увеличении или отличном от нуля параметре стоит заменить кабель
Как читать вывод показателей SMART
Работа с показаниями Smartudm
При чтении S.M.A.R.T. программа строит таблицу такого типа:
Attribute * Spin Up Time
ID 3
Threshold 63
Value 236
Worst 235
Raw 000000001199h
Type PR SP
Attribute - имя атрибута;
ID - номер атрибута;
Value - значение атрибута (выше лучше);
Threshold - пороговое значения атрибута (если значение меньше чем Threshold, готовьтесь к неприятностям);
Worst - самое низкое значение атрибута за все время тестирования;
Raw - текущее значение атрибута в 16-ричном значении (меньше лучше);
Type - тип атрибута (PR - Performance-related, ER - Error rate, EC - Events count, SP - Self-preserve).
Значения параметров SMART
Raw Read Error Rate - Частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя.
Spin Up Time - Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости. Предположительно, в поле raw value содержится время в миллисекундах/секундах.
Reallocated Sector Count - Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации он пытается переместить данные из него в специальную резервную область (spare area) и, в случае успеха, помечает сектор как "переназначенный". Также, этот процесс называют remapping, а переназначенный сектор - remap. Благодаря этой возможности, на современных жестких дисках очень редко видны [при тестировании поверхности] так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны "провалы" - резкое падение скорости чтения (до 10% и более). Поле raw value содержит общее количество переназначенных секторов.
Throughput Performance - Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе.
Start/Stop Count - Количество циклов запуск/останов шпинделя. Поле raw value хранит общее количество включений/выключений диска.
Read Channel Margin - Запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется.
Seek Error Rate - Частота появления ошибок позиционирования БМГ. В случае сбоя в механической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже механики и/или поверхности жесткого диска.
Seek Time Performance - Средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.
Power-On Hours - Количество отработанных часов во включенном состоянии. Поле raw value этого атрибута показывает количество часов (минут, секунд - в зависимости от производителя), отработанных жестким диском. Снижение значения (value) атрибута до критического уровня (threshold) указывает на выработку диском ресурса (MTBF - Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать.
Spin Retry Count - Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Recalibration Retries - Количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Device Power Cycle Count - Количество полных циклов запуска/останова жесткого диска.
Soft Read Error Rate - Частота появления "программных" ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.
End-to-End error - Данный атрибут-часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают.
Reported UNC Errors - Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.
Load/Unload cycle count - Количество циклов вывода БМГ в специальную парковочную зону/в рабочее положение. Подробнее - см. описание технологии Head Load/Unload Technology.
Drive Temperature - Температура. Данный параметр отражает в поле raw value показание встроенного температурного сенсора в градусах Цельсия.
Reallocation Event Count - Количество операций переназначения (ремаппинга). Поле raw value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции.
Current Pending Sector Count - Текущее количество нестабильных секторов. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped). Постоянно ненулевое значение raw value этого атрибута говорит о низком качестве (отдельной зоны) поверхности диска.
Uncorrectable Sector Count - Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя.
UltraDMA CRC Error Count - Общее количество ошибок CRC в режиме UltraDMA. Поле raw value содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC - Interface CRC). Примечание автора. Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также - по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA.
Write Error Rate (Multi Zone Error Rate)- Частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле raw value (и ниже значение value), тем хуже состояние поверхности диска и/или механики привода.
Disk Shift - Сдвиг пакета дисков относительно оси шпинделя. Актуальное значение атрибута содержится в поле raw value. Единицы измерения - не известны. Подробности - см. в описании технологии G-Force Protection. Примечание. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам.
G-Sense Error Rate - Частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора - общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее - см. описание технологии G-Force Protection.
Loaded Hours - Нагрузка на привод БМГ, вызванная общей наработкой часов накопителем. Учитывается только период, в течении которого головки находились в рабочем положении.
Load/Unload Retry Count - Нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течении которого головки находились в рабочем положении.
Load Friction - Нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении.
Load/Unload Cycle Count - Общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении.
Load-in Time - Общее время нагрузки на привод БМГ. Предположительно, данный атрибут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковочной зоны).
Torque Amplification Count - Количество усилий вращающего момента привода.
Power-Off Retract Count - Количество зафиксированных повторов в(ы)ключения питания накопителя.
GMR Head Amplitude - Амплитуда дрожания GMR-головок (GMR-Head) в рабочем состоянии.
Программы для чтения SMART
SpeedFan
SMARTUDM - HDD S.M.A.R.T. Viewer
MHDD
Виктория
К посту прикреплен официальный список значений атрибутов (eng)
Конфигурация компьютера | |
Процессор: AMD Phenom II X2 Black Edition 555 unlocked to 4-core B55, 4000 MHz (20 x 200) + Thermalright SI-128 SE | |
Материнская плата: Gigabyte GA-890GPA-UD3H v2.1 (FF BIOS) | |
Память: 4 x Kingston 99U5584-005.A00LF 4 ГБ DDR3-1600, 11-11-11-28 at 800 МГц | |
HDD: APPLE SSD TS256C (Toshiba on JMicron 61x), 2 x FUJITSU MBA3147RC + 2 x HDT721010SLA360 + 2 x HDS5C3020ALA632 + 2 x HDN724030ALE640 | |
Видеокарта: Gigabyte GTX970 | |
Звук: ESI Juli@ + Epos m12.2 + NAD C325BEE + AKG K240 | |
Блок питания: Thermaltake (Channel Well Technology) TPX-675M (TP675AH3CC) с 01.05.2011 | |
CD/DVD: 2 x Lite-on iHAP122 | |
Монитор: Samsung LE40D503 | |
Ноутбук/нетбук: Samsung SM-T805 | |
ОС: Windows 7 SP1 x64 | |
Индекс производительности Windows: 6,7 (ограничен SSD) | |
Прочее: Корпус Chieftec BA-01B-B-B, вентиляторы Glacialtech HDLA, RAID контроллер LSI1064E (3000 series) |
И кое-что новенькое, актуально для SSD.
Аттирбут 232 (E8h) - Endurance Remaining (Остаточный износ) - Процент количества произведенных записей от теоретического максимума (от 0 до 100, 0 - 64h)
Аттрибут 233 (E9h) - Power-On Time (Время работы) - Количество секунд, которое проработал накопитель.
Как читать вывод показателей SMART
Работа с показаниями Smartudm
При чтении S.M.A.R.T. программа строит таблицу такого типа:
Attribute * Spin Up Time
ID 3
Threshold 63
Value 236
Worst 235
Raw 000000001199h
Type PR SP
Attribute - имя атрибута;
ID - номер атрибута;
Value - значение атрибута (выше лучше);
Threshold - пороговое значения атрибута (если значение меньше чем Threshold, готовьтесь к неприятностям);
Worst - самое низкое значение атрибута за все время тестирования;
Raw - текущее значение атрибута в 16-ричном значении (меньше лучше);
Type - тип атрибута (PR - Performance-related, ER - Error rate, EC - Events count, SP - Self-preserve).
Значения параметров SMART
Raw Read Error Rate - Частота появления ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине аппаратной части накопителя.
Spin Up Time - Время раскрутки шпинделя. Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости. Предположительно, в поле raw value содержится время в миллисекундах/секундах.
Reallocated Sector Count - Количество переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи/верификации он пытается переместить данные из него в специальную резервную область (spare area) и, в случае успеха, помечает сектор как "переназначенный". Также, этот процесс называют remapping, а переназначенный сектор - remap. Благодаря этой возможности, на современных жестких дисках очень редко видны [при тестировании поверхности] так называемые bad block. Однако, при большом количестве ремапов, на графике чтения с поверхности будут заметны "провалы" - резкое падение скорости чтения (до 10% и более). Поле raw value содержит общее количество переназначенных секторов.
Throughput Performance - Средняя производительность (пропускная способность) диска. Уменьшение значения value этого атрибута с большой вероятностью указывает на проблемы в накопителе.
Start/Stop Count - Количество циклов запуск/останов шпинделя. Поле raw value хранит общее количество включений/выключений диска.
Read Channel Margin - Запас канала чтения. Назначение этого атрибута не документировано и в современных накопителях не используется.
Seek Error Rate - Частота появления ошибок позиционирования БМГ. В случае сбоя в механической системе позиционирования, повреждения сервометок (servo), сильного термического расширения дисков и т.п. возникают ошибки позиционирования. Чем их больше, тем хуже механики и/или поверхности жесткого диска.
Seek Time Performance - Средняя производительность операций позиционирования БМГ. Данный параметр показывает среднюю скорость позиционирования привода БМГ на указанный сектор. Снижение значения этого атрибута говорит о неполадках в механике привода.
Power-On Hours - Количество отработанных часов во включенном состоянии. Поле raw value этого атрибута показывает количество часов (минут, секунд - в зависимости от производителя), отработанных жестким диском. Снижение значения (value) атрибута до критического уровня (threshold) указывает на выработку диском ресурса (MTBF - Mean Time Between Failures). На практике, даже падение этого атрибута до нулевого значения не всегда указывает на реальное исчерпывание ресурса и накопитель может продолжать нормально функционировать.
Spin Retry Count - Количество повторов попыток старта шпинделя диска. Данный атрибут фиксирует общее количество попыток раскрутки шпинделя и его выхода на рабочую скорость, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Recalibration Retries - Количество повторов попыток рекалибровки накопителя. Данный атрибут фиксирует общее количество попыток сброса состояния накопителя и установки головок на нулевую дорожку, при условии, что первая попытка была неудачной. Снижение значения этого атрибута говорит о неполадках в механике привода.
Device Power Cycle Count - Количество полных циклов запуска/останова жесткого диска.
Soft Read Error Rate - Частота появления "программных" ошибок при чтении данных с диска. Данный параметр показывает частоту появления ошибок при операциях чтения с поверхности диска по вине программного обеспечения, а не аппаратной части накопителя.
End-to-End error - Данный атрибут-часть технологии HP SMART IV, это означает, что после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают.
Reported UNC Errors - Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.
Load/Unload cycle count - Количество циклов вывода БМГ в специальную парковочную зону/в рабочее положение. Подробнее - см. описание технологии Head Load/Unload Technology.
Drive Temperature - Температура. Данный параметр отражает в поле raw value показание встроенного температурного сенсора в градусах Цельсия.
Reallocation Event Count - Количество операций переназначения (ремаппинга). Поле raw value этого атрибута показывает общее количество попыток переназначения сбойных секторов в резервную область, предпринятых накопителем. При этом, учитываются как успешные, так и неудачные операции.
Current Pending Sector Count - Текущее количество нестабильных секторов. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на переназначение в резервную область (remap). Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка претендентов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped). Постоянно ненулевое значение raw value этого атрибута говорит о низком качестве (отдельной зоны) поверхности диска.
Uncorrectable Sector Count - Количество нескорректированных ошибок. Атрибут показывает общее количество ошибок, возникших при чтении/записи сектора и которые не удалось скорректировать. Рост значения в поле raw value этого атрибута указывает на явные дефекты поверхности и/или проблемы в работе механики накопителя.
UltraDMA CRC Error Count - Общее количество ошибок CRC в режиме UltraDMA. Поле raw value содержит количество ошибок, возникших в режиме передачи данных UltraDMA в контрольной сумме (ICRC - Interface CRC). Примечание автора. Практика, собранная статистика и изучение журналов ошибок SMART показывают: в большинстве случаев ошибки CRC возникают при сильном завышении частоты PCI (больше номинальных 33.6 MHz), сильно перекрученом кабеле, а также - по вине драйверов ОС, которые не соблюдают требований к передачи/приему данных в режимах UltraDMA.
Write Error Rate (Multi Zone Error Rate)- Частота появления ошибок при записи данных. Показывает общее количество ошибок, обнаруженных во время записи сектора. Чем больше значение в поле raw value (и ниже значение value), тем хуже состояние поверхности диска и/или механики привода.
Disk Shift - Сдвиг пакета дисков относительно оси шпинделя. Актуальное значение атрибута содержится в поле raw value. Единицы измерения - не известны. Подробности - см. в описании технологии G-Force Protection. Примечание. Сдвиг пакета дисков возможен в результате сильной ударной нагрузки на накопитель в результате его падения или по иным причинам.
G-Sense Error Rate - Частота появления ошибок в результате ударных нагрузок. Данный атрибут хранит показания ударочувствительного сенсора - общее количество ошибок, возникших в результате полученных накопителем внешних ударных нагрузок (при падении, неправильной установки, и т.п.). Подробнее - см. описание технологии G-Force Protection.
Loaded Hours - Нагрузка на привод БМГ, вызванная общей наработкой часов накопителем. Учитывается только период, в течении которого головки находились в рабочем положении.
Load/Unload Retry Count - Нагрузка на привод БМГ, вызванная многочисленными повторениями операций чтения, записи, позиционирования головок и т.п. Учитывается только период, в течении которого головки находились в рабочем положении.
Load Friction - Нагрузка на привод БМГ, вызванная трением в механических частях накопителя. Учитывается только период, в течении которого головки находились в рабочем положении.
Load/Unload Cycle Count - Общее количество циклов нагрузки на привод БМГ. Учитывается только период, в течении которого головки находились в рабочем положении.
Load-in Time - Общее время нагрузки на привод БМГ. Предположительно, данный атрибут показывает общее время работы накопителя под нагрузкой, при условии, что головки находятся в рабочем состоянии (вне парковочной зоны).
Torque Amplification Count - Количество усилий вращающего момента привода.
Power-Off Retract Count - Количество зафиксированных повторов в(ы)ключения питания накопителя.
GMR Head Amplitude - Амплитуда дрожания GMR-головок (GMR-Head) в рабочем состоянии.
Программы для чтения SMART
SpeedFan
SMARTUDM - HDD S.M.A.R.T. Viewer
MHDD
Виктория
К посту прикреплен официальный список значений атрибутов (eng)
Программа ориентирована на широкий круг пользователей ПК, и предназначена для тестирования, сервисного обслуживания и получения технической информации с любых жестких дисков с интерфейсами IDE и Serial ATA. Программа представляет собой полностью готовое решение для всесторонней, глубокой, и в тоже время максимально быстрой оценки реального технического состояния HDD.
В ней собраны возможности большинства фирменных диагностических утилит для HDD, и другие полезные функции, имеющиеся в ATA стандарте на современные жесткие диски, однако нет ограничений на поддерживаемые модели.
Автор программы, Sergei_Kazanskij, у нас на форуме! Желающие могут поддержать проект через сайт Виктории.
Старые версии
Сергей, у меня к Вам два предложения.
1. Можно ли сделать так, чтоб программа повторно не запускалась вторым экземпляром,
если уже запущена и мониторит в трее.
А при случайной попытке запустить с ярлыка уже запущенный экземпляр просто всплывал из трея.
2. Можно ли сделать так, чтоб программа снимала показания смарта не только выбранного диска,
но и всех дисков в системе ? Или сделать это как опцию.
Verify error: Timeout
1. Пункт "DDD (API)" и "нумеровать". Когда необходимо их активировать?
2. На вкладке INFO после строки SIZE (значение - "2 Тб") имеется красная строка API SIZE (значение - "-5102"). Это что-то важное или не имеет значения?
3. Имеется внешний жесткий (2 Тб Seagate BUP Slim BK).
Над диском в настоящее время производится длительное действие в Виктории. И тем не менее вопрос.
Использую Hard Disk Sentinel Pro для постоянного мониторинга за дисками.
В какой-то момент эта программа показала здоровье -9! Буквально вчера было все здорово, а сегодня здоровье 9?! И это при том, что реально диск отработал за 2 года меньше 10 дней, так как используется для хранения!
И предложила сохранить всю информацию.
Всю информацию я с него перенес (при этом были обнаружены 3 некопирующихся файла) и теперь для сокращения времени, я запустил процесс WRITE. (В теме я прочитал, что это нормальный вариант для диска без информации для приведения его в норму).
Timeout установлен по умолчанию 10000 ms.
Пока найден 1 красный блок с такой информацией:
Warning! Block start at 2436220664 (1,2 TB) = 3838 ms
Block start at 23478265720 Write error : Preset timeout limit.
- этот блок (2436220664) записался нулями? И таким образом восстановился?
- этот блок (23478265720) не записался нулями? И его нужно еще раз пройти, но с другими настройками?
- потому что неправильно указано в настройках значение Timeout?
- какое значение Timeout нужно указывать для режимов : (Игнорировать, Починить, Обновить), а также (Верификация, Запись, Чтение)?
- как вариант, можно было не переносить с диска всю информацию, и запустить режим: Верификация? Починить? Обновить? Какой предпочтительней? приналичии на диске относительно важной информации?
И еще вопрос. Когда-то меня очень подвел один жесткий диск. Он вышел из строя как-то очень внезапно. И я не смог ничего спасти. Для неповторения в будущем подобной ситуации я установил программу для постоянного мониторинга Hard Disk Sentinel Pro.
И вот сейчас она сработала и предупредила меня. Однако, Уважаемый автор в начале этой темы если я правильно его понял, неодобрительно отозвался о программах, которые мониторят состояние дисков в реальном времени. Но если не использовать подобную программу, то как узнать о возможных проблемах?
Нумеровка диска-приёмника нужна для восстановления данных - так сразу видно по номерам, на какие файлы пришлись пропущенные во время копирования места. Также я использую нумеровку для исследования механизмов трансляции накопителей.
Паспорт берётся с винта, и в нем прописан размер винта. А API-размер это то, что видит Windows с учётом USB-мостов и прочих прослоек между винтом и API.
Это видно только Вам. Посмотрите в редакторе.
Так делать вообще нельзя.
Насколько я знаю, если на диске есть важная информация, первым делом надо её скопировать, потому что в любой момент диск может отказать. Вообще, если есть сомнения, лучше сразу нести его специалистам, а не пытаться что-то сделать самостоятельно. Посмотрите тему про ремонт HDD - там подобные действия должны разбираться.
Я не совсем это понял. Ведь смысл постоянного мониторинга и заключается именно в том - чтобы вовремя отследить, когда необходимо предпринимать срочные меры. Мой пример очень показателен- вчера здоровье - 100, сегодня -9!
И если я буду проверять Викторией каждый диск хотя бы раз в неделю, даже быстрой проверкой, я не отслежу такой скачок!
Например: Скачок был во вторник, а в воскресенье запланирована проверка. Так диск до восресенья сдохнет несколько раз. Разве я не прав?
Или Виктория уже предоставляет сегодня такую возможность-постоянного мониторинга.
Если нет, то может быть Вы посоветуете наиболее безопасную на Ваш взгляд программу для этой цели?
---------------------------------
3)Все-таки я хотел бы разобраться с установкой значения Timeout.
При превышении устанавливаемого здесь значения - блок признается дефектным.
Но хотелось бы понять алгоритм установки этих пресетов. Поясните, пожалуйста. Какие значения для каких ситуаций нужно устанавливать.
По умолчанию установлено значение 10000 ms.
Нужно ли его менять и в каких случаях?
---------------------------------
4) И последний вопрос касается результатов моего тестирования.
Что все-таки означает мой результ:
187 атрибут - Нескорректированные ECC кодом ошибки - 2441 (красным цветом!)
Что это такое и что мне делать?
-------------------------------
Еще раз огромное спасибо.
В 1948 году Клод Шеннон опубликовал свою знаменитую работу о передаче информации, в которой, помимо прочего, была сформулирована теорема о передаче информации по каналу с помехами. После публикации, было разработано немало алгоритмов исправления ошибок с помощью некоторого увеличения объема передаваемых данных, но одним из часто встречающихся семейств алгоритмов, являются алгоритмы, основанные на коде с малой плотностью проверок на четность (Low-density parity-check code, LDPC-code, низкоплотностный код), получившие сейчас распространение за счет простоты реализации.
LDPC был впервые представлен миру в стенах MIT Робертом Греем Галлагером (Robert Gray Gallager), выдающимся специалистом в области коммуникационных сетей. Произошло это в 1960 году, и LDPC опередил свое время. Компьютеры на вакуумных лампах, распространенные в то время, редко обладали мощностью достаточной, для эффективной работы с LDPC. Компьютер, способный обрабатывать такие данные в реальном времени, в те годы занимал площадь почти в 200 квадратных метров, и это автоматически делало все алгоритмы, основанные на LDPC экономически невыгодными. Поэтому, на протяжении почти 40 лет использовались более простые коды, а LDPC оставался скорее изящным теоретическим построением.
В середине 90-х, инженеры, работающие над алгоритмами спутниковой передачи цифрового телевидения, «стряхнули пыль» с LDPC и стали его использовать, поскольку компьютеры к тому времени стали и мощней, и меньше. К началу 2000-х годов, LDPC получает повсеместное распространение, поскольку он позволяет с большой эффективностью исправлять ошибки при высокоскоростной передаче данных в условиях высоких помех (например при сильных электромагнитных наводках). Так же распространению способствовало появление специализированных систем на чипах, использующихся в WiFi технике, жестких дисках, контроллерах SCSI и т.д., такие SoC оптимизируются под задачи, и для них вычисления, связанные с LDPC вообще не представляют проблемы. В 2003 году LDPC-код, вытеснил технологию турбо-кода, и стал частью стандарта спутниковой передачи данных для цифрового телевидения DVB-S2. Аналогичная замена произошла и в стандарте DVB-T2 для цифрового «эфирного» телевидения.
Стоит сказать, что на базе LDPC строятся очень разные решения, нет «единственно правильной» эталонной реализации. Часто решения, основанные на LDPC несовместимы между собой и код, разработанный, например, для спутникового телевидения, не может быть портирован и использован в жестких дисках. Хотя чаще всего, объединение усилий инженеров разных областей дает массу преимуществ, и LDPC «в целом» является технологией не запатентованной, разные ноу-хау и проприетарные технологии вместе с корпоративными интересами встают на пути. Чаще всего, подобное сотрудничество возможно только в пределах одной компании. В качестве примера можно привести решение для канала чтения HDD от LSI под названием TrueStore®, которое компания предлагает на протяжении уже 3 лет. После приобретения компании SandForce, инженеры LSI стали работать над алгоритмами исправления ошибок SHIELD™ для SSD контроллеров (основанными на LDPC), не существовало портов алгоритмов для работы с SSD, но знания инженерной команды, работавшей над решениями для HDD очень помогли в разработке новых алгоритмов.
Тут, разумеется, у большинства читателей возникнет вопрос: чем алгоритмы, каждый алгоритм LDPC отличается от остальных? Большинство решений LDPC начинаются как декодеры с жестким решением, то есть такой декодер работает с жестко ограниченным набором данных (чаще всего 0 и 1) и использует код коррекции ошибок при малейших отклонениях от нормы. Такое решение, конечно, позволяет эффективно обнаруживать ошибки в передаваемых данных и исправлять их, но в случае высокого уровня ошибок, что иногда случается при работе с SSD, такие алгоритмы перестают справляться с ними. Как вы помните из наших предыдущих статей, любая флеш-память подвержена росту количества ошибок в процессе эксплуатации. Этот неизбежный процесс стоит учитыавть при разработке алгоритмов корреции ошибок для SSD накопителей. Что же делать в случае роста числа ошибок?
Тут на помощь приходят LDPC с мягким решением, являющиеся по сути «более аналоговыми». Подобные алгоритмы «смотрят» глубже, чем «жесткие», и, обладают большим набором возможностей. Примером самого простого такого решения может быть попытка прочитать данные снова, используя другое напряжение, так же как мы часто просим собеседника повторить фразу погромче. Продолжая метафоры с общением людей, можно привести пример более сложных алгоритмов коррекции. Представьте, что вы общаетесь на английском с человеком, говорящим с сильнейшим акцентом. В данном случае сильный акцент выступает в роли помехи. Ваш собеседник произнес некую длинную фразу, которую вы не поняли. В роли LDPC с мягким решением в данном случае будут выступать несколько коротких наводящих вопросов, которые вы можете задать и прояснить весь смысл фразы, которую вы изначально не поняли. Подобные мягкие решения часто используют так же сложные статистические алгоритмы, позволяющие исключить ложнопозитивные срабатывания. В общем, как вы уже поняли, такие решения заметно сложней в реализации, но они чаще всего показывают куда лучшие результаты по сравнению с «жексткими».
В 2013 году, на саммите, посвященном флэш-памяти, проходившем в Санта-Кларе, Калифорния, LSI представили свою технологию расширенной коррекции ошибок SHIELD. Комбинируя подходы с мягким и жестким решением, DSP SHIELD предлагает ряд уникальных оптимизаций для будущих технологий Flash-памяти. Например, технология Adaptive Code Rate, позволяет менять объем, отведенный под ECC так, чтоб он занимал как можно меньше места изначально, и динамически увеличивался по мере неизбежного роста количества ошибок, характерных для SSD.
Как видите, различные решения LDPC работают очень по-разному, и предлагают разные фунции и возможности, от которых во многом будет зависеть и качество работы финального продукта.
Читайте также: