Available reserved space ssd что это

Что означает «0xAA»: Available Reserved Space? Допустимые значения атрибута «Available Reserved Space» отличаются для различных производителей жестких дисков WD (Western Digital), Samsung, Seagate, HGST (Hitachi), Toshiba.

Актуально для ОС: Windows 10, Windows 8.1, Windows Server 2012, Windows 8, Windows Home Server 2011, Windows 7 (Seven), Windows Small Business Server, Windows Server 2008, Windows Home Server, Windows Vista, Windows XP, Windows 2000, Windows NT.

Заключение

Контроллеры накопителей — сложные устройства, которые управляют не менее сложными процессами, которые проходят внутри твердотельных накопителей. Мы рассмотрели только самые интересные процессы в общих чертах.

Если вам хочется больше погрузиться в особенности работы с NVMe, рекомендуем статью про пространства имен NVMe.

Привет, Гиктаймс! Многие производители SSD советуют оставлять неразмеченную область или определенное свободное пространство на твердотельных накопителях для улучшения производительности. Постараемся разобраться, нужна ли вообще резервная область SSD, и как она влияет на производительность накопителей. По традиции все подробности под катом.

Способ 2: Восстановите удаленные данные диска

В случае возникновения SMART ошибки не всегда требуется восстановление данных с диска. В случае ошибки рекомендуется незамедлительно создать копию важных данных, так как диск может выйти из строя в любой момент. Но бывают ошибки при которых скопировать данные уже не представляется возможным. В таком случае можно использовать программу для восстановления данных жесткого диска - Hetman Partition Recovery.

По умолчанию, пользователю будет предложено воспользоваться Мастером восстановления файлов. Нажав кнопку «Далее», программа предложит выбрать диск, с которого необходимо восстановить файлы.
Дважды кликните на сбойном диске и выберите необходимый тип анализа. Выбираем «Полный анализ» и ждем завершения процесса сканирования диска.
После окончания процесса сканирования вам будут предоставлены файлы для восстановления. Выделите нужные файлы и нажмите кнопку «Восстановить».
Выберите один из предложенных способов сохранения файлов. Не сохраняйте восстановленные файлы на диск с ошибкой «0xAA Available Reserved Space».

Перепрошивка

О прошивке твердотельных накопителей задумываются нечасто. В лучшем случае после покупки «накатывают» свежую версию и забывают до конца жизни накопителя.

Как бы то ни было, обновления прошивки редко приносят какие-то значительные и заметные для пользователя нововведения. Прошивка, как и любое другое программное обеспечение, может содержать ошибки, в том числе критические. К счастью, это происходит редко, а потому нет надобности постоянно поддерживать актуальность прошивок на всех используемых накопителях.

Хотя NVMe можно перепрошить через команды fw-download и fw-commit, чаще всего обновление прошивки производится через утилиты, предоставляемые производителем накопителя. Во избежание потенциально деструктивных действий мы не будем публиковать точные команды, а порекомендуем обратиться к официальной инструкции от производителя.

Балансировка износа

В каком-то смысле производитель накопителей обманывает нас дважды. Первый раз использует десятичные приставки вместо двоичных: 480 ГБ — это 447 ГиБ. А второй раз, когда фактический объем накопителя больше, чем доступно пользователю. Часть объема зарезервирована производителем для внутренних нужд контроллера. Такой резерв называется запасной областью (spare).

Таким образом, у контроллера всегда есть немного свободного пространства, которое может быть использовано для внутренних процессов. Хотя точных данных нет, в различных источниках утверждается, что для контроллера резервируется от 7 до 28 % объема накопителя.

Увеличение объема зарезервированной области уменьшает доступный объем, но чаще всего повышает производительность диска. Для увеличения spare-области достаточно оставить часть накопителя неразмеченным. Однако если хочется экстрима и сделать все «по уму», то можно уменьшить объем видимого пользователю пространства через ключ -N утилиты hdparm.

Как бы то ни было, вернуть зарезервированную производителем область в собственное пользование не получится.

Процесс «сбора мусора». Источник
Помимо балансирования износа, в контроллерах в фоновом режиме часто проходит процесс «‎сбора мусора» (garbage collection). В ходе него с нескольких блоков собираются актуальные страницы и помещаются в один блок. Затем исходные блоки очищаются, так как в них не осталось страниц с данным.

Важно отметить, что сборщик мусора занимается перекладыванием данных в хранилище, чтобы было как можно больше чистых блоков. При этом он не может понять, что на файловой системе какой-то файл отмечен удаленным, так как контроллер накопителя не умеет работать в терминах файловых систем.

Для решения этой проблемы в каждом из протоколов есть команда, позволяющая уведомить контроллер об удалении файла. Для NVMe — это deallocate, для SATA — TRIM, а для SCSI — unmap. Суть каждой их этих команд одинакова: пометить страницы с удаленным файлом как «грязные».

Контроллеру приходится постоянно беспокоиться о состоянии страниц хранилища. При этом напрашивается очевидная оптимизация: если операционная система пытается считать данные со страниц, на которых нет данных, то вместо операции чтения можно просто генерировать необходимое количество нулей.

Это легко подтверждается с помощью эксперимента. Проводим Secure Erase для накопителя и запускаем тесты на случайное чтение с глубиной очереди 64. Затем «забиваем» накопитель с помощью последовательной записи, желательно дважды. И повторяем тесты.

Размер блока	Чистый	Забитый
4M	3400 MiB/s	3376 MiB/s
8M	3399 MiB/s	3336 MiB/s

В наших тестах использовался SSD-накопитель Micron 7300 1.92 TB, подключенный по PCIe 3.0 x4. Третья версия PCI Express по четырем линиям способна пропускать 3940 МБ/с или 3757 МиБ/с. Мы, конечно, не достигли предела, но надо полагать, это из-за накладных расходов на протокол NVMe. Тем не менее, видно, что чтение с диска без данных «упирается» в предел 3400 МиБ/с. После заполнения диска на 15% результаты тестов стали хуже.

Несмотря на то, что контроллер накопителя всегда пытается сделать как лучше, иногда системному администратору стоит взглянуть на показатели диска своими глазами.

Способ 4: Снизьте температуру диска

Иногда, причиной возникновения "S M A R T" ошибки может быть превышение максимально допустимой температуры работы диска. Такая ошибка может быть устранена путём улучшения вентиляции компьютера. Во-первых, проверьте оборудован ли ваш компьютер достаточной вентиляцией и все ли вентиляторы исправны.

Если вами обнаружена и устранена проблема с вентиляцией, после чего температура работы диска снизилась до нормального уровня, то SMART ошибка может больше не возникнуть.

Способ 1: Прекратите использование сбойного HDD

Необходимо побеспокоится о сохранности ваших данных, создать резервную копию или перенести файлы на другой носитель информации. Одновременно с сохранностью ваших данных, необходимо предпринять действия по замене жесткого диска. Жесткий диск, на котором были определены S.M.A.R.T. ошибки нельзя использовать – даже если он полностью не выйдет из строя он может частично повредить ваши данные.

Конечно же, жесткий диск может выйти из строя и без предупреждений S.M.A.R.T. Но данная технология даёт вам преимущество предупреждая о скором выходе диска из строя.

Показатели

Вне зависимости от интерфейса накопителя SSD имеют набор показателей состояния, которые могут быть считаны системным администратором. Для SATA-накопителей используются показатели S.M.A.R.T., которые не стандартизированы. Отсутствие стандарта приводит к появлению различных трактовок одного показателя.

Рассмотрим вывод утилиты smartctl на примере Intel S4510.

Для нашего диска интересны следующие параметры:

С точки зрения износа исправного диска интересен показатель 233 Media_Wearout_Indicator, так как при достижении числа 1023 накопитель программно заблокируется и будет доступен в режиме только для чтения.

Показатели S.M.A.R.T — это особенность протокола SATA. Для NVMe-накопителей есть NVMe log, который также считывается программой smartctl. Аналогичный вывод можно получить с помощью команды nvme smart-log.

В выводе NVMe накопителя меньше непонятных показателей, но все равно есть место разночтениям. Легко предположить, что параметр percentage_used отвечает за объем занятого пользователем пространства на диске, но это не так. Этот параметр эквивалентен Media_Wearout_Indicator и обозначает износ накопителя.

Не стоит забывать, что предоставляемые показатели и поведение контроллера реализуется прошивкой, которая может быть обновлена.

Как изменить размер резервной области SSD?

Обычно производители дают такую возможность в своих фирменных утилитах для твердотельных накопителей. У OCZ это реализовано очень просто и удобно при помощи специальной утилиты SSD Guru — она не только следит за состоянием SSD, но и мониторит SMART, включает команду TRIM, проверяет автоматически наличие новых прошивок — в общем, незаменимый помощник для пользователей наших накопителей. С самой утилитой мы вас уже знакомили, так что обратим внимание только на ту вкладку, которая нужна в нашем случае.

Переходим во вкладку Tuner и получаем доступ не только к активации Trim, но и настройке over provisioning прямо на лету: достаточно перетащить ползунок и самостоятельно выбрать размер резервной области. В нашем случае, например, есть возможность увеличить spare area до 134 ГБ — при том, что объем самого накопителя составляет 480 ГБ. Получается почти 28 %.

Если же вы хотите сделать это самостоятельно, просто скройте от операционной системы часть накопителя — оставьте на нем неразмеченное пространство.

Способ 5: Произведите дефрагментацию жесткого диска

Откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с ошибкой « 0xAA Available Reserved Space». Выберите Свойства / Сервис / Оптимизировать в разделе Оптимизация и дефрагментация диска. Выберите диск, который необходимо оптимизировать и кликните Оптимизировать.

Примечание. В Windows 10 дефрагментацию и оптимизацию диска можно настроить таким образом, что она будет осуществляться автоматически.

Немного о главном

В прошлый раз мы рассказывали вам о том, как работает флэш-память. Принцип ее работы визуально отлично характеризует картинка ниже. Блок (X) удалось очистить для последующей записи благодаря наличию свободного блока (Y) — новые страницы были записаны в блок (X), а затем в (Y), после чего и произошло стирание блока (X).

Это лишь один из примеров работы флэш-памяти. Суть в том, что когда на SSD много свободного пространства, то и таких блоков, как (Y), становится много. Хотя скорость работы самого контроллера является константой, производительность самого накопителя может изменяться. Чем меньше свободных блоков у флэш-памяти, тем больше процессов ей приходится выполнять, прежде чем данные будут записаны, а значит и скорость работы накопителя будет страдать. К примеру, при заполнении SSD на 98 %, свободных блоков остается все меньше и меньше. Вопрос один: что произойдет, если во время такой загруженности накопителя вы начнете записывать большие объемы данных? Здесь-то нам и пригодится резервная область SSD.

Износостойкость

Выравнивание износа. Источник
Современные накопители построены на базе ячеек TLC, ресурс которых в разы меньше, чем у накопителей с ячейками SLC и MLC. Если какая-то программа в ОС будет постоянно перезаписывать маленький файл, а контроллер будет «наивно» обновлять одну страницу данных, то вскоре блок с этой страницей исчерпает ресурс. Исчерпание ресурса будет отображено в показателях накопителя, что неизбежно приведет к беспокойству системного администратора.

Во избежание сильного износа единичных блоков накопителя применяются технологии выравнивания износа (Wear Leveling). При этом обновление данных выполняется без очистки страницы накопителя и выглядит так:

Чтение данных из страницы в буфер.
Изменение данных в странице.
Запись обновленных данных из буфера в «чистую» страницу.
Старая страница помечается как «грязная».

Способ 3: Просканируйте диск на наличие «битых» секторов

Для этого, откройте папку «Этот компьютер» и кликните правой кнопкой мышки на диске с SMART ошибкой.
Выберите Свойства / Сервис / Проверить в разделе Проверка диска на наличия ошибок. [скриншот]

В результате сканирования обнаруженные на диске ошибки могут быть исправлены.

Способ 6: Ошибка «Available Reserved Space» для SSD диска

Даже если у вас не претензий к работе SSD диска, его работоспособность постепенно снижается. Причиной этому служит факт того, что ячейки памяти SSD диска имеют ограниченное количество циклов перезаписи. Функция износостойкости минимизирует данный эффект, но не устраняет его полностью.

SSD диски имеют свои специфические SMART атрибуты, которые сигнализируют о состоянии ячеек памяти диска. Например, "209 Remaining Drive Life", "231 SSD life left" и т.д. Данные ошибки могут возникнуть в случае снижения работоспособности ячеек, и это означает, что сохранённая в них информация может быть повреждена или утеряна.

Ячейки SSD диска в случае выхода из строя не восстанавливаются и не могут быть заменены.

Особенности записи

Блоки и страницы в NAND-памяти. Источник
Хранилище твердотельного накопителя состоит из множества полевых транзисторов, соединенных друг с другом. При таком подходе чтение и запись выполняются страницами данных, размер которых обычно 4 КиБ. Таким образом, изменение одного бита на диске приводит к необходимости перезаписать всю страницу данных. Эта проблема называется усилением записи (Write Amplification).

Кроме того, твердотельные накопители не могут обновить данные в странице. Обновление страницы производится в четыре шага:

Чтение данных из страницы в буфер.
Изменение данных в странице.
Очистка страницы данных.
Запись обновленных данных из буфера.

Берегите свои накопители!

Безусловно, даже без манипуляций с резервной областью твердотельный накопитель прослужит вам долго: благо большинство мифов о недолговечности SSD удалось развеять. По возможности накопители, разумеется, стоит беречь, но только если это не ограничивает ваши потребности. Самый простой способ — оставлять свободным от 10 до 20 % доступного вам объема SSD: именно вам, а не контроллеру.

Увидев первый раз атрибуты SMART для SSD диска в Synology я немного растерялся, так как они сильно отличаются от атрибутов для HDD дисков. Я разобрался в этих отличиях и решил поделиться с другими.

Synology атрибуты SMART для SSD диска

Почему важно знать атрибуты SMART? Все просто, SMART был придуман для мониторинга состояния диска, не важно HDD или SSD. SMART позволяет заранее узнать о приближении повреждения диска, что бы вовремя успеть перенести с него данные или заменить.

Я использую эти диски для кэша чтения и записи. Поэтому потеря данных с этих SSD дисков приведет к потере всего моего тома размером 8Т на данный момент, а в будущем я планирую расширяться и не хотелось бы потерять все эти данные.

И так, перед вами скриншоты атрибутов SMART для SSD диска в Synology NAS.

Critical Warning – критические ошибки в работе накопителя (от отображаемого значения определяется характер сбоя).
Temperature – текущая температура твердотельного накопителя.
Available Spare – текущий оставшийся объем резервной области, используемой для подмены вышедших из строя ячеек памяти
Available Spare Threshold – это значение параметра Available Spare, по достижении которого состояние накопителя считается критическим.
Percentage Used – уровень износа накопителя в процентах (%).
Data Units Read – количество прочитанных с массива флеш-памяти блоков данных (один блок соответствует 512 байт данных).
Data Units Written – количество записанных на массив флеш-памяти блоков данных (один блок соответствует 512 байт данных).
Host Read Commands – количество выполненных по интерфейсу операций чтения данных (изменение на единицу соответствует 1 Мбайт данных).
Host Write Commands – количество выполненных по интерфейсу операций записи данных (изменение на единицу соответствует 1 Мбайт данных).
Controller Busy Time – время в минутах, в течение которого контроллер был занят обслуживанием запросов со стороны системы.
Power Cicles – количества циклов включения/выключения: 35.
Power On Hours – учет наработанного времени, в нашем случае это 15 часов.
Unsafe Shutdowns – количество небезопасных отключений питания: 22.
Warning Composite Temperature – время работы (в минутах) при высокой температуре.
Critical Composite Temperature – время работы (в минутах) при критической температуре.

На данный момент для меня интересны следующие показатели, это Available Spare и Available Spare Threshold. Если первое приблизится к пороговому значению, значит диск скоро выйдет из строя и пора задуматься о его замене. Так же интересен атрибут Percentage Used думаю он напрямую завит от первых двух. Ну а если увидите Critical Warning следует сразу задумать о замене.

Пишите ваши комментарии, если вам есть, что добавить. Буду рад узнать еще больше.

Способ 8: Приобретите новый жесткий диск

Целесообразен ли ремонт HDD?

Важно понимать, что любой из способов устранения SMART ошибки – это самообман. Невозможно полностью устранить причину возникновения ошибки, так как основной причиной её возникновения часто является физический износ механизма жесткого диска.

Для устранения или замены неправильно работающих составляющих жесткого диска, можно обратится в сервисный центр специальной лабораторией для работы с жесткими дисками.

Но стоимость работы в таком случае будет выше стоимости нового устройства. Поэтому, ремонт имеет смысл делать только в случае необходимости восстановления данных с уже неработоспособного диска.

Как выбрать новый накопитель?

Если вы столкнулись со SMART ошибкой жесткого диска то, приобретение нового диска – это только вопрос времени. То, какой жесткий диск нужен вам зависит от вашего стиля работы за компьютером, а также цели с которой его используют.

Большинство из нас знает, что существует отчет SMART, показывающий, насколько исправен носитель. Однако, например, я далеко не всегда точно знаю, что именно обозначает та или иная метрика в отчете. Предлагаю делиться информацией и замечаниями. Начну с базового.

В отчетах содержатся данные
Value - текущее значение метрики
Threshold - минимальное пороговое значения метрики
Worst - самое худшее значение метрики за все время работы накопителя
Raw - абсолютное значение метрики
Type - некоторые из программ в данном необязательном поле отображают информацию из флажков атрибутов или признаки их критичности (Critical или Pre-Fail , отражающих ухудшение характеристик оборудования, и Old-age для атрибутов, отражающих выработку ресурса);

Для анализа состояния накопителя, пожалуй самым важным значением атрибута является Value - условное число (обычно от 0 до 100 или до 253), заданное производителем. Значение Value изначально установлено на максимум при производстве накопителя и уменьшается в случае ухудшения его параметров. Для каждого атрибута существует пороговое значение, при достижения которого, производитель не гарантирует его работоспособность - поле Threshold. Если значение Value приближается или становится меньше значения Threshold, - накопитель пора менять.

Ниже - снял отчет smartctl с ноутбука жены (Hitachi/HGST Travelstar 5K750).

001 ( 1h ) Raw Read Error Rate - абсолютное значение ошибок считывания. Существует некоторые отличия в формировании значения данного атрибута разными производителями. Из практики могу сказать, что накопители Seagate могут иметь гигантское значение RAW этого атрибута, реально будучи в хорошем состоянии, а накопители Western Digital могут иметь его нулевым, имея критические показатели по другим характеристикам. Некоторые модели вообще не поддерживают данный атрибут.

002 ( 02h ) Throughput Performance - усредненная производительность жесткого диска. Редко встречающийся атрибут.

003 ( 3h ) Spin Up Time - Среднее время раскрутки шпинделя диска от 0 RPM до рабочей скорости. Для SSD дисков не поддерживается.

004 ( 4h ) Start/Stop Count - Количество циклов запуск/останов шпинделя.

005 ( 5h ) Reallocated Sector Count - Количество переназначенных ( перераспределенных) секторов . Современные накопители имеют резервную область поверхности для использования ее объема в случае ухудшения характеристик блоков из основной зоны. Если микропрограмма накопителя обнаруживает ошибки с записи/чтения какого-либо блока рабочей поверхности, то запускается механизм, обеспечивающий переадресацию обращений к дефектному блоку ( сектору ), на блок из резервной части. Он автоматически перемещает его данные в резервную область, а данный блок помечается как "переназначенный". Часто этот процесс называют "remapping", или "automatic defect reassignment". Процедура переназначения сбойных секторов на резервные, выполняется автоматически внутренней микропрограммой накопителя, и для пользователя (операционной системы) она невидима. Сам факт переназначения и количество переназначенных секторов доступны только из журналов SMART. Поле абсолютного значения атрибута Raw Value содержит общее количество переназначенных секторов. Нормализованное значение Value отражает процент допустимого количества дефектных блоков. При исчерпании резервной области, переназначение становится невозможным и диск подлежит замене. Даже некритическое, но большое значение этого поля, может привести к снижению скорости обмена данными, поскольку накопитель выполняет дополнительные операции установки головок на дорожки резервной области, которая обычно находится в конце рабочей поверхности диска.

007 ( 7h ) Seek Error Rate - Частота появления ошибок позиционирования блока магнитных головок (БМГ) . Дисковые накопители контролирует правильность установки головок на требуемую дорожку поверхности. В случае, когда установка выполнилась неверно, фиксируется ошибка и операция повторяется. На практике, большое количество ошибок позиционирования может быть вызвано не только проблемами оборудования, но и влиянием внешних факторов – не соответствующим температурным режимом или вибрацией.

008 ( 8h ) Seek Time Performance - средняя скорость позиционирования магнитных головок. Если значение атрибута уменьшается (замедление позиционирования), то велика вероятность проблем с механической частью привода головок.

009 (09h) Power-On Hours (POH) Количество рабочих часов - количество часов, когда диск находился во включенном состоянии за весь срок с момента производства, в виде целочисленного значения в часах. Иногда встречаются модели накопителей, в которых внутреннее значение данного атрибута сохраняется в виде количества рабочих минут или секунд, а не часов. Достижение порогового значения данного атрибута означает выработку ресурса, заданного производителем ( MTBF - Mean Time Between Failures

010 ( 0Ah ) Spin Retry Count - Количество повторных попыток старта шпинделя. После включения питания, накопитель раскручивает диски и контролирует достижение рабочей скорости вращения, заданной производителем для данной модели . Если за отведенное контрольное время рабочая скорость не достигнута, увеличивается значение данного атрибута и выполняется повторная раскрутка двигателя.

011 ( 0B ) Recalibration Retries - атрибут отражает количество повторных рекалибровок, в случае, если первая попытка была неудачной. Если значение атрибута увеличивается, то велика вероятность проблем с механической частью накопителя. Кроме того, увеличение абсолютного значения данного атрибута может быть вызвано тем, что процедура рекалибровки используется внутренней микропрограммой накопителя для коррекции других типов ошибок.

012 ( 0Ch ) Device Power Cycle Count - абсолютное значение Raw Value указывает на количество циклов включения/выключения питания накопителя за весь период эксплуатации. Нормализованное значение Value обычно не изменяется и равно 100.

013 ( 0Dh ) - Soft Read Error Rate - Количество программных сбоев - совокупное количество программных сбоев. Нормализованное значение: начиная со 100, отображает процент оставшегося допустимого нарастающего количества программных сбоев.

100 ( 64h ) Erase/Program Cycles - количество циклов стирания –записи перепрограммируемой памяти (flash) для SSD-дисков. Количество таких циклов ограниченно и зависит от микросхем постоянной перезаписываемой памяти, используемых в данной модели SSD.

103 ( 67h ) Translation Table Rebuild - количество событий, связанных с разрушением внутренних таблиц транслятора и его перестроением.

170 ( AAh )Reserved Block Count - количество доступных резервных блоков для переназначения сбойных секторов (см. атрибут E8h).

171 ( ABh ) Program Fail Count - ошибки записи в перепрограммируемую память SSD

172 ( ACh ) Erase Fail Count – ошибки стирания flash-памяти SSD. Процесс записи в перезаписываемую постоянную память состоит из двух частей - стирания и записи. Процедура стирания всегда выполняется перед записью данных.

173 ( ADh ) Wear Leveller Worst Case Erase Count - максимально допустимое количество операций стирания для единичного блока SSD-диска.

174 ( AEh) Unexpected Power Loss - непредвиденное отключение питания для SSD . Также этот показатель называется «Количество аварийных выключений» в терминологии жестких дисков с магнитными носителями. Абсолютное значение Raw Value: совокупное количество нештатных выключений за весь срок использования устройства.

175 ( AFh ) Program Fail Count– данный атрибут используется в SSD-накопителях производства Intel и отображает информацию о сбоях защиты от отключения питания SSD-дисков. Результаты последнего теста в виде количества микросекунд до разряда конденсатора, фиксируется на максимальном значении. Также записывается количество минут после последнего теста и общее количество тестов за весь срок использования устройства. Необработанное значение Raw Value:
Байты 0—1: Результаты последнего теста в виде количества микросекунд до разряда конденсатора,
фиксируется на максимальном значении. Результат теста должен быть в диапазоне
25 - 5 000 000, более низкое значение указывает на определенный код ошибки.
Байты 2—3: количество минут после последнего текста, фиксируется на максимальном значении.
Байты 4—5: количество тестов за весь срок использования устройства, не увеличивается при циклах включения и отключения,
фиксируется на максимальном значении.
Значение Value устанавливается равным 1 при сбое теста, или 11 при тестировании конденсатора в недопустимых температурных условиях; в противном случае устанавливается равным 100.

183 ( B7h ) SATA Downshifts - Количество снижений скорости SATA Необработанное значение: количество случаев, когда из-за ошибок для интерфейса SATA была выбрана пониженная скорость передачи данных ( с 6 Гб/с до 3Гб/с или 1,5Гб/с или с 3Гб/с. До 1.5Гб/с. Очень часто данный атрибут характеризует недостаточное качество электропитания, окисление контактов интерфейсного кабеля, или его неисправность.

184 ( B8h ) End-to-End error Количество обнаруженных сквозных ошибок кэш-памяти ( disk cache). Абсолютное значение: количество обнаруженных и исправленных оборудованием сквозных ошибок.

188 ( BCh ) Command Timeout - количество команд, прерванных по таймауту.

189 ( BDh ) High Fly Writes - количество событий, связанных с ошибками, зафиксированными монитором контроля высоты полета Fly Height Monitor, когда головки записи находятся в положении, не гарантирующем нормальное выполнение операции. Если высота полета головки над магнитной поверхностью, даже на короткое время превысит оптимальную, то записанные ею данные, в дальнейшем, могут не прочитаться. Современные накопители используют специально разработанную технологию контроля высоты полета головок, позволяющую не выполнять запись данных при неоптимальной высоте. В счетчик данного атрибута добавляется единица, а запись выполняется после установки нормальной высоты полета. Повышенное значение данного атрибута может быть вызвано внешними ударами или вибрациями, ненормальной температурой, ухудшением характеристик магнитной поверхности или головки.

190 ( BEh ) Airflow Temperature температура воздушного потока (корпус). Значение Raw Value: статистические данные по температуре корпуса .

Байты 0—1: текущая температура корпуса в градусах по Цельсию;
байт 2: недавняя минимальная температура корпуса в градусах по Цельсию;
байт 3: недавняя максимальная температура корпуса в градусах по Цельсию;
байты 4—5: счетчик превышений температуры. Количество случаев, когда зафиксированная температура
превышала максимальную допустимую рабочую температуру накопителя.

191 ( BFh ) G-sense error rate - количество ошибок, возникающих в результате ударных нагрузок. Атрибут хранит показания встроенного акселерометра, который фиксирует все удары, толчки, падения и даже неаккуратную установку диска в корпус компьютера. Обычно довольно точно характеризует условия эксплуатации ноутбуков - большое значение атрибута говорит о резких толчках и падениях при работе устройства.

192 ( C0h ) Emergency Retract Cycle Count Количество аварийных выключений (количество нештатных выключений) - совокупное количество событий аварийного (нештатного) отключения питания за весь срок использования устройства. Для SSD дисков под «нештатным выключением» понимается отключение питания устройства без предварительной выдачи команды STANDBY IMMEDIATE.

194 ( C2h ) HDA Temperature - температура самого накопителя (HDA - Hard Disk Assembly). В данном атрибуте хранятся показания встроенного температурного датчика, которым обычно служит одна из магнитных головок (как правило - нижняя ). У SSD дисков термодатчик размещается внутри корпуса на печатной плате. Данные, записанные в полях атрибута отображают текущую, минимальную и максимальную температуру. Поле Worst показывает наихудшую, достигнутую за время работы накопителя, температуру (можно установить факт перегрева и его степень), Raw Value - текущую температуру. Некоторые модели накопителей могут поддерживать атрибут 205 ( CDh ) Thermal asperity rate (TAR), фиксирующий количество опасных перепадов температуры.

195 ( C3h ) Hardware ECC Recovered - количество ошибок считывания, исправленных оборудованием накопителя с применением кода коррекции ошибок. Подобные ошибки не требуют повторного считывания сектора, и не приводят к потере скорости обмена данными, но большое их количество говорит об ухудшении параметров тракта считывания.

196 ( C4h ) Reallocation Event Count - Число событий переназначения сбойных секторов. В поле raw value данного атрибута хранится общее число попыток переноса данных из нестабильных секторов в резервную область. Учитываются как успешные, так и неуспешные попытки.

197 ( C5 ) Current Pending Sector Count - Текущее количество нестабильных секторов. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает кандидатами на переназначение в резервную область . Если в дальнейшем какой-то из этих секторов будет прочитан успешно, то он исключается из списка кандидатов. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить данные и перенести их в резервную область, а сам сектор пометить как переназначенный (remapped).

198 ( C6 ) Uncorrectable Sector Count - Счетчик некорректируемых ошибок, т.е , счетчик ошибок, которые не были исправлены внутренними средствами коррекции оборудования накопителя. Это означает, что такие ошибки проявляются как классические сбойные блоки файловой системы ( Bad Block ). Причиной подобных сбоев диска, может быть неисправность отдельных элементов или отсутствие свободных секторов в резервной области диска, когда возникла необходимость переназначения.

199 ( C7h ) UltraDMA CRC Error Rate - Количество ошибок при передаче данных в режиме прямого доступа к памяти, обнаруженных средствами циклического избыточного кода (англ. Cyclic redundancy check, CRC). Аппаратные средства контроля передачи данных из накопителя в оперативную память обнаружили ошибку контрольной суммы и исправили ее “на лету”, если ошибка исправимая. В данном случае алгоритм обычной работы диска не изменяется. В случае же неисправимой ошибки, процедура ее обработки выполняется системой. Обычно, данный атрибут содержит счетчик любых видов ошибок CRC. Нередко этот тип ошибки связан не столько с оборудованием накопителя, сколько с неисправным интерфейсным кабелем, окислившимися контактами, некачественным электропитанием, разгоном частоты шины PCI, перегревом микросхем чипсета материнской платы и т.п.

200 ( C8h ) Write Error Rate (Multi Zone Error Rate) - ошибки записи данных.

232 ( E8h ) Total Count of Write Sectors Для SSD-дисков - количество записанных секторов. Значение Raw Value увеличивается на 1 на каждые 65 536 секторов (32 МБ), записываемых системой. Для SSD Intel - Intel SSD Available Reserved Space - процент доступной резервной области, используемой для переназначения дефектных блоков.

233 ( E9h ) Power-On Hours - Время работы накопителя. Для SSD-дисков этот атрибут интерпретируется как Remaining Life - указатель износа носителя. Количество циклов работы носителя NAND. Линейно снижается от 100 до 1 по мере увеличения среднего количества циклов стирания от 0 до максимального. Нормализованное значение перестанет уменьшаться после достижения 1, но, по всей вероятности, устройство выдержит значительный дополнительный износ.

241 ( F1h) Total LBAs Written - Общее количество записанных секторов LBA. Значение Raw Value : совокупное количество секторов, записанных системой. Значение увеличивается на 1 на каждые 65 536 секторов (32 МБ), записываемых системой.

242 ( F2h ) Total LBAs Read - Общее количество прочитанных секторов LBA. Значение Raw Value увеличивается на 1 на каждые 65 536 секторов (32 МБ), прочитываемых системой.

254 ( FEh ) Free Fall Event Count - количество событий ускорения свободного падения диска за время эксплуатации ( сколько раз диск падал ).

В прошлых частях цикла мы рассказывали про историю накопителей, о применяемых интерфейсах и форм-факторах, а также про организацию на физическом уровне. Пятая же часть посвящена «мозгу» современного твердотельного накопителя.

Контроллер современного накопителя — маленький компьютер, который принимает стандартизированные команды и выполняет соответствующие действия с подконтрольным ему хранилищем. При этом внутреннее устройство контроллера может быть любым.

У Intel есть накопитель P4618 6.4 TB, который представляется системе как два накопителя по 3.2 TB. Аналогичное встречается и среди жестких дисков. Накопители Seagate с технологией MACH.2 — это два диска, «заключенные» в одном корпусе и объединенные единым контроллером.

Контроллер — достаточно сложное устройство, которое в зависимости от предназначения диска выполняет различные задачи по управлению данными. Например, базы данных часто требуют от накопителя запись непосредственно в энергонезависимую память, минуя кэш, и в этом случае серверный SATA SSD будет быстрее, чем пользовательский NVMe. Из-за большой вариативности контроллеров не будем вдаваться в детали конкретных устройств, а поговорим об общих принципах работы современного твердотельного накопителя.

Способ 7: Сбросьте ошибку

SMART ошибки можно легко сбросить в BIOS (или UEFI). Но разработчики всех операционных систем категорически не рекомендуют этого делать. Если же для вас не имеют ценности данные на жестком диске, то вывод SMART ошибок можно отключить.

Для этого необходимо сделать следующее:

Перезагрузите компьютер, и с помощью нажатия указанной на загрузочном экране комбинации клавиш (у разных производителей они разные, обычно "F2" или "Del") перейдите в BIOS (или UEFI).
Перейдите в: Аdvanced >SMART settings >SMART self test. Установите значение Disabled.

Примечание: место отключения функции указано ориентировочно, так как в зависимости от версии BIOS или UEFI, место расположения такой настройки может незначительно отличаться.

Способ 1: Прекратите использование сбойного HDD

А что с производительностью?

Для компаний очень важно иметь накопители с большим количеством резервной области, поскольку именно там чаще всего происходят атаки случайными данными. Чем больше блоков резервной области в распоряжении контроллера, тем больше вероятность того, что контроллер сработает верно, и производительность SSD не будет падать даже при большой нагрузке. У OCZ на эти случаи есть отличные корпоративные решения — Z-Drive 6000 NVMe, Toshiba Hawk 4R (THNSN8) и Hawk 4E (THNSN8). 2900 МБ/с на чтение и 1900 МБ/с на запись, емкость до 6,4 ТБ.

Но не будем голословными, лучше покажем, как зависит производительность SSD от объема резервной области при помощи тестов. Для этого возьмем один из накопителей c неоптимизированным под увеличенную резервную область контроллером и будем постепенно увеличивать размер spare area — от 12 % вплоть до 50 %. Последний вариант в домашних условиях, конечно же, исключен, но важно уловить суть.

Сравнивать будем по показателю IOPS — количеству операций ввода и вывода — проще говоря, количеству блоков, которое считывается или записывается на носитель. Соответственно, чем это значение выше, тем лучше. Определяется IOPS как частное скорости и размера блока при выполнении операции. Для начала возьмем SSD со стандартным объемом резервной области (около 7 %). Вот какими показателями он может похвастаться в тестах:

А теперь проведем небольшой опыт — увеличим резервную область до 12 % и вновь замерим IOPS.

Разница пусть и небольшая, но все же видна — IOPS явно увеличился. Что ж, не будем на этом останавливаться, увеличим резервную область до 25 % — четверть накопителя теперь доступна только контроллеру.

Думаем, здесь все понятно без слов. Впрочем, отдавать столько под резервную область явно нецелесообразно, поскольку полезной становятся только 3/4 SSD. И вряд ли кто-то будет повторять подобное в домашних условиях, однако для чистоты эксперимента мы все же это сделаем. Да, увеличим spare area до 50 %.

Изменения в производительности заметны, но уж точно не настолько, чтобы отдавать половину накопителя под резерв. Это попросту нецелесообразно, поскольку рост производительности в данном случае не сможет компенсировать потерянную емкость SSD. Одно ясно точно: размер резервной области действительно влияет на быстродействие накопителя. Если решите повторить такой тест со своими SSD, учитывайте, что результаты могут отличаться в зависимости от контроллера, прошивки и, собственно, производителя и модели самого накопителя.

Помимо производительности, резервная область также снижает износ твердотельных накопителей и продлевает срок их службы. Здесь не нужно проводить какие-либо тесты: очевидно, если выполняется меньше операций чтение/записи, количество записанных данных также уменьшается. Так что чем больше spare area, тем дольше накопитель вам прослужит (но злоупотреблять этим, как мы сказали, не стоит).

Что такое резервная область, и зачем она нужна

На самом деле операционные системы не распознают весь объем памяти твердотельных накопителей. Резервная область SSD или так называемая spare area выделяется по принципу over-provisioning и видна только контроллеру. Чтобы понять, как она работает, полезно рассмотреть, а как же, собственно, измеряется емкость SSD.

Емкость SSD измеряется в гигабайтах (десятичных приставках) и гибибайтах (двоичных приставках). Если в одном гигабайте 1 миллиард байт, то в гибибайте ~ 1,074 x 10 в девятой степени байт. Производители, в том числе OCZ, указывают емкость в гигабайтах, при этом операционная система производит свой расчет в гибибайтах. Из-за этого получается так, что фактически емкость накопителя меньше заявленной.

Вот, например, интересная статистика по одному из накопителей. У него на борту 264 ГиБ NAND, но пользователю из них доступны только 186 ГиБ при заявленных производителем 200 ГБ. Остальная часть SSD используется в качестве резервной области для улучшения производительности и выносливости накопителя.

Как правило, резервная область составляет около 7 % общей емкости NAND. Для расчета реальной емкости SSD в ГиБ необходимо поделить емкость в гигабайтах на 1,073741824. В случае с накопителем на 256 ГБ это будет 238,4 ГиБ. Оставшаяся часть SSD и используется как spare area. Для наглядности еще раз обратимся к тому, как работает флэш-память.

Часто задают вопрос, почему некоторые SSD имеют емкость 120/240/480 ГБ, когда другие 128/256/512 ГБ. В случае с OCZ физический объем данных пар емкостей накопителя одинаков. Разница заключается в объеме резерва для различных моделей: при полных объемах 128/256/512ГБ резерва нет, а на 120/240/480ГБ присутствует резервная область, недоступная пользователю.

Зависимость между усилением записи (Write amplification) и резервной областью хорошо отображена в отчете исследовательской лаборатории IBM:

Как видите, чем больше резервная область, тем меньше усиление записи. Из-за наличия такой зависимости между ними производители и рекомендуют не загружать твердотельный накопитель полностью, а оставлять от 10 % до 20 % свободного места. Для чего же SSD вообще нужна резервная область?

Во-первых, так называемый сброс мусора (garbage collection), который мы разобрали на первой картинке, осуществляется реже за счет того, что операционная система не может получить доступ в резервную область и заполнить свободные блоки памяти — следовательно, контроллер получает доступ к большему количеству блоков памяти. Поэтому SSD всегда имеет свободные блоки «про запас», что немаловажно. Кроме того, если один из блоков памяти выходит из строя, контроллер берет свободный из резервной области. Также spare area влияет на выравнивание износа: если данные будут записываться в один и тот же блок, ресурс накопителя будет истощаться за счет увеличения количества циклов перезаписи блоков. Контроллер распределяет данные равномерно, тем самым выравнивая износ.

Читайте также: