Ssd life remaining что это
В современном мире все большей популярности набирают твердотельные накопители SSD из-за своей очень высокой скорости передачи данных. Однако, при работе с SSD, как и при работе с жестким диском, необходимо уметь анализировать его состояние чтобы не потерять важные данные. SSD накопители поддерживают технологию анализа диска SMART. В этой статье мы рассмотрим, как проверить состояние вашего SSD накопителя опираясь на SMART параметры.
Благодаря компактному размеру SSD накопителей и высочайшей скорости чтения и записи они приобрели всенародную популярность. Ведь просто установив бюджетный твердотельный накопитель можно ускорить работу вашего компьютера в несколько раз. Однако, пользователи, которые используют свой компьютера для работы или хранят важные данные все чаще задаются вопросом: «Сколько раз можно перезаписать SSD накопитель?», «Как мне предвидеть скорый выход SSD накопителя из строя?»
Ответ на первый вопрос сравнительно прост. Обычно, производители твердотельных накопителей закладывают около 3000-5000 циклов перезаписи каждого блока памяти. Таким образом получается, что имея SSD диск объемом 100 Гб, вы сможете записать на него 300 000 ГБ. Естественно в реальности этот показатель немного меньше, но его хватает на несколько лет продуктивной работы.
Ответ на второй вопрос немного сложнее. Для того, чтобы предвидеть, когда именно ваш твердотельный накопитель выйдет из строя нужно уметь анализировать разные параметры вашего диска. И тут нам на помощь приходит технология S.M.A.R.T.
Надёжность SSD и HDD в первый год работы
Самым известным источником данных по надёжности накопителей в практическом использовании остаётся статистика хостера Backblaze, которая периодически обновляется. У них тысячи серверов и девять лет статистики по разным моделям HDD и SSD (в последние годы загрузочные диски серверов перевели на SSD).
В сентябре 2021 года Backblaze впервые сравнила SSD и HDD по надёжности, получилось любопытно.
В целом оказалось, что в начале работы (в среднем до 14 месяцев в данном случае) SSD выходят из строя немножко реже, чем HDD.
Годовая частота сбоев (AFR)
Количество дисков | Средний возраст (месяцев) | Дней работы | Всего сбоев | AFR | |
---|---|---|---|---|---|
SSD | 1666 | 14,2 | 591 501 | 17 | 1,05% |
HDD | 1607 | 52,4 | 3 523 610 | 619 | 6,41% |
Что будет дальше — непонятно. На интервале в несколько лет достоверная статистика пока не собрана. Вполне возможно, что там преимущество SSD будет не таким очевидным, как раз из-за ограниченного ресурса на количество циклов перезаписи.
Атрибут 5: Вышедшие из эксплуатации блоки NAND
Ваш SSD накопитель состоит из блоков памяти, которые имеют определенный срок службы. Однако зачастую некоторые из них выходят из строя раньше, чем предполагалось. Поэтому в каждом NAND-flash устройстве присутствует встроенная функция непрерывной оценки качества блоков NAND. Эта функция анализирует состояние блоков памяти и выводит из эксплуатации те блоки, которые непригодны для дальнейшего использования. Причины могут быть разные. Например, микропрограмма не может стереть блок во время удаления или перемещения данных.
Для того, чтобы проверить количество вышедших из строя блоков памяти достаточно проверить значение SMART атрибута 5. Чем выше будет значение – тем большее количество блоков памяти вышло из строя и соответственно ниже уровень здоровья вашего SSD накопителя.
Купить
Купить за 450 руб.!
(цена указана без НДС)
У каждого SSD есть ресурс на количество циклов перезаписи, то есть объём записанной информации в течение всей жизни. Физика и механика SSD очень сложные, но долговечность накопителя в итоге сводится к простому правилу — чем больше на него пишешь, тем меньше он проживёт.
У одних SSD критический сбой происходит через несколько месяцев, другие работают годами. Это зависит от качества комплектующих, условий эксплуатации и везения. В общем, как у людей.
Срок жизни SSD ограничен, потому что ячейки флеш-памяти NAND выдерживают ограниченное количество циклов перезаписи (циклы P/E, "program / erase"). По мере перехода производителей флеш-памяти с технологии Multi Level Cell (MLC/DLC, 2 бита на ячейку) на Triple Level Cell (TLC, 3 бита), Quad-level cell (QLC, 4 бита) и Penta-level cell (PLC, 5 бит, пока находится в разработке) ресурс P/E уменьшается из-за увеличения сложности производства. Причём уменьшается кратно.
Например, древняя однобитная SLC на этапе анонса технологии NAND выдерживала 100 тысяч циклов перезаписи, двухбитная MLC/DLC — уже 10 тысяч. С увеличением плотности записи и ёмкости накопителей снижается цена гигабайта, но увеличивается сложность и уменьшается ресурс ячеек памяти.
Уменьшение ресурса P/E с увеличением технологической сложности производства флеш-памяти, источник
Производители пытаются увеличить срок жизни SSD разными способами: интеллектуальное распределение нагрузки (прошивка SSD, контроллер), отслеживание и коррекция ошибок, резервный кэш накопителя.
SSD+HDD
Один из известных лайфхаков — связка SSD+HDD. Условно говоря, вместо одного большого SSD можно купить NVMe маленького размера, только для операционной системы, рабочих приложений и избранных игр, а все остальные файлы, дистрибутивы и резервные копии хранить на дешёвом медленном SATA HDD. По цене получится примерно одинаковая сумма, а места больше на несколько терабайт.
Хотя так делают скорее для экономии и увеличения объёма хранилища, но у лайфхака есть и дополнительный бонус — некоторое снижение нагрузки на SSD. То есть увеличение его срока жизни.
Кроме того, в более свободных SSD больше размер кэша и выше производительность, чем в заполненных.
Изменение размера кэша SLC в зависимости от объёма свободного места в Intel SSD 665p, источник
Да и игры всё растут. Дистрибутивы по 200 ГБ уже почти норма… Так что полностью переходить на модель «один большой SSD» немного опасно, места может не хватить для всего. С другой стороны, всё больше игр рекомендуют SSD для установки. Тут особо не забалуешь, потому что при использовании HDD страдает производительность.
Атрибут 194 (C2): Температура корпуса (температура устройства на PCIe)
Многие программы для получения SMART данных позволяют просматривать рабочую температуру SSD и в случае превышения допустимых норм фиксировать ошибку в атрибуте 194. Обычно нормой принято считать рабочую температуру в границах от 0°C до 70 °C (от 32 °F до 158 °F). Если значение для вашего накопителя превышает 70°C – следует немедленно обратить внимание на систему охлаждения вашего компьютера, поскольку это может привести к потере информации. Кроме того, если ваш накопитель выйдет из строя – даже если он будет на гарантии – она будет аннулирована, поскольку производители считают выход рабочей температуры за пределы нормы нарушением гарантийных условий.
Помимо прочего, повышение рабочей температуры выше 65°C может быть причиной других неполадок вашего компьютера. Поэтому пренебрегать атрибутом 194 явно не стоит.
Атрибут 202 (CA): Использование срока службы в процентах
Как видно из названия атрибута – он показывает сколько процентов от прогнозируемого срока службы вы уже использовали на данный момент времени. Сразу же после приобретения SSD накопителя, атрибут 202 будет показывать значение «0» (то есть в данный момент вы использовали 0% от максимального срока службы вашего накопителя). Со временем этот показатель будет увеличиваться и когда вы достигните конца заявленного производителем срока службы – атрибут 202 будет показывать 100%.
В некоторых накопителях все наоборот (как на скриншоте) — когда вы только купили SSD накопитель, атрибут 202 (CA) показывает 100% и со временем значение уменьшается.
Естественно, что достижение конца прогнозируемого срока службы не означает что ваш SSD накопитель тут же перестал работать. Он просто говорит о том, что пользователь должен быть готовым замене SSD диска в скором времени, а также о том, что пользователю настоятельно рекомендуется позаботится о безопасности важных данных , дабы в случае поломки данные не были потеряны .
Если уж речь зашла о сроке службы устройства NAND-flash – тогда стоит поговорить о такой характеристике как сохранность данных. Сохранность данных – это период времени, на протяжении которого ваш накопитель будет надежно хранить ваши данные при отсутствии питания и успешно извлекать их, когда они будут вам нужны. Когда твердотельный накопитель или другое NAND-flash устройство новое – оно может хранить ваши данные без питания на протяжении нескольких лет, однако по мере увеличения износа диска – период сохранности данных начинает уменьшаться.
Поэтому, данные атрибута 202 можно также использовать для анализа сохранности данных. К примеру, когда ваш SSD накопитель будет изношен на 50% — рекомендуется включать ваш компьютер не реже чем раз в полгода. Это позволит гарантировать, что данные на вашем накопителе не исчезнут из-за отсутствия питания.
Для твердотельных накопителей при отсутствии питания и температуре 30 °C (86 °F) нормой считается безопасное хранение данных на протяжении одного года. Этот период времени считается достаточным для того, чтобы пользователь мог хранить и успешно извлекать свои данные.
Поэтому считается, что пока значения атрибута 202 не достигло 100% ваши данные на SSD накопителе будут гарантированно хранится на протяжении года. После преодоления отметки в 100% период сохранности данных начнет постепенно уменьшаться – сначала полгода, потом три месяца, потом месяц, и в конечном результате ваш SSD диск перестанет вообще хранить данные при отсутствии питания и станет непригодным для дальнейшего использования. Современные микропрограммы SSD накопителя учитывают этот фактор и по мере старения накопителя пытаются устранить эту проблему путем фонового обслуживания данных, замены деградирующих блоков данных встроенными запасными, адаптивными параметрами чтения и т.д. Однако на практике это не устраняет проблему, а позволяет немного продлить срок жизни SSD накопителя. Поэтому стоит учитывать значения атрибута 202 также и для анализа сохранности данных.
Фактически данные из атрибута 202 позволяют ответить на вопрос: «На сколько процентов изношен мой SSD накопитель?»
Однако, для получения полной информации о состоянии вашего SSD накопителя стоит проверить данные и в других атрибутах и анализировать все полученные данные.
Что делать, если с SSD накопителя пропали важные данные?
Несмотря на высочайшую скорость работы SSD накопителя он не может похвастаться такой надежностью, какой обладают обыкновенные жесткие диски. Поэтому нередки случаи, когда пользователи теряют важные данные , которые хранились на SSD диске. Даже сбор и анализ SMART данных не всегда позволяют предотвратить потерю важной информации .
Для того, чтобы восстановить утерянный файл следует:
Шаг 1. Установить и запустить программу RS Partition Recovery .
Наверное самый популярный вопрос в нашей техподдержке - “почему здоровье моего диска - 80%”? Или иначе говоря - как вы считаете здоровье диска?
И второй по популярности - откуда берется дата срока службы диска? “Почему у меня пишет что она “еще не определена”? Здесь вы найдете ответы на все эти вопросы.
Почему дата резко меняется?
В некоторых случаях срок службы может резко изменяться - происходит это в случае если был резко увеличен объём записи на диск. Например, вы установили какую-нибудь большую игрушку. Но волноваться не стоит - буквально через несколько дней SSD Life поймёт, что это был временный всплеск, диск вернулся к прежним обычным объемам записи, и скорректирует дату окончания срока службы.
Как продлить срок жизни SSD
Логика подсказывает: если ресурс SSD ограничен количеством циклов перезаписи, то для увеличения срока жизни нужно уменьшить объём записи .
Разумеется, при этом мы не хотим жертвовать производительностью или чем-то другим.
Что можно сделать?
- поставить больше RAM, чтобы уменьшить использование файла подкачки во время работы операционной системы (некоторые рекомендуют вовсе отключить файл подкачки, но это, по сути, плохой совет, хотя его логика понятна);
- отключить неиспользуемые функции ОС (см. статью о том, что нужно отключить в Windows 11, по мнению бывшего разработчика Microsoft) и лишние элементы автозагрузки (см. «Ускорение загрузки Windows for fun and profit» на Хабре);
- отключить ненужную дефрагментацию SSD;
- использовать утилиты вроде PowerToys для оптимизации ОС;
- под Linux можно перейти на более продвинутую файловую систему: например, ZFS со встроенным сжатием, которое снижает количество операций записи, при этом увеличивая скорость, вместительность и срок жизни накопителя (см. «Основы ZFS: система хранения и производительность»), или Btrfs, во многом не уступающую ZFS по функциям.
Почему нельзя подсчитать дату сразу?
Это простая математическая причина - для того чтобы подсчитать сразу, нам надо знать хотя бы дату, когда произошла первая запись на диск - но, к сожалению, он не предоставляет такой информации. Поэтому нам и необходимо после первого запуска SSDLife какое-то время мониторить интенсивность использования SSD диска, чтобы определить его среднюю загрузку. Разумеется, в зависимости от изменения активности использования диска будет и меняться эта дата.
Что в итоге
Вообще, в последние годы после освоения NVME и PCIe 4.0 рынок потребительских SSD немножко застыл на месте. Бенчмарки топовых моделей вроде 980Pro и SN850 не слишком отличаются от моделей двух-трёхлетней давности. Максимальный объём массовых SSD упёрся в 2–4 ТБ и дальше особо не растёт. Причин много, в том числе дефицит микросхем.
Если нет особого прогресса по техническим характеристикам, то на первый план выходит надёжность как ключевой фактор. И вот здесь прогресс виден. Некоторые SSD уже обогнали отдельные HDD по заявленной надёжности (объём записи 1200–2500 ТБ на 5 лет). Хотя до рекодсменов типа WD Ultrastar DC SN840 им ещё далеко. Там вообще 35 040 ТБ на 5 лет.
Интересно, что «закон Мура» в широком смысле (то есть возрастание некоего технического параметра в геометрической прогрессии) оживает и затихает в разных местах. В конце 20 века он был явно виден у CPU, потом начался бурный прогресс HDD (2000-е), потом SSD (2010-е), а сейчас заметен в области аккумуляторов. Создаётся впечатление, что интенсивное развитие начинается в разных отраслях по очереди, после чего затихает. Но иногда случается неожиданный технологический прорыв, как было с ядром Zen от AMD — и закон Мура снова просыпается… И так продолжается снова и снова: научно-технический прогресс не остановить.
ОС: Win 7 x64
Данные смарт:
- Вопрос задан более трёх лет назад
- 7194 просмотра
SSD Life Left - 1% На помойку.
Если есть гарантия - в гарантию.
Стоит SSD Kingston sh103s3240g, с мая, используется под систему и софт. Всё прочее - игры, мультимедиа, облака, вынесено на другие диски, своп отключен, большая часть всяческих темп-каталогов тоже вынесено на другие диски.
Загрузка системы за 20 секунд например мне очень нравится. Быстрый запуск рабочих программ и быстрая работа браузера тоже приятны.
CrazySage: Это понятно, для этого и покупают SSD.
Только вот нужен он как раз для того чтобы разместить на нем - файл подкачки, и профили и темпы пользователей. Это в первую очередь.
Ну и саму систему неплохо тоже на нем.
А какой толк от SSD если подкачка и темпы на другом диске.
Зачем тогда нужен SSD если вы его не используете?
Откуда быстрая работа браузера, если темпы браузера вынесены на другой диск?
АртемЪ: при 16 гигабайтах памяти своп вообще не очень нужен))
Темпы браузера как раз не вынесены, вынесены системные темпы, AppData и LocalData оставлены на ссд
На SSD размещают горячие данные с которыми активно работают - читают/пишут.
А на HDD выносят холодные данные - архивы, коллекции фотографий и видеофильмов, и прочее объемное, но мало используемое..
CrazySage: Своп нужен при любом количестве памяти! Даже при 64гигабайтах.
Во первых возможны проблемы с нехваткой памяти, во вторых память банально работает быстрее и эффективнее с подкачкой, нежели без нее.
Что темпы браузера не вынесены - отлично, а зачем системные темпы выносить?
CrazySage: 16 гб озу в своп накапало что-то около 600 гб за несколько дней, да и есть программы которые при отсутствии свопа начинают дико тупить, хотя даже 1 гиг озу выжрать не могут
Василий: Ну насчет 600гб за несколько дней в свопе это не реально, просто. Там намного меньше, используется. А без свопа, да лучше не работать.
CrazySage: Зря. Выгодней именно на SSD его держать.
Объем записи туда небольшой, и запись идет блоками по 4к.
Для SSD скорость работы с блоками 4к на уровне 20-40Мб/с, а для HDD 0,3-0,9Мб/с
А сам своп используется для дефрагментации памяти в фоновом режиме, и для сброса редко используемых страниц памяти.
Так страница лежит в памяти и занимает место - нужно выделить много памяти а его нет.
А так она сбрасывается на диск - если надо будет выделить память, страницу перезапишут, а при необходимости прочитают с диска.
Не будет выделения памяти - она так же будет лежать в памяти.
Ну миф про своп сильно изнашивающий ссд он активно ходит по интернету. Впрочем ссд всё равно оказался внезапно хилый.
CrazySage: Про своп изнашивающий ССД это действительно миф.
Нереально.
А вот от бракованных ССД никто не застрахован - чтобы упереться в износ ячеек в домашних условиях это невероятный сценарий, а вот нарваться на ССД у которого заглючит прошивка, или вылезут какие то технические проблемы неустранимые - такое случается.
Ломаются они так же как и HDD, не чаще, но и не реже.
АртемЪ: миф не миф, в 7ке 8ке 2012 сервере не видел заметной активности своп файла в 10ке по дефолту чуть ли не нонстопом пишет, только после того как "потыркал" конфигурацию свопа - успокоилась хотя своп остался на том же диске.
За 2500 часов очень трудно износить накопитель. Проверьте наличие обновления фирмваре у производителя.
АртемЪ: Основные параметры, влияющие на "здоровье" накопителя, это количество циклов перезаписи и выведенных из резерва блоков(из-за сбойных ячеек). Когда эти параметры исчерпываются, накопитель "правильно" умирает - переходит в режим "Read only". Такой накопитель можно только читать и сбросить флаг не получится. Такие SSD в гарантию не принимаются - считается что пользователь превысил лимит суточной нагрузки, указанной в инструкции. И да, это называют износом.
Nikolay45: Исчерпать количество циклов перезаписи в домашних условиях практически нереально.
Накопитель быстрее устареет морально, чем исчерпает ресурс перезаписи.
А ломаются накопители как и вся электроника из за банального брака, и глюков в микропрограмме.
Поэтому количество циклов перезаписи и переназначения ячеек это далеко не основной фактор.
АртемЪ: Полагаю, Вы знакомы с Коэффициентом усиления записи, и знаете почему с ним усиленно борются производители? Для чего производители делают недоступными для пользователя 10-30% ёмкости накопителя? И можете назвать ещё параметры SMART SSD уменьшающие значение его здоровья?
Nikolay45: Я достаточно хорошо разбираюсь в SSD, но вот про коэффициент усиления записи я слышу впервые. Что это такое?
А 10-30% емкости оставляют для служебных целей - во первых это всегда чистые неадресованные ячейки в которые можно записывать, во вторых запас для переназначения в случае сбоев ячеек, в третьих они нужны для выравнивания записи - чтобы все ячейки были перезаписаны примерно одинаковое количество раз.
По поводу здрововья - нет у накопителя такого понятия.
Он либо работает, либо не работает.
Есть ресурс циклов перезаписи, но он очень большой и в домашних условиях практически неисчерпаем.
В итоге признали случай гарантийным и подлежащим обмену. Хотя сказали, что были случаи когда производитель отказывался признавать это гарантийным случаем, ведь работает ещё.
Читайте, какие S.M.A.R.T. параметры присущи SSD накопителям . Рассмотрим программу для вычисления степени износа SSD-накопителей. Система S.M.A.R.T. (или SMART) работает несколько иначе при использовании совместно с накопителями SSD. В самом деле, такой параметр, как «счётчик неудачных попыток раскрутки пластин» в случае с SSD-бессмысленны. В то же время, количество циклов записи в каждую ячейку памяти в случае с SSD – ограничено конечным значением, поэтому этот параметр имеет смысл подсчитывать и сравнивать с предельным значением.
Рассмотрим носитель информации компании SanDisk. Программа CrystalDiskInfo вычисляет степень износа SSD-накопителей анализом переменных Reallocated Sectors Count , Current Pending Sectors Count , Uncorrectable Sector Count , а также переменной, специфичной для дисков типа SSD – Percentage of the Rated Lifetime Used (либо, для некоторых моделей, параметра SSD Life Left ).
- Износ диска (англ. Wear Leveling Count ). Счётчик имеет ненулевое значение в начале, и уменьшается со временем. При достижении некоего определённого производителем порогового значения, диск признается полностью изношенным и непригодным к дальнейшей эксплуатации. Обратите внимание на этот параметр – он покажет, сколько осталось жить вашему диску.
- Попытки очистки ячейки памяти (англ. Erase Fail Count ). При преждевременном выходе ячеек из строя этот счётчик увеличивается. Большое число таких ячеек указывает на высокую вероятность того, что диск выйдет из строя преждевременно – задолго до достижения заложенного производителем числа циклов перезаписи.
- Остаток жизни диска (англ. SSD Life Left ). Производители вычисляют эту переменную в процентах: значение 100 (100%) указывает на полностью здоровое устройство, а значение 1 (1%) означает, что накопитель полностью изношен. Иногда вместо этого параметра используется обратный ему счётчик – Percentage of the Rated Lifetime Used .
- Износ диска (англ. Percentage of the Rated Lifetime Used ). Единица означает новый диск, 100 – сто процентов износа, диск можно выбрасывать.
В теории, оставшийся срок жизни SSD предсказать довольно легко простым чтением переменных S.M.A.R.T. К сожалению, в жизни всё не так просто. SSD-накопители любых производителей (к примеру, Sandisk, Transcend, и т.д.) выходят из строя преждевременно и неожиданно: вчера работал – а сегодня уже нет. На текущем уровне развития технологий это, к сожалению, неизбежное зло. В позитиве можно сказать только то, что ситуация улучшается со временем, и вероятность неожиданного выхода из строя новых моделей ниже, чем у предыдущих поколений накопителей. Ну а пока вы можете использовать наши программы для восстановления информации в случае не запланированной утери данных.
Сбор статистики с конкретного SSD
Для просмотра показателей SMART существует ряд специализированных утилит. В частности, под Linux это консольные утилиты smartctl, smartd и др. (см. статью про мониторинг SSD под Linux).
Для разных атрибутов SMART утилиты показывают статус типа OLD_AGE, PRE-FAIL или FAILING_NOW. Это значит, что некий атрибут соответствует количеству аномальных ситуаций, и для этих аномалий установлено граничное значение (threshold). Если значение приближается к граничному, это означает PRE-FAIL, а если превышает его — FAILING_NOW. Но это лишь косвенные параметры, которые напрямую не говорят о физическом повреждении ячеек памяти. Некоторые специалисты предпочитают игнорировать показатели типа Wear_Leveling_Count . Один из разработчиков сделал форк стандартной утилиты мониторинга etbe-mon, которая умеет отслеживать данные SMART и подавлять бесполезные уведомления типа FAILING_NOW от Wear_Leveling_Count .
Самый важный их показатель — объективная нагрузка на диск и количество записанной информации, то есть реальные DWPD и TBW, вот их желательно учитывать в первую очередь.
Под Windows есть несколько хороших инструментов для сбора статистики. Например, программа Hard Disk Sentinel отслеживает объём информации, записанной на каждый накопитель за всё время эксплуатации, и рассчитывает прогноз оставшегося срока жизни.
Hard Disk Sentinel
Есть ещё программа CrystalDiskInfo и др.
CrystalDiskInfo
Многие производители предлагают собственные инструменты для обслуживания своих SSD-накопителей. Например, для накопителей Kingston есть Kingston SSD Manager, для накопителей Samsung — Samsung Magician и так далее.
Эти программы не только собирают статистику с накопителя, но и оповещают о выходе новых прошивок. Производители рекомендуют держать SSD в актуальном состоянии и обновлять прошивку.
Атрибут 180 (B3): Количество неиспользуемых зарезервированных блоков
Этот атрибут отображает количество дополнительных блоков, которые могут быть задействованы вместо вышедших из строя блоков. Этот параметр зависит от того, какая NAND архитектура используется в вашем накопителе, какая архитектура микропрограммы установлена в вашем накопителе и от емкости SSD диска. Обычно значение атрибута 180 начинается с 1000 блоков. В некоторых случаях значение отображается в процентах.
По мере увеличения количества поврежденных блоков это число уменьшается (поскольку вышедший из строя блок был заменен запасным) и соответственно, чем ниже это значение, тем хуже состояние вашего накопителя.
Когда значение атрибута 180 достигнет «0» — встроенная микропрограмма переведет ваш SSD накопитель в состояние «Read Only». То есть вы больше не сможете записать новую информацию на диск, но в то же время у вас будет возможность безопасно считать информацию с иска, чтобы сохранить ее в другом месте и тем самым предотвратить потерю важных данных .
Показатели DWPD и TBW
Обычно производитель указывает два параметра, которые позволяют рассчитать срок эксплуатации накопителя: DWPD и TBW. Например, для NVMe SSD 980 PRO заявлен гарантийный показатель 150 TBW для накопителя на 250 ГБ и 600 TBW для модели 1 ТБ.
- Terabytes Written (TBW) = количество терабайт, которые можно записать на SSD в течение срока эксплуатации.
- Drive Writes Per Day (DWPD или DW/D) = расчётная нагрузка на SSD (в день) во время срока эксплуатации, который составляет три-пять лет.
Если в технических характеристиках 4-терабайтного SSD указано «пять лет, 1 DWPD», то накопитель рассчитан на 4 терабайта записи в день в течение 365*5 = 1825 дней, то есть:
Такой объём записи должен выдержать накопитель в течение гарантийного срока.
Для разных накопителей количество TBW кратно отличается при одинаковом DWPD. То есть 1 DWPD для 15-терабайтного диска означает в 15 раз больший объём записи, чем 1 DWPD для терабайтного.
То еcть даже изначально при покупке SSD можно рассчитать, сколько лет отработает SSD с конкретным DWPD, если вы заранее знаете объём записи на диск в своей системе.
Соответственно, в случае интенсивной нагрузки 24/7 типа майнинга Chia можно выбрать более дорогую модель с более высоким показателем DWPD — и всё равно она долго не проживёт. А для нормальной работы нет смысла переплачивать, если расчёт по формуле покажет вам срок эксплуатации более 100 лет. Тут явно накопитель выйдет из строя раньше и по другим причинам.
Атрибут 174 (AE): Неожиданные сбои питания (подсчет небезопасных выключений на твердотельных накопителях PCIe)
Когда пользователь кликает по кнопке « Пуск », выбирает « Питание » и щелкает на « Выключение » — система посылает вашему твердотельному накопителю сигнал, который предупреждает его о том, что в скором времени питание будет отключено. Тем самым система дает SSD накопителю некоторое время чтобы он завершил все операции на диске. После того, как это сделано – накопитель также посылает сигнал системе, что все ок и питание можно отключить. После этого компьютер отключает питание.
Однако, часто ситуация прямо противоположная. Особенно это актуально для ПК, которые работают без источника бесперебойного питания. То есть, если во время работы с данными на SSD возникнет перебой энергии – это может привести не только к потере файла, который записывался, но и к выходу твердотельного накопителя из строя.
Поэтому, несмотря на то, что атрибут 174 носит исключительно информационный характер – он может послужить явным сигналом о том, что с накопителем обращались пренебрежительно и оттолкнуть пользователя от покупки такого б/у накопителя. Кроме того, атрибут 174 может послужить сигналом о том, что кабель подключения диска поврежден или предупредить пользователя о проблемах с источником питания.
SMART атрибуты для SSD накопителя
Технология SMART имеет много атрибутов, которые можно использовать для сбора информации о состоянии вашего накопителя. Мы же рассмотрим те из них, на которые стоит обратить внимание в первую очередь.
Подробнее - для желающих разобраться или технических специалистов.
Еще со времен жестких дисков (HDD) известна система самодиагностики S.M.A.R.T. (SMART) встроенная во все современные жесткие диски. Она постоянно контролирует разнообразные параметры технического состояния диска и сообщает их в относительных величинах. Как только значения параметров станут ниже критического уровня - считается что диск ненадежен и производитель рекомендует заменить его. Однако на практике бывает что диск продолжает нормально работать, да и сами производители говорят что SMART - это рекомендательный сервис, а не абсолютно точный прогнозист.
В отличе от жестких дисков, в мире SSD всё более определённо. Флеш-память, на основе которой построены SSD диски, имеет точно известный ресурс использования - 10000 перезаписей (упрощенно говоря, точное число зависит от используемого в SSD типа памяти). Все диски содержат в себе микропрограмму, которая следит за равномерным использованием всех ячеек памяти и отслеживает, сколько перезаписей был сделано, каков оставшийся ресурс SSD диска. В итоговом виде именно эти данные и сообщаются микропрограммой диска в одном из параметров S.M.A.R.T. с красноречивым названием SSD Life Left (Осталось жизни SSD) или Media wear out indicator (Показатель износа носителя) - и именно этот параметр в удобном и понятном для пользователя виде отображает программа SSDLife.
Разумеется, у пользователя в первую очередь возникнет вопрос - а что будет когда износ диска достигнет 100%? (здоровье станет равным 0%) Ответ на этот вопрос смотрите в конце этой страницы.
Итак, мы точно знаем технический ресурс SSD диска и можем отслеживать его изменения. Анализируя динамику уменьшения здоровья (увеличения износа) можно путем математических вычислений спрогнозировать дату, когда здоровье уменьшится до 0% (износ будет 100%). Именно это и делает SSD Life.
примечание: кстати, некоторые производители приводят общий объем записанного на диск как один из показателей срока службы диска. Например, Intel на диски X25-M дает гарантию на общий объем записи около 37Тбайт (20Гбайт в день в течении 5 лет - “The drive will have a minimum of 5 years of useful life under typical client workloads with up to 20GB host writes per day”). Однако, почему нельзя ориентироваться на эту информацию для анализа состояния диска - смотрите на этой странице.
Оценка своего DWPD
Для предварительной оценки нагрузки на SSD в продакшне на основе рекомендаций производителей можно составить такую небольшую шпаргалку с указанием типичных вариантов использования:
Сценарий использования | Описание | Примерный DWPD |
Загрузочный диск | Загрузка сервера. Нечастые обновления. Логи и постоянные файлы хранятся на другом накопителе. | 0,1 ~ 1,0 |
Раздача контента | Фронтенд CDN. Кэш для самых популярных медиафайлов | 0,5 ~ 2,0 |
Видеонаблюдение | Запись трансляции с нескольких камер 24/7, периодическая перезапись содержимого диска. | кратно Nкамер |
Виртуализация и контейнеры | Хранилище Tier-0 для контейнеров и VM в гиперконвергентной системе. Всё локальное хранилище в кластере работает на SSD. | 1,0 ~ 3,0 |
Транзакционная система (OLTP) | Нагрузки с интенсивным использованием данных. Частое обновление журналов БД и файлов, до тысячи операций в секунду. | от 3,0 |
Высокопроизводительное кэширование | Кэш для локальных HDD. Максимальные нагрузки. | от 3,0 и гораздо выше |
Таким образом, из реального DWPD и P/E для своего SSD можно примерно оценить приблизительный срок его жизни: общий и сколько осталось.
Оставшийся срок можно ориентировочно спрогнозировать, если вычесть реальный срок эксплуатации из общего срока жизни SSD.
Или другой вариант — посчитать максимальный TBW для своего SSD исходя из его технических характеристик, а потом отслеживать реальный TBW в процессе эксплуатации.
Что являет собой технология SMART?
Технология SMART (Self-Monitoring, Analysis and Reporting Technology) появилась задолго до появления SSD накопителей. Первоначально ее разрабатывали для жестких дисков и со временем адаптировали также и под накопители SSD. Эта технология являет собой инструмент, который позволяет собирать и сохранять данные о состоянии вашего SSD накопителя для того, чтобы заранее предупреждать пользователя о возникновении серьезных ошибок и возможности выхода вашего накопителя из строя и соответственно предотвратить потерю важных данных . Эта технология будет очень ценным инструментом анализа состояния вашего SSD диска, если уметь правильно интерпретировать полученные данные.
Прочесть более детально о том, что такое SMART технология и о ее параметрах для HDD диско вы можете в этой статье .
К сожалению, на сегодняшний день не существует общепринятого стандарта для того, чтобы определить какой именно атрибут SMART мог бы описать конкретное физическое свойство диска. Поэтому нужно уметь правильно интерпретировать полученные данные для каждой из технологий хранения данных. То есть полученные данные для HDD диска будут означать совсем другое, чем те же данные для SSD диска.
На сегодняшний день существует достаточно много бесплатных (и условно бесплатных утилит) от третьих производителей, которые позволяют получать SMART данные диска и передавать их пользователю для предупреждения о скором выходе диска из строя.
Однако полагаться на 100% на данные, полученные при помощи технологии SMART не стоит, поскольку при работе с SSD накопителем важен даже производитель диска. Все дело в том, что если разработчики стороннего ПО не консультировались с производителем вашего SSD диска насчет правильных атрибутов SMART, то вы можете получить некорректные данные, что может привести к потере важных данных. Поэтому при малейшем намеке на поломку SSD диска сразу же позаботьтесь о создании резервной копии всех важных данных .
Что касается NVMe накопителей – ситуация аналогичная к обыкновенным SSD накопителям, поскольку NVMe это только протокол для более быстрой передачи данных между материнской платой и накопителем, в то время как сама технология запоминания данных является неизменной.
Кратко и просто.
1. Мы не считаем процент здоровья диска. Его считает и сообщает сам SSD диск. Или иначе говоря - это данные производителя диска.
2. Предполагаемый срок службы считается в зависимости от динамики изменения здоровья диска, которое в свою очередь косвенно зависит от активности записи на диск. Если у вас он еще не определен - значит данных пишется немного, просто подождите - обычно максимум в течении недели после первого запуска. (почему косвенно - более подробно читайте тут)
Атрибут 210 (D2): Количество успешных восстановлений при помощи технологии RAIN
Еще одна полезная функция, главным заданием которой является предотвращение потери важных данных пользователя — Redundant Array of Independent NAND (RAIN) очень сильно напоминает технологию RAID, однако все процессы происходят внутри одного диска незаметно для пользователя. Эта функция также используется для повышения длительности срока службы SSD накопителя.
Обычно события RAIN случаются редко, однако частое их возникновение сильно снизит быстродействие SSD накопителя. Все дело в том, что при использовании избыточности RAIN для предотвращения потери информации расходуется некоторая полоса пропускания ввода-вывода. Поэтому, если события RAIN стали часто появляться – это явный сигнал, что пора заменить ваш твердотельный накопитель, поскольку он уже не в состоянии хранить информацию и поэтому постоянно пытается ее восстановить используя для этого RAIN технологию.
Читайте также: