Почему на новом ssd оставшийся ресурс накопителя 0
Твердотельные накопители обладают массой преимуществ: они быстрее, тише и экономичнее. Однако, несмотря на все достоинства, у твердотельных накопителей есть одна особенность – ресурс, ограниченный определенным числом циклов записи.
Мы уже рассказывали, как протестировать купленный SSD и какие показатели здоровья должны быть у нового устройства. А сегодня разберем вопрос, почему быстро расходуется ресурс и как предотвратить аномально-быстрое старение диска.
Надёжность SSD и HDD в первый год работы
Самым известным источником данных по надёжности накопителей в практическом использовании остаётся статистика хостера Backblaze, которая периодически обновляется. У них тысячи серверов и девять лет статистики по разным моделям HDD и SSD (в последние годы загрузочные диски серверов перевели на SSD).
В сентябре 2021 года Backblaze впервые сравнила SSD и HDD по надёжности, получилось любопытно.
В целом оказалось, что в начале работы (в среднем до 14 месяцев в данном случае) SSD выходят из строя немножко реже, чем HDD.
Годовая частота сбоев (AFR)
Количество дисков | Средний возраст (месяцев) | Дней работы | Всего сбоев | AFR | |
---|---|---|---|---|---|
SSD | 1666 | 14,2 | 591 501 | 17 | 1,05% |
HDD | 1607 | 52,4 | 3 523 610 | 619 | 6,41% |
Что будет дальше — непонятно. На интервале в несколько лет достоверная статистика пока не собрана. Вполне возможно, что там преимущество SSD будет не таким очевидным, как раз из-за ограниченного ресурса на количество циклов перезаписи.
Как продлить срок службы SSD
Как мы и говорили в самом начале, принципы работы твердотельного накопителя сильно отличаются от того, к чему привыкли владельцы HDD. Поэтому вам стоит придерживаться нескольких простых правил для того, чтобы продлить срок работы своего накопителя.
Не увлекайтесь тестами в бенчмарках
При покупке новенького SSD, а особенно если речь идет о каком-то сверхбыстром накопителе, многие пользователи хотят убедиться в том, что он действительно стоит потраченных на него денег, а иногда и хотят похвастаться его рекордной скоростью работы перед друзьями и знакомыми. Не стоит. Нет, правда, не стоит. Всевозможные бенчмарки крайне негативно сказываются на ресурсе твердотельного накопителя, записывая на него огромные массивы данных. И, если вы действительно хотите продлить срок службы SSD, не злоупотребляйте бенчмарками, особенно если они нужны лишь для того, чтобы потешить ваше самолюбие.
Что в итоге
Вообще, в последние годы после освоения NVME и PCIe 4.0 рынок потребительских SSD немножко застыл на месте. Бенчмарки топовых моделей вроде 980Pro и SN850 не слишком отличаются от моделей двух-трёхлетней давности. Максимальный объём массовых SSD упёрся в 2–4 ТБ и дальше особо не растёт. Причин много, в том числе дефицит микросхем.
Если нет особого прогресса по техническим характеристикам, то на первый план выходит надёжность как ключевой фактор. И вот здесь прогресс виден. Некоторые SSD уже обогнали отдельные HDD по заявленной надёжности (объём записи 1200–2500 ТБ на 5 лет). Хотя до рекодсменов типа WD Ultrastar DC SN840 им ещё далеко. Там вообще 35 040 ТБ на 5 лет.
Интересно, что «закон Мура» в широком смысле (то есть возрастание некоего технического параметра в геометрической прогрессии) оживает и затихает в разных местах. В конце 20 века он был явно виден у CPU, потом начался бурный прогресс HDD (2000-е), потом SSD (2010-е), а сейчас заметен в области аккумуляторов. Создаётся впечатление, что интенсивное развитие начинается в разных отраслях по очереди, после чего затихает. Но иногда случается неожиданный технологический прорыв, как было с ядром Zen от AMD — и закон Мура снова просыпается… И так продолжается снова и снова: научно-технический прогресс не остановить.
Год назад мы добавили в наш агент сбор метрик из S.M.A.R.T. атрибутов дисков на серверах клиентов. В тот момент мы не стали добавлять их в интерфейс и показывать клиентам. Дело в том, что метрики мы снимаем не через через smartctl, а дергаем ioctl прямо из кода, чтобы этот функционал работал без установки smartmontools на серверы клиентов.
Агент снимает не все доступные атрибуты, а только самые значимые на наш взгляд и наименее вендор-специфичные (иначе пришлось бы поддерживать базу дисков, аналогичную smartmontools).
Сейчас наконец дошли руки до того, чтобы проверить, что мы там наснимали. А начать было решено с атрибута "media wearout indicator", который показывает в процентах оставшийся ресурс записи SSD. Под катом несколько историй в картинках о том, как расходуется этот ресурс в реальной жизни на серверах.
TRIM
TRIM – это функция, оптимизирующая работу твердотельного накопителя путем регулярной автоматической очистки неиспользуемых ячеек.
Функция TRIM активируется автоматически, если система определяет накопитель, как твердотельный. Однако, как уже сказано выше, могут случаться и сбои. Проверить активность функции можно, войдя в подсистему BIOS, или воспользоваться одной из утилит для тестирования дисков, например, той же SSDLife.
Итого
- Количество записи на диск, которую создает Redis+RDB зависит не от количества модификаций в базе, а от размера базы + интервала дампов (и вообще, это наибольший уровень write amplification в известных мне хранилищах данных)
- Активно используемый swap на ssd — плохо, но если вам нужно внести jitter в износ ssd (для надежности raid-1), то может сойти за вариант:)
- Помимо WAL и datafiles базы данных могут ещё писать на диск всякие временные данные
Мы в okmeter.io считаем, что для того, чтобы докопаться до причины проблемы инженеру нужно много метрик про все слои инфраструктуры. Мы изо всех сил в этом помогаем:)
Принципы работы SSD сильно отличаются от того, к чему привыкли владельцы жестких дисков и обходиться с ними нужно совсем иначе. Как не убить твердотельный накопитель раньше времени, а еще лучше продлить срок его службы? Разбираемся вместе с CHIP.
Еще лет 10 назад твердотельные накопители воспринимались многими чуть ли в качестве предмета роскоши и служили лишь в роли системного накопителя, способного ускорить загрузку операционной системы и работу ПК в целом. Но со временем SSD становились все дешевле, а их емкость росла все больше. И теперь твердотельные накопители начинают уверенно вытеснять обычные жесткие диски.
Поскольку твердотельный накопитель устроен иначе, чем традиционный жесткий диск, то и правила корректного обращения с ним отличаются.
Вирусы
Довольно высока вероятность, что в системе может скрытно находиться вирус, который активно использует ресурсы ПК, например, для скрытого майнинга криптовалют. Это приводит к незначительному падению производительности системы, повышению сетевой активности и быстрому расходованию ресурса SSD.
Решением проблемы станет комплексная проверка системы на вирусы, которую рекомендуется выполнить несколькими антивирусными программами, предварительно обновив их вирусные базы.
Как продлить срок жизни SSD
Логика подсказывает: если ресурс SSD ограничен количеством циклов перезаписи, то для увеличения срока жизни нужно уменьшить объём записи .
Разумеется, при этом мы не хотим жертвовать производительностью или чем-то другим.
Что можно сделать?
- поставить больше RAM, чтобы уменьшить использование файла подкачки во время работы операционной системы (некоторые рекомендуют вовсе отключить файл подкачки, но это, по сути, плохой совет, хотя его логика понятна);
- отключить неиспользуемые функции ОС (см. статью о том, что нужно отключить в Windows 11, по мнению бывшего разработчика Microsoft) и лишние элементы автозагрузки (см. «Ускорение загрузки Windows for fun and profit» на Хабре);
- отключить ненужную дефрагментацию SSD;
- использовать утилиты вроде PowerToys для оптимизации ОС;
- под Linux можно перейти на более продвинутую файловую систему: например, ZFS со встроенным сжатием, которое снижает количество операций записи, при этом увеличивая скорость, вместительность и срок жизни накопителя (см. «Основы ZFS: система хранения и производительность»), или Btrfs, во многом не уступающую ZFS по функциям.
Дефрагментация
Эта функция ОС крайне полезна для скорости работы и здоровья HDD, но противопоказана для SSD. Новейшие версии ОС автоматически определяют твердотельный накопитель и выполняют все необходимые настройки. Однако в некоторых случаях случаются и сбои, особенно если используются нелицензионные версии ПО. Также новый SSD может не распознаться системой, если на него было выполнено клонирование диска HDD.
Чтоб проверить статус диска и отключить дефрагментацию вручную, необходимо в окне «Компьютер» вызвать контекстное меню SSD и перейти в «Свойства». Далее следует перейти в раздел «Оптимизация» и кликнуть на кнопку «Изменить параметры». В открывшемся окне уберите галочку в строке «Выполнять по расписанию», или выберите частоту «Никогда» и сохраните изменения.
Как узнать, какой ресурс у SSD
Для проверки состояния твердотельного накопителя рекомендуется регулярно производить его тестирование, которое поможет выявить:
- наличие на диске ошибок;
- температурный режим работы;
- оставшийся ресурс циклов перезаписи, обычно указывается в процентах;
- ориентировочный срок жизни накопителя при текущем уровне нагрузки.
Если игнорировать регулярные проверки, можно пропустить критический момент и потерять важную информацию из-за выхода диска из строя.
Тестировать SSD можно фирменными утилитами, которые распространяются бесплатно или выбрать одну из универсальных разработок независимых лабораторий:
Hard Disk Sentinel – универсальная утилита для контроля состояния жестких дисков и твердотельных накопителей. Помимо сбора параметров работы диска, утилита выполняет поиск и исправление системных ошибок.
SSDLife – доступная утилита с интерфейсом, рассчитанным на пользователей начального уровня. Программа может работать в фоновом режиме и предупреждать об опасности в критических ситуациях. Удобно, что в окне проверки сразу же отображается процент здоровья и оставшееся время работы.
CrystalDiskInfo – одна из самых популярных программ для комплексной проверки накопителей, включая информацию S.M.A.R.T.
Acronis Drive Monitor – бесплатное приложение, которое подходит под любые версии Windows. Программа работает в фоновом режиме, и, если проблемы не обнаруживаются раньше, раз в неделю выдает плановый отчет.
Уровень заполнения диска
Чем меньше свободного пространства остается на SSD, тем чаще используются свободные ячейки, что приводит к их ускоренному старению. Выходов из этой ситуации два: либо приобрести диск большего объема, либо строго следить за его наполняемостью и своевременно удалять ненужные файлы.
SSD+HDD
Один из известных лайфхаков — связка SSD+HDD. Условно говоря, вместо одного большого SSD можно купить NVMe маленького размера, только для операционной системы, рабочих приложений и избранных игр, а все остальные файлы, дистрибутивы и резервные копии хранить на дешёвом медленном SATA HDD. По цене получится примерно одинаковая сумма, а места больше на несколько терабайт.
Хотя так делают скорее для экономии и увеличения объёма хранилища, но у лайфхака есть и дополнительный бонус — некоторое снижение нагрузки на SSD. То есть увеличение его срока жизни.
Кроме того, в более свободных SSD больше размер кэша и выше производительность, чем в заполненных.
Изменение размера кэша SLC в зависимости от объёма свободного места в Intel SSD 665p, источник
Да и игры всё растут. Дистрибутивы по 200 ГБ уже почти норма… Так что полностью переходить на модель «один большой SSD» немного опасно, места может не хватить для всего. С другой стороны, всё больше игр рекомендуют SSD для установки. Тут особо не забалуешь, потому что при использовании HDD страдает производительность.
Износ SSD и PostgreSQL
На самом деле я хотел посмотреть скорость износа ssd при различных нагрузках на запись в Postgres, но как правило на нагруженных базах ssd используются очень аккуратно и массивная запись идет на HDD. Пока искал подходящий кейс, наткнулся на один очень интересный сервер:
Износ двух ssd в raid-1 за 3 месяца составил 4%, но судя по скорости записи WAL данный постгрес пишет меньше 100 Kb/s:
Оказалось, что постгрес активно использует временные файлы, работа с которыми и создает постоянный поток записи на диск:
Так как в postgresql с диагностикой достаточно неплохо, мы можем с точностью до запроса узнать, что именно нам нужно чинить:
Как вы видите тут, это какой-то конкретный SELECT порождает кучу временных файлов. А вообще в постгресе SELECT'ы иногда порождают запись и без всяких временных файлов — вот тут мы уже про это рассказывали.
Как узнать остаток ресурса SSD?
Ресурс твердотельного накопителя определяется параметром TBW (Total Byte Written), описывающим гарантированный объем данных, который можно записать на SSD до исчерпания его ресурса. Причем он зависит не только от модели накопителя, но и его объема — чем выше емкость SSD, тем больше его ресурс.
К примеру, ADATA Ultimate SU650 емкостью 120 Гбайт имеет ресурс 70 TBW, а у этого же накопителя объемом 240 Гбайт он увеличивается до 140 TBW. Т.е. в первом случае он гарантированно позволяет записать 70 Тбайт, а во втором — 140 Тбайт данных.
Итак, мы знаем ресурс нашего накопителя. Осталось понять, сколько данных на него уже записано, т.е. сколько ему осталось жить. Для этого можно воспользоваться простенькой, но весьма информативной утилитой CrystalDiskInfo. Обратите внимание на параметр «Всего хост-записей». Это и есть объем уже записанной на SSD информации. Вычтите эту цифры из заявленного ресурса своего накопителя, и вы узнаете оставшийся срок его жизни.
Хотя, конечно, стоит понимать, что при исчерпании ресурса накопитель не обязательно сразу же начнет изображать из себя умирающего лебедя. Практика показывает, что некоторые модели SSD легко выдерживают и 2-кратное превышение параметра TBW.
Как узнать, какой ресурс у SSD
Для проверки состояния твердотельного накопителя рекомендуется регулярно производить его тестирование, которое поможет выявить:
- наличие на диске ошибок;
- температурный режим работы;
- оставшийся ресурс циклов перезаписи, обычно указывается в процентах;
- ориентировочный срок жизни накопителя при текущем уровне нагрузки.
Если игнорировать регулярные проверки, можно пропустить критический момент и потерять важную информацию из-за выхода диска из строя.
Тестировать SSD можно фирменными утилитами, которые распространяются бесплатно или выбрать одну из универсальных разработок независимых лабораторий:
Hard Disk Sentinel – универсальная утилита для контроля состояния жестких дисков и твердотельных накопителей. Помимо сбора параметров работы диска, утилита выполняет поиск и исправление системных ошибок.
SSDLife – доступная утилита с интерфейсом, рассчитанным на пользователей начального уровня. Программа может работать в фоновом режиме и предупреждать об опасности в критических ситуациях. Удобно, что в окне проверки сразу же отображается процент здоровья и оставшееся время работы.
CrystalDiskInfo – одна из самых популярных программ для комплексной проверки накопителей, включая информацию S.M.A.R.T.
Acronis Drive Monitor – бесплатное приложение, которое подходит под любые версии Windows. Программа работает в фоновом режиме, и, если проблемы не обнаруживаются раньше, раз в неделю выдает плановый отчет.
Показатели DWPD и TBW
Обычно производитель указывает два параметра, которые позволяют рассчитать срок эксплуатации накопителя: DWPD и TBW. Например, для NVMe SSD 980 PRO заявлен гарантийный показатель 150 TBW для накопителя на 250 ГБ и 600 TBW для модели 1 ТБ.
- Terabytes Written (TBW) = количество терабайт, которые можно записать на SSD в течение срока эксплуатации.
- Drive Writes Per Day (DWPD или DW/D) = расчётная нагрузка на SSD (в день) во время срока эксплуатации, который составляет три-пять лет.
Если в технических характеристиках 4-терабайтного SSD указано «пять лет, 1 DWPD», то накопитель рассчитан на 4 терабайта записи в день в течение 365*5 = 1825 дней, то есть:
Такой объём записи должен выдержать накопитель в течение гарантийного срока.
Для разных накопителей количество TBW кратно отличается при одинаковом DWPD. То есть 1 DWPD для 15-терабайтного диска означает в 15 раз больший объём записи, чем 1 DWPD для терабайтного.
То еcть даже изначально при покупке SSD можно рассчитать, сколько лет отработает SSD с конкретным DWPD, если вы заранее знаете объём записи на диск в своей системе.
Соответственно, в случае интенсивной нагрузки 24/7 типа майнинга Chia можно выбрать более дорогую модель с более высоким показателем DWPD — и всё равно она долго не проживёт. А для нормальной работы нет смысла переплачивать, если расчёт по формуле покажет вам срок эксплуатации более 100 лет. Тут явно накопитель выйдет из строя раньше и по другим причинам.
Отключите режим гибернации
Если ваш SSD установлен на обычном настольном компьютере, использование режима гибернации лишено особого смысла, а его работа снижает ресурс накопителя — в этом режиме операционная система записывает на SSD содержимое оперативной памяти для быстрого возобновления работы ПК. Более того, учитывая большие объемы оперативки современных компьютеров, ущерб ресурсу накопителя может быть весьма серьезным.
Для отключения режима гибернации нажмите сочетание клавиш win+X, запустите Windows PowerShell от имени администратора и введите команду powercfg -h off. Если же вы хотите вернуть все на круги своя, повторите процедуру, но используйте команду powercfg -h on.
Почему не стоит покупать SSD небольшого объема, и как это связано с таким параметром, как ресурс твердотельного накопителя. Разбираемся вместе с CHIP.
В начале своего развития твердотельные накопители стоили очень дорого. Они преимущественно использовались в роли системного накопителя, и редко в какой машине стоял SSD объемом выше 120 Гбайт. Да и большие размеры в те времена казались излишеством.
Но в наши дни твердотельные накопители стали куда доступнее, а сама Windows заметно потяжелела, и вы можете просто не уложиться в базовые 120 Гбайт. Поэтому в большинстве гуляющих в сети гайдах по выбору SSD вы найдете рекомендацию не покупать накопитель объемом меньше 250 Гбайт. К слову, мы полностью согласны с этим утверждением, но вовсе не из-за прожорливости Windows 10 или размеров современных игр.
Перенесите файл подкачки
Любая операционная система семейства Windows предусматривает использование файла подкачки, который вступает в игру при исчерпании доступного объема оперативной памяти. Файл подкачки можно перенести с твердотельного накопителя на жесткий диск, это продлит срок эксплуатации SSD.
Но тут есть нюанс: HDD, разумеется, гораздо медленнее SSD, так что такой перенос замедлит систему. Поэтому стоит сначала разобраться с приоритетами: например, если ресурс вашего накопителя уже почти исчерпан, а скорость работы системы не так важна, перенос на HDD имеет смысл. В остальных случаях — скорее нет.
Если у вас огромный объем оперативки, вы можете полностью отключить файл подкачки без ущерба для скорости работы ПК. Как это сделать, мы рассказали здесь.
Как быстро убиваются SSD?
Так как сбор метрик мы начали год назад, а метрики мы не удаляем, есть возможность посмотреть на эту метрику во времени. К сожалению сервер с наибольшей скоростью расхода подключен к okmeter только 2 месяца назад.
На этом графике мы видим, как за 2 месяца сожгли 8% ресурса записи. То есть при таком же профиле записи, этих ssd хватит на 100/(8/2) = 25 месяцев. Много это или мало не знаю, но давайте посмотрим, что за нагрузка там такая?
Видим, что с диском работает только ceph, но мы же понимаем, что ceph это только прослойка. В данном случае у клиента ceph на нескольких нодах выступает хранилищем для кластера kubernetes, посмотрим, что внутри k8s генерирует больше всего записи на диск:
Абсолютные значения не совпадают скорее всего из-за того, что ceph работает в кластере и запись от redis приумножается из-за репликации данных. Но профиль нагрузки позволяет уверенно говорить, что запись иницирует именно redis. Давайте смотреть, что там в редисе происходит:
тут видно, что в среднем выполняется меньше 100 запросов в секунду, которые могут изменять данные. Вспоминаем, что у redis есть 2 способа записывать данные на диск:
- RDB — периодические снэпшоты всей баз на диск, при старте redis читаем последний дамп в память, а данные между дампами мы теряем
- AOF — пишем лог всех изменений, при старте redis проигрывает этот лог и в памяти оказываются все данные, теряем только данные между fsync этого лога
Не проводите дефрагментацию
Бытует мнение, что сразу после покупки и установки SSD в систему вам необходимо отключить функцию дефрагментации, но на самом деле это не более, чем миф. Нет, мы не спорим, что дефрагментация очень вредна для любого твердотельного накопителя. Она серьезно уменьшает срок его жизни, способствуя быстрому износу диска все из-за того же ограниченного ресурса на запись. Но дело в том, что любая современная операционная система прекрасно видит, что перед ней именно SSD и отлично умеет с ним обращаться. Никакую дефрагментацию она проводить не будет, и отключение этой опции вручную ничего не изменит.
Просто не занимайтесь дефрагментацией самостоятельно, используя для этого многочисленные сторонние утилиты.
Сбор статистики с конкретного SSD
Для просмотра показателей SMART существует ряд специализированных утилит. В частности, под Linux это консольные утилиты smartctl, smartd и др. (см. статью про мониторинг SSD под Linux).
Для разных атрибутов SMART утилиты показывают статус типа OLD_AGE, PRE-FAIL или FAILING_NOW. Это значит, что некий атрибут соответствует количеству аномальных ситуаций, и для этих аномалий установлено граничное значение (threshold). Если значение приближается к граничному, это означает PRE-FAIL, а если превышает его — FAILING_NOW. Но это лишь косвенные параметры, которые напрямую не говорят о физическом повреждении ячеек памяти. Некоторые специалисты предпочитают игнорировать показатели типа Wear_Leveling_Count . Один из разработчиков сделал форк стандартной утилиты мониторинга etbe-mon, которая умеет отслеживать данные SMART и подавлять бесполезные уведомления типа FAILING_NOW от Wear_Leveling_Count .
Самый важный их показатель — объективная нагрузка на диск и количество записанной информации, то есть реальные DWPD и TBW, вот их желательно учитывать в первую очередь.
Под Windows есть несколько хороших инструментов для сбора статистики. Например, программа Hard Disk Sentinel отслеживает объём информации, записанной на каждый накопитель за всё время эксплуатации, и рассчитывает прогноз оставшегося срока жизни.
Hard Disk Sentinel
Есть ещё программа CrystalDiskInfo и др.
CrystalDiskInfo
Многие производители предлагают собственные инструменты для обслуживания своих SSD-накопителей. Например, для накопителей Kingston есть Kingston SSD Manager, для накопителей Samsung — Samsung Magician и так далее.
Эти программы не только собирают статистику с накопителя, но и оповещают о выходе новых прошивок. Производители рекомендуют держать SSD в актуальном состоянии и обновлять прошивку.
Гибернация
Гибернация – очень полезный для пользователя режим, позволяющий сделать паузу в работе и моментально вернуться к открытым документам и запущенным приложениям. Однако эта функция опасна для здоровья твердотельного диска. Чем сложнее приложения и больше их одновременно запущено, тем больший объем информации из ОЗУ пересохраняется на накопитель, что ускоряет его износ.
Отключить ее можно через командную строку, командой «powercfg -h off». Также можно в настройках электропитания параметров Windows установить режим гибернации «Никогда». Если без нее не обойтись, поставьте промежуток отсутствия активности не менее 15 минут, чтоб компьютер не перешел в сон, пока Вы отвлеклись на телефонный звонок или отошли за чашкой кофе.
SSD + RAID
По нашим наблюдениям существуют три основных конфигурации дисковой подсистемы серверов с присутствием SSD:
- в сервере 2 SSD собраные в raid-1 и там живет всё
- в сервере есть HDD + raid-10 из ssd, обычно используется для классических РСУБД (система, WAL и часть данных на HDD, а на SSD самые горячие с точки зрения чтения данные)
- в сервере есть отдельностоящие SSD (JBOD), обычно используется для nosql типа кассандры
В случае, если ssd собраны в raid-1, запись идет на оба диска, соответственно износ идет с одинаковой скоростью:
Но на глаза попался сервер, в котором картинка другая:
При этом cмонтированы только партиции mdraid (все массивы raid-1):
По метрикам записи тоже видно, что на /dev/sda долетает больше записи:
Оказалось, что одна из партиций на /dev/sda используется в качестве swap, а swap i/o на этом сервере достаточно заметно:
Как продлить срок службы SSD
Помимо вышеуказанных причин, повлиять на ресурс накопителя может и неправильная эксплуатация. Чтоб диск служил долго и эффективно, используйте его для установки операционной системы, игровых и рабочих приложений. А длительное хранение архивов документов, фотографий, музыки и фильмотеки лучше организовать на жестком диске. Кстати файлы из сети лучше скачивать тоже на жесткий, особенно если это торренты.
А вот переносить файлы подкачки, отключать индексирование и автоматическое восстановление системы мы не рекомендуем. Неумелые действия с системными файлами могут повлиять на работоспособность всей системы, и вред окажется существеннее возможной экономии ресурса SSD.
У каждого SSD есть ресурс на количество циклов перезаписи, то есть объём записанной информации в течение всей жизни. Физика и механика SSD очень сложные, но долговечность накопителя в итоге сводится к простому правилу — чем больше на него пишешь, тем меньше он проживёт.
У одних SSD критический сбой происходит через несколько месяцев, другие работают годами. Это зависит от качества комплектующих, условий эксплуатации и везения. В общем, как у людей.
Срок жизни SSD ограничен, потому что ячейки флеш-памяти NAND выдерживают ограниченное количество циклов перезаписи (циклы P/E, "program / erase"). По мере перехода производителей флеш-памяти с технологии Multi Level Cell (MLC/DLC, 2 бита на ячейку) на Triple Level Cell (TLC, 3 бита), Quad-level cell (QLC, 4 бита) и Penta-level cell (PLC, 5 бит, пока находится в разработке) ресурс P/E уменьшается из-за увеличения сложности производства. Причём уменьшается кратно.
Например, древняя однобитная SLC на этапе анонса технологии NAND выдерживала 100 тысяч циклов перезаписи, двухбитная MLC/DLC — уже 10 тысяч. С увеличением плотности записи и ёмкости накопителей снижается цена гигабайта, но увеличивается сложность и уменьшается ресурс ячеек памяти.
Уменьшение ресурса P/E с увеличением технологической сложности производства флеш-памяти, источник
Производители пытаются увеличить срок жизни SSD разными способами: интеллектуальное распределение нагрузки (прошивка SSD, контроллер), отслеживание и коррекция ошибок, резервный кэш накопителя.
Оценка своего DWPD
Для предварительной оценки нагрузки на SSD в продакшне на основе рекомендаций производителей можно составить такую небольшую шпаргалку с указанием типичных вариантов использования:
Сценарий использования | Описание | Примерный DWPD |
Загрузочный диск | Загрузка сервера. Нечастые обновления. Логи и постоянные файлы хранятся на другом накопителе. | 0,1 ~ 1,0 |
Раздача контента | Фронтенд CDN. Кэш для самых популярных медиафайлов | 0,5 ~ 2,0 |
Видеонаблюдение | Запись трансляции с нескольких камер 24/7, периодическая перезапись содержимого диска. | кратно Nкамер |
Виртуализация и контейнеры | Хранилище Tier-0 для контейнеров и VM в гиперконвергентной системе. Всё локальное хранилище в кластере работает на SSD. | 1,0 ~ 3,0 |
Транзакционная система (OLTP) | Нагрузки с интенсивным использованием данных. Частое обновление журналов БД и файлов, до тысячи операций в секунду. | от 3,0 |
Высокопроизводительное кэширование | Кэш для локальных HDD. Максимальные нагрузки. | от 3,0 и гораздо выше |
Таким образом, из реального DWPD и P/E для своего SSD можно примерно оценить приблизительный срок его жизни: общий и сколько осталось.
Оставшийся срок можно ориентировочно спрогнозировать, если вычесть реальный срок эксплуатации из общего срока жизни SSD.
Или другой вариант — посчитать максимальный TBW для своего SSD исходя из его технических характеристик, а потом отслеживать реальный TBW в процессе эксплуатации.
Брак
Твердотельные накопители перед выпуском в продажу проходят строгую систему контроля. Однако вероятность брака, хоть и крайне низкая, все же остается. И чаще всего причиной быстрого расхода ресурса является неисправный контроллер. Однако, на SSD накопители дается гарантия от 1 до 8 лет, которой Вы сможете воспользоваться в случае возникновения проблем.
Что такое TBW
На наш взгляд, главная причина в выборе SSD большего объема кроется в ресурсе накопителя. Этот параметр определяется значением TBW (Total Byte Written) — количества данных, которые можно гарантированно записать на накопитель до исчерпания его ресурса. Обычно он измеряется в терабайтах, т.е. надпись «300 TBW», к примеру, означает возможность SSD «переварить» запись 300 Тбайт данных.
Стоит понимать, что это именно гарантированный объем записи. Другими словами, при исчерпании заявленного производителем ресурса твердотельный накопитель вовсе не обязательно сразу же умрет. Некоторые модели SSD легко переносят и 2-кратное превышение TBW, продолжая работать как ни в чем не бывало.
К тому же, все современные модели SSD используют контроллеры, которые стремятся минимизировать циклы перезаписи в одну и ту же ячейку. Для этого они используют всевозможные алгоритмы выравнивания износа, контролирующие обращения к каждой ячейке памяти. Они равномерно распределяют записываемую информацию между всеми ячейками, продлевая срок жизни каждой из них. Ну а в случае выхода из строя какой-то ячейки, контроллер имеет возможность оперирования специальным резервом памяти, выделяя из него новые ячейки взамен вышедших из строя.
Кстати, о том, как не убить SSD, раньше времени, вы можете прочитать в нашей статье.
Причины быстрого износа SSD
Скорость износа SSD зависит от характера его эксплуатации:
- интенсивности операций записи-удаления данных;
- объема записываемой информации;
- времени хранения.
А значит, причин быстрого старения твердотельного накопителя может быть множество. Вот самые распространенные:
Существуют ли убитые SSD?
Бытует мнение, что новые более производительные ssd выходят чаще, чем старые успевают убиться. Поэтому первым делом было интересно посмотреть на самый убитый с точки зрения ресурса записи диск. Минимальное значение по всем ssd всех клиентов — 1%.
Мы сразу же написали клиенту об этом, это оказался дедик в hetzner. Поддержка хостера сразу же заменила ssd:
Очень интересно было бы посмотреть, как выглядит с точки зрения операционной системы ситуация, когда ssd перестает обслуживать запись (мы сейчас ищем возможность провести умышленное издевательство над ssd, чтобы посмотреть на метрики этого сценария:)
Не используйте SSD для торрентов
Использовать SSD для скачивания торрентов — не самая удачная идея. Конечно, если вам не жалко твердотельный накопитель, то связка SSD и широкого канала доступа в интернет поможет поднять скорость скачивания до невероятных значений. Но, как мы и писали, ресурс SSD небезграничен, и вы рискуете «убить» его за очень короткий срок. Если же ваш канал ограничен стандартными для многих провайдеров 100 Мбит/с, никакого выигрыша в скорости вы, скорее всего, не получите.
Как зависит TBW от объема накопителя
Каждая линейка твердотельных накопителей имеет свой ресурс циклов перезаписи. Более того, чем выше объем SSD, тем больше этот ресурс. И именно поэтому мы рекомендуем покупать твердотельные накопители объемом 500 Гбайт и выше. Тем более, что сейчас их стоимость совсем невелика.
Читайте также: