Как организовано хранение информации на жестких дисках
1. Введение
Большинство пользователей, отвечая на вопрос, что находится в их системном блоке, помимо прочего упоминают винчестер. Винчестер - это устройство, на котором чаще всего хранятся Ваши данные. Бытует легенда, объясняющая, почему за жесткими дисками повелось такое причудливое название. Первый жесткий диск, выпущенный в Америке в начале 70-х годов, имел емкость по 30 Мб информации на каждой рабочей поверхности. В то же время, широко известная в той же Америке магазинная винтовка О. Ф. Винчестера имела калибр - 0.30; может грохотал при своей работе первый винчестер как автомат или порохом от него пахло - не знаю, но с той поры стали называть жесткие диски винчестерами.
В процессе работы компьютера случаются сбои. Вирусы, перебои энергоснабжения, программные ошибки - все это может послужить причиной повреждения информации, хранящейся на Вашем жестком диске. Повреждение информации далеко не всегда означает ее потерю, так что полезно знать о том, как она хранится на жестком диске, ибо тогда ее можно восстановить. Тогда, например, в случае повреждения вирусом загрузочной области, вовсе не обязательно форматировать весь диск (!), а, восстановив поврежденное место, продолжить нормальную работу с сохранением всех своих бесценных данных.
С одной стороны, в процессе написания этой статьи я ставил для себя задачей рассказать Вам:
о принципах записи информации на жесткий диск;
о размещении и загрузке операционной системы;
о том как грамотно разделить Ваш новый винчестер на разделы с целью использовать несколько операционных систем.
С другой стороны, я хочу подготовить читателя ко второй статье, в которой я расскажу о программах, называемых boot manager-ами. Для того чтобы понимать, как работают эти программы, нужно обладать базовыми знаниями о таких вещах как MBR, Partitions и т. д.
Довольно общих слов - приступим.
2. Устройство жесткого диска
Жесткий диск (НDD - Hard Disk Drive) устроен следующим образом: на шпинделе, соединенным с электромотором, расположен блок из нескольких дисков (блинов), над поверхностью которых находятся головки для чтения/записи информации. Форма головкам придается в виде крыла и крепятся они на серпообразный поводок. При работе они `летят` над поверхностью дисков в воздушном потоке, который создается при вращении этих же дисков. Очевидно, что подъемная сила зависит от давления воздуха на головки. Оно же, в свою очередь, зависит от внешнего атмосферного давления. Поэтому некоторые производители указывают в спецификации на свои устройства предельный потолок эксплуатации (например, 3000 м). Ну чем не самолет? Диск разбит на дорожки (или треки), которые в свою очередь поделены на сектора. Две дорожки, равноудаленные от центра, но расположенные по разные стороны диска, называются цилиндрами.
3. Хранение информации
Жесткий диск, как и всякое другое блочное устройство, хранит информацию фиксированными порциями, которые называются блоками. Блок является наименьшей порцией данных, имеющей уникальный адрес на жестком диске. Для того чтобы прочесть или записать нужную информацию в нужное место, необходимо представить адрес блока в качестве параметра команды, выдаваемой контроллеру жесткого диска. Размер блока уже довольно с давних пор является стандартным для всех жестких дисков - 512 байт.
К сожалению, достаточно часто происходит путаница между такими понятиями как `сектор`, `кластер` и `блок`. Фактически, между `блоком` и `сектором` разницы нет. Правда, одно понятие логическое, а второе топологическое. `Кластер` - это несколько секторов, рассматриваемых операционной системой как одно целое. Почему не отказались от простой работы с секторами? Отвечу. Переход к кластерам произошел потому, что размер таблицы FAT был ограничен, а размер диска увеличивался. В случае FAT16 для диска объемом 512 Мб кластер будет составлять 8 Кб, до 1 Гб - 16 Кб, до 2 Гб - 32 Кб и так далее.
Для того чтобы однозначно адресовать блок данных, необходимо указать все три числа (номер цилиндра, номер сектора на дорожке, номер головки). Такой способ адресации диска был широко распространен и получил впоследствии обозначение аббревиатурой CHS (cylinder, head, sector). Именно этот способ был первоначально реализован в BIOS, поэтому впоследствии возникли ограничения, связанные с ним. Дело в том, что BIOS определил разрядную сетку адресов на 63 сектора, 1024 цилиндра и 255 головок. Однако развитие жестких дисков в то время ограничилось использованием лишь 16 головок в связи со сложностью изготовления. Отсюда появилось первое ограничение на максимально допустимую для адресации емкость жесткого диска: 1024*16*63*512 = 504Mb.
Он магнитный. Он электрический. Он фотонный. Нет, это не новое супергеройское трио из вселенной Marvel. Речь идёт о хранении наших драгоценных цифровых данных. Нам нужно где-то их хранить, надёжно и стабильно, чтобы мы могли иметь к ним доступ и изменять за мгновение ока. Забудьте о Железном человеке и Торе — мы говорим о жёстких дисках!
Итак, давайте погрузимся в изучении анатомии устройств, которые мы сегодня используем для хранения миллиардов битов данных.
You spin me right round, baby
Механический накопитель на жёстких дисках (hard disk drive, HDD) был стандартом систем хранения для компьютеров по всему миру в течение более 30 лет, но лежащие в его основе технологии намного старше.
Первый коммерческий HDD компания IBM выпустила в 1956 году, его ёмкость составляла аж 3,75 МБ. И в целом, за все эти годы общая структура накопителя не сильно изменилась. В нём по-прежнему есть диски, которые используют для хранения данных намагниченность, и есть устройства для чтения/записи этих данных. Изменился же, и очень сильно, объём данных, который можно на них хранить.
В 1987 году можно было купить HDD на 20 МБ примерно за 350 долларов; сегодня за такие же деньги можно купить 14 ТБ: в 700 000 раз больший объём.
Мы рассмотрим устройство не совсем такого размера, но тоже достойное по современным меркам: 3,5-дюймовый HDD Seagate Barracuda 3 TB, в частности, модель ST3000DM001, печально известную своим высоким процентом сбоев и вызванных этим юридических процессов. Изучаемый нами накопитель уже мёртв, поэтому это будет больше похоже на аутопсию, чем на урок анатомии.
Перевернув накопитель, мы видим печатную плату и несколько разъёмов. Разъём в верхней части платы используется для двигателя, вращающего диски, а нижние три (слева направо) — это контакты под перемычки, позволяющие настраивать накопитель под определённые конфигурации, разъём данных SATA (Serial ATA) и разъём питания SATA.
Serial ATA впервые появился в 2000 году. В настольных компьютерах это стандартная система, используемая для подключения приводов к остальной части компьютера. Спецификация формата претерпела множество ревизий, и сейчас мы пользуемся версией 3.4. Наш труп жёсткого диска имеет более старую версию, но различие заключается только в одном контакте в разъёме питания.
В подключениях передачи данных для приёма и получения данных используется дифференцированный сигнал: контакты A+ и A- используются для передачи инструкций и данных в жёсткий диск, а контакты B — для получения этих сигналов. Подобное использование спаренных проводников значительно снижает влияние на сигнал электрического шума, то есть устройство может работать быстрее.
Если говорить о питании, то мы видим, что в разъёме есть по паре контактов каждого напряжения (+3.3, +5 и +12V); однако большинство из них не используется, потому что HDD не требуется много питания. Эта конкретная модель Seagate при активной нагрузке использует менее 10 Вт. Контакты, помеченные как PC, используются для precharge: эта функция позволяет вытаскивать и подключать жёсткий диск, пока компьютер продолжает работать (это называется горячей заменой (hot swapping)).
Контакт с меткой PWDIS позволяет удалённо перезагружать (remote reset) жёсткий диск, но эта функция поддерживается только с версии SATA 3.3, поэтому в моём диске это просто ещё одна линия питания +3.3V. А последний контакт, помеченный как SSU, просто сообщает компьютеру, поддерживает ли жёсткий диск технологию последовательной раскрутки шпинделей staggered spin up.
Перед тем, как компьютер сможет их использовать, диски внутри устройства (которые мы скоро увидим), должны раскрутиться до полной скорости. Но если в машине установлено много жёстких дисков, то внезапный одновременный запрос питания может навредить системе. Постепенная раскрутка шпинделей полностью устраняет возможность таких проблем, но при этом перед получением полного доступа к HDD придётся подождать несколько секунд.
Сняв печатную плату, можно увидеть, как она соединяется с компонентами внутри устройства. HDD не герметичны, за исключением устройств с очень большими ёмкостями — в них вместо воздуха используется гелий, потому что он намного менее плотный и создаёт меньше проблем в накопителях с большим количеством дисков. С другой стороны, не стоит и подвергать обычные накопители открытому воздействию окружающей среды.
Благодаря использованию таких разъёмов минимизируется количество входных точек, через которые внутрь накопителя могут попасть грязь и пыль; в металлическом корпусе есть отверстие (большая белая точка в левом нижнем углу изображения), позволяющее сохранять внутри давление окружающей среды.
Теперь, когда печатная плата снята, давайте посмотрим, что находится внутри. Тут есть четыре основных чипа:
- LSI B64002: чип основного контроллера, обрабатывающий инструкции, передающий потоки данных внутрь и наружу, корректирующий ошибки и т.п.
- Samsung K4T51163QJ: 64 МБ DDR2 SDRAM с тактовой частотой 800 МГц, используемые для кэширования данных
- Smooth MCKXL: управляет двигателем, крутящим диски
- Winbond 25Q40BWS05: 500 КБ последовательной флеш-памяти, используемой для хранения встроенного ПО накопителя (немного похожего на BIOS компьютера)
Открыть накопитель просто, достаточно открутить несколько болтов Torx и вуаля! Мы внутри…
Учитывая, что он занимает основную часть устройства, наше внимание сразу привлекает большой металлический круг; несложно понять, почему накопители называются дисковыми. Правильно их называть пластинами; они изготавливаются из стекла или алюминия и покрываются несколькими слоями различных материалов. Этот накопитель на 3 ТБ имеет три пластины, то есть на каждой стороне одной пластины должно храниться 500 ГБ.
Изображение довольно пыльное, такие грязные пластины не соответствуют точности проектирования и производства, необходимого для их изготовления. В нашем примере HDD сам алюминиевый диск имеет толщину 0,04 дюйма (1 мм), но отполирован до такой степени, что средняя высота отклонений на поверхности меньше 0,000001 дюйма (примерно 30 нм).
Базовый слой имеет глубину всего 0,0004 дюйма (10 микронов) и состоит из нескольких слоёв материалов, нанесённых на металл. Нанесение выполняется при помощи химического никелирования с последующим вакуумным напылением, подготавливающих диск для основных магнитных материалов, используемых для хранения цифровых данных.
Этот материал обычно является сложным кобальтовым сплавом и составлен из концентрических кругов, каждый из которых примерно 0,00001 дюйма (примерно 250 нм) в ширину и 0,000001 дюйма (25 нм) в глубину. На микроуровне сплавы металлов образуют зёрна, похожие на мыльные пузыри на поверхности воды.
Каждое зерно обладает собственным магнитным полем, но его можно преобразовать в заданном направлении. Группирование таких полей приводит к возникновению битов данных (0 и 1). Если вы хотите подробнее узнать об этой теме, то прочитайте этот документ Йельского университета. Последними покрытиями становятся слой углерода для защиты, а потом полимер для снижения контактного трения. Вместе их толщина составляет не больше 0,0000005 дюйма (12 нм).
Скоро мы увидим, почему пластины должны изготавливаться с такими строгими допусками, но всё-таки удивительно осознавать, что всего за 15 долларов можно стать гордым владельцем устройства, изготовленного с нанометровой точностью!
Однако давайте снова вернёмся к самому HDD и посмотрим, что же в нём есть ещё.
Жёлтым цветом показана металлическая крышка, надёжно крепящая пластину к электродвигателю привода шпинделя — электроприводу, вращающему диски. В этом HDD они вращаются с частотой 7200 rpm (оборотов/мин), но в других моделях могут работать медленнее. Медленные накопители имеют пониженный шум и энергопотребление, но и меньшую скорость, а более быстрые накопители могут достигать скорости 15 000 rpm.
Чтобы снизить урон, наносимый пылью и влагой воздуха, используется фильтр рециркуляции (зелёный квадрат), собирающий мелкие частицы и удерживающий их внутри. Воздух, перемещаемый вращением пластин, обеспечивает постоянный поток через фильтр. Над дисками и рядом с фильтром есть один из трёх разделителей пластин: помогающих снижать вибрации и поддерживать как можно более равномерный поток воздуха.
В левой верхней части изображения синим квадратом указан один из двух постоянных стержневых магнитов. Они обеспечивают магнитное поле, необходимое для перемещения компонента, указанного красным цветом. Давайте отделим эти детали, чтобы видеть их лучше.
То, что выглядит как белый пластырь — это ещё один фильтр, только он очищает частицы и газы, попадающие снаружи через отверстие, которое мы видели выше. Металлические шипы — это рычаги перемещения головок, на которых находятся головки чтения-записи жёсткого диска. Они с огромной скоростью движутся по поверхности пластин (верхней и нижней).
Посмотрите это видео, созданное The Slow Mo Guys, чтобы увидеть, насколько они быстрые:
В конструкции не используется чего-то вроде шагового электродвигателя; для перемещения рычагов по соленоиду в основании рычагов проводится электрический ток.
Обобщённо их называют звуковыми катушками, потому что они используют тот же принцип, который применяется в динамиках и микрофонах для перемещения мембран. Ток генерирует вокруг них магнитное поле, которое реагирует на поле, созданное стержневыми постоянными магнитами.
Не забывайте, что дорожки данных крошечны, поэтому позиционирование рычагов должно быть чрезвычайно точным, как и всё остальное в накопителе. У некоторых жёстких дисков есть многоступенчатые рычаги, которые вносят небольшие изменения в направление только одной части целого рычага.
В некоторых жёстких дисках дорожки данных накладываются друг на друга. Эта технология называется черепичной магнитной записью (shingled magnetic recording), и её требования к точности и позиционированию (то есть к попаданию постоянно в одну точку) ещё строже.
На самом конце рычагов есть очень чувствительные головки чтения-записи. В нашем HDD содержится 3 пластины и 6 головок, и каждая из них плавает над диском при его вращении. Для этого головки подвешены на сверхтонких полосках металла.
И здесь мы можем увидеть, почему умер наш анатомический образец — по крайней мере одна из головок разболталась, и что бы ни вызвало изначальный повреждение, оно также погнуло один из рычагов. Весь компонент головки настолько мал, что, как видно ниже, очень сложно получить её качественный снимок обычной камерой.
Однако мы можем разобрать отдельные части. Серый блок — это специально изготовленная деталь под названием «слайдер»: когда диск вращается под ним, поток воздуха создаёт подъёмную силу, поднимая головку от поверхности. И когда мы говорим «поднимает», то имеем в виду зазор шириной всего 0,0000002 дюйма или меньше 5 нм.
Чуть дальше, и головки не смогут распознавать изменения магнитных полей дорожки; если бы головки лежали на поверхности, то просто поцарапали бы покрытие. Именно поэтому нужно фильтровать воздух внутри корпуса накопителя: пыль и влага на поверхности диска просто сломают головки.
Крошечный металлический «шест» на конце головки помогает с общей аэродинамикой. Однако чтобы увидеть части, выполняющие чтение и запись, нам нужна фотография получше.
На этом изображении другого жёсткого диска устройства чтения и записи находятся под всеми электрическими соединениями. Запись выполняется системой тонкоплёночной индуктивности (thin film induction, TFI), а чтение — туннельным магнеторезистивным устройством (tunneling magnetoresistive device, TMR).
Создаваемые TMR сигналы очень слабы и перед отправкой должны проходить через усилитель для повышения уровней. Отвечающий за это чип находится рядом с основанием рычагов на изображении ниже.
Как сказано во введении к статье, механические компоненты и принцип работы жёсткого диска почти не изменились за многие годы. Больше всего совершенствовалась технология магнитных дорожек и головок чтения-записи, создавая всё более узкие и плотные дорожки, что в конечном итоге приводило к увеличению объёма хранимой информации.
Однако механические жёсткие диски имеют очевидные ограничения скорости. На перемещение рычагов в нужное положение требуется время, а если данные разбросаны по разным дорожкам на различных пластинах, то на поиски битов накопитель будет тратить довольно много микросекунд.
Прежде чем переходить к другому типу накопителей, давайте укажем ориентировочные показатели скорости типичного HDD. Мы использовали бенчмарк CrystalDiskMark для оценки жёсткого диска WD 3.5" 5400 RPM 2 TB:
В первых двух строчках указано количество МБ в секунду при выполнении последовательных (длинный, непрерывный список) и случайных (переходы по всему накопителю) чтения и записи. В следующей строке показано значение IOPS, то есть количество операций ввода-вывода, выполняемых каждую секунду. В последней строке показана средняя задержка (время в микросекундах) между передачей операции чтения или записи и получением значений данных.
В общем случае мы стремимся к тому, чтобы значения в первых трёх строчках были как можно больше, а в последней строчке — как можно меньше. Не беспокойтесь о самих числах, мы просто используем их для сравнения, когда будем рассматривать другой тип накопителя: твердотельный накопитель.
Добрый день, Гиктаймс!
Некоторое время назад, на тостере попалось несколько интересных вопросов о хранении информации на жестких дисках, которые вызвали желание копнуть немного глубже, и я провел небольшое исследование.
Часть информации уже пробегала на Хабре, но не все. А кое-что я не смог найти в русскоязычном инете, поэтому и решил поделиться найденным с сообществом.
Где информация читается быстрее — в начале или в конце диска?
На жестких дисках, первый сектор находится на внешней стороне диска, а последний сектор — на внутренней.
В начале времен, количество секторов на дорожке было одинаково, но это было настолько в дремучее время, что можно и не вспоминать. Сейчас дорожки, находящиеся ближе к началу диска (внешней стороны), содержат больше секторов.
Итак, линейная скорость записи и чтения информации расположенной в начале диска, значительно выше. Точные цифры зависят от производительности самого диска, но в процентах — разница может составлять 200% и даже немного больше процентов между самыми крайними дорожками (!)
Количество секторов на дорожку указывается не индивидуально, а для зоны, в которые объеденено несколько дорожек, поэтому разница в скорости будет видна не для двух крайних дорожек, а для двух крайних зон и постепенно снижаться к середине диска. Вдобавок эмперически можно сказать, что «быстрых» секторов на диске больше — поскольку их просто больше на внешней части диска.
Блок ECC данных
В 512 байтных секторах, ECC Блок занимал 50 байт. В 4096 байтных секторах, ECC блок увеличился до 100 байт, но зато уменьшилось количество самих секторов. И на самом деле ECC занимает теперь в четыре раза меньше (100 байт на 4096 байт против 400 байт на 8*512 байт).
Вдобавок, на более длинной цепочке данных алгоритм коррекции работает эффективнее, в результате и место сэкономили и эффективность увеличили. По разным оценкам скорость вычисления ECC увеличилась на 5-10%. А значит, контроллер диска меньше напрягается и может заняться другими вещами. Косвенно это влияет и на общую производительность записи/чтения данных.
Один из главных плюсов — это конечно экономия места.
Суммарно — уменьшение объема, выделенного под блоки ECC, уменьшение общего количества секторов (меньше gap, меньше меток, меньше индексов для адресации секторов) — общий размер места, выделяемый для пользовательских данных, увеличился более чем на 10%!
Есть и еще один маленький плюс, связанный с большими секторами. В случае брака или дефекта поверхности, сразу плохим будет помечен бОльший участок. Если пометить мегабайт секторов по 512байт, это займет в разы больше времени, чем по 4кб.
Вдобавок нечитаемая часть будет помечена более надежно — если мы обрезаем подгнивший или червивый кусок вкусного яблока, мы отрезаем часть хорошего — так и в жестком диске — лучше пометить плохой участок не в притык.
Но конечно от дисков с бэдами лучше быстрее избавиться.
NAS: удобный и надежный бэкап
Хорошие NAS-системы обеспечивают отличную защиту информации в реальном времени, непрерывно сохраняя все новые данные на свои диски. Соответствующие утилиты для синхронизации называются, к примеру, Synology Cloud Station и Qnap QSync.
Управление этими системами может отличаться — подробные руководства вы найдете на сайтах разработчиков. От повреждений жестких дисков сетевое хранилище NAS спасет лишь в том случае, если располагает по меньшей мере двумя накопителями (на жаргоне NAS «Bays» = слотами для дисков).
Системы на два или четыре слота стандартно объединяют два накопителя в один массив RAID 1, в котором данные одновременно сохраняются на оба диска.
Но вы можете задействовать второй этап бэкапа (устойчивость к вредоносному ПО), используя оба накопителя как отдельные тома вместо одного массива RAID 1. Резервные копии в реальном времени с ПК сохраняйте на диск номер 1. С него посредством вашей версии программы для резервного копирования NAS регулярно записывайте на второй диск «моментальные снимки», отражающие реальное состояние папок архива на момент их создания.
Такое программное решение от компании Synology носит название «Hyper Backup», а продукт от Qnap — «Hybrid Backup». Подробные руководства пользователя вы найдете на веб-страницах разработчиков. Если настроить права к конечным папкам со снимками так, чтобы компьютеры не имели к ним прав на запись, эффективная защита от вирусов гарантирована.
В веб-интерфейсе NAS-системы можно активировать сервис для синхронизации файлов в реальном времени (например, Synology CloudStation), взаимодействующий с клиентским ПО на ПК с Windows
Сконфигурированное таким образом сетевое хранилище объединит в себе оба этапа бэкапа даже сразу для нескольких компьютеров в локальной сети. Те же, кто хочет защитить свои данные от грабителей или от пожара, должны вынести дополнительные копии либо в облако, либо на внешних дисках.
В следующей статье мы расскажем, как организовать синхронизацию файлов для бэкапа данных, в том числе в режиме реального времени.
Про Cluster Straddling.
Это касается именно тех дисков, которые работают в 512е эмуляции (а таких в ходу еще много)
Разобъем такой диск на разделы и отформатируем с дефолтными настройками. Стандартный кластер NTFS- 4 килобайта. Блок HFS+ (или ext4) — обычно тоже 4 килобайта. И физический сектор диска — уже тоже 4 килобайта. Очень удобный размер (даже x86 mem страница — тоже 4 кбайта).
Но во время разбития 512e диска на разделы, может выйти так, что раздел будет начинаться начинается не с начала 4-к сектора, а со смещением, кратным 512 байт.
В результате 4 килобайтный кластер/блок будет лежать между двумя 4 килобайтными физическими секторами жесткого диска.
Каждый раз при чтении такого кластера, жесткий диск (из-за логики своей работы) будет считывтаь два сектора целиком. При записи тоже не все гладно.
Эту проблему решают различные align утилиты — тот же WD Align Tool или HGST Align Tool для Windows 7 и выше.
Только применять их нужно ПОСЛЕ того, как вы разбили диск на партиции — утилита проверит, что границы партиций совпадают с началом нового 4кбайтного сектора, и подвинет их, если это потребуется. После чего можно работать без падения производительности.
Что такое SMR и с чем его едят?
Размеры пишущей головки примерно в 1,7 раза больше по сравнению с размерами считывающего сенсора. Столь внушительная разница объясняется достаточно просто: если записывающий модуль сделать еще более миниатюрным, силы магнитного поля, которое он сможет генерировать, окажется недостаточно для намагничивания доменов ферромагнитного слоя, а значит, данные попросту не будут сохраняться. В случае со считывающим сенсором такой проблемы не возникает. Более того: его миниатюризация позволяет дополнительно снизить влияние упомянутой выше ITI на процесс считывания информации.
Данный факт лег в основу черепичной магнитной записи (Shingled Magnetic Recording, SMR). Давайте разбираться, как это работает. При использовании традиционного PMR пишущая головка смещается относительно каждого предыдущего трека на расстояние, равное ее ширине + ширина защитного пространства (guard space).
При использовании черепичного метода магнитной записи пишущая головка смещается вперед лишь на часть своей ширины, поэтому каждый предыдущий трек оказывается частично перезаписан последующим: магнитные дорожки накладываются друг на друга подобно кровельной черепице. Такой подход позволяет дополнительно повысить плотность записи, обеспечивая выигрыш по емкости до 10%, при этом не отражаясь на процессе чтения. В качестве примера можно привести Western Digital Ultrastar DC HC 650 — первые в мире 3.5-дюймовые накопители объемом 20 ТБ с интерфейсом SATA/SAS, появление которых стало возможным именно благодаря новой технологии магнитной записи. Таким образом, переход на SMR-диски позволяет повысить плотность хранения данных в тех же стойках при минимальных затратах на модернизацию IT-инфраструктуры.
Несмотря на столь значительное преимущество, SMR имеет и очевидный недостаток. Поскольку магнитные дорожки накладываются друг на друга, при обновлении данных потребуется перезапись не только требуемого фрагмента, но и всех последующих треков в пределах магнитной пластины, объем которой может превышать 2 терабайта, что чревато серьезным падением производительности.
Решить данную проблему помогает объединение определенного количества треков в обособленные группы, называемые зонами. Хотя такой подход к организации хранения данных несколько снижает общую емкость HDD (поскольку между зонами необходимо сохранять достаточные промежутки, препятствующие перезаписи треков из соседних групп), это позволяет существенно ускорить процесс обновления данных, так как теперь в нем участвует лишь ограниченное количество дорожек.
Черепичная магнитная запись предполагает несколько вариантов реализации:
- Drive Managed SMR (SMR, управляемая диском)
Недостаток этого подхода заключается в изменчивости уровня производительности, в связи с чем Drive Managed SMR оказывается неподходящей для корпоративных приложений, в которых постоянство быстродействия системы является критически важным параметром. Тем не менее такие диски хорошо показывают себя в сценариях, предоставляющих достаточное время для выполнения фоновой дефрагментации данных. Так, например, DMSMR-накопители WD Red, оптимизированные для использования в составе малых NAS на 8 отсеков, станут отличным выбором для системы архивирования или резервного копирования, предполагающей долговременное хранение бэкапов.
- Host Managed SMR (SMR, управляемая хостом)
При использовании HMSMR весь доступный объем накопителя разделяется на зоны двух типов: Conventional Zones (обычные зоны), которые используются для хранения метаданных и произвольной записи (по сути, играют роль кэша), и Sequential Write Required Zones (зоны последовательной записи), занимающие большую часть общей емкости жесткого диска, в которых данные записываются строго последовательно. Неупорядоченные данные сохраняются в области кэширования, откуда затем могут быть перенесены в соответствующую зону последовательной записи. Благодаря этому все физические сектора записываются последовательно в радиальном направлении и перезаписываются только после циклического переноса, что позволяет добиться стабильной и предсказуемой производительности системы. При этом HMSMR-диски поддерживают команды произвольного чтения аналогично накопителям, использующим стандартный PMR.
Host Managed SMR реализована в жестких дисках enterprise-класса Western Digital Ultrastar HC DC 600-й серии.
Линейка включает в себя SATA- и SAS-накопители высокой емкости, ориентированные на использование в составе гипермасштабных центров обработки данных. Поддержка Host Managed SMR существенно расширяет сферу применения таких винчестеров: помимо систем резервного копирования, они прекрасно подойдут для облачных хранилищ, CDN или стриминговых платформ. Высокая емкость жестких дисков позволяет существенно повысить плотность хранения (в тех же стойках) при минимальных затратах на апгрейд, а низкое энергопотребление (не более 0,29 Ватта на каждый терабайт сохраненной информации) и тепловыделение (в среднем на 5 °C ниже, чем у аналогов) — дополнительно сократить операционные расходы на обслуживание ЦОДа.
Единственным недостатком HMSMR является сравнительная сложность имплементации. Все дело в том, что на сегодняшний день ни одна операционная система или приложение не умеют работать с подобными накопителями «из коробки», в силу чего для адаптации IT-инфраструктуры требуются серьезные изменения стека программного обеспечения. В первую очередь это касается, конечно же, самой ОС, что в условиях современных ЦОД, использующих многоядерные и многосокетные сервера, является достаточно нетривиальной задачей. Узнать подробнее о вариантах реализации поддержки Host Managed SMR можно на специализированном ресурсе ZonedStorage.io, посвященном вопросам зонального хранения данных. Собранные здесь сведения помогут предварительно оценить степень готовности вашей IT-инфраструктуры для перевода на зональные системы хранения.
- Host Aware SMR (SMR, поддерживаемая хостом)
Подобно Host Managed SMR, Host Aware SMR использует два типа зон: Conventional Zones для произвольной записи и Sequential Write Preferred Zones (зоны, предпочтительные для последовательной записи). Последние, в отличие от упомянутых выше Sequential Write Required Zones, автоматически переводятся в разряд обычных в том случае, если в них начинает вестись неупорядоченная запись данных.
Реализация SMR с поддержкой хоста предусматривает внутренние механизмы восстановления после непоследовательной записи. Неупорядоченные данные записываются в области кэширования, откуда диск может переносить информацию в зону последовательной записи, после того как будут получены все необходимые блоки. Для управления неупорядоченной записью и фоновой дефрагментацией диск использует таблицу косвенного обращения. Однако, если корпоративным приложениям требуется предсказуемая и оптимизированная производительность, достичь этого по-прежнему можно лишь в случае, когда хост берет на себя полное управление всеми потоками данных и зонами записи.
При сегодняшних массивах данных ни один бэкап не может проходить без участия жестких дисков. Такие носители предлагают большие объемы за небольшие деньги, позволяют осуществлять быстрое архивирование и восстановление.
Жесткие диски являются наиболее оптимальным хранителем ваших файлов, будь то фотоархив, видео или ценные документы. Именно они являются самым бюджетным и емким носителем, по сравнению с оптическими дисками или облачными сервисами.
Но, помимо несомненных плюсов использования HDD, у этих типов накопителей есть и существенный недостаток: в среднем они служат несколько лет, однако отдельные экземпляры могут выйти из строя уже через несколько дней или недель с начала эксплуатации без каких-либо предупреждений.
Про виртуальные 512- байтные сектора
Логотип с «512e» означает, что сам диск уже 4кб-секторный, но работает в режиме эмуляции виртуальных 512 байтных секторов.
Логотип с «4Kn» говорит, что диск поддерживает 4к нативный интерфейс, такие диски в продаже с 2014 года.
Многие все еще популярные ОС (тут я говорю про Windows 7 и Windows Vista), не поддерживают 4к диски нативно.
Тем не менее, старые диски на них работают отлично, а новые диски предоставляют интерфейс с виртуальными 512-байтными секторами.
О виртуальных 512-байтных секторах следует помнить, когда вы тестируете 512е диски, или во время теста работаете на устаревшей ОС.
Например, запись рандомных 512-байтных секторов в таких условиях будет выглядеть как «считать 4кб, записать 4к», что явно будет выдавать непонятную деградацию скорости на графике. В тоже время как линейная скорость записи и чтения будет показывать нормальную производительность.
Windows поддерживает 4кn диски нативно, начиная с Windows 8 и Windows server 2012.
Правильное использование прав доступа
Внутренний или постоянно подключенный внешний диски не застрахованы от случайной перезаписи или от активности трояна-вымогателя. Определенную защиту могут предложить права доступа к Windows. Для этого в параметрах Windows создайте стандартный аккаунт без прав администратора для повседневной работы.
Настройте папки таким образом, чтобы у этого пользователя был полный доступ к исходным директориям, которые должны быть скопированы, однако к конечным папкам с архивами — только доступ на чтение (клик правой кнопкой мыши по папке «Свойства | Безопасность | Изменить…»).
Добавьте еще один стандартный аккаунт для резервных копий, который к исходным папкам будет иметь лишь право на чтение, а к конечным — полный. ПО для бэкапа необходимо запускать под аккаунтом для резервных копий — это настраивается либо в самом ПО, либо в Планировщике задач Windows («При выполнении задачи использовать следующую учетную запись пользователя:»).
После атаки трояна-вымогателя, например Petya, данным можно сказать «прощай». Хорошо, когда под рукой есть резервная копия
Программы-вымогатели, похищающие, как правило, стандартную учетную запись, уже не смогут зашифровать резервные копии. Однако все усилия будут напрасными, если вирус обзаведется правами администратора. Поэтому не стоит пренебрегать вторым этапом: сохранением раз в день, неделю или месяц копий на внешний диск, изолированный от процессов бэкапа, происходящих на компьютере. Достаточно будет простого USB-диска 2,5 дюйма.
Если речь идет о крупных массивах данных, мы рекомендуем встроить большой и долговечный NAS-диск в корпус 3,5 дюйма для подключения по USB. Или же вы можете сразу сделать разумную инвестицию в самое удобное решение для локального хранения резервных копий: систему NAS (Network Attached Storage).
Быстрая и адекватная реакция на дефекты дисков
Информация, хранящаяся на двух дисках, при повреждении одного из них все равно будет в безопасности — и все же в этом случае необходимо срочно заменить вышедший из строя накопитель и скопировать данные на новый.
Внимание: при старении еще работающего диска или при возникновении с ним проблем скорость копирования может кого угодно вывести из себя. В таких ситуациях следует сначала заняться самой важной информацией (то есть теми файлами, которые при последнем бэкапе не попали на другой накопитель). После того как вы и диск остынете, скопируйте остальное.
LMR, PMR, CMR и TDMR: в чем разница?
Принцип работы жестких дисков достаточно прост. Тонкие металлические пластины, покрытые слоем ферромагнитного материала (кристаллического вещества, способного сохранять намагниченность даже при отсутствии воздействия на него внешнего магнитного поля при температуре ниже точки Кюри) движутся относительно блока пишущих головок на большой скорости (5400 оборотов в минуту или более). При подаче электрического тока на пишущую головку возникает переменное магнитное поле, которое изменяет направление вектора намагниченности доменов (дискретных областей вещества) ферромагнетика. Считывание данных происходит либо за счет явления электромагнитной индукции (перемещение доменов относительно сенсора вызывает в последнем возникновение переменного электрического тока), либо за счет гигантского магниторезистивного эффекта (под действием магнитного поля изменяется электрическое сопротивление датчика), как это реализовано в современных накопителях. Каждый домен кодирует один бит информации, принимая логическое значение «0» или «1» в зависимости от направления вектора намагниченности.
Долгое время жесткие диски использовали метод продольной магнитной записи (Longitudinal Magnetic Recording, LMR), при котором вектор намагниченности доменов лежал в плоскости магнитной пластины. Несмотря на относительную простоту реализации, данная технология имела существенный недостаток: для того чтобы побороть коэрцитивность (переход магнитных частиц в однодоменное состояние), между треками приходилось оставлять внушительную буферную зону (так называемое guard space — защитное пространство). Вследствие этого максимальная плотность записи, которой удалось добиться на закате данной технологии, составляла всего 150 Гбит/дюйм 2 .
В 2010 году LMR была практически полностью вытеснена PMR (Perpendicular Magnetic Recording — перпендикулярная магнитная запись). Главное отличие данной технологии от продольной магнитной записи состоит в том, что вектор магнитной направленности каждого домена располагается под углом 90° к поверхности магнитной пластины, что позволило существенно сократить промежуток между треками.
За счет этого плотность записи данных удалось заметно увеличить (до 1 Тбит/дюйм 2 в современных устройствах), при этом не жертвуя скоростными характеристиками и надежностью винчестеров. В настоящее время перпендикулярная магнитная запись является доминирующей на рынке, в связи с чем ее также часто называют CMR (Conventional Magnetic Recording — обычная магнитная запись). При этом надо понимать, что между PMR и CMR нет ровным счетом никакой разницы — это всего лишь другой вариант названия.
Изучая технические характеристики современных жестких дисков, вы также можете наткнуться на загадочную аббревиатуру TDMR. В частности, данную технологию используют накопители корпоративного класса Western Digital Ultrastar 500-й серии. С точки зрения физики TDMR (что расшифровывается как Two Dimensional Magnetic Recording — двумерная магнитная запись) ничем не отличается от привычной нам PMR: как и прежде, мы имеем дело с непересекающимися треками, домены в которых ориентированы перпендикулярно плоскости магнитных пластин. Разница между технологиями заключается в подходе к считыванию информации.
В блоке магнитных головок винчестеров, созданных по технологии TDMR, на каждую пишущую головку приходятся по два считывающих сенсора, осуществляющих одновременное чтение данных с каждого пройденного трека. Такая избыточность дает возможность контроллеру HDD эффективно фильтровать электромагнитные шумы, появление которых обусловлено межтрековой интерференцией (Intertrack Interference, ITI).
Решение проблемы с ITI обеспечивает два чрезвычайно важных преимущества:
- снижение коэффициента помех позволяет повысить плотность записи за счет уменьшения расстояния между треками, обеспечивая выигрыш по общей емкости вплоть до 10% по сравнению с обычной PMR;
- в сочетании с технологией RVS и трехпозиционным микроактуатором, TDMR позволяет эффективно противостоять ротационной вибрации, вызванной работой винчестеров, что помогает добиться стабильного уровня производительности даже в наиболее сложных условиях эксплуатации.
О секторах
Это не совсем 512 байт. Это область, в которой для пользовательских данных выделено 512 байт. Также есть служебная информация о секторе — это низкоуровневая метка начала и конца сектора, а также блок коррекции данных, обычно он идет после пользовательских данных. Плюс неразмеченное место между секторами (gap).
Метки сектора наносятся производителем во время так называемого низкоуровневого форматирования. В древние годы, это можно было делать самостоятельно из BIOS, но сейчас штатными способами это уже недоступно пользователю. Объем служебных данных, может варьироваться в зависимости от оптимизации firmware диска, но в считается, что сектор вместе со служебными данными занимает 577 байт. Плюс gap.
Точнее так было раньше.
В 2007 году было предложено увеличение размера сектора, и после процедур согласования и утверждения, начиная с 2011 года, все выпускающиеся диски уже форматируются с сектором размером в 4096 байт пользовательских данных (примерно 4211 байт со служебными данными) — так называемый Advanced Format.
Упрощение адресации низкоуровневых секторов, которых стало в восемь раз меньше при том же объеме — это и увеличение производительности за счет упрощения расчетов и работы с бОльшими блоками, и эффективность использования диска заметно увеличилась. Насколько? Давайте дочитаем следующий абзац.
Обязательное дублирование копий на HDD
С учетом вышеперечисленного становится ясно, что основной принцип хранения архивов на жестких дисках — это избыточность информации: новые данные должны по возможности быстро попадать как минимум на два отдельных накопителя. Проще всего это сделать на настольном ПК со вторым внутренним диском, регулярно копируя данные вручную или автоматически на оба.
Выбор 3,5-дюймовых SATA-носителей огромен. Для хранения информации лучше всего подходят NAS-диски. Они разработаны специально для бесшумного и экономного режима непрерывной работы, благодаря чему практически не нагреваются и способны служить дольше. Самой известной линейкой NAS является WD Red от Western Digital. Схожая концепция и у компании Seagate, реализованная в серии Iron Wolf.
Неважно, что вы выберете, NAS или обычный диск с повышенным быстродействием, — максимальную долговечность обещать могут лишь те носители, которые заявлены производителями как пригодные для непрерывного использования («24/7») и с гарантией как минимум на три года.
Дополнительный жесткий SATA-диск 3,5 дюйма очень просто установить в компьютер: закрепить, подключить — готово!
Добавить SATA-диски формата 3,5 дюйма в настольный компьютер просто: закрепить в свободной нише, подключить информационный SATA-кабель и кабель питания, после включения компьютера отформатировать — готово.
Про размагничивание данных на диске.
В нормальных бытовых условиях (отсутствие резкой смены температуры/влажности/давления, отсутствие ударов), намагниченная поверхность диска может хранить информацию несколько десятков лет. Гарантировать сложно, так как реальные промышленные тесты не проводились, а те, что проводятся — обычно как раз и представляют собой смену внешних условий для воздействия аггрессивной средой.
Но большинство сходятся на том, что мощность магнитного поля деградирует со скоростью примерно 1% в год.
При этом нельзя сказать, что через 50 лет не прочитается половина диска — это некорректно, ибо деградация поля не равна поломке — тут роль играет чувствительность считывающих головок и точность механизма позиционирования.
Даже в одной партии жестких дисков хорошего производителя на выходе получаются немного отличные пластины, и цельное устройство тщательно калибруется на заводе. Повторная калибровка в домашних условиях невозможна.
Со временем, внешне может показаться, что это ухудшилась магнитная запись, но в подавляющем большинстве случаев — ухудшение считывания связано с механической деградацией материалов — это вызывает и ошибки позиционирования и чувствительность головок.
Если важные для вас данные перестали считываться со старого жесткого диска — скорее всего дело в деградации механики/электроники, и их можно считать в специальных компаниях, которые специализируются на восстановлении даных — винчестер разберут, блины вынут и установят на отдельное устройства, после чего считают с них данные напрямую.
Даже если механика и электроника полностью навернулась — сами пластины и информация на них подлежит считыванию.
Есть множество свидетелей, у которых старые диски, лежащие в шкафчике, отлично читаются спустя 15, и даже 20 лет (я, кстати, тоже один из них). А бывает, что диск не заводится, едва перейдя гарантийный срок годности.
Итак, в современных дисках сперва выходит из строя электроника и механика, раздалбываются разъемы, могут даже устареть стандарты, но вряд ли основной причиной будет размагничивание данных.
К этому можно еще добавить, что первыми должны размагнититься низкоуровневые разметки дорожек и секторов, которые были нанесены производителем, и которые штатными способами пользователь перезаписывать не сможет. Правда мощность поля у разметки гораздо выше, что заметно под микроскопом, но тем не менее ничто не вечно.
Выводы из этого пункта — перезаписывать информацию на диске, чтобы «обновить» магнитную запись — нет никакого резона.
Гораздо важнее обеспечить отсутствие агрессивного внешнего воздействия, как самое элементарное — закрутить его понадежнее, чтобы уменьшить вибрации. Включение-выключение ведет к тому, что температура диска меняется и следовательно материал расширяется и сужается. Это один из важных факторов, почему быстрые HDD живут меньше, чем медленные диски из «green» серий, у которых перепад температуры гораздо меньше. Но не стоит забывать, что если диск на ощупь не горячий, это не значит, что металл не расширился — каждый цикл включения-выключения ускоряет деградацию материала, просто у «холодных дисков» она заметно меньше.
Если ваш компьютер регулярно засыпает и просыпается, по нескольку раз в день, а питается он от сети — имеет смысл увеличить срок ожидания до выключения диска при питании от сети. Современные жесткие диски в режиме простоя потребляют всего пару ватт.
Как же хранить?
Если сравнивать с CD, DVD и флешками — CD и флеш диски явно проигрывают в длительности хранения данных. DVD могут поспорить, но тут все неоднозначно — нужны и качественные болванки, и хороший привод, и запись производить не на максимальной скорости, и все равно, есть вероятность, что данные перестанут читаться. Вдобавок, 4.5 или даже 9 гб на DVD — это не так уж много, плюс отсутствие комфорта. И сохранить можно только раз — связываться с DVD-RW для длительного хранения данных вообще не стоит.
Я записал в свое время свыше 5000 CD/DVD дисков, тестировал чтение. Конечно качество чтения и долговечность зависела от качества болванки, но тот же самый Verbatim, который был одним из эталонов CD-R 650, в DVD был довольно посредственным.И в каждой партии могло встретиться что-то неудачное.
Если брать Blue Ray диски, то стоимость пишущего привода и болванок такова, что если не дешевле, то почти равноценно через 5 лет купить новый жесткий диск и переписать на него данные.
На текущий момент, недорогие способы хранения личных данных в основном делятся на:
* Если данных не слишком много, и инет позволяет — можно хранить в облаке, а лучше в двух разных независимых облаках, предварительно зашифровав данные трукриптом/архиватором. Тут я прорекламирую WinRAR, который кроме архивирования с паролем, вдобавок умеет использовать ECC. Можно увеличить размер архива на некоторый процент, но зато иметь возможность восстановить данные из любого поврежденного места этого архива, в пределах этого процента. Есть даже возможность разбивать архив на тома, и том для восстановления создать отдельным файлом. В древности, я этим активно пользовался со старыми дискетами, когда целая дискета могла просто не прочитаться в чужом дисководе.
* Съемный HDD, но рекомендую менять носитель с периодичностью в 3-5 лет на более новый, стараясь не слишком далеко отходить от гарантийного срока. Можно просто купить SATA/USB переходник и апгрейдя системный диск на более быстрый/емкий, старый диск отдавать под бэкапы.
* Купить недорогой домашний NAS с рейдом и настроить обычное простое зеркало. Этот способ заметно дороже предыдущих двух, но в случае выхода из строя одного из дисков, вам нужно будет просто заменить поломанный диск на новый, и рейд контроллер сам выполнит подключение нового диска в массив и заполнит его данными. То есть ничего не нужно будет настраивать заново, искать и восстанавливать информацию из разных бэкапов. Просто заменил диск и все. NAS также очень нетребователен по питанию, его можно оставить включенным постоянно и автоматизировать все процессы бэкапов.
UPD: DaemonGloom рекомендует замечательные устройства WD My Cloud Mirror, которое идет практически по цене жестких винтов, плюс небольшая переплата за корпус/контроллер:
«По текущим ценам — устройство на 2x4TB даёт 100 долларов переплаты, 2x6TB — 80 долларов.»
Лично я делаю резервную копию всего важного на второй диск, и периодически скидываю архивы на внешний USB диск вручную.
Таким образом есть а) рабочая копия, б) ежедневный архив на втором диске, и с) примерно ежемесячный архив на внешнем отключенном диске. Но в принципе уже начинаю подумывать про NAS.
Первый в мире жесткий диск, IBM RAMAC 305, увидевший свет в 1956 году, вмещал лишь 5 МБ данных, а весил при этом 970 кг и по габаритам был сопоставим с промышленным рефрижератором. Современные корпоративные флагманы способны похвастаться емкостью уже в 20 ТБ. Только представьте себе: 64 года назад, для того чтобы записать такое количество информации, потребовалось бы свыше 4 миллионов RAMAC 305, а размеры ЦОДа, необходимого для их размещения, превысили бы 9 квадратных километров, тогда как сегодня для этого будет достаточно маленькой коробочки весом около 700 грамм! Во многом добиться столь невероятного повышения плотности хранения удалось благодаря совершенствованию методов магнитной записи.
В это сложно поверить, однако принципиально конструкция жестких дисков не меняется вот уже почти 40 лет, начиная с 1983 года: именно тогда свет увидел первый 3,5-дюймовый винчестер RO351, разработанный шотландской компанией Rodime. Этот малыш получил две магнитные пластины по 10 МБ каждая, то есть был способен вместить вдвое больше данных, чем обновленный ST-412 на 5,25 дюйма, выпущенный Seagate в том же году для персональных компьютеров IBM 5160.
Rodime RO351 — первый в мире 3,5-дюймовый винчестер
Несмотря на инновационность и компактные размеры, на момент выхода RO351 оказался практически никому не нужен, а все дальнейшие попытки Rodime закрепиться на рынке винчестеров потерпели фиаско, из-за чего в 1991 году компания была вынуждена прекратить свою деятельность, распродав практически все имеющиеся активы и сократив штат до минимума. Однако стать банкротом Rodime оказалось не суждено: в скором времени к ней начали обращаться крупнейшие производители винчестеров, желающие приобрести лицензию на использование запатентованного шотландцами форм-фактора. В настоящее время 3,5 дюйма является общепринятым стандартом производства как потребительских HDD, так и накопителей корпоративного класса.
За и против: жесткие диски в качестве архива
Классические магнитные диски отлично подходят для хранения объемных резервных копий, если не забывать о некоторых факторах
За и против: жесткие диски в качестве архива. Классические магнитные диски отлично подходят для хранения объемных резервных копий, если не забывать о некоторых факторах
Согласно статистике, собранной в вычислительном центре облачного провайдера Backblaze, в связи с возможными ошибками при изготовлении необходимо принимать во внимание, что абсолютно новые HDD столь же сильно подвержены риску выхода из строя, как и диски после трехлетней эксплуатации в качестве носителя бэкапов.
Опасность поломки жестких дисков
По данным Backblaze, недорогие потребительские диски позволяют пред-
видеть поломки. В течение первых полутора лет при непрерывном исполь-
зовании перестает работать относительно много накопителей. Затем про-
цент выживания сохраняется на стабильном уровне, пока не начинает
резко снижаться после трех лет эксплуатации.
Последний срок соответствует примерно пяти годам стандартного использования, когда диск пусть реже отсоединяется и присоединяется, однако находится под дополнительной нагрузкой из-за частого включения и выключения компьютера в постоянном режиме работы.
Такие диски для NAS, как линейки Red от Western Digital и IronWolf от Seagate, работают тихо, не нагреваются и обещают долгую службу
Читайте также: