Выбор raid массива для видео
Многие строят RAID-системы на своих компьютерах, эта статья поможет разобраться с этими системами.
Время RAID для видео
Идея объединения нескольких сравнительно "дешевых" жестких дисков в одно логическое устройство с целью повышения общей емкости, быстродействия и надежности была высказана еще в конце 80-х. Впервые публично она была изложена в 1987 г. в ставшей с тех пор классической статье Гибсона и Катца из Калифорнийского университета Беркли под названием "A Case for Redundant Arrays of Inexpensive Disks (RAID)". Но до недавнего времени подобные системы, получившие название RAID-массивов, в основном являлись частью дорогостоящих компьютерных комплексов, предназначенных для хранения больших объемов критически важной информации (в качестве примера можно привести банковские серверы). Проблема заключалась в том, что для обеспечения действительно надежной и эффективной работы RAID-систем, отвечающих предъявляемым требованиям, приходилось использовать не дешевые, а дорогостоящие дисковые устройства (именно поэтому впоследствии аббревиатуру RAID стали расшифровывать как Redundant Arrays of Independent Discs). И только сейчас, когда в результате общего прогресса стоимость таких решений значительно снизилась, и появились достаточно хорошие диски по разумной стоимости, различные решения на базе RAID-технологии стали активно предлагаться для рабочих станций, а в упрощенном варианте - для офисных и даже домашних компьютеров.
Впрочем, стоимость внешних RAID-систем снижается не так быстро, как цены на базовые диски - последние определяют лишь "половину" затрат на создание полной системы. Весьма существенную ее часть составляют специализированный контроллер (со встроенным процессором) и программное обеспечение, которые и гарантируют эффективную совместную работу дисков как единого целого. Более того, в полном соответствии с пословицей "аппетит приходит во время еды", по мере развития технологий возрастали и требования к характеристикам систем. Сегодня пользователи хотят иметь массивы емкостью в террабайты, со скоростью записи/чтения в десятки и даже сотни мегабайт в секунду. В ответ на это производители предлагают все более производительные решения, в которых используются последние модели RISC-процессоров. Поэтому стоимость современных RAID-систем, как и их предшественников, сохраняется на уровне от нескольких тысяч долларов до десятков тысяч. Оно и понятно - в компьютерной индустрии, так же как и в других отраслях высоких технологий, действует общий закон сохранения стоимости (иначе ее развитие просто прекратится). Но сегодня за те же деньги пользователь получает гораздо более мощную систему, чем несколько лет назад.
Одной из важнейших областей применения RAID-массивов являются различные профессиональные системы цифрового видеомонтажа. Сегодня здесь требуется одновременная обработка в реальном времени трех-четырех потоков некомпрессированного видео и нескольких слоев графики, титров (Pinnacle Liquid Chrome, DPS VelosityQ и др.). При разрешении стандартного телевизионного кадра 720x756 и YUV-представлении 4:2:2 для этого необходимы скорости воспроизведения 80-90 Мбайт/с. Все более актуальными становятся и системы монтажа HD (High Definition), оперирующие телевизионными кадрами высокой четкости 1280x720x30p (в качестве примера упомянем Pinnacle CineWave HD и DPS Velosity HD). Здесь уже один поток цифрового видео превышает 50 Мбайт/с. И, наконец, нельзя забывать про грядущую эру цифрового кинематографа с параметрами 1920x1080x24p и потоком данных около 100 Мбайт/с. Иными словами, в цифровом видеопроизводстве наступило время RAID-массивов. На рынке уже представлено достаточно много предложений, и в ответ на растущий спрос их количество будет возрастать. Но для того, чтобы сделать правильный выбор, найти разумный компромисс между функциональностью и ценой, между реально достигаемой производительностью и эффективной емкостью, необходимо понимать базовые принципы построения и функционирования RAID. Желание разобраться в этом и стало побудительной причиной для написания настоящей статьи.
Итак, основные задачи, которые призвана решать RAID как система объединения нескольких дисков, - обеспечение повышенной емкости, надежности хранения и увеличение скорости записи/чтения данных. С емкостью все понятно: чем больше используется дисков, составляющих систему, и чем больше емкость каждого из них, тем лучше. При этом надо оговориться, что максимальный размер логического диска (раздела), допускаемый (распознаваемый) системой Windows при файловой структуре FAT32 (Windows 95/98, XP) ограничен 2 терабайтами, а системой NTFS (Windows NT, 2000/XP) - 12 тарабайтами. А вот две другие характеристики RAID требуют более детального рассмотрения.
Надежность хранения (отказоустойчивость) достигается за счет того, что в систему вводится избыточность - в RAID объединяется больше дисков, чем это необходимо для получения требуемой емкости. Или, другими словами, часть дисков используется для записи и хранения резервной (дублирующей) информации, что обеспечивает восстановление данных при выходе из строя одного диска (а в некоторых случаях и сразу нескольких). Здесь зависимость также очевидна - чем больше степень резервирования, тем более надежное хранение обеспечивается. Платой за это является пропорциональное снижение эффективной емкости RAID (с точки зрения хранения исходных данных). Самую высокую степень надежности обеспечивает полное дублирование (повторение) данных. В этом случае диски разбиваются на две тождественные группы, и на них ведется параллельная запись двух копий каждого блока данных (рис.1). В результате, одна группа дисков всегда является зеркальной (mirrowing) копией другой. И при потере одного или нескольких дисков из одной группы (или даже всей группы) данные сохраняются (впрочем, теоретически возможен и одновременный выход двух зеркально связанных дисков, а это уже приведет к крушению системы). Естественной платой за подробную надежность является высокая стоимость, поскольку эффективная емкость падает вдвое по сравнению с потенциально возможной. Частичным утешением может послужить то, что за счет дублирования операция чтения выполняется вдвое быстрее - ведь с каждого диска можно считать только половину требуемой информации.
Наконец, повышение быстродействия (производительности) достигается за счет того, что современные интерфейсы (в частности, SCSI) позволяют выполнять операции записи-чтения на несколько дисков одновременно (более точно, практически одновременно, так называемым "веерным способом", так как шина передачи данных все же одна на всех). Таким образом, входной поток данных разбивается на блоки заданного размера, которые параллельно записываются на (считываются с) несколько независимых дисков (striping). Соответственно, можно считать, что скорость записи-чтения возрастает пропорционально числу дисков, используемых для хранения данных (но без учета дисков, задействованных в резервировании), и, конечно, пропорционально их собственному быстродействию.
Таковы самые общие идеи эффективного объединения дисков в массивы. И хотя конкретные схемы реализации могут существенно отличаться, для RAID-систем существуют жесткие стандарты, позволяющие использовать при их построении оборудование и программное обеспечение различных производителей. Созданный в 1992 г. промышленный консорциум по стандартизации RAID (RAID Advisory Board, RAB) определил семь типовых RAID уровней: от нулевого до шестого.
Уровни RAID
Уровень RAID 0 определяет простейший вариант построения массива без избыточности дисков. Поэтому, строго говоря, системы этого уровня не являются RAID-массивами. Тем не менее, термин RAID 0 широко используется и принят RAB. При данном уровне происходит простое распараллеливание записи/чтения данных (разбиение на равные блоки заданного размера, striping) между всеми имеющимися дисками (рис.2).
Очевидная привлекательность данного подхода заключается в простоте и дешевизне его реализации при потенциально самой высокой производительности (скорости записи/чтения) и самой низкой стоимости хранения данных. Именно поэтому уровень RAID 0 весьма популярен на массовом рынке недорогих систем, для его реализации предлагается множество контроллеров различных производителей (наиболее известны Promise Technologies, Adaptec). Многие материнские платы для компьютеров уже имеют встроенные контроллеры (например, HPT 374 - четырехканальный Ultra DMA/ATA133). Более того, в силу существенно возросшей производительности центральных процессоров возможно построение системы RAID 0 программным способом, без специального аппаратного контроллера. В частности, программная поддержка RAID 0 встроена в Windows 2000/XP. Слабым местом RAID 0 является незащищенность данных: при выходе из строя любого из дисков данные всего массива будут потеряны. Поэтому использовать его в "серьезных" приложениях не рекомендуется.
Для задач с критически важной информацией обычно предлагают уровень RAID 1 (рис.3), который также достаточно просто реализуется - надо лишь обеспечить формирование и хранение двух зеркальных копий данных на двух идентичных дисках (или двух массивах дисков), что не требует никаких дополнительных вычислений.
Очевидно, что в этом случае выход из строя одного диска не приведет к потере данных! Однако эффективность использования дисков будет вдвое ниже, чем у систем RAID 0. Поэтому чаще используют более сложные RAID-уровни, которые обеспечивают высокое быстродействие и надежную защиту данных при сравнительно небольшой степени избыточности.
RAID 2 основан на разбиении входных данных на уровне битов и вычислении кода Хэмминга для контроля возможных ошибок (Hamming ECC - Error Correction Code). Исходные биты данных распределяются между дисками массива, а параллельно с ними на специальные выделенные диски (ECC диски) записываются вычисленные коды (рис.4).
Уровень RAID 3 (рис. 5) с параллельным доступом к дискам массива предлагает более эффективный способ. Здесь входной поток данных разбивается на отдельные байты, которые распределяются (и параллельно записываются) между всеми дисками массива кроме одного выделенного.
Последний диск используется для записи контрольной информации (четности, parity), которая вычисляется на основании значений битов записываемых данных путем выполнения сравнительно простой операции XOR (exclusive OR, "исключающее или").
Результирующее значение этой логической операции равно True ("правда") тогда и только тогда, когда из двух входных логических значений только одно равно True. Во всех остальных ситуациях результат равен False ("ложь"). Другими словами, когда два входных значения p и q совпадают, результат pXORq равен False, когда различаются - True. Эту операцию можно применить к бинарным данным (значениям битов), приравнивая True 1, а False 0, соответственно мы получаем равенства 1XOR1 = 0, 1XOR0 = 1, 0XOR1 = 1, 0XOR0 = 0. Несложно заметить, что по двум имеющимся значениям операции отсутствующее третье вычисляется однозначно. Если подобное вычисление последовательно применить к значениям (N-1) битов, то получим N-е значение, которое позволит однозначно восстановить любое потерянное значение исходных (N-1) битов (при условии, что остальные сохранились). Например, мы имеем три бита со значениями 1, 0, 0. Для первых двух битов вычисляем 1XOR0 = 1 и запоминаем окончательный результат (1) как контрольное число (четность). Теперь, если значение второго бита потеряно (соответствующий диск вышел из строя), то по четности и третьему биту восстанавливаем результат XOR между первым и вторым битами, а по нему и значению первого бита успешно вычисляем значение второго бита. На практике применение данного алгоритма еще проще. Математически несложно доказать, что в любой цепочке нулей и единиц результат последовательного применения XOR всегда равен 1, если число исходных единиц нечетно, и 0 - если четно. Таким образом, в случае потери значения любого из битов в сколь угодно длинной цепочке достаточно пересчитать число единиц в оставшихся битах и сравнить со значением четности. Например, если четность равна 1, а число оставшихся единиц четно, то потерянное значение тоже равно 1.
Таковы общие принципы использования четности для защиты записей в уровне RAID-3. Очевидно, что при этом для хранения контрольных данных всегда достаточно только одного выделенного диска, например, в массиве из 12 дисков исходный поток можно разбивать по байтам на 11 субпотоков, по ним вычислять четность и параллельно записывать данные на все 12 дисков, на первые 11 - исходные данные, а на 12-й - контрольные. Платой за такую "экономию" является большой объем необходимых вычислений, выполняемых одновременно с операциями записи/чтения (что в обязательном порядке требует аппаратного RAID-контроллера с собственным процессором и памятью), а также несколько более низкая степень защиты данных от сбоев по сравнению, например, с вариантом полного дублирования (RAID 1). Однако в системах RAID 3 за счет эффективного распараллеливания обеспечивается очень высокая скорость непрерывной записи/чтения данных.
Надо признать, что теоретические положения, изложенные выше, производители RAID-массивов вынуждены были скорректировать из-за объективных ограничений, связанных с форматированием используемых дисков и необходимостью их оптимального применения. На практике размер блоков, на которые разбивается входной поток данных перед его параллельной записью на диски массива, увеличивается с 1 байта до 512 байт (стандартный размер сектора) или даже до больших значений (при этом уровень RAID 3 фактически приближается к RAID 4).
По быстродействию массивы RAID 3 практически сравнимы с RAID 0, но первые обеспечивают защиту данных. Поэтому массивы RAID 3 рекомендуются для использования в системах, оперирующих файлами сравнительно большого размера (мегабайты), например, при обработке видео. Однако в приложениях, характеризующихся большой интенсивностью коротких запросов (коллективные базы данных) эффективная скорость резко падает: поскольку при обработке каждого запроса всегда задействованы все имеющиеся в системе диски (RAID 3 называют "массивом с параллельным доступом к дискам"), то все последующие запросы ждут завершения обработки предыдущего. Для таких задач целесообразно существенно увеличить размер блока (с байта до сектора диска или больше), на которые при записи разбивается исходный файл перед распределением между дисками. Тогда для одного файла достаточно будет задействовать не все имеющиеся диски, а только часть их, и одновременно обрабатывать несколько запросов.
В этом и заключается основное отличие RAID 3 от RAID 4 (рис.6) - в последнем используются блоки существенно большего размера. В результате запись и чтение коротких файлов будет вестись на отдельные диски. RAID 4, в отличие от RAID 3, называют "системой с независимым доступом к дискам массива".
Впрочем, даже после увеличения размера блока (страйпа) при интенсивной обработке множества коротких запросов остается еще одно узкое место - единственный выделенный диск для записи четности. Действительно, даже если параллельно записывать/считывать несколько файлов с различных дисков, вычисленные контрольные данные все равно придется записывать на один и тот же диск, что будет заметно тормозить весь процесс. Естественный выход - распределять все данные между всеми имеющимися дисками, записывая блоками, как исходные потоки, так и контрольные данные (рис.7).
Это идея и заложена в уровень RAID 5. Но, к сожалению, и данной схеме (как и в RAID 4) все равно остается узкое место, заметно снижающее общее быстродействие системы. Дело в том, что, если необходимо изменить данные только одного блока на одном диске, все равно придется вычислять новую четность, в которой задействованы блоки с остальных дисков.
В RAID 5 это выполняется следующим эффективным способом. До записи новых данных в некий блок из него сначала считываются старые данные, а также старые значения соответствующего блока четности. После этого вычисляются значения операции XOR для старых данных этого блока и старой четности. Полученный результат, что несложно понять, является предпоследним промежуточным результатом при вычислении старой четности (только по неизменяемым блокам старых данных). Именно он при сравнении с данными перезаписываемого блока давал и дает окончательное значение четности. Поясним данные рассуждения простым примером. Пусть у нас есть четыре значения данных 1, 0, 0, 1 и результирующая четность 0 (поскольку в цепочке четное число 1). Нам надо изменить первую единицу на 0. Тогда правильное новое значение четности тоже должно измениться на 1. Как это понять без предварительного считывания и анализа всех старых, неизменяемых данных? Достаточно вычислить XOR старых значений данных 1 и четности 0 (получим 1), а результат сравнить с новым значением данных 0 в первом бите. Полученная 1 и будет новая четность! Таким образом, в RAID-5 каждая операция записи требует двух чтений старых значений (данных и четности), выполнения двух операций XOR и двух новых записей (опять данных и четности). Как следствие, общее быстродействие в отношении записи (но не чтения) падает в 1,5-2 раза (по сравнению, например, с RAID 1).
В определенном смысле RAID 5 является компромиссом между производительностью записи/чтения, надежностью и эффективностью хранения данных, что делает его наряду с RAID 0 и RAID 3 одним из наиболее популярных вариантов построения систем хранения информации. Что касается RAID 6, то он представляет дальнейшее развитие RAID 5. В нем для повышения надежности добавляется вычисление второго независимого уровня четности, что обеспечивает сохранение данных даже при выходе из строя двух дисков. Очевидно, это приводит к усложнению системы, а также к дальнейшему снижению производительности и эффективности массива. Как следствие, уровень RAID-6 в основном представляет исключительно теоретический интерес.
Существуют и другие уровни построения RAID, но они также не нашли широкого применения и существенно зависят от интерпретации фирмы-производителя. В связи с этим наиболее интересны так называемые "комбинированные уровни", например, RAID 0+1 и RAID 1+0. Несмотря на схожесть названий, организованы они по-разному. Так, в RAID 0+1 формируется два идентичных массива RAID 0 (только striping), запись на которые ведется зеркально (mirroring), т.е. согласно RAID 1. Например, если у нас есть восемь идентичных дисков, то мы получаем два массива по четыре диска в каждом. Данные в каждом массиве пишутся параллельно сразу на четыре диска (без защиты данных), но между массивами данные полностью дублируются. В варианте RAID 1+0 наоборот формируется четыре массива по два диска в каждом. Теперь в каждом массиве осуществляется зеркальное дублирование информации, но входной поток данных распараллеливается между четырьмя массивами. Понятно, что итоговые характеристики обоих вариантов схожи. Популярность этих комбинированных уровней вызвана простотой их реализации (отсутствием дополнительных вычислений контрольных данных), сравнительно высоким быстродействием и надежностью хранения. Возможны и другие комбинации (RAID 0+3, 3+0, 0+5, 5+1 и т.д.), но их построение весьма сложно и не очень оправданно.
К системам хранения данных в видеонаблюдении требования особые. Тут не может быть никаких компромиссов. Данные должны гарантированно быть доступны по необходимости, и реализация этого возложена не только на хранилища, но и к организации распределения информации в самих СХД предъявляются определенные требования. Жесткие диски имеют определенный ресурс работы: они постепенно вырабатываются и выходят из строя. Например, WD Purple и Seagate Surveillance предназначены специально для работы в видеонаблюдении и также имеют определенное время жизни.
Видеонаблюдение сейчас строится не только на «крутизне» видеокамер и используемого ПО (Video Management Software). Важное значение имеет организация всей структуры ИТ, ведь ей предстоит все это обслуживать. Конечно, тут разговор не о небольших системах, а о тех, где используется достаточно много IP-видеокамер, в систему которых входят сервера видеонаблюдения и СХД.
Попробуем разобрать требования системы на организацию видеонаблюдения, например, в 100 потоков. Саму мощь сервера рассматривать не станем, будем считать, что он выполняет свои функции на все 100% и весь необходимый функционал работает исправно. То есть сервер выполняет прием, обработку и запись видеопотоков в архив. Рассчитаем нагрузку только на подсистему хранения данных и требования, которые предъявляются к СХД в проекте такого размера.
Для расчета представим, что будет использоваться достаточно хорошая IP-видеокамера с разрешением Full-HD, кодеком H.264 и частотой 25 кадров. Управление будет происходить VMS AxxonSoft и, согласно их калькулятору , представленному на сайте, поток с одной камеры составляет 6,86 Мбит/с.
- при поломке диска часть видеоархива будет потеряна;
- производительность одного диска снижается в разы.
Обслуживание и работа с RAID-массивами в системах видеонаблюдения
При необходимости замены крайне желательно использование дисков того же объёма и той же модели, что и неисправные, так как в другом случае можно получить проблемы совместимости оборудования, ведущие к последующему выходу массива из строя. В любом случае, при необходимости замены жесткого диска на отличающийся от ранее используемого, требуется проконсультироваться у специалиста. Для оперативной замены неисправных жестких дисков рекомендуется постоянно иметь подменный фонд, актуальность которого сильно возрастает по мере снятия дисков используемой модели с производства.
Для программного обслуживания RAID-массива, переконфигурирования, замены дисков в нем, используется специальное программное обеспечение от производителя RAID-контроллера. С его помощью можно быстро найти неисправный диск, определить характер неисправности, принять решение о необходимости замены или переконфигурирования массива. Тем не менее, такие операции рекомендуется проводить персоналу, хорошо знакомому с принципами обслуживания дисковых массивов.
RAID-массивы в видеонаблюдении
Проблема решается объединением жестких дисков в RAID-массивы. Для этого существуют RAID-контроллеры, которые могут быть как платой расширения, монтируемой в рабочую станцию или сервер, так и законченной конструкцией СХД, например, NAS (Network Attached Storage).
Несмотря на множество структур RAID-массивов, в видеонаблюдении используются только несколько типов объединения дисков. Основные – это 0, 1, 6, 50, 60. У каждой структуры есть свои преимущества и недостатки.
RAID 0 — страйпинг. При таком построении данные пишутся параллельно на все диски массива.
То есть два диска, объединенных по такой схеме, образуют один виртуальный полный диск. Система не выдерживает никакой критики, так как при отказе одного диска мы автоматически теряем данные и на втором. В системах видеонаблюдения RAID 0 практически не используется, хоть и отличается высокой скоростью записи данных. Это стало неактуальным с увеличением пропускной способности шин передачи информации как на серверах, так и на оборудовании видеонаблюдения.
В отличие от RAID 0, RAID 1 обладает высокой надежностью, так как весь поток информации пишется одновременно на два диска и на каждый в полном объеме. То есть информация дублируется, а не делится. Скорость записи, конечно, меньше, но надежность выше. Даже при полном выходе из строя любого диска копия данных будет доступна на другом. В видеонаблюдении такой RAID-массив используется крайне редко. Несмотря на надежность решения, отказ от него в первую очередь происходит ввиду дороговизны. Ведь количество HDD для записи архивов удваивается. В основном, если говорить о видеонаблюдении, RAID 1 можно использовать на рабочем компьютере как зеркалирование операционной системы, применяемой в составе видеонаблюдения.
RAID 5 не обладает большой скоростью, как и RAID 1. Состоит минимум из трех дисков, на которые пишется информация блоками, как и в RAID 0, то есть считая диски одним виртуальным.
Но тут есть блок, который ответственен за контрольные суммы записываемых данных, и при выходе из строя любого диска, опираясь на технические контрольные суммы, можно восстановить данные. Недостаток системы для видеонаблюдения заключается в скорости замены неисправного диска, так как длительное использование только рабочих дисков может способствовать некорректному подсчету контрольных сумм. Преимущество такого массива – меньшая по сравнению с RAID 1 стоимость хранения данных.
Рассмотренные массивы, как уже было сказано, используются редко или не используются совсем в видеонаблюдении. А теперь о массивах с «двойными цифрами», в частности, о RAID 6+0.
Под RAID 6+0 имеют в виду вариант RAID 60, когда два RAID 6 объединяются в RAID 0. Вариант, когда два RAID 0 объединяются в RAID 6, называется RAID 0+6 и «снаружи» представляет собой тот же RAID 60.
RAID 6 считается более совершенной версией RAID 5. Резервирование и подсчет контрольных сумм при таком построении осуществляется уже на базе двух жестких дисков. Что, соответственно, допускает выход пары HDD без боязни утратить данные. Тут увеличивается объем обрабатываемых данных, но современные RAID-контроллеры с этим легко справляются. Причем существует не только аппаратная реализация таких массивов, но и программная.
Использование массивов RAID 6 и RAID 60 в системах видеонаблюдения уже много лет показывает лучшие результаты и множество интеграторов применяет именно эту технологию из-за ее преимуществ в отказоустойчивости. Еще один положительный момент – отличная производительность при последовательном доступе, который характерен для видеопотока.
Вот выборка преимуществ RAID 6 и RAID 60 по сравнению, например, с RAID 10. Это можно увидеть в представленной таблице:
Но у RAID 6/60 есть существенный недостаток: при выходе жестких дисков из строя при продолжении эксплуатации системы наблюдается значительная просадка производительности.
Если использовать производительные аппаратные RAID-контроллеры или СХД, правильно планировать массив и систему в целом, деградация массива RAID-6/60 не вызовет катастрофы, при этом емкость дисков будет использоваться эффективно.
Выше была упомянута еще и программная реализация RAID – это разработка RAIDIX. Программный массив носит имя RAID 7.3 и является отечественной разработкой. Подробней можно почитать на сайте создателей . Тут можно сказать только то, что используется технология чередования блоков с тройным распределением четности, при отказе до 3-х дисков информация с них восстанавливается достаточно легко. В основе RAID 7.3 заложен собственный уникальный алгоритм RAIDIX, позволяющий достигать высоких показателей производительности без дополнительной нагрузки на серверные мощности.
Резюме:
В статье мы рассказали только о некоторых, наиболее часто возникающих вопросах работы RAID-массивов. Изучение всех тонкостей их корректного использования займет много времени у неспециалиста в данной области, поэтому мы настоятельно рекомендуем не заниматься созданием и обслуживанием массивов самостоятельно, во избежание возможных проблем с потерей информации или даже неожиданного выхода из строя, казалось бы защищенной, системы видеонаблюдения.
В первых персональных компьютерах винчестеров вообще не было. Чуть позднее они стали штатным оборудованием. Еще позднее в основном были решены проблемы совместимости, мешающие использованию одновременно и поддерживаемой в теории пары устройств, а к концу 90-х годов прошлого века конфигурация среднестатистического компьютера потенциально могла включать в себя уже и четыре винчестера. С этого момента многие пользователи заинтересовались уже использованием накопителей не по-отдельности, а в составе единого массива — как во «взрослых системах». В последних, впрочем, чаще всего применялся SCSI-интерфейс, доступный и владельцу обычной «персоналки», но излишне дорогой — требовались дешевые решения. И они появились в виде контроллеров IDE RAID.
Заметим, что наиболее часто используемым вариантом был RAID0, строго говоря, к «RAID-массивам» не относящийся, поскольку избыточность данных он не обеспечивает. Надежность хранения сравнительно с одиночным диском даже снижает. Но иногда было просто некуда деваться, поскольку винчестеры тех лет были слишком медленными для некоторых сфер применения, а альтернативных решений с более высокой производительностью не было вовсе. Использование же чередования позволяло их заметно «пришпорить». Но применялись (да и сейчас применяются) и «зеркала» (RAID1) — для повышения надежности. А наиболее обеспеченные граждане могли объединить достоинства обоих подходов посредством создания массива RAID10, что позволяло повысить и скорость, и надежность. Других режимов в те времена в массовых контроллерах «не водилось»: слишком сложными были для программной реализации — с учетом вычислительных возможностей систем того времени.
Через некоторое время дискретные RAID-контроллеры начали устанавливать и на топовые системные платы — надо же было чем-то выделяться их производителям. В итоге к массивам стали приглядываться и пользователи, ранее о них не задумывавшиеся — раз уж возможность есть. В итоге идею подхватили сами производители чипсетов, так что возможность создания RAID-массивов стала стандартной для последних. Как минимум — для старших модификаций. Причем к числу возможных вариантов добавился и RAID5, на первый взгляд выглядящий очень привлекательно: более экономным расходованием дискового пространства, чем у RAID10, но при обеспечении необходимой для надежности хранения избыточности.
А позднее начались новые времена — винчестеры перестали быть основным и единственным типом накопителей, применяющихся в компьютере. Внедрение твердотельных накопителей прервало эволюцию, оказавшись революционным шагом с точки зрения производительности. Правда было оно достаточно медленным — просто потому, что и стоимость хранения информации первое время была очень высокой. Довольно быстро снижалась, но и сейчас до паритета с винчестерами еще далеко — особенно если рассматривать «настольные» модели. Да и с абсолютной емкостью тоже пока все не просто: теоретически флэш-памяти в стандартный корпус «напихать» можно очень много, а практически это будет слишком уж дорого. Собственно, поэтому до сих пор подавляющее большинство компьютеров продается лишь с одним-единственным винчестером в качестве накопителя «для всего»: и для программ, и для данных. В принципе, даже устройств этого класса минимальной на сегодня емкости достаточно для того, чтобы полностью закрыть все потребности среднестатистического пользователя, поэтому в бюджетном сегменте такой вариант долго еще будет преобладающим, несмотря на низкую производительность. А вот чуть выше решений минимальной стоимости у покупателя есть выбор, часто приводящий его к одному из гибридных вариантов системы хранения данных. Самым дешевым (но пока до конца не изученным и освоенным) способом является кэширование посредством технологии Optane Memory. Более дорогим, но предсказуемым и совместимым со старыми системами — использование SSD невысокой емкости для операционной системы и приложений в паре с тихоходным, но очень емким винчестером для хранения данных. В итоге про RAID-массивы в бытовых персоналках все как-то и забыли. Хотя некоторые пользователи считают, что зря — все-таки и емкость самая большая (в пределах фиксированного бюджета), и производительность должна быть более высокой, чем у одиночного накопителя. Пусть, даже, и не на столько, как обеспечивают твердотельные накопители, но ведь дешево же — а вдруг и этого хватит на практике. Поэтому мы сегодня решили немного отклониться от основной линейки тестов и посмотреть — как ведут себя лучшие винчестеры в т. ч. и в массивах из двух-трех дисков, сравнительно с разными твердотельными накопителями.
Основные рекомендации при использовании RAID-массивов
Желательно, а в некоторых случаях просто обязательно использование дисков одного производителя и одинакового объема. Если не придерживаться этого правила, можно получить сбои, причина которых – несовместимость различного оборудования. При использовании СХД с массивом HDD лучшим решением будет вариант боксов с салазками для горячей замены. Всегда необходимо иметь подменный фонд для быстрой замены накопителей с заранее подобранными параметрами. Во многих VMS есть функции тревоги, которые могут помочь при оперативном реагировании на проблему аварии в хранилище. Настройте уведомление о работе СХД на электронную почту или посредством СМС: этим вы оградите себя от потери видеоархивов в непредвиденных ситуациях.
Читайте о том, как собрать RAID 5 в домашних условиях. На что обратить внимание при выборе комплектующих под RAID, как собрать компьютер и создать на нём RAID массив.
Все современные материнские платы оснащены интегрированным RAID-контроллером, а топовые модели имеют их даже несколько. Востребованы ли такие интегрированные контроллеры в материнских платах для обычных пользователей — это другой вопрос. Но в любом случае, некоторые материнские платы предоставляют возможность создать RAID массив прямо на персональном компьютере.
Далее будут представлены краткие рекомендации по созданию RAID-массива на домашнем ПК и конкретный пример сборки компьютера с RAID.
Комплектующие
Первым делом нужно определиться для каких целей вы будете создавать массив на своём компьютере и какой тип RAID вам нужен.
Детально о том, какие типы RAID массивов бывают, какие между ними различия и как они работаю, читайте в отдельной статье блога.
Определившись с типом RAID, нужно подобрать материнскую плату с поддержкой нужного вам типа массива и наличия достаточного количества SATA разъёмов, чтобы иметь возможность подключить нужное количество дисков.
Для Своих нужд было принято решение построить систему с RAID 5. Для этого была выбрана такая конфигурация:
- Материнская плата ASRock B365M Pro4-F с поддержкой RAID 0, 1, 5 и 10 и шестью SATA разъёмами для дисков;
- Вместительный корпус Cooler Master K380 с большим количеством посадочных мест под HDD;
- Процессор от Intel 9-го поколения – i5-9400F;
- Одна планка оперативной памяти Kingston на 16 ГБ (2400 MHz);
- Видеокарта nVIDIA GeForce GTX 1060.
RAID6 - средняя скорость, защита от поломки до двух дисков
Более современной версией массива RAID5, избавленной от основных его недостатков, является массив RAID6. В нем для резервирования используется пространство уже двух жестких дисков, что, соответственно, позволяет допустить выход из строя до двух дисков без потери данных. Несмотря на большой объём обрабатываемых данных, современные RAID-контроллеры, используемые в оборудовании VIDEOMAX, позволяют добиться высокой скорости работы и записи данных в таких массивах.
На сегодняшний день RAID6 - наиболее часто используемый и эффективный вид RAID-массивов в системах видеонаблюдения.
Уровень RAID | Количество дисков | Скорость записи | Эффективная емкость | Защита от поломки HDD | Примечание |
---|---|---|---|---|---|
RAID0 | Нет ограничений | Высокая | N*S | нет | При выходе из строя HDD происходит потеря всех данных в массиве на всех дисках |
RAID1 | 2 | Низкая | S | 1 HDD | Чаще всего применяется для защиты диска с ОС |
RAID5 | от 3 | Средняя | (N-1)*S | 1 HDD | При выходе из строя HDD переходит в критический режим работы со снижением скорости записи и резким увеличением вероятности поломки остальных дисков |
RAID6 | от 4 | Средняя | (N-2)*S | 2 HDD | Выдерживает выход из строя до 2-х HDD в массиве |
N - количество дисков, S - объём одного диска
Процессор
Начнём с установки процессора и оперативной памяти на материнскую плату.
Этот процесс не сложный, нужно лишь сориентироваться как его расположить в сокете. Если вы впервые собираете компьютер, не в коем случае не нужно пытаться его вдавить силой. Все это приведет к тому, что вы попросту погнете ножки или повредите процессор. При правильной установке он легко и без усилий сядет на свое место.
На самом процессоре есть обозначение в углу в виде треугольника и такое же обозначение есть и на материнской плате. Этот угол на процессоре и такой же угол сокета должны совпадать.
Также на самом процессоре есть небольшие вырезы и соответственно на сокете метки под них, обратите на это внимание.
Ресурс жестких дисков, используемых в системах видеонаблюдения, даже специализированного типа, например серверных, в условиях постоянной интенсивной работы при записи видеоархива достаточно интенсивно расходуется, и благодаря этому жесткие диски довольно быстро выходят из строя. Защитить систему видеонаблюдения от поломки при таких условиях – задача совсем непростая и требует внимательного подхода профессионалов со знаниями и опытом в создании систем хранения данных. В качестве одного из способов, позволяющих продлить срок службы дисковой подсистемы и защитить данные от потери в случае выхода и строя жестких дисков, можно использовать RAID-массивы.
На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал
Какие RAID-массивы целесообразно использовать в системах видеонаблюдения и как добиться надёжной и долгой работы подсистемы хранения данных - в нашей статье.
RAID0 - высокая скорость, отсутствие защиты от поломки диска
Массив RAID0 позволяет производить запись поступающих данных на несколько дисков одновременно (распараллеливать), что обеспечивает очень высокую скорость. В некоторых видах ПО систем видеонаблюдения это свойство используется для записи «горячего» оперативного архива, до его переноса в основное хранилище. В этом случае обеспечивается высокая скорость записи в критические моменты больших потоков поступающих данных от большого количества камер.
Этот тип массива не обладает свойствами защиты от потери данных при выходе одного из дисков из строя, и в такой ситуации приводит к потере всей имеющейся информации. В современных системах видеонаблюдения используется редко, учитывая возрастающие скорости оборудования для хранения данных.
Сборка ПК
Итак, с комплектующими мы разобрались, приступаем к сборке.
Участники тестирования
Поскольку в наших руках оказалось одновременно три не совсем идентичных, но почти идентичных винчестера Seagate, они и выступили в роли «подопытных кроликов». Было бы сразу четыре — можно было бы и RAID10 организовать, а так пришлось ограничиться RAID0 из двух и RAID5 из трех дисков (три-четыре диска в RAID0 это уже за границей добра и зла, которую без необходимости мы стараемся не переступать), имеющие одинаковый объем в 20 ТБ. Собственно, чем RAID5 многим и кажется привлекательным — «пропадает» всего один накопитель в массиве, а не половина, как в «зеркалах» (RAID1, 10 и подобных). RAID0 еще «гуманнее», но ценой потенциальных проблем с надежностью. Сами же винчестеры — одни из лучших на сегодняшний день: модели на 10 ТБ со скоростью вращения 7200 об/мин, использующие заполнение гермоблока гелием. Понятно, что в роли системного и единственного накопителя даже один такой винчестер выглядит странно (мягко говоря), однако дает оценку сверху того, что вообще можно получить от массивов. Недорогие устройства малой емкости просто медленнее, в чем мы уже не раз убеждались.
С кем будем сравнивать? Во-первых, интересна разница в пределах группы. Во-вторых, для части тестов мы отобрали следующую четверку твердотельных накопителей:
-
— медленный бюджетный SATA — чуть более «серьезный» накопитель, но тоже недорогой и тоже SATA — бюджетная реализация NVMe-устройства — похоже, но не бюджетно
Можно было бы ограничиться и меньшим количеством, но мы решили пойти навстречу читателям, жалующимся на то, что в статьях сайта редко сравниваются твердотельные накопители разных классов или, тем более, твердотельные с механическими. Просили? Сами виноваты :)
RAID5 - средняя скорость, защита от поломки одного диска
Массив RAID5 не обладает ни высокой скорости записи, ни большой надёжностью, однако его преимуществом является значительно меньшая по сравнению с массивами RAID1 стоимость хранения данных. В таких массивах данные записываются блоками на несколько дисков. Одновременно высчитывается и записывается контрольная сумма для всех поступающих данных, по которой в случае выхода из строя не более чем одного из дисков можно восстановить информацию без потерь. Для резервирования в массивах RAID5 используется пространство одного дополнительного жесткого диска.
Недостатком такого массива является критический режим работы, в который входит массив после выхода из строя одного из жестких дисков, что требует его срочной замены в кратчайшие сроки во избежание поломки других дисков. Это свойство ограничивает использование RAID5 в современных системах видеонаблюдения, где важны не только надёжность хранения, но и надёжность записи в любой момент времени и в любой ситуации.
RAID-массивы в видеонаблюдении
Проблема решается объединением жестких дисков в RAID-массивы. Для этого существуют RAID-контроллеры, которые могут быть как платой расширения, монтируемой в рабочую станцию или сервер, так и законченной конструкцией СХД, например, NAS (Network Attached Storage).
Несмотря на множество структур RAID-массивов, в видеонаблюдении используются только несколько типов объединения дисков. Основные – это 0, 1, 6, 50, 60. У каждой структуры есть свои преимущества и недостатки.
RAID 0 — страйпинг. При таком построении данные пишутся параллельно на все диски массива.
То есть два диска, объединенных по такой схеме, образуют один виртуальный полный диск. Система не выдерживает никакой критики, так как при отказе одного диска мы автоматически теряем данные и на втором. В системах видеонаблюдения RAID 0 практически не используется, хоть и отличается высокой скоростью записи данных. Это стало неактуальным с увеличением пропускной способности шин передачи информации как на серверах, так и на оборудовании видеонаблюдения.
В отличие от RAID 0, RAID 1 обладает высокой надежностью, так как весь поток информации пишется одновременно на два диска и на каждый в полном объеме. То есть информация дублируется, а не делится. Скорость записи, конечно, меньше, но надежность выше. Даже при полном выходе из строя любого диска копия данных будет доступна на другом. В видеонаблюдении такой RAID-массив используется крайне редко. Несмотря на надежность решения, отказ от него в первую очередь происходит ввиду дороговизны. Ведь количество HDD для записи архивов удваивается. В основном, если говорить о видеонаблюдении, RAID 1 можно использовать на рабочем компьютере как зеркалирование операционной системы, применяемой в составе видеонаблюдения.
RAID 5 не обладает большой скоростью, как и RAID 1. Состоит минимум из трех дисков, на которые пишется информация блоками, как и в RAID 0, то есть считая диски одним виртуальным.
Но тут есть блок, который ответственен за контрольные суммы записываемых данных, и при выходе из строя любого диска, опираясь на технические контрольные суммы, можно восстановить данные. Недостаток системы для видеонаблюдения заключается в скорости замены неисправного диска, так как длительное использование только рабочих дисков может способствовать некорректному подсчету контрольных сумм. Преимущество такого массива – меньшая по сравнению с RAID 1 стоимость хранения данных.
Рассмотренные массивы, как уже было сказано, используются редко или не используются совсем в видеонаблюдении. А теперь о массивах с «двойными цифрами», в частности, о RAID 6+0.
Под RAID 6+0 имеют в виду вариант RAID 60, когда два RAID 6 объединяются в RAID 0. Вариант, когда два RAID 0 объединяются в RAID 6, называется RAID 0+6 и «снаружи» представляет собой тот же RAID 60.
RAID 6 считается более совершенной версией RAID 5. Резервирование и подсчет контрольных сумм при таком построении осуществляется уже на базе двух жестких дисков. Что, соответственно, допускает выход пары HDD без боязни утратить данные. Тут увеличивается объем обрабатываемых данных, но современные RAID-контроллеры с этим легко справляются. Причем существует не только аппаратная реализация таких массивов, но и программная.
Использование массивов RAID 6 и RAID 60 в системах видеонаблюдения уже много лет показывает лучшие результаты и множество интеграторов применяет именно эту технологию из-за ее преимуществ в отказоустойчивости. Еще один положительный момент – отличная производительность при последовательном доступе, который характерен для видеопотока.
Вот выборка преимуществ RAID 6 и RAID 60 по сравнению, например, с RAID 10. Это можно увидеть в представленной таблице:
Но у RAID 6/60 есть существенный недостаток: при выходе жестких дисков из строя при продолжении эксплуатации системы наблюдается значительная просадка производительности.
Если использовать производительные аппаратные RAID-контроллеры или СХД, правильно планировать массив и систему в целом, деградация массива RAID-6/60 не вызовет катастрофы, при этом емкость дисков будет использоваться эффективно.
Выше была упомянута еще и программная реализация RAID – это разработка RAIDIX. Программный массив носит имя RAID 7.3 и является отечественной разработкой. Подробней можно почитать на сайте создателей . Тут можно сказать только то, что используется технология чередования блоков с тройным распределением четности, при отказе до 3-х дисков информация с них восстанавливается достаточно легко. В основе RAID 7.3 заложен собственный уникальный алгоритм RAIDIX, позволяющий достигать высоких показателей производительности без дополнительной нагрузки на серверные мощности.
Итого
В общем и целом, картина понятная. Равно как понятно и то, почему тема RAID-массивов в персональных компьютерах практически сошла на нет. Во всяком случае, в их «винчестерной» ипостаси — с массивами из SSD некоторые энтузиасты продолжают баловаться, чему способствуют производители, реализовав, в частности, возможность создания RAID из NVMe-устройств. Да и в топовых ноутбуках нет-нет да и встречаются RAID0 из пары твердотельных накопителей — в основном, конечно, чтобы блистать в обзорах. На этом всё. В тех сферах, где технология RAID-массивов зарождалась, она по-прежнему является нужной и полезной, но в ПК ей делать особо нечего. С одной стороны, современные ОС способны и из одиночного винчестера «выжимать» все, на что он способен, так что улучшением части характеристик «подстегнуть» производительность не получится. С другой — доступными стали более быстрые накопители. В том числе, существенно более быстрые в тех сценариях, ради которых до сих пор имеет смысл использовать RAID-массивы с увеличением производительности (благодаря чередованию). А «настоящие» RAID (т. е. с избыточностью хранения данных) по-прежнему полезны, но в бюджетном исполнении силами программного обеспечения они могут заметно понизить производительность. Кроме того, RAID в любом случае не заменяет резервного копирования данных, так что начинать надо с него, а не наоборот.
RAID1 - низкая скорость, хорошая защита от поломки диска
Массив RAID1 напротив обладает высокой надёжностью благодаря тому, что все поступающие данные пишутся одновременно на два жестких диска («зеркалируются») и система всегда имеет минимум две копии одних и тех же данных. При выходе из строя одного из дисков позволяет безопасно эксплуатировать систему используя данные, сохранившиеся на работоспособном диске.
Несмотря на высокую надёжность такой массив для записи архива, как правило, не используется. Связано это с тем, что хранить в таком массиве большие объёмы видеоданных довольно дорого за счёт как минимум двукратного увеличения необходимого количества дисков. Чаще всего в системах видеонаблюдения массив RAID1 используется для защиты от выхода жесткого диска с установленной операционной системой.
Виды RAID массивов в системах видеонаблюдения
Несмотря на большое количество существующих разновидностей RAID-массивов, выполняющих различные требования к дисковым системам и обеспечивающих различный уровень защиты, в видеонаблюдении прижились три основных вида, рассмотрим их.
Тестирование
Методика тестирования
Методика подробно описана в отдельной статье. Там можно познакомиться с используемым аппаратным и программным обеспечением. Для данной статьи нам ее пришлось, немного доработать, поскольку участие в тестировании сегодня принимают и винчестеры, и твердотельные накопители, но касается это в основном использования результатов (благо тестовые программы в основном пересекаются) и их группировки.
Последовательные операции
Для начала начнем с «чисто винчестерных» тестов, в которых твердотельные накопители по понятным причинам не участвуют — для них нет зависимости скорости от конкретной области данных.
Как и предполагается априори, скорость чтения удваивается. Точнее, для RAID0 из двух дисков это очевидно. Для RAID5 на трех дисках — в общем-то тоже: для данных используется то же самое чередование. В итоге даже минимальная скорость чтения оказалась выше средней одиночного диска, а средняя — выше максимальной. Идеальный случай.
Потому что при записи все уже не так просто. Точнее, для RAID0 — по-прежнему просто и быстро, на что любят упирать «любители» этого типа массивов (который, строго говоря, RAID-массивом и не является, как уже было сказано выше). Все также работает чередование блоков с данными, так что два винчестера (или большее их количество) работают, по сути параллельно.
А вот ситуация с RAID5 печальна. Однако легко объяснима: специфика организации этого типа массивов такова, что практически любая операция записи превращается в две операции чтения и две записи, которые должны «отработать» практически одновременно. Итоговая производительность в случае «чипсетного» контроллера, фактически лишенного собственных «мозгов», так что реализующего всю необходимую функциональность на базе программного драйвера, оказывается удручающе низкой. «Нормальный аппаратный» контроллер способен ослабить проблему, но не решить ее полностью — RAID5 все равно остается одним из самых медленных типов массивов в любых условиях. Радикальным способом решения проблемы (да и практически единственно-возможным для программной реализации) является использование RAID10, сочетающего в себе и производительность, и отказоустойчивость, но. Но ценой потери уже половины потенциального пространства, т. е. для создания массива в те же 20 ТБ потребуется уже не три, а четыре диска по 10 ТБ, о чем было сказано в начале статьи. Впрочем, можно «выжать» и из чипсетного RAID5 немного больше: подбором размера блока чередования и кластера файловой системы, чем мы не занимались, оставив значения по-умолчанию. Однако повысить скорость записи до уровня хотя бы одиночного винчестера и это не позволяет — в отличие от RAID10, обеспечивающего ее удвоение (пусть и высокой ценой). В лучшем случае получается повысить скорость примерно до 100 МБ/с, т. е. RAID5 на практике даже при тонкой настройке снижает производительность операций записи. Где-нибудь в NAS это не важно: данные записываются редко, а читаются часто, да и лимитирует производительность сам по себе сетевой интерфейс (как раз значениями в районе сотни мегабайт в секунду, а то и меньше), так что высокая емкость и отказоустойчивость выходят на первый план. А вот в персональном компьютере или рабочей станции массивы такого типа просто не интересны. Точнее, интересны еще меньше, чем RAID0 или RAID1. А ведь и у первых уже появились серьезные конкуренты, но об этом чуть ниже.
Время доступа
Если при чтении данных латентность практически неизменна, то при записи в массиве RAID0 она резко снижается. В чем, впрочем, заслуга, скорее, не его, а алгоритмов кэширования, применяемых контроллером для массивов. Но, как видим, RAID5 и это никак не помогает. Даже наоборот, что вполне согласуется с логикой его работы.
Последовательные операции (Crystal Disk Mark)
Поскольку HD Tune Pro при тестировании твердотельных накопителей мы не используем, а вот Crystal Disk Mark «прогоняется» везде, посмотрим на его результаты.
Как и положено, производительность при чтении данных примерно удваивается. Забавный результат в многопоточном режиме связан с тем, что при использовании ограниченной области данных (в программе, напомним, мы используем лишь 2 ГБ) и современных алгоритмов внутреннего кэширования винчестеров, вкупе с нынешними емкостями кэш-памяти, данные зачастую в ней и будут оказываться еще до соответствующего запроса. Остается только передать нужный блок по интерфейсу, что происходит очень быстро. Это позволяет с легкостью опережать SATA SSD (поскольку их сдерживает именно интерфейс), да и в однопоточном режиме от них практически не отставать. Но только в «тепличных условиях» — внешние дорожки (на внутренних скорость вдвое ниже, что уже было показано выше), небольшие объемы данных. Что бывает в более сложных случаях — посмотрим чуть позже.
С записью же все намного хуже: чем-то подстегнуть многопоточный режим не получается, так что он не только медленнее однопоточного, но и удвоения скорости сравнительно с одиночным накопителем уже не наблюдается. Но в один поток потягаться с SATA SSD хотя бы можно. Во всяком случае, при использовании RAID0 из двух дисков. Если бы мы объединили в такой массив три имеющихся винчестера — было бы еще быстрее, хотя и слишком перпендикулярно здравому смыслу. А с RAID5 все традиционно плохо. Поэтому в последующих тестах мы его использовать не будем — и без того картина ясна.
Работа с большими файлами
Как и следовало ожидать на основании низкоуровневых тестов, в однопоточном режиме хотя бы на внешних дорожках скорость чтения сравнима с SATA SSD. Но если нужно считать 32 ГБ в 32-х файлах по 1 ГБ, производительность резко падает почти до уровня одиночного винчестера (кэширование же при таких объемах ничем помочь уже не может). Для твердотельных же накопителей, напротив, это идеальный случай. А если они не ограничены интерфейсом — тем более.
Чем, все-таки, до сих пор привлекательны механические накопители — симметричностью производительности при записи и чтении, чего для флэш-памяти и близко нет. Соответственно, на операциях записи даже некоторые NVMe-накопители могут оказаться медленнее одиночного современного винчестера. Двух — тем более. Но если не рассматривать самые медленные из устройств, то опять ничего похожего на «честную конкуренцию» не наблюдается.
А запись одновременно с чтением — хороший случай для большинства SSD и плохой для винчестеров. Причем твердотельным накопителям и (псевдо)случайный режим «жизнь не портит», в отличие от. Таким образом, быстро прочитать или записать большой объем данных современные винчестеры могут — если есть куда или откуда. Объединенными в массив RAID0 сделают это быстрее. Но поскольку обработка данных предполагает обычно и запись, и чтение, и далеко не всегда последовательные — для этой цели уже лучше использовать твердотельные накопители. Если, конечно, объемы позволяют. А вот хранить данные лучше там, где это обходится дешевле.
Производительность в приложениях
Но основной темой сегодняшней статьи было вовсе не исследование вопросов хранения и обработки больших массивов данных, хотя и это тоже интересно. Еще важнее — оценить перспективность использования RAID0 для ускорения обычной работы за компьютером. Когда-то это позволяло что-то выиграть сравнительно с одиночным винчестером, но тогда и программы были другими, да и операционные системы тоже. Да и сравнивать сейчас уже нужно не только «механику с механикой». Вот и сравним :)
Тестируя SSD, мы временами жаловались на то, что с точки зрения тестов высокого уровня они слишком похожи. Тестируя винчестеры — аналогично. Но они «по-разному похожи»: это два непересекающихся мира. А одиночный винчестер и RAID0 из винчестеров — один мир. Совсем один. Потенциальное ускорение от чередования к настоящему моменту по сути рассосалось: современные операционные системы и с одиночным винчестером работают настолько эффективно, насколько он позволяет (чему сильно помогает развитое кэширование данных в оперативной памяти, радикально улучшившееся в современных версиях Windows — пусть это и вызывает жалобы некоторых пользователей, привыкших к примитивной Windows XP и более ранним, на «расход памяти»). Снижение задержек пригодилось бы, но его при чтении данных (что важно для тестов высокого уровня) как раз и нет.
И даже по низкоуровневому баллу появляются различия между разными моделями твердотельных накопителей, но не более того. Винчестеры (что с ними не делай) намного медленнее. Причем в этом случае и порядки-то величин разные, что «замаскировать» получается лишь потому, что реальная работа приложений «упирается» и в другие компоненты компьютера. А иногда и в самого пользователя, что и не всегда позволяет реализовать потенциальные возможности накопителей. Твердотельных. У «механики» таковых и не водится.
Кстати, и предыдущая версия тестового пакета ведет себя аналогично. Когда-то, кстати, PCMark на массивы реагировал хорошо — но это было под управлением других ОС и на трассах, имитирующих другие приложения. А сейчас уже так. Подробные результаты, думаем, уже не нужны.
Рейтинги
Как видим, с точки зрения тестов низкого уровня, ориентированных в первую очередь на SSD (так что изобилующими операциями со случайным доступом) сравнивать «механику» (что с ней не делай) и SSD большого смысла нет. Но и ничего удивительного в этом тоже уже нет — для винчестеров лучший сценарий это однопоточный последовательный, однако, как уже было показано выше, и в этом случае о прямой конкуренции говорить не всегда приходится. Иногда при записи, разве что, но и при этом «потолок» винчестеров (и массивов из них) сопоставим лишь с «полом» твердотельных накопителей с SATA-интерфейсом (eMMC-модули — отдельная история; но они и используются чаще всего там, куда никакие другие накопители просто «не лезут»).
Да и «подмешивание» к оценке результатов тестов высокого уровня не слишком меняет картину. По совокупности разные SSD при этом отличаются друг от друга примерно вдвое, поскольку мы взяли один из самых медленных и один из самых быстрых из протестированных накопителей, радикально различающихся конструктивно. Однако при этом и «самый медленный» быстрее массива RAID0 из пары топовых винчестеров даже не в два, а в два с половиной раза. Комментарии излишни.
Читайте также: