Где используется таблица размещения файлов fat12
Каждый элемент таблицы FAT занимает на диске определенное место, т.е. под него выделяется определенное количество бит. Используются 12-ти, 16 32-битовые элементы FAT. Соответственно файловая система носит название FAT12, FAT16 или FAT32.
Длина элемента FAT определяет разрядность хранимого в нем двоичного числа, а значит и максимальный номер кластера, информация о котором находиться в этом элементе. Поэтому длина элемента FAT ограничивает максимальное количество кластеров, которые могут быть сформированы в рабочей области тома (для FAT12: 2 12 = 4096; для FAT-16: 2 16 = 65535; для FAT-32: 2 32 = 4294967296).
12-битовый формат годиться только для гибких дисков (дискет) с небольшим количеством секторов при этом вся таблица FAT помещается в одном секторе диска.
16-ти и 32-битовые версии FAT были разработаны для жестких дисков. В настоящее время используется в основном FAT32, FAT16 может использоваться только с дисками небольшого объема, которые в настоящий момент уже не применяются. Разберем почему. Пусть нам необходимо организовать файловую систему на диске объемом 4Гбайта (очевидно, что речь идет о Flash-диске). Если мы используем FAT16, количество используемых кластеров на диске может достигать 2 16. Вычислим размер одного кластера, размер всего диска 4*2 30 делим на количество кластеров:
Размер кластера = 4*230 / 216 = 216 = 64КБайта
Это значит, что даже для хранения файла размером один байт будет использовано 64 КБайта дисковой памяти, т.е. дисковое пространство используется крайне нерационально. Неиспользованная часть кластера называется потерянным местом(slack). В небольших файлах почти весь кластер может быть потерянным местом, а в среднем потери составляют половину размера кластера.
При применении FAT32 это ограничение на количество кластеров (а значит и на его размер) снимается, эта система намного эффективнее расходует дисковое пространство, так как использует кластеры меньшего размера. Размеры кластера задаются системой при форматировании диска (См. таблицу 9).
Таблица 9 Зависимость размера кластера от емкости диска
Емкость диска, Гбайт | Размер кластера, Кбайт |
Менее 8 | |
Менее 16 | |
Менее 32 | |
32 и более |
У системы FAT16 есть одно преимущество, так как она является небольшой файловой системой, ее FAT-таблица при работе целиком помещается в память. У файловой системы FAT32 кластеры небольшие, зато она сама большая и поэтому ее таблица FAT полностью в памяти не помещается. Поэтому быстродействие файловой системы FAT16 гораздо выше, чем у FAT32.
FAT12 - это файловая система (файловая система), которая использовалась со времен DOS. Она до сих пор используется на гибких дисках. Форматированная дискета FAT12: есть две магнитные головки, каждая с 80 цилиндрами (дорожками), каждая Цилиндр имеет 18 секторов, и каждый сектор имеет 512 байт пространства. Итак, общий объем стандартной дискеты составляет:
2 * 80 *18 * 512=1474560B=1440K=1.44M
Ниже приведена структурная схема FAT12:
1. Загрузочный сектор
Причина, по которой операционная система распознает диски с форматом FAT12, заключается в 512B сектора логического 0. Если содержимое последних двух байтов из 512 байтов - 55 и AA (сначала младший байт 0xAA55, затем старший байт), BIOS прочитает этот сектор как 0: 7C00h- В 0: 7DFFh, затем перейдите к 0: 7C00h, чтобы продолжить выполнение инструкций.Операционная система использует это для достижения цели загрузки системы, и этот диск называется загрузочным.
Операционная система идентифицирует файловую систему FAT12, поскольку определенная структура данных также хранится в секторе логического 0 (т. Е. Загрузочном секторе). Эта структура имеет фиксированный формат и автоматически создается, когда операционная система форматирует диск. Конкретные данные Структура представлена в следующей таблице:
Инструкция по короткому прыжку
jmp short LABEL_START
Количество байтов на сектор (байтов / сектор)
Количество секторов в кластере (сектор / кластер)
Сколько секторов занимают загрузочные записи
Сколько там FAT таблиц
Максимальное количество файлов в области корневого каталога
Общее количество секторов
Количество секторов, занимаемых каждой таблицей FAT
Количество секторов на дорожку (сектор / дорожка)
Количество голов (количество сторон)
Количество скрытых секторов
Если BPB_TotSec16 = 0, здесь указывается количество секторов.
Буква диска INT 13H
Зарезервировано, не используется
Расширенная метка загрузки (29h)
Серийный номер тома
Тип файловой системы
Загрузочный код и другой контент
Загрузочный код и другие данные
Загрузочный код (оставшееся место заполняется 0)
Конечный флаг 0xAA55
510-й байт равен 0x55, а 511-й байт - 0xAA.
Ниже мы вводим значение некоторых из этих переменных:
BS_jmpBoot: это инструкция перехода, инструкция перехода со смещением 0 должна быть законной и исполняемой инструкцией ЦП на базе x86, такой как jmp start, которая может генерировать 3-байтовую инструкцию (плюс короткое ключевое слово short Длина инструкции перехода составляет 2 байта), указывая на часть кода загрузки операционной системы. Инструкция перехода в загрузочном секторе FAT12, сгенерированная Windows и MS-DOS, представляет собой короткий переход, например: jmp short LABEL_START, а затем добавьте команду nop null, чтобы сохранить 3 байта длина.
BPB_BytsPerSec: количество байтов на сектор, тип - двухбайтовый, количество байтов на сектор в стандартном разделе, как правило, составляет 512 байт, а в формате FAT12 установлено значение 512 (0x200h).
BPB_SecPerClus: количество секторов в каждом кластере, смещение 13, тип - байт. Кластер - это наименьшая единица хранения данных. Обычно это 1 в формате FAT12, то есть каждый кластер имеет только 1 сектор (512 байт).
BPB_RsvdSecCnt: сколько секторов занимает загрузочная запись, то есть загрузочный сектор до FAT1. Обычно загрузочный сектор занимает 1 сектор.
BPB_NumFATs: общее количество таблиц FAT. По умолчанию значение этого поля равно 2, что означает, что имеется две таблицы FAT. Содержимое FAT1 и FAT2 одинаково. FAT2 можно использовать для восстановления таблицы размещения файлов, если в таблице FAT1 есть ошибка.
BPB_RootEntCnt: максимальное количество файлов корневого каталога, по умолчанию - 224, каждая запись каталога занимает 32 Б пространства, поэтому размер корневого каталога: 224 * 32/512 = 14, что занимает 14 секторов.
BPB_TotSec16: общее количество секторов = 0xB40 = 2880
BPB_FATSz16: количество секторов, занимаемых каждой FAT = 0x9 = 9, то есть FAT1 занимает 1-9 логических секторов, а FAT2 занимает 10-18 логических секторов.
BPB_SecPerTrk: Количество секторов на дорожку = 0x12 = 18, то есть в стандартной файловой системе FAT12 количество секторов на дорожку равно 18.
BPB_NumHeads: количество головок = 0x2 = 2, на диске 2 головки, то есть количество сторон равно 2.
2. Таблица FAT
FAT1 и FAT2 - две идентичные таблицы FAT, каждая из которых занимает 9 секторов. Среди них FAT1 занимает 1-9 секторов, а FAT2 - 10-18 секторов. Подробнее см. 4 ниже.
3. Область корневого каталога
Номер начального сектора области корневого каталога - 19, который состоит из нескольких записей каталога (запись каталога), и имеется не более записей BPB_RootEntCnt. Поскольку размер области корневого каталога зависит от BPB_RootEntCnt, длина не является фиксированной.
В этой FAT12, поскольку BPB_RootEntCnt = 0xE0 = 14 * 16 + 0 = 244, максимальное количество записей составляет 244, а поскольку каждая запись занимает 32 байта, 244 * 32/512 = 14, что является областью корневого каталога. Занимает 14 секторов, то есть 19-32.
Каждая запись в области корневого каталога занимает 32 байта и имеет следующий формат:
Здесь в основном определяется имя файла, его атрибуты, время и дата последней записи, количество кластеров в начале файла и размер файла.
Давайте разберемся с этим содержанием на примерах,
1. Сначала создайте виртуальную дискету, здесь мы используем WinImage, конкретный адрес загрузки указан в моих ресурсах для загрузки.
Выберите "Файл" - "Новый"
После создания новой виртуальной дискеты вам необходимо добавить на нее файлы, нам нужно заранее записать следующие файлы
RIVER.TXT, содержимое - река, река
FLOWER.TXT, содержимое - flowerflower …… flower, требуется не менее 100 цветов, что делает пространство данных больше 512 байт, поэтому файл будет занимать два последовательных сектора.
TREE.TXT, содержимое - дерево
Добавьте еще один каталог HOUSE, а затем добавьте два текстовых файла в каталог \ HOUSE:
CAT.TXT, контент - catcatcat
DOG.TXT, содержание dogdogdog
Изображение - "Создать папку ДОМ
Добавить каталог ДОМА
Дважды щелкните дом, войдите в папку дома и добавьте два файла CAT.TXT и DOG.TXT.
Файл добавляется, а затем сохраняется. Обратите внимание, что тип сохранения: образ виртуального гибкого диска (* .vfd). Я не знаю, в чем разница между этим типом и IMG, но я знаю, что результат этого типа правильный. Ха-ха! Имя файла - FLOOPY, поэтому мы создаем виртуальную дискету FLOOPY.vfd.
Затем используйте UltraEdit, чтобы открыть FLOOPY.vfd, поскольку область корневого каталога начинается с 19-го сектора, каждый сектор составляет 512 байт, поэтому первый байт расположен по смещению 19 * 512 = 9278 = 0x2600, хорошо Да, теперь давайте найдем 0x2600 и посмотрим, что такое запись в каталоге?
Здесь нам нужно заботиться только о DIR_FstClus в RIVER.TXT, то есть о начальном номере кластера файла. Поскольку BPB_SecPerClus = 1 в этой FAT12, кластер представляет собой сектор, DIR_FstClus = 2, что означает, что файл находится в области данных. Номер начального сектора - 2. Здесь следует отметить, что номер кластера первого кластера в области данных равен 2, а не 0 или 1, поэтому данные файла начинаются с первого кластера в области данных, который является первым сектором.
Так где же первый сектор области данных?
Сначала подсчитайте количество секторов, занимаемых областью корневого каталога:
Причина, по которой (BPB_BytsPerSec-1) добавляется к числителю, состоит в том, чтобы гарантировать, что эта формула все еще действительна, когда область корневого каталога не может заполнить целые сектора.
В этом примере, поскольку BPB_RootEntCnt = 224, вычислено, что область корневого каталога занимает 14 секторов. и другие
Номер сектора в начале области данных = номер сектора в начале области корневого каталога + 14 = 19 + 14 = 33.
Теперь давайте перейдем к 33-му сектору, смещение 512 * 33 = 16896 = 0x00004200, давайте посмотрим на содержимое здесь:
Конечно же, это река.
4. Таблица FAT
Здесь, поскольку размер RIVER.TXT меньше 512 байт, нам не нужна таблица FAT, чтобы найти содержимое RIVER.TXT в области данных, но для файлов размером более 512 байт это не так просто и необходимо использовать Таблица FAT для поиска всех секторов области данных, занятых файлом.
Давайте перейдем к содержимому FAT1. Номер начального сектора FAT1 равен 1, поэтому смещение равно 1 * 512 = 512 = 0x200.
Куча непонятных символов, как у многих Ф. На самом деле это несложно: это немного похоже на битовую карту, в которой каждые 12 битов становятся записью FAT (запись FAT), представляющей кластер в области данных. 0-й и 1-й элементы FAT вообще не используются. 2-й элемент FAT начинает указывать каждый кластер в области данных, то есть 2-й элемент FAT указывает первый кластер в области данных и так далее. Как упоминалось ранее, номер кластера первого кластера в области данных равен 2, что отражается здесь.
Следует отметить, что, поскольку каждый элемент FAT занимает 12 бит, он содержит один байт и другой байт, поэтому это особенно неудобно. Конкретная ситуация такова, предположим, что 3 последовательных байта показаны на рисунке:
Как правило, значение элемента FAT представляет следующий номер кластера файла, но если значение больше или равно 0xFF8, это означает, что текущий кластер является последним кластером файла. Если значение 0xFF7, это означает, что это плохой кластер.
Номер начального кластера файла RIVER.TXT равен 2, а значение в соответствующей таблице FAT - 0xFFF, что указывает на то, что этот кластер является последним.
Номер начального кластера файла FLOWER.TXT равен 3, а значение в соответствующей таблице FAT - 0x004, что указывает на то, что файл еще не закончен, следующий номер кластера - 0x004, а затем мы смотрим на значение FAT, соответствующее четвертому кластеру в таблице FAT. Если это 0xFFF, это означает, что это последний кластер, а файл FLOWER.TXT занимает 3-й и 4-й кластеры.
Если вы хотите разделить содержимое файла на отдельные секторы, есть способ сделать это, то есть сначала добавить файл в дисковод для гибких дисков, а затем добавить тот же файл для его перезаписи. Конечно, размер файла должен быть больше 512 байт.
Вкратце, прямо tree Теперь я вручную смоделировал
Здесь всего 2 места:
Одно место - flower.txt Для этого требуются два кластера, поэтому он будет включать в себя знание связного списка толстого слоя. В частности, сначала найдите информацию о кластере по смещению 0x1a соответствующего элемента каталога и прочтите 03 , Ок, можете проверить 14 * 512 + 19 * 512+ (03-02) * 512 = 0x4400h, вы точно найдете то, что я написал aaaaaa. Content, а затем мы должны перейти к fat [03], чтобы посмотреть, следующий номер кластера (пронумерованный от 2 для области данных, поэтому будет 03-02 выше, чтобы помочь нам найти местоположение), чтобы найти это местоположение 12bit Это 04, что означает, что остальной контент находится в области 04 области данных. Фактически, он связан с вышеупомянутым. Иногда это не непрерывно. Просто так случилось, что оно находится здесь. Эта часть также соответствует толстому [04]. Пойдите, посмотрите и увидите FFF , Описание flower.txt закончился
Другое место - ДОМ, вы можете увидеть, что используется кластер 06, но если вы перейдете к жирному [06], вы можете найти FFF , Но это не важно, вы должны перейти в область данных 06, третье изображение ниже, вы можете сразу увидеть, я сделал набор записей информации о подкаталогах, вы можете увидеть место хранения суб-файлов в области данных 07 08 или что-то в этом роде , Вы можете найти то, что мы написали в файле, вычислив.
Файловая система FAT12 относится к предоставлению определенного формата хранения на диске. Этот формат хранения является эффективным, удобным и мощным, таким образом формируя единое регулирование.
Базовые знания
В частности, файловая система FAT12 представляет собой дискету размером 1,44 МБ. Дискета 1,44 МБ имеет 2880 секторов, а один сектор имеет 512 байт; тогда размер пространства, управляемый файловой системой FAT12, составляет 2880 * 512 = 1474560 байт.
Фактические секторы находятся на диске, но мы можем рассматривать все пространство для хранения как большой массив, а секторы - как непрерывную структуру. Когда сектор рассматривается как массив, он называется логическим сектором и нумеруется от 0.
Инфраструктура FAT12
Во-первых, файловая система FAT12 делит 2880 секторов на 5 частей:Загрузочная запись MBR, таблица FAT1, таблица FAT2, корневой каталог, область данных
Пространство, занимаемое каждым сектором и каталогом, выглядит следующим образом
Начальный адрес (байтовый адрес) | Количество занятых секторов | название |
---|---|---|
0 | 1 | MBR |
512 | 9 | Таблица FAT1 |
5120 | 9 | Таблица FAT2 |
9728 | 14 | Корневая директория |
16896 | 2847 | Область данных |
Ниже приводится схематическая диаграмма структуры FAT12.
Загрузочная запись MBR
Загрузочная запись MBR имеет 512 байтов, последние два байта - 0x55 и 0xAA; вся информация записи MBR выглядит следующим образом (сохраненные данные присоединены с общими значениями; некоторые данные не указаны)
название | Начальный байт | длина | Хранение данных |
---|---|---|---|
BS_jmpBOOT | 0 | 3 | Инструкция прыжка |
BS_OEMName | 3 | 8 | Имя поставщика, "msdos1.0" |
BPB_BytesPerSec | 11 | 2 | Количество байтов на сектор, 512 |
BPB_SecPerClus | 13 | 1 | Количество секторов в кластере, 1 |
BPB_ResvdSecCnt | 14 | 2 | Количество секторов, занятых MBR, 1 |
BPB_NumFATs | 16 | 1 | Сколько там таблиц FAT, 2 |
BPB_RootEntCnt | 17 | 2 | Максимальное количество файлов в области корневого каталога, 224 |
BPB_TotSec16 | 19 | 2 | Общее количество секторов, 2880 |
BPB_Media | 21 | 1 | Дескриптор медиа, 0xF0 |
BPB_FATSz16 | 22 | 2 | Количество секторов, занятых таблицей FAT, 9 |
BPB_SecPerTrk | 24 | 2 | Количество секторов на дорожку |
BPB_NumHeads | 26 | 2 | Количество голов |
BPB_HiddSec | 28 | 4 | Количество скрытых секторов, 0 |
BPB_TotSec32 | 32 | 4 | Если BPB_TotSec16 = 0, здесь указывается количество секторов. |
BS_DrvNum | 36 | 1 | Буква диска INT 13H |
BS_Reserved1 | 37 | 1 | Зарезервированный бит |
BS_BootSig | 38 | 1 | Расширенная метка загрузки |
BS_VolID | 39 | 4 | Серийный номер тома |
BS_VolLab | 43 | 11 | Метка тома |
BS_FileSysType | 54 | 8 | Тип файловой системы «FAT12» |
Код сборки | 64 | 448 | Код сборки в загрузочной записи |
Знак конца | 510 | 2 | Два байта: 0x55, 0xAA |
Загрузочная запись MBR - это сектор, который BOIS считывает в память. Вы можете видеть, что первая инструкция - это инструкция перехода на ассемблере x86. Эта инструкция перейдет в следующую область кода ассемблера для выполнения. Поскольку нам не нужно учитывать следующий раздел кода, когда мы выполняем симуляцию программы файловой системы FAT12, следующий код сборки обычно равен 0.
На что следует обратить внимание - это параметры некоторых файлов FAT12 впереди. Для удобства объяснения рассмотрим файловую систему FAT12 со значениями по умолчанию, которые в основном фиксированы в системе DOS.
Таблица FAT1, FAT2
Эти две таблицы абсолютно одинаковы.Цель таблицы FAT2 - восстановить таблицу FAT1. Поэтому в реальном рабочем процессе таблица FAT1 может быть назначена FAT2, когда аппарат выключен. Когда мы будем говорить о таблице FAT позже, по умолчанию используется таблица FAT1.
Каждые двенадцать бит (1,5 байта) таблицы FAT представляют собой кластер., Отсюда и название FAT12.
Что хранится в каждом кластере?Во-первых, 12 двоичных цифр указывают следующий кластер, на который указывает этот кластер. Таблица FAT нумеруется с нуля. Если в кластере 2 хранится 3, то кластер 2 указывает на кластер 3. Если 12-значное число кластера 3 равно 5, то кластер 3 указывает на кластер 5. Это формирует связанный список, списокНулевой указатель NULL (конечный флаг), используйте 0xFFF для указания。
Таблица FAT состоит из 9 секторов и всего кластера 3072. Максимальный номер кластера, который может быть представлен 12-битным двоичным числом, составляет 4096. Доступен каждый кластер, и нужно беспокоиться о том, чтобы номер кластера не пересек границу.
Кластер 0 и кластер 1 таблицы FAT использовать нельзя, они хранят метку плохого кластера 0xFF0 и метку конца 0xFFF.
Ниже приведен снимок экрана части таблицы FAT системы DOS. Обратите внимание, что Intel использует память с прямым порядком байтов, то есть старший байт хранится по старшему адресу. Первый кластер представляет собой объединение 0xF0 0xFF, а F за 0xFF и 0xF0 объединяются с образованием 0xFF0, который является меткой плохого кластера. Второй кластер также можно анализировать так же, как 0xFFF, который является концом списка кластеров.
Мы можем видеть, что эта структура все больше и больше похожа на структуру связанного списка в программировании, которая может быть выражена как следующая структура на языке C
** Почему разделены кластеры и сектора? ** Конечно, мы можем поместить следующий указатель в сектор, который больше похож на структуру связанного списка в программировании. Однако в реальной операционной системе часто требуется только доступ к номеру кластера, без доступа к данным в секторе (вычисление размера каталога), в это время только чтение содержимого в одном секторе может в основном завершить операцию. , Что значительно сокращает время ввода-вывода.
Область корневого каталога
Корневой каталог, как следует из его названия, является начальной папкой системы. Он обозначен символом «\» в Windows и «/» в Linux. Файлы и подкаталоги хранятся в корневом каталоге. Реальные данные обоих хранятся в области данных. Основная информация хранится в корневом каталоге, чтобы найти их реальные данные. Эта основная информация называетсяЗапись в каталоге файлов。
Запись в каталоге файлов имеет 32 байта, а метод организации следующий (адресуется по байтам)
Смещение | длина | описание |
---|---|---|
0 | 8 | имя файла |
8 | 3 | Расширение файла |
11 | 1 | Атрибуты файла |
12 | 10 | Зарезервированный бит |
22 | 2 | Время создания |
24 | 2 | Дата создания |
26 | 2 | Номер кластера |
28 | 4 | Размер файла |
Имя файла и расширение - это основное имя и имя после символа '.'. Например, имя файла a.txt - a, а расширение - txt. Следует отметить, что если имя файла меньше 8 символов, то следующие символы должны быть установлены как «пробел» вместо 0.
Существует три основных атрибута файла: скрытые файлы 0x27; каталоги 0x10; обычные файлы 0x20;
10-байтовый зарезервированный бит позже использовался для хранения такой информации, как «время модификации». Он был потрачен впустую в исходной системе DOS.
Дата и время создания посложнее, я специально написалстатьяТщательно анализируйте. Среди них - код извлечения языка C.
Номер кластераСсылается на адрес, по которому хранится первый раздел файла. Как упоминалось ранее, кластер отображается в сектор области данных, поэтому данные файла хранятся в секторе, соответствующем первому номеру кластера.
Если файл имеет только один сектор и номер первого кластера равен 2, то первые несколько байтов таблицы FAT выглядят следующим образом: F0 FF FF FF? F. Младшие четыре бита последнего байта и предшествующего FF образуют конечный тег FFF. Все данные файла хранятся в 32 секторах.
Если файл состоит из нескольких секторов и номер первого кластера равен 2, то первые несколько байтов таблицы FAT могут выглядеть так: F0 FF FF 02 0F FF. Данные файла хранятся в 32 и 33 секторах.
Размер файла - это размер файла, выраженный в байтах.
Область данных
Если определенный сектор области данных является каталогом, то этот каталог называется подкаталогом. Подкаталоги делятся на подкаталоги первого уровня, второго уровня . и их метод организации в основном такой же, как и у корневого каталога.
Подкаталог должен содержать два элемента каталога:.…
Например, использование команды dir в определенном подкаталоге DOS приведет к следующим результатам
Первые две записи каталога отмечены точкой и точкой для удобства описания.
Первый номер кластера, хранящийся в записи каталога точек, является первым номером кластера текущего каталога, что означает, что, за исключением имени, другая информация точки такая же, как запись в каталоге текущего каталога. Затем, когда используется следующая команда, она все равно останется в текущем каталоге
Запись каталога dotdot хранит номер первого кластера родительского каталога текущего каталога.Если родительский каталог является корневым каталогом, первый номер кластера равен нулю, что является особым случаем. При использовании следующей команды он вернется в родительский каталог
Если в определенном секторе хранятся обычные файлы, особых правил нет, и в зависимости от каждого файла будут разные структуры организации данных.
А теперь уберите детей и беременных женщин от экранов, потому что мы будет иметь дело с байтами в чистом виде.
Для начала определимся с дискетой. А именно с самой обыкновенной дискетой 3.5” с 1.44Мб на борту, которая всем нам так хорошо знакома. Так вот, всё место на дискете разбито на секторы, размер каждого сектора составляет 512 байт. Сектора объединяются в кластеры, но на дискете не так уж и много секторов (2848), поэтому каждый кластер содержит только один сектор.
Итак, файловая система. Самый первый сектор на дискете (нулевой) отводится под Boot Sector – загрузочный сектор. В нем хранится всякая полезная и важная информация. Сразу за ним следует FAT таблица. FAT расшифровывается как File AllocationTable – Таблица Размещения Файлов. Как правило, эта таблица дублируется с целью увеличения надежности. Первая и вторая таблицы занимают 1-9 и 10-18 сектора соответственно. После таблиц несколько секторов (на дискете это 14шт) отводятся под корневой каталог. И после всего этого уже идут секторы с содержимым файлов.
А теперь обо всем по порядку.
Boot Sector – Загрузочный сектор
Этот сектор занимает нулевой сектор на дискете. Он содержит очень важную информацию об устройстве файловой системы. Далее следуют номера байтов в секторе и то, что в них хранится:
Если байт загрузочной области установлен в 0x29, то следующие за ним 3 поля присутствуют.
Id тома используется как его серийный номер. Обычно его получают из времени создания тома.
Метка тома — это его название. По умолчанию выставляется в «NO NAME    ».
Тип файловой системы — для FAT12, это строка «FAT12   ». На самом деле большинство драйверов определяют тип системы не из этой строки, а на основе количества секторов в носителе (FAT12 выбирается, если на носителе не более 2^12 = 4096 секторов)
FAT таблица
FAT таблица очень похожа на массив, элементы которого состоят из 2х байтов. Каждый элемент соответствует сектору с данными, но тут мы используем не реальные, а логические сектора. Их отличие в том, что их нумерация начинается не с начала дискеты, а с начала области данных. То есть в нашем примере первые 33 сектора дискеты (0-32) заняты Boot сектором, FAT таблицами и корневым каталогом, то есть сами данные начинаются на 33 секторе. В FAT таблицах нулевой и первый элемент зарезервированы, поэтому мы начинаем со второго. Таким образом второй элемент FAT таблицы соответствует 33 сектору на дискете или 0 логическому сектору, а, например, пятый элемент — 36му и 3му логическому. Значения элемента могут быть 3х типов:
- Значение, указывающее на то, что сектор является последним в файле
- Значение, указывающее на то, что сектор в настоящее время не используется
- Порядковый номер следующего сектора файла
Вот более подробный список значений и того, что они означают:
Небольшой пример. Представьте, что у нас на диске записано 2 файла. Это text.txt, который занимает 4 сектора и picture.jpg, который занимает 2 сектора. Пусть text.txt занимает 0, 2, 4 и 5 логические сектора в области данных (отсчет ведется с нуля), а picture.jpg — 1 и 3. Тогда FAT таблица будет выглядеть примерно так:
R 0x0000
R 0x0000 — первые 2 элемента зарезервированы, помните?
0 0x0002 — начало файла text.txt, тут хранится указатель на следующий сектор файла text.txt
1 0x0003 — начало picture.jpg и указатель на продолжение
2 0x0004 — продолжение text.txt
3 0x0FFF — последний сектор picture.jpg
4 0x0005 — предпоследний сектор text.txt
5 0x0FFF — последний сектор text.txt
Цифра перед значением показывает, с каким логическим сектором связан этот элемент. Буква «R» стоит перед зарезервированными, то есть неиспользуемыми элементами.
Директории
Директории (в том числе и корневая) хранятся на диске как файлы и занимают один или несколько секторов. Каждый сектор директории (512 байт) содержит указатели на 16 файлов, то есть по 32 байта на каждый указатель. Такой указатель описывает вложенную директорию или файл на диске и ссылается на него. Таким образом набор этих указателей полностью описывает внутреннее содержимое папки. Разберем эти указатели поподробнее. Номера байтов и их содержимое:
Если первый байт имени имеет значение 0x29, то этот указатель пуст (то есть файл был удален), но после него еще имеются указатели. Если же первый байт имени — 0x00, то указатель пуст и дальше все указатели тоже пусты.
Байт атрибутов описывает свойства файлов. Вот его допустимые значения:
- 0x01 — только чтение
- 0x02 — скрытый
- 0x04 — системный
- 0x08 — Volume Label (я так и не разобрался, что это такое)
- 0x10 — указывает на то, что файл является папкой
- 0x20 — архивный (Archive, тоже не разобрался)
- 0x40 — не используется
- 0x80 — не используется
Значения можно комбинировать. Например, если мы хотим чтобы наш файл был скрытой системной папкой, то мы устанавливаем этот байт в значение 0x16, потому-что 0x16 = 0x02 + 0x04 + 0x10.
Имя файла и расширение
В FAT12 выделяется 8 символов под имя файла и 3 символа под расширение. Если у файла имя занимает меньше 8ми символов, то оставшиеся заполняются пробелами (ASCII 32 или 0x20). То же самое и с расширением. Также все имена и расширения хранятся в ВЕРХНЕМ РЕГИСТРЕ. У директорий, кстати, тоже могут быть расширения. В одной папке не может находится сразу несколько файлов или директорий с одинаковыми именами и расширениями. Вот несколько примеров, слева то, что хранится на диске, а справа имена, которые мы дали файлам. Символом подчеркивания ("_") я заменил пробел для наглядности:
- «FOO_____BAR» — «foo.bar»
- «FOO_____BAR» — «Foo.Bar»
- «FOO_____BAR» — «FOO.BAR»
- «FOO________» — «foo»
- «FOO________» — «foo.»
- «PICKLE__A__» — «PICKLE.A»
- «PRETTYBGBIG» — «prettybg.big»
Имя файла ".big" является некорректным, потому-что имена не могут начинаться с точки.
Ну вот, теперь вы должны представлять себе устройство системы FAT12, надеюсь я все понятно разжевал. Тем не менее, если у вас возникнут какие-либо вопросы, то задавайте их в комментариях.
Каждый элемент таблицы FAT занимает на диске определенное место, т.е. под него выделяется определенное количество бит. Используются 12-ти, 16 32-битовые элементы FAT. Соответственно файловая система носит название FAT12, FAT16 или FAT32.
Длина элемента FAT определяет разрядность хранимого в нем двоичного числа, а значит и максимальный номер кластера, информация о котором находиться в этом элементе. Поэтому длина элемента FAT ограничивает максимальное количество кластеров, которые могут быть сформированы в рабочей области тома (для FAT12: 2 12 = 4096; для FAT-16: 2 16 = 65535; для FAT-32: 2 32 = 4294967296).
12-битовый формат годиться только для гибких дисков (дискет) с небольшим количеством секторов при этом вся таблица FAT помещается в одном секторе диска.
16-ти и 32-битовые версии FAT были разработаны для жестких дисков. В настоящее время используется в основном FAT32, FAT16 может использоваться только с дисками небольшого объема, которые в настоящий момент уже не применяются. Разберем почему. Пусть нам необходимо организовать файловую систему на диске объемом 4Гбайта (очевидно, что речь идет о Flash-диске). Если мы используем FAT16, количество используемых кластеров на диске может достигать 2 16. Вычислим размер одного кластера, размер всего диска 4*2 30 делим на количество кластеров:
Размер кластера = 4*230 / 216 = 216 = 64КБайта
Это значит, что даже для хранения файла размером один байт будет использовано 64 КБайта дисковой памяти, т.е. дисковое пространство используется крайне нерационально. Неиспользованная часть кластера называется потерянным местом(slack). В небольших файлах почти весь кластер может быть потерянным местом, а в среднем потери составляют половину размера кластера.
При применении FAT32 это ограничение на количество кластеров (а значит и на его размер) снимается, эта система намного эффективнее расходует дисковое пространство, так как использует кластеры меньшего размера. Размеры кластера задаются системой при форматировании диска (См. таблицу 9).
Таблица 9 Зависимость размера кластера от емкости диска
Емкость диска, Гбайт | Размер кластера, Кбайт |
Менее 8 | |
Менее 16 | |
Менее 32 | |
32 и более |
У системы FAT16 есть одно преимущество, так как она является небольшой файловой системой, ее FAT-таблица при работе целиком помещается в память. У файловой системы FAT32 кластеры небольшие, зато она сама большая и поэтому ее таблица FAT полностью в памяти не помещается. Поэтому быстродействие файловой системы FAT16 гораздо выше, чем у FAT32.
Фрагментация диска
Как это видно на рисунке 6 цепочка кластеров, принадлежащих одному файлу, может записаться не подряд, а в виде нескольких фрагментов. Если на диске записано много данных, на нем может не быть цельной области, достаточной для размещения файла. Тем не менее, файл все-таки запишется, если на диске много мелких областей, суммарный размер которых достаточен для записи. В этом случае файл записывается в виде нескольких фрагментов
Процесс разбиения файла на небольшие фрагменты при записи на диск называется фрагментацией. Особенно способствует фрагментации ситуация, когда на диск записывается большое количество мелких файлов, а потом некоторые из них удаляются. При этом на диске остается большое количество разрозненных пустых кластеров, в которые при записи новые файлы будут записываться с разрывами. Если на диске много фрагментированных файлов, скорость чтения носителя уменьшается, поскольку поиск кластеров, в которых хранятся файлы, на жестких дисках требует времени.
Для ускорения работы производится дефрагментация т.е.перераспределение файлов на диске, при котором они располагаются в непрерывных последовательностях кластеров. После дефрагментации ускоряется чтение и запись файлов, а следовательно и работа программ. Операционные системы Windows имеют встроенные утилиты для дефрагментации.
Потерянные кластеры
Потерянные кластеры – это наиболее распространенная ошибка файловой системы, при которой кластеры в FAT помечаются как используемые, хотя на самом деле таковыми не являются. То есть в таблице FAT есть цепочка кластеров, но при этом ни в одном из каталогов на диске нет ни одного дескриптора файла, который указывал бы на начало этой цепочки.
Такая ситуация может возникнуть при «зависании» программы или при пропадании питания во время операции записи файла (Именно поэтому система предлагает проверить диск с FAT после «неправильного» выключения компьютера). Система производит запись информации в область данных (в кластеры файла) и в элементы FAT, но не успевает поместить в каталог соответствующий дескриптор файла. Это происходит из-за того, что запись каталога для файла является последней частью операции записи файла, потому, что каталог содержит размер файла, a Windows не может знать его до тех пор, пока не закончит запись файла.
Сервисная утилита, входящая в состав Windows сканирует FAT, ищет потерянные кластеры и создает в корневом каталоге дескриптор файла, указывающий начало цепочки. Кроме встроенной утилиты существует большое количество утилит внешних производителей для решения проблем с дисками.
Иерархическая (древовидная) структура каталогов
Разберемся, как устроена древовидная структура каталогов, каким именно образом в каталоге хранятся ссылки на каталоги следующего уровня (дочерние каталоги) и как любой дочерний каталог хранит ссылку на родительский. Ссылки обоих типов являются дескрипторами.
Про организацию дочерних каталогов мы уже упоминали, такой каталог имеет в родительском каталоге дескриптор (как обычных файл). От дескриптора файла дескриптор каталога отличается только установленным атрибутом D (4-й бит в байте атрибутов - DIRECTORY).
Теперь разберемся, каким образом дочерний каталог «знает» о родительском. В любом каталоге, кроме корневого, два первых дескриптора имеют специальное назначение. Первый дескриптор содержит в поле имени строку «.». Этот дескриптор указывает на содержащий его каталог, то есть каталог имеет ссылку сам на себя. Второй специальный дескриптор имеет имя «..». Этот дескриптор указывает на каталог более высокого уровня (родительский).
Таким образом, в древовидной структуре каталогов файловой системы FAT имеются ссылки как в прямом, так и в обратном направлении. Эти ссылки можно использовать для проверки целостности структуры каталогов файловой системы.
Длинные имена
Первые версии файловой системы FAT позволяли хранить только короткие имена файлов в стандарте «восемь-точка-три» (8.3). Это объясняется тем, что в дескрипторе файла для имени файла выделяется 8 байт, а для расширения 3 байта. Начиная с Windows 95 была введена поддержка длинных имен файлов. В улучшенной файловой системе файлу или каталогу можно присваивать имя длиной до 255 символов. В длинных именах файлов можно использовать пробелы, а также символы + ,; = [], которые нельзя было использовать в стандартных именах файлов. Разберемся, как устроены длинные имена в файловой системе FAT.
Проблема использования длинных имен файлов была решена следующим образом: для каждого файла и подкаталога имеются два имени: короткое, «понятное» всем прикладным программам, и длинное - для приложений Windows и тех программ, в которых предусмотрена возможность работы с длинными именами. Для хранения коротких имен в формате 8.3 используются обычные 32-байт записи. Короткие имена Windows создает из длинных имен, отсекая шесть старших символов и добавляя в конце этого базового имени "~1". Если же существует еще одно имя, состоящее из тех же шести символов, то этот номер увеличивается на единицу. Расширение файла сохраняется прежним. Если в имени встречается символ, не допустимый в предыдущих версиях операционной системы, он заменяется на знак «подчеркивание» (_). Кириллица переводится в верхний регистр (только заглавные буквы).
Покажем как длинные имена преобразуются в короткие.
Длинные имена Короткие имена
Именно эти короткие имена и будут храниться в дескрипторах файлов, размещаемых в каталогах. Таким образом, все версии операционных систем могут получить доступ к файлу под длинным именем с помощью его короткого имени.
Остается еще одна проблема: как хранить 255 символов имени файла в 32 байтах дескриптора файла, ведь каждый символ имени файла — это один байт? Модифицировать структуру записи каталога нельзя, поскольку тогда предыдущие версии операционных систем не смогут использовать ее. Разработчики файловой системы решили эту проблему следующим образом: были добавлены дополнительные записи каталога для хранения длинных имен файлов. Чтобы предыдущие версии операционных систем не «замечали» этих дополнительных записей каталога, система устанавливает для них атрибуты, которые нельзя использовать для обычного файла (значение байта атрибутов 0Fh: только для чтения, скрытый, системный и метка тома). Поскольку значения атрибутов противоречивы (не бывает защищенных от записи, скрытых и системных меток тома), дескрипторы с такими атрибутами система игнорирует, и, следовательно, длинные имена файлов остаются «нетронутыми».
Для конкретного файла или каталога непосредственно перед его единственным дескриптором с его именем в формате 8.3 находится группа из одной или нескольких записей (дескрипторов с «неправильными» атрибутами), представляющих длинное имя (до 255 символов). Каждая такая запись содержит часть длинного имени файла не более 13 символов, и операционная система составляет полное длинное имя из всех записей.
NTFS
Структура NTFS
Файловая система NTFS (New Technology File System – файловая система новой технологии) является сложной файловой системой, разработанной независимо от системы FAT.
При установке NTFS, диск разделяется на две неравные части: первая в начале диска отводиться под специальную таблицу MFT (Master File Table - главная файловая таблица), называется MFT - зоной и занимает порядка 12% от общего размера диска, вторую часть занимают собственно ваши данные. Это основа NTFS. Каждая запись в MFT соответствует какому-либо файлу и занимает около 1 Kb. По своей сути это каталог всех файлов находящихся на диске.
Первые 16 файлов носят служебный характер и недоступны операционной системе - они называются метафайлами. Эти первые 16 элементов MFT - единственная часть диска, имеющая фиксированное положение. Вторая копия этих первых записей хранится ровно посередине диска для надежности.
Обратимся теперь к записи файла MFT. В этом месте хранится вся информация о файле, за исключением собственно данных. Имя файла, размер, положение на диске отдельных фрагментов, и т.д. Если для информации не хватает одной записи MFT, то используются несколько, причем не обязательно подряд. Если данных в файле не много, то они наоборот целиком хранятся в записи файла MFT. Это значит что небольшие файлы и каталоги (обычно до 1500 байт) могут полностью содержаться внутри записи MFT. Подобный подход обеспечивает очень быстрый доступ к маленьким файлам.
Имя файла может иметь длину до 255 символов, при этом допустимы любые символы, включая полный набор национальных алфавитов, так как данные представлены в Unicode (65535 разных символов).
Как и файловой системе FAT файлы в NTFS записываются в виде последовательности кластеров. Кластеры в файловой системе NTFS могут принимать размеры от 512 байт до 64 Кб. Стандартным значением длины кластера является размер 4 Кб.
Читайте также: