Что означают окончания файлов
Запрещенные символы в именах файлов
Приведу примеры имен файлов, которые являются недопустимыми:
5<>8/7.txt – символы «» и «/» запрещены,
В чем вопрос? – символ «?» запрещен,
PRN.bmp – здесь PRN зарезервированное имя.
Имя файла
Какие можно использовать символы в имени файла? В именах файлов рекомендуется использовать русские и латинские буквы, цифры, пробелы и знаки препинания.
Однако имя файла не следует начинать с точки, а также использовать в имени квадратные [ ] или фигурные < >скобки. Недопустимыми для имен файлов являются следующие служебные символы / \ | : * ? “
Существует ли максимальная длина имени файла? Длина имени файла не должна превышать 255 символов. На самом деле, обычно хватает 20-25 символов.
Операционная система Windows не делает различий между строчными и прописными буквами для имен файлов. Это означает, что не получится хранить в одной и той же папке файлы, имена которых различаются только регистром. Например, два имени файла «Название.doc» и «НАЗВАНИЕ.doc» для Windows будет одним именем для одного и того же файла.
EOF — это не символ
Почему кто-то говорит или думает, что EOF — это символ? Полагаю, это может быть так из-за того, что в некоторых программах, написанных на C, можно найти код, в котором используется явная проверка на EOF с использованием функций getchar() и getc() .
Это может выглядеть так:
Если заглянуть в справку по getchar() или getc() , можно узнать, что обе функции считывают следующий символ из потока ввода. Вероятно — именно это является причиной возникновения заблуждения о природе EOF . Но это — лишь мои предположения. Вернёмся к мысли о том, что EOF — это не символ.
А что такое, вообще, символ? Символ — это самый маленький компонент текста. «A», «a», «B», «b» — всё это — разные символы. У символа есть числовой код, который в стандарте Unicode называют кодовой точкой. Например — латинская буква «A» имеет, в десятичном представлении, код 65. Это можно быстро проверить, воспользовавшись командной строкой интерпретатора Python:
Или можно взглянуть на таблицу ASCII в Unix/Linux:
Выясним, какой код соответствует EOF , написав небольшую программу на C. В ANSI C константа EOF определена в stdio.h , она является частью стандартной библиотеки. Обычно в эту константу записано -1 . Можете сохранить следующий код в файле printeof.c , скомпилировать его и запустить:
Скомпилируем и запустим программу:
У меня эта программа, проверенная на Mac OS и на Ubuntu, сообщает о том, что EOF равняется -1 . Есть ли какой-нибудь символ с таким кодом? Тут, опять же, можно проверить коды символов в таблице ASCII, можно взглянуть на таблицу Unicode и узнать о том, в каком диапазоне могут находиться коды символов. Мы же поступим иначе: запустим интерпретатор Python и воспользуемся стандартной функцией chr() для того, чтобы она дала бы нам символ, соответствующий коду -1 :
Как и ожидалось, символа с кодом -1 не существует. Значит, в итоге, EOF , и правда, символом не является. Переходим теперь ко второму рассматриваемому утверждению.
Добавить комментарий Отменить ответ
Структура папок
Когда Вы открываете Проводник (Пуск—>Программы—>Стандартные—>Проводник), то видите там некое дерево, конечно, без зеленых листочков, потому что это компьютерное дерево. Дело в том, что если попробовать нарисовать общую структуру всех папок, находящихся на своем компьютере, то получится как раз дерево.
Такую структуру папок (каталогов) называют иерархической древообразной (или древовидной).
Обычно пользователи называют это просто дерево папок.
Корневая папка. Вложенные папки.
На каждом диске имеется главная, или корневая, папка (каталог), которая не имеет собственного имени и ее обозначают обратным слешем: \. Например, C:\ — корневая папка диска C, где «C:» — имя самого диска, а «\» — обозначение корневой папки.
Помимо корневой папки диска, папок 1-го, 2-го и т.д. уровней вложенности, есть еще понятие текущей папки. Текущая папка – это папка, с которой в настоящий момент работает пользователь.
Если Вам понадобился файл не из текущей папки, необходимо указать в какой папке (папках) находится этот файл, то есть указать путь к файлу. По аналогии с матрешками файл является самой маленькой матрешкой, вложенной в матрешки бОльшего размера (папки). Чтобы указать полное имя файла (т.е. имя самой маленькой матрёшки), следует поименно назвать все матрешки бОльшего размера (папки).
Как изменить расширение
Изменить расширение можно через переименование:
- Настроить компьютер на показ расширений (см. выше).
- Щелкнуть правой кнопкой мыши по файлу – Переименовать.
- Стереть старое расширение после точки и напечатать новое.
- Нажать Enter.
Появится окошко, в котором система предупредит о последствиях. Ведь если вы неправильно укажите формат, файл может не открыться. Например, у вас документ с расширением doc, а вы меняете его на pdf.
После нажатия на кнопку «Да» новый тип будет назначен. А также добавится значок программы для его запуска. Но обычно после такой ручной смены расширения файл перестает открываться. Потому что он технически остался тем же, что и был.
Вернуть старое расширение можно таким же образом – через переименование. Или щелкнув правой кнопкой мыши по пустому месту и выбрав пункт «Отменить переименование».
Так как же правильно изменить расширение? Для этого нужно сделать конвертацию – преобразование в другой формат. Это делается через специальные программы или онлайн-сервисы.
Вбиваем в поисковик Яндекс или Гугл запрос «из … в …». Например, из word в pdf .
В моем случае Яндекс предложил несколько онлайн сервисов. Все они интуитивно понятны: загружаем документ на сайт → сервис преобразовывает его в pdf → скачиваем результат на компьютер.
Но в некоторых случаях лучше использовать программу. Например, если нужно конвертировать видео большого размера.
Комментарии: 43 к “Имена и типы файлов”
Автору респект
Самая толковая статья из всего опубликованного на эту тему.
Спасибо за уроки! Я начинающий. У меня есть проблема, кажется созвучна с уроком. Была программа outlook, в неё заносил знакомых, друзей и т.д. Компьютер стал зависать, внуки переписали всё на флешку, затем вновь записали на новый компьютер ( windows 8.1) OUTLOOK не открывается, нет не телефонов, адресов друзей и т.д. Как открыть?
Николай, данные из Outlook сохраняют в файлах с расширением .pst. Автоматически данные сохраняются в основном файле с расширением .pst (обычно это файл с именем Outlook.pst). Поищите (или попросите внука поискать) файл Outlook.pst в сделанных копиях. Если этот файл сохранен, то есть шанс восстановить данные из старого Outlook. Если этого файла в сделанных внуком копиях нет, то новый Outlook будет работать, что называется, с чистого листа, то есть без старых данных, которые были в нем до копирования и восстановления данных.
Обычно исходный файл Outlook.pst находится в папке C:\Users\Имя_пользователя\AppData\Local\Microsoft\Outlook Но может храниться и в другом месте. Это можно точно выяснить, если в программе Outlook кликнуть по меню «Файл», затем «Управление файлами данных». И в открывшемся окне можно посмотреть, где хранится файл Outlook.pst. Там так и будет написано, «Outlook.pst в папке … и далее написано полное имя папки».
Хороший совет спасибо!
Спасибо за очень интересный и важный урок Ахат.
Cпасибо большое за совет.Уже создала разные папки, заодно навела порядок-разложила фото так, чтобы их быстро можно было найти. С уважением-Тамара.
Здравствуйте, Надежда!Я скачала фото на ноутбук не с моего телефона, и у скачанных фото номера совпали с ранее скачанными фото с моего телефона (Это я потом поняла).Мои фото исчезли.Можно ли восстановить мои прежние фото и как мне избежать такой ошибки в дальнейшем? С уважением-Тамара.
Тамара, потерянные фотки можно восстановить или из Вашего телефона, если они там сохранились, или из копии данных, если Вы эти копии своих данных делали ранее. Вопросы архивации и восстановления данных рассматриваются в статьях из рубрики «Архивация и восстановление» на моем блоге.
Чтобы избежать подобной проблемы в дальнейшем надо копировать данные из телефона в компьютер в разные папки. Например, если Вы скачиваете фотки из своего телефона, то можно создать папку «Фотки из моего телефона» и копировать данные в эту папку. А если Вы собираетесь копировать данные из чужого телефона, то можно создать папку «Фотки из телефона Лены» (Маши, Светы и т.п.) и копировать данные из телефона Лены (Маши, Светы и т.п.) в эту папку (в эти папки).
С первым заданием справилась: вторую папку не создаёт, т.к. имя уже занято; второй вопрос — не откроет, потомучто имя зарезервировано;
третий — имени фпайла допущена ошибка — / знак запрещенный в именя файла
Спасибо! Нужная инфа. Не могли ли вы дать ссылку на читалку на русском языке для расширения fb2.А если ещё и инструкцию к ней…
В моем случае не помогает. Надо счто-то другое.
Откройте в верхнем меню Вид. Поставьте галочку напротив Плитка.
Да все так и и есть. Только видеофайлы показываются в иде значков,а я хотел, чтобы как раньше в виде кадров из них. Может какую прогу надо? А менять значки крупные на мелкие смысла нет.
Попробуйте задать другую программу для просмотра видеофайлов по умолчанию из числа установленных на Вашем ПК. Правая кнопка мыши напротив значка видеофайла — Воспроизвести с помощью — Выбрать программу и поставить галочку, чтобы все подобные видеофайлы воспрозводились именно этой программой. Иногда помогает.
Надежда! У меня W-7.Раньше все видеофалы имели значки в виде начальных кадров содержимого файла,т.е. типа как-будто видеопленка и кадр из этого файла. Что-то я кликнул не то и вместо этого отбражения файла стало отбражение файла в виде значка программы, открывающей файл. А как мне вернуть предыдущее отображение файла? Может подскажете. Спасибо!
Олег, откройте папку, в которой размещены Ваши видеофайлы, в строке меню окна папки выберите «Вид» и в открывшемся меню отметьте «Крупные значки» или «Мелкие значки».
Надежда, у меня 2 вопроса. 1)В каком формате(с каким расширением или надо знать сколько пикселей — я тут запуталась в правильности вопроса)сохранять картинки и фотографии,чтобы они занимали немного места и их можно было бы поставить на десктоп,в виде обоев. 2)Что это за файлы:WRL 1491.tmp; desktop.ini;thumbs.db? Можно ли их удалять, переносить, и почему они иногда не удаляются, даже, если сам файл уже закрыт? При копировании они переносятся и на флешки и на СD.
Нина, 1) Файлы с расширением .jpg
2) Это системные файлы, которые создает Windows или прикладные программы. В том числе антивирусные программы создают подобные файлы. Их лучше не трогать. При копировании (не при архивации, а именно при копировании) эти файлы можно не копировать. При архивации нужно копировать все файлы. Конечно, раздражает, когда эти файлы находятся прямо на рабочем столе. Но это — дело привычки.
Надежда, благодарю Вас за исчерпывающую информацию по моим вопросам. С вашим блогом надо дружить постоянно. Это только начало, а еще сколько надо выучить! Век живи-век учись!
Нина, и Вам спасибо на добром слове, обращайтесь, если смогу — помогу. Компьютер — такая вещь, что постоянно появляется много нового, много необходимого, поэтому, да, «Век живи-век учись!». Это относится и к новичкам, и к опытным пользователям.
Спасибо за урок, хоть я основное по теме знаю, но добывать информацию мне пришлось методом многих проб и ошибок долгое время. Ваши уроки ускоряют работу на компьютере. Я рада, что получаю компьютерную грамотность с вами, Надежда! Правда, с паролями у меня постоянная проблема,так и не восстановила пароль в Яндексе. Есть и вопрос: есть ли какие правила организации файлов в компьютере, чтобы все можно было разложить по полочкам и найти быстро. Сколько лет храниться инфо в компьютерах и кто ответственный за чистку от хлама в ПК и на диске сервера компании: пользователь или компьютерщик (в корпоративных компьютерах)?. Как работает компьютер, если в нем хранится много лишнего?
Нина, четких правил организации файлов нет, их надо каждый раз «изобретать» под конкретные задачи.
Правил по срокам хранения файлов на серверах тоже нет. Все зависит от того, какую информацию хранят в этих файлах. Например, бухгалтерская информация (по правилам налоговой инспекции) хранится не менее 5-и лет. Кадровая информация хранится до 75-и лет. Многие другие виды информации не имеют четкой регламентации по срокам хранения. Это опять же надо устанавливать под конкретные задачи.
Чистят «хлам» — пользователи (обычно), так как сисадмины навряд ли осведомлены вообще о том, что в каких папках и файлах хранится. Обычно в организациях это происходит следующим образом. Сисадмин, видя, что у него заканчивается место на файловых серверах, просит (требует) от пользователей к такому-то сроку удалить лишнюю информацию и предупреждает, что в противном случае он удалит ее полностью. Как правило, срабатывает, все начинают думать, что удалить. Но удалять полностью информацию пользователей не нужно, даже если они не воспримут угрозы сисадмина. Так как среди удаленной информации может быть очень нужная.
Компьютер не понимает, много у него лишнего или не много. Поэтому на обычную производительность это не влияет. Но все программы, предназначенные для обслуживания ПК (антивирусы, программы архивации данных и т.п.) начинают работать дольше, так как приходится обслуживать большее количество папок и файлов.
Упражнения к этой статье.
1.Windows не дал «добро» при открытии второй папки и добавил в имя папки цифру 2,чтобы их отличать.
2.Windows не разрешил такое имя для нового файла, так как это имя зарезервировано для использования операционной системой.
3.Значит, не той программой пытаюсь ( мне предлагается список)
открыть файл. А что делать не знаю.
Теперь я поняла и как изменить имя файла, и как сделать так, чтобы расширения у файлов были видны.
Очень доступно и понятно изложен материал. Спасибо Вам, Надежда, за уроки!
Что такое тип файла или формат файла
Как Вы считаете, могут ли быть в одной папке несколько файлов с одинаковым именем PRIMER? Это возможно при условии, что у имени PRIMER будут разные расширения.
Расширение имени файла указывает на его тип (иногда еще говорят — формат файла). Таким образом,
- «тип файла»,
- «формат файла»,
- «расширение файла»,
- «расширение имени файла»
— все эти понятия, по сути, одно и то же.
PRIMER.doc(x) – типом файла является документ Word (или файл в формате Ворда),
PRIMER.bmp – типом файла является рисунок,
PRIMER.avi – типом файла является видеофайл,
PRIMER.wav – типом файла является аудиофайл.
Все эти файлы имеют разные имена (за счет разных расширений имени файла) и могут храниться в одном и том же месте, т.е. в одной папке.
Если проводить аналогию с именами людей, то имя файла совпадает с именем человека, а расширение имени файла – с фамилией человека. Соответственно, PRIMER.doc и PRIMER.bmp по этой аналогии то же самое, что Иван Петров и Иван Сидоров.
Файлы с именами PRIMER.doc и VARIANT.docx – это два брата из одного семейства документов (с одинаковым расширением .docx). Аналогично, например, Иван Петров и Федор Петров – братья из одной семьи Петровых.
Тип файла (то есть, расширение имени файла) – это часть имени файла, которая начинается с точки, после которой стоят несколько символов.
Распространены типы (расширения), состоящие из трех букв – .doc, .txt, .bmp, .jpg и.т.д. Регистр не имеет значения, поэтому .doc и .DOC – это одно и то же расширение документа, один тип файла.
Расширение является необязательным атрибутом в имени файла, то есть его может и не быть. В таком случае в конце имени файла точка, как правило, не ставится.
Заполняем пробелы — расширяем горизонты!
Для того чтобы иметь относительный порядок на своем компьютере, необходимо свои файлы хранить в соответствующих папках. Это значительно упрощает как поиск отдельных файлов, так и работу с группой файлов: перемещение, копирование, удаление и т.п. Такой принцип организации используется в библиотеках, архивах и канцеляриях.
Документы, систематизированные по общему признаку, хранятся в одной папке (или каталоге). Папки подписываются. Получается, что документы не свалены в одну кучу, а разложены по папкам и в итоге можно легко найти необходимый документ.
По аналогии с этим компьютерные файлы объединяют в группы, для которых на компьютере создают папки. Таким образом, назначение папки состоит в объединении файлов и других папок в группы по любому параметру.
На сегодняшний день три понятия:
с точки зрения компьютерной грамотности, означают одно и то же, давайте уточним, что именно.
Папка или директория – это специальное место на компьютерном носителе информации, в котором хранятся имена файлов и сведения об этих файлах (размер файлов, время их последнего обновления, свойства файлов и т.п.)
Понятия «каталог», «директория» появились в компьютерном мире одновременно с понятиями «файл», «файловая система» для упрощения организации файлов. Понятие «папка» в мире компьютеров появилось значительно позднее, точнее, вместе с появлением Windows 95.
Можно придумать собственную систему для хранения файлов и папок на своем компьютере. Например, создать папки, где файлы сгруппированы:
по теме – папки «Обучающие программы», «Счета», «Рыбалка» и т.п., по имени автора материалов – папки «Мамонтов», «Воробьёва» и т.п.. по времени создания – папка «01.01-30.06.2010» с файлами, созданными с 1 января по 30 июня 2010г., папка «3 квартал 2010» и т.п.
Выбор типа файла при сохранении файла
При сохранении файла достаточно написать его имя и выбрать тип файла из имеющегося списка. Выбранное расширение автоматически добавится к имени файла. Например, на рисунке ниже к имени файла программа сама добавит расширение .jpg. В результате Windows запомнит этот файл с именем «рисунок в paint.jpg».
Прежде чем сохранить файл, выбираем сначала подходящий тип файла, затем вводим имя файла и жмем «Сохранить».
Во избежание недоразумений при сохранении файлов всегда обращайте внимание на строку «тип файла», если она есть. Ведь тип файла является для Windows подсказкой, с помощью которого система определяет, какой именно программой этот файл можно открыть.
Python 3
В Python нет механизма явной проверки на EOF , похожего на тот, который имеется в ANSI C. Но если посимвольно читать файл, то можно выявить состояние EOF в том случае, если в переменной, хранящей очередной прочитанный символ, будет пусто:
Запустим программу и взглянём на возвращаемые ей результаты:
Вот более короткая версия этого же примера, написанная на Python 3.8+. Здесь используется оператор := (его называют «оператор walrus» или «моржовый оператор»):
Запустим этот код:
В Go можно явным образом проверить ошибку, возвращённую Read(), на предмет того, не указывает ли она на то, что мы добрались до конца файла:
ANSI C
Начнём с почтенного C. Представленная здесь программа является модифицированной версией cat из книги «Язык программирования C».
Вот некоторые пояснения, касающиеся вышеприведённого кода:
- Программа открывает файл, переданный ей в виде аргумента командной строки.
- В цикле while осуществляется копирование данных из файла в стандартный поток вывода. Данные копируются побайтово, происходит это до тех пор, пока не будет достигнут конец файла.
- Когда программа доходит до EOF , она закрывает файл и завершает работу.
Как назвать папку?
Все папки имеют имена. Требования к именам папок те же, что и к именам файлов. Единственное отличие состоит в том, что в имени папки расширение, как правило, не применяется, хотя при необходимости его можно использовать. В каждой папке могут храниться как файлы, так и другие папки, те, в свою очередь, тоже могут содержать файлы и папки и т.д.
Папки чем-то напоминают матрёшки. Про такие папки, находящиеся внутри других папок, говорят, что это вложенные папки. Папка, включающая в себя другие папки, называется родительской или охватывающей.
Если возле названия папки стоит «+», то это значит, что в этой папке есть еще папки и их можно открыть. Для этого надо щёлкнуть по «+» и он поменяется на «-», при этом под названием папки откроется список из папок, содержащихся в открываемой папке.
Если же щелкнуть по «-», то он превратится в «+», а список содержимого папки закроется.
Тесная связь между типом файла и программой, открывающей такой тип
Если Вы скачали из Интернета файл, например, с расширением .rar, но на вашем компьютере не установлена программа-архиватор для работы с такими «сжатыми, заархивированными» файлами, то не удивляйтесь, что файл не открывается. Другими словами, надо отдавать себе отчет, что если открывать файлы, например, в видео-формате, то на компьютере должна быть в наличии соответствующая программа для работы с таким форматом.
Можно провести аналогию между файлом (точнее, между типом файла) и программой, работающей с таким типом файлов. Файл – замок, а программа, открывающая этот файл, – ключик к замочку. Как известно, замок без ключика не открывается, да и ключик без замка особой ценности не представляет.
Упражнения по компьютерной грамотности:
1) Попробуйте на Рабочем столе создать две папки с именами: PRIMER и primer.
Для этого на Рабочем столе кликните правой кнопкой мыши на свободном месте, а в появившемся окне – по опции «Создать» и, наконец, клик по опции «Папку». Вместо слов «Новая папка» введите «PRIMER». Затем все это повторяете для создания второй папки с именем «primer». Windows дал Вам «добро» на открытие второй папки?
2) Зайдите, например, в редактор Word и попробуйте сохранить документ с именем PRN. Windows разрешил такое имя для нового файла?
3) Как решить проблему: «С инета скачиваю файлы, а они в формате .rar и на компе не открываются, не читаются. Что делать?»
Если у Вас есть вопросы по этой теме, напишите их ниже, в комментариях, я отвечу.
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.
Если расширения нет
Если у объекта нет расширения, компьютер не может подобрать программу для его запуска. Это происходит, когда пользователь случайно или намеренно удаляет расширение из имени. А еще может быть из-за вируса.
Решить эту проблему легко, если знаешь тип объекта. Например, знаешь, что это фотография. Тогда нужно просто переименовать файл, добавить после названия точку и указать формат. Вот как это сделать:
- Настроить компьютер на показ расширений (см. выше).
- Правой кнопкой мыши по файлу – Переименовать.
- Сразу после названия напечатать точку и расширение.
- Нажать Enter.
Наиболее популярные форматы:
- Документы – doc, docx или pdf
- Таблицы – xls, xlsx
- Архивы – zip или rar
- Фотографии – jpg или png
- Музыка – mp3 или wav
- Видео – mp4 или avi
Другие типы можно посмотреть в конце урока в таблице.
Если формат неизвестен . Чтобы открыть файл, необязательно вручную прописывать расширение. Можно просто запустить его и в окошке выбрать подходящую программу. Если вы правильно ее укажите, объект откроется.
Или щелкните по нему правой кнопкой мыши, выберите «Открыть с помощью…». Или «Открыть с помощью» → «Выбрать другое приложение».
В конце файлов нет некоего особого символа
Может, EOF — это особенный символ, который можно обнаружить в конце файла? Полагаю, сейчас вы уже знаете ответ. Но давайте тщательно проверим наше предположение.
Возьмём простой текстовый файл, helloworld.txt, и выведем его содержимое в шестнадцатеричном представлении. Для этого можно воспользоваться командой xxd :
Как видите, последний символ файла имеет код 0a . Из таблицы ASCII можно узнать о том, что этот код соответствует символу nl , то есть — символу новой строки. Это можно выяснить и воспользовавшись Python:
Так. EOF — это не символ, а в конце файлов нет некоего особого символа. Что же такое EOF ?
Заполняем пробелы — расширяем горизонты!
Компьютер работает с информацией, которая может быть текстовой, графической, в аудио или видео формате. Вся информация, обрабатываемая на компьютере, хранится в файлах. Например, файл — это фото, картинка, ролик, документ, презентация, программа и так далее.
Понятие файла является одним из базовых понятий компьютерной грамотности.
Файл – это поименованная область памяти на компьютерном носителе.
Другими словами, файлом называется набор данных на компьютерном носителе (жёсткий диск, флешка, карта памяти в смартфоне, CD и DVD диск и т.п.), у которого есть свое имя (имя файла).
Что такое значок файла или иконка файла
В зависимости от типа файла на экран Windows выводятся различные значки (иконки). Первый пример касается значка текстового редактора:
— значок документа, обрабатываемого редактором Word, и имеющего расширение .doc.
Второй пример относится к архивному файлу. Это тот файл, который был обработан с помощью программы-архиватора WinRAR (сокращенно RAR):
— значок сжатых (архивных) файлов, обрабатываемых архиватором RAR, и имеющих расширение .rar.
Почему я не вижу типы файлов в своем Проводнике?
Проводник Windows (Пуск—Программы—Стандартные—Проводник) по умолчанию имеет режим, когда расширения имен (типы) файлов на экран не выводятся, но при этом выводятся значки (иконки) файлов.
Подробнее о том, как «заставить» Windows показывать типы файлов: Изменение имени файла в Windows
Что такое формат и расширение
Формат или тип — это информация о файле, по которой система понимает, какого он вида и в какой программе его открыть. Для этого у каждого файла есть расширение .
Расширение — это несколько английских букв и/или цифр. Находятся они сразу после названия и разделяются точкой.
На картинке показан файл с расширением mp3. Про него компьютер знает, что это аудио и открывать его нужно в программе-проигрывателе. Значок, которым он отмечен – это иконка программы запуска.
Есть текстовые файлы - они открываются в программе для работы с текстом. Есть музыкальные и видео - они запускаются в проигрывателях. Есть графические (фото, картинки) – они открываются в программах для просмотра изображений. И еще много других типов. У каждого из них свой значок, точнее, значок приложения, в котором он будет открыт.
Если у файла вместо иконки белый лист, значит, компьютер не подобрал для него подходящую программу.
При его открытии появится окно с выбором приложения. Компьютер предлагает пользователю самостоятельно указать программу для запуска.
На заметку . В Windows есть разнообразные системные иконки:
Как правило, такими значками отмечены файлы, которые нужны для корректной работы компьютера. Их много в системном локальном диске. Такие объекты нельзя удалять или переименовывать, иначе приложения, за которые они отвечают, могут работать со сбоями.
JavaScript (Node.js)
В среде Node.js нет механизма для явной проверки на EOF . Но, когда при достижении конца файла делается попытка ещё что-то прочитать, вызывается событие потока end.
Что такое EOF?
EOF (end-of-file) — это состояние, которое может быть обнаружено приложением в ситуации, когда операция чтения файла доходит до его конца.
Взглянем на то, как можно обнаруживать состояние EOF в разных языках программирования при чтении текстового файла с использованием высокоуровневых средств ввода-вывода, предоставляемых этими языками. Для этого напишем очень простую версию cat , которая будет называться mcat . Она побайтно (посимвольно) читает ASCII-текст и в явном виде выполняет проверку на EOF . Программу напишем на следующих языках:
- ANSI C
- Python 3
- Go
- JavaScript (Node.js)
Выбор программы по умолчанию
А бывает, объекты определенного типа открываются в неподходящей программе. Тогда можно указать другое приложение для их запуска.
1 . Щелкните правой кнопкой мыши по файлу. Выберите «Открыть с помощью…» или «Открыть с помощью» → «Выбрать другое приложение».
2 . В окошке кликните левой кнопкой мыши по нужной программе и поставьте птичку на пункт «Всегда использовать это приложение». Нажмите ОК.
Вот и всё – теперь объекты данного формата будут по умолчанию запускаться в назначенной программе.
Низкоуровневые системные механизмы
Как высокоуровневые механизмы ввода-вывода, использованные в вышеприведённых примерах, определяют достижение конца файла? В Linux эти механизмы прямо или косвенно используют системный вызов read(), предоставляемый ядром. Функция (или макрос) getc() из C, например, использует системный вызов read() и возвращает EOF в том случае, если read() указывает на возникновение состояния достижения конца файла. В этом случае read() возвращает 0 . Если изобразить всё это в виде схемы, то получится следующее:
Получается, что функция getc() основана на read() .
Напишем версию cat , названную syscat , используя только системные вызовы Unix. Сделаем мы это не только из интереса, но и из-за того, что это вполне может принести нам какую-то пользу.
Вот эта программа, написанная на C:
В этом коде используется тот факт, что функция read() , указывая на достижение конца файла, возвращает 0 .
В этом уроке я расскажу, что такое расширение и какие бывают типы файлов в Windows. А в конце дам таблицу наиболее популярных форматов с подробным описанием.
Зачем нужен тип файла
Расширение в имени файла хоть и не обязательно, но все-таки желательно, так как оно указывает операционной системе Windows на тип файла. Проще говоря, тип файла является подсказкой для Windows, с помощью какой программы системе Windows следует этот файл открывать.
Например, расширение .docx указывает, что файл следует открывать с помощью редактора Word, а расширение .cdr – на то, что файл открывается графической программой Corel Draw.
Есть зарезервированные (служебные) имена, которые нельзя использовать в качестве имен файлов, так как они являются именами устройств:
COM1-COM4 – устройства, присоединяемые к последовательным портам 1-4,
AUX – то же, что COM1,
LPT1-LPT4 – устройства, присоединяемые к параллельным портам 1-4 (как правило, принтеры),
CON (consol) – при вводе – клавиатура, при выводе – экран,
NUL – «пустое» устройство.
Что такое полное имя файла
Полное имя файла начинается с указания имени дисковода, затем идет последовательность из имен папок и, наконец, имя файла.
Имя дисковода, имена папок и имя файла в полном имени разделяются символами « \ ».
Например, запись полного имени файла может выглядеть так: D:\Финансы\Счета\Счет-1.doc. Это означает, что файл с именем Счет-1.doc находится в папке Счета, которая в свою очередь находится в папке Финансы на диске D:.
Полный путь к файлу (или путь к файлу) – это часть полного имени, не включающая само имя файла. Путь к файлу Счет-1.doc выглядит так: D:\Финансы\Счета\.
Упражнение по компьютерной грамотности:
Напишите, как выглядит полное имя какого-нибудь файла, находящегося на вашем компьютере в папке «Мои документы»?
Файлы… что вообще может быть проще? Мы все привыкли создавать, удалять, редактировать, перекидываться файлами.
Но можем ли мы заглянуть внутрь каждого файла и понять как он устроен? Конечно можем, поэтому сегодня мы немного покопаемся в бинарном коде и пощупаем метаданные.
Заодно узнаем, почему iPhone зависает от SMS и распотрошим PowerPoint.
Почему форматов файлов так много?
Если бы мы просто могли взглянуть на сырые данные, которые хранятся внутри жесткого диска или SSD, то мы бы не увидели никаких файлов: мы бы увидели только нолики и единички. Потому как, в любом случае, в памяти компьютера всё хранится в виде сплошного потока двоичного кода.
Но как же тогда понять, где заканчивается один файл и начинается другой?
Поначалу эту проблему человечество решало брутально. Люди записывали один файл на один жесткий диск, чтобы уж точно не ошибиться. Поэтому раньше словом файл называли не отдельную область на жестком диске, а прям целое устройство. К примеру IBM 305.
CTSS (Compatible Time-Sharing System)
Но потом, люди придумали файловые системы. Если очень упростить, это такое оглавление в котором указано имя файла, где он начинается и его длина. А также всякие метаданные, типа время создания, изменения, и можно ли его перезаписывать.
Но для того чтобы прочитать файл, знать его местоположение и границы на жестком диске недостаточно, ведь нам нужно как-то расшифровать бинарный код.
Для этого и существуют различные форматы файлов. В большинстве операционных систем форматы файлов указываются в виде расширения, которое отделяется точкой от имени файла. А если вы не видите расширения, это нормально. Потому что, по умолчанию, современные ОС их скрывают, но можно поставить галочку в настройках.
Расширение даёт подсказку операционной системе и программам, о том какой тип данных он содержит и как это всё структурировано. Например, увидев файл droider.jpg операционная система и мы, люди, сразу понимаем, что это картинка в формате JPEG.
Естественно, для типов данных и разных задач оптимальной будет разная структура файла. Поэтому и форматов файлов существует огромная масса.
Поэтому давайте разберем, как устроены наиболее популярные форматы файлов от более простых к более сложным.
Один из самый простых форматов — это TXT. Это текстовый формат. Знаменитое приложение «Блокнот» в Windows работает как раз с этим форматом.
TXT — формат незамысловатый. Он может хранить в себе только простой неформатированный текст, то есть в нем нет никаких выделений, подчеркиваний, курсивов, отступов, разных шрифтов. Только голый текст, а точнее просто символы.
Каждый символ в TXT-формате хранится в виде бинарного кода.
То что мы с вами видим как осмысленный текст, операционная система видит вот так:
01001000 01100101 01101100 01101100 01101111 00101100 00100000 01110111 01101111 01110010 01101100 01100100 00100001
Каждые 8 цифр, то есть 8 бит этого кода — это отдельный символ.
Например, 01001000 — это “H”, 01100101 — это “e”, и так далее.
Подобрав правильную кодировку остается дело техники. Система сопоставляет бинарный код с таблицей кодировки UTF-8 и готово! Но что будет если система подберет кодировку неправильно? Вариантов не много, скорее всего мы увидим крякозябры:
И такое часто случается, так как TXT-файл не содержит никакой дополнительной информации о кодировке. И это большой недостаток формата.
И вдобавок, эту таблицу нужно было загрузить в оперативную память при загрузке компьютера, а у типового ПК в начале 80-х годов редко было больше 640 килобайт оперативки. А использовать 16-битные таблицы (65536 вариантов) было просто невозможно, такая таблица просто не влезла бы в память.
Но мощность компьютеров росла и проблема ушла. К таблицам с латинскими символами добавились кириллические, которые занимали уже не по 8 бит, а по 16 бит каждый. Поэтому текст на русском занимает в два раза больше памяти, при том же количестве символов.
11010000 10011111 11010001 10000000 11010000 10111000 11010000 10110010 11010000 10110101 11010001 10000010 00101100 00100000 11010000 10111100 11010000 10111000 11010001 10000000 00100001
11010000 10011111 — П
11010001 10000000 — р
10111000 11010000 — и
11010000 10110010 — в
Старики помнят лайфхак, если писать SMS на латинице, то влезет в два раза больше текста. Всё это как раз из-за кодировки.
Так вот, чтобы у операционной системы не было проблем с пониманием как прочитать файл. Помимо самих данных, в разные форматы стали добавлять данные о данных. То есть метаданные, которые хранятся прямо внутри файла и содержат дополнительную информацию о том, как этот файл прочитать.
Это простой аудиоформат, который содержит несжатый. Всё CD диски записаны в формате WAV.
Первые 44 байта классического WAV-файла содержат заголовок, к котором указывается полезнейшая информация:
- количество аудио каналов;
- частота дискретизации;
- битовая глубина;
- и многое другое.
Открытые и проприетарные форматы
Структура WAV хорошо известна и наверное такой файл сможет прочитать практически любой плеер. Всё потому, что WAV-файл — это пример открытого формата.
Есть и другие открытые форматы, которыми вы ежедневно пользуетесь. Например:
- язык разметки web-страниц — HTML;
- картинки — PNG;
- аудио в формате — OGG;
- архива — ZIP;
- видео — MKV;
- электронной книги — EPUB;
- и другие.
Проприетарные форматы всем прекрасны, но в отдельных случаях они препятствуют конкуренции в сфере программного обеспечения, так как приводят к замыканию на поставщике. Есть даже такой термин Vendor lock-in.
Старый офис
Например, раньше такая ситуация была с форматами Microsoft Office: DOC, XLS, PPT.
Мало того, что это были проприетарные форматы компании Microsoft и работали только с фирменным ПО. Так еще Microsoft постоянно меняли свою структуру файлов от одной версии MS Office к другой. И в результате? при выходе новой версии офисного пакета? файлы из старого редактора уже не читались новым, а наоборот — и подавно.
Такая ситуация не очень нравилась Европейскому Союзу. Поэтому, ЕС взъелся на тему ограничения конкуренции. В итоге, форматы файлов опубличили, и все научились хотя бы их читать, но для записи в старые форматы, по-прежнему, нужна лицензия Microsoft. И параллельно этому начали разрабатываться открытые форматы.
ODF и OOXML
1 мая 2006 года на свет появился формат формат ODF, что буквально расшифровывается как открытый формат документов для офисных приложений. Он был разработан консорциумом OASIS и Sun Microsystems.
- ODF — Open Document Format for Office Application.
- OASIS — Organization for the Advancement of Structured Information Standards.
Microsoft тоже не спал. Под давлением Европейского суда они объединились с рядом компаний в ассоциацию ECMA и разработали свой открытый формат Office Open XML, который появился на свет чуть позже в 2006 году.
OOXML стандартизирован European Computer Manufacturers Association. Standard ECMA-376
К привычным форматом конце добавилась буква X и мы получили: DOCX, XLSX, PPTX.
OOXML — Office Open XML (DOCX, XLSX, PPTX)
OOXML, в целом, очень похож на ODF. Он также основан на XML-разметке и также представляет из себя ZIP-архив. Поэтому вы также можете заглянуть внутрь офисных файлов при помощи любого архиватора. Можно даже вытащить картинки и даже подменить их, что бывает особенно удобно при работе с презентациями или когда вам присылают текстовый документ с картинками внутри файла.
Несмотря на кажущуюся простоту, формат реально сложный. Только основная документация — это 5 тысяч страниц. И это практически без картинок.
Тем не менее, кто-то всё таки смог прочитать всю эту документацию и поэтому на свет появились классные офисные пакеты, например МойОфис, которые умеют работать и ODF форматом, и с Office Open XML, и даже с устаревшими форматами типа DOC.
Но есть важная ремарка про старые форматы. Как правило, современный софт умеет их только читать, но не записывать, потому как это действие требует приобретение лицензии Microsoft. Впрочем, в наше время это действие, мягко говоря, бессмысленно.
Итого
Что мы в итоге узнали? Файлы бывают нескольких типов:
Самые базовые — бинарные. Такие форматы любят придумывать компании, чтобы никто не понял, как их программы хранят данные.
Более открытый вариант — xml-контейнеры. К счастью, большинство популярных офисных форматов сейчас такие. Если хотите работать со всеми этими файлами хоть дома, хоть на бегу, скачивайте программы МойОфис! На этом у нас сегодня всё.
Недавно я читал книгу «Компьютерные системы: архитектура и программирование. Взгляд программиста». Там, в главе про систему ввода-вывода Unix, авторы упомянули о том, что в конце файла нет особого символа EOF .
Если вы читали о системе ввода-вывода Unix/Linux, или экспериментировали с ней, если писали программы на C, которые читают данные из файлов, то это заявление вам, вероятно, покажется совершенно очевидным. Но давайте поближе присмотримся к следующим двум утверждениям, относящимся к тому, что я нашёл в книге:
- EOF — это не символ.
- В конце файлов нет некоего особого символа.
Как назначить программу запуска
Каждому типу файла система назначает приложение для его запуска. И помечает иконкой этой программы. Например, текстовые (txt) будут по умолчанию открыты в Блокноте. А музыкальные (mp3) – в проигрывателе Windows Media.
Когда вместо значка показан белый лист, значит, система не понимает, в какой программе открыть объект. И при его запуске предлагает самостоятельно выбрать приложение из тех, что установлены на компьютере.
Если поставить птичку на пункт «Всегда использовать это приложение», то в последующем все объекты данного типа будут запускаться в выбранной программе.
Но не всегда нужная программа установлена на компьютере. Бывает, ее просто нет - тогда файл открыть никак не получится. В этом случае нужно установить подходящее приложение.
Для каждого популярного формата есть своя бесплатная программа:
- PDF – Foxit Reader (оф.сайт)
- ZIP и RAR – 7-Zip (оф.сайт)
- DOC, DOCX, XLS, XLSX и другие документы MS Office – OpenOffice (оф.сайт)
- MP3, MP4, MKV и другие аудио/видео – Media Player Classic (оф.сайт)
Другие форматы и программы для них смотрите в таблице.
На заметку . Также белый лист вместо значка приложения показывается на файлах, у которых нет расширения. Об этом я рассказывал выше в статье.
Как узнать расширение
Система компьютера может быть настроена таким образом, что расширения у всех файлов показаны.
Или наоборот: так, что показаны только имена, без форматов.
Эту настройку можно изменить.
В Windows 10 открыть любую папку, нажать на пункт «Вид» вверху и поставить или убрать птичку с пункта «Расширения имен файлов».
В Windows 7 чуть сложнее:
Или так: Пуск → Панель управления → Оформление и персонализация → Параметры папок.
Читайте также: