К какому типу данных относятся текстовые файлов с определенными паттернами для их обработки
21. Тип данных файл. Виды файлов. Работа с текстовыми файлами.
Файл представляет собой именованную последовательность однотипных элементов, размещенных на внешнем устройстве. Для выполнения операций с конкретным файлом в программе обычно используется так называемая файловая переменная или логический файл. В зависимости от типа элементов различают текстовые, типизированные и нетипизированные файлы.
Текстовый файл можно рассматривать как последовательность символов, разбитую на строки длиной от 0 до 256 символов. Текстовый файл - это файл, компонентами которого являются символьные строки переменной длины, заканчивающиеся специальным маркером конца строки Для описания используется стандартный тип Text:
К типизированным файлам относятся файлы строго определенного типа. Чаще всего это файлы, состоящие из записей. Они применяются для создания различных баз данных.Типизированный файл - это файл, все компоненты которого одного типа, заданного при объявлении файловой переменной. Компоненты файла хранятся на диске во внутреннем (двоичном) формате и нумеруются с 0. Если посмотреть такой файл любым текстовым редактором, то можно распознать только символьную информацию, на месте же чисел в файле будут располагаться пробелы или символы псевдографики. Стандартное задание в программе такой файловой переменной осуществляется следующим образом:
type
FileRec = record
end;
var F : file of FileRec;
Нетипизированными называют файлы, объявленные без указания типа его компонентов. Операции чтения и записи с такими файлами осуществляются блоками. Отсутствие типа компонента делает эти файлы совместимыми с любыми другими, а выполнение ввода/вывода блоками позволяет организовать высокоскоростной обмен данными между диском и памятью. Нетипизированные файлы, как и типизированные, допускают организацию прямого доступа. Для определения в программе нетипизированного файла служит зарезервированное слово File:
var UntypedFile : File;
Работа с текстовыми файлами.
Для работы с текстовыми файлами используют специальные процедуры
и функции.
Наряду с описанными типами файлов Pascal имеет средства взаимодействия с файлами несколько иной структуры–так называемыми текстовыми файлами. Введение текстовых файлов несколько нарушает стройность языка, однако позволяет использовать Pascal при программировании широкого класса задач, имеющих нечисловой характер и связанных с обработкой текстовой информации.
Во многих версиях языка допускается хранение файлов на диске как символьных данных. При считывании файла в оперативную память машины символы файла преобразуются в тот тип данных, который объявлен в программе. Файлы символьных данных называются текстовыми файлами. Текстовые файлы имеют тип text.
Таким образом, текстовый файл структурно несколько похож на "файл из байтов" (file of byte) с той разницей, что в нем, помимо содержательной информации, встречаются символы специального назначения.
Его можно схематически представить в следующем виде:
Описанная структура текстовых файлов хорошо согласуется с интуитивно понимаемым построением текстовой информации и полностью совпадает со стандартной структурой текстов, принятой в MS-DOS, используемой во многих текстовых редакторах, понимаемой компиляторами с языков программирования и т.д.
С каждым файлом на диске должна быть связана файловая переменная, которая описывается в соответствии с типом файла на диске. Представителем же текстового файла в Pascal-программе является переменная файлового типа, которая должна быть описана с указанием стандартного типа text:
Примечание. Слово text не является зарезервированным словом, а считается идентификатором стандартного типа, наряду с идентификаторами integer, real и т.д.
Обращение к файлу в дальнейшем идёт через файловую переменную.
Далее доступ к файлу требуется открыть. Открыть любой файл можно на чтение и на запись. Для этого существуют процедуры reset, rewrite.
К примеру, пусть на диске создан текстовой файл text.txt.
Для Turbo Pascal описание и связывание файловой переменной f с файлом text.txt, будет выглядеть так :
assign([файл. пер. ], [полный путь до файла на диске])–связывает файл на диске с файловой переменной f типа текст.
Примечание. Процедура assign не должна использоваться для открытого файла.
Когда имя файла на диске не указывается, то параметр f оказывается связанным со стандартным вводом/выводом. Если присвоено пустое имя, то после обращения к reset(f) f будет указывать на стандартный файл ввода, а после обращения к rewrite(f) f будет указывать на стандартный файл вывода.
reset([ файловая переменная ]); –открывает файл на чтение.
Ввод-вывод для текстовых файлов подчиняется тем же общим правилам, что и для обычных типизированных файлов; однако имеется несколько важных особенностей.
Во-первых, для одного текстового файла нельзя одновременно производить операции и ввода, и вывода. Это означает, что после открытия текстового файла процедурой reset возможно только чтение информации из файла, после процедуры rewrite – только запись в файл.
Во-вторых, обмены с текстовыми файлами всегда являются строго последовательными, то есть после чтения из файла элемента с порядковым номером N следующая операция чтения даст элемент с номером N+1. Иными словами, прямой доступ к любому элементу текстового файла невозможен; для текстовых файлов не допускаются вызовы Seek, FilePos, FileSize.
Под чтением файла понимают ввод данных из внешнего файла, находящегося на диске, в оперативную память машины. Данные файла становятся доступными программе. Внешний файл, из которого читаются данные, часто называют входным файлом.
Базовой техникой обменов с текстовыми файлами является посимвольный ввод-вывод. При этом производится чтение или запись всех символов, как информационных, так и специальных.
Покажем простую программу, выполняющую чтение некоторого текста. Эта программа выводит на экран последовательность кодов символов, составляющих файл text.txt.
while not Eof(f) do
Задание. Наберите текст программы и запустите программу на выполнение. Просмотрите результат работы программы. Найдите выведенные на экран коды специальных символов.
Еще одной особенностью работы с текстовыми файлами является возможность непосредственных обменов значениями различных базовых типов (для обычных типизированных файлов тип параметров read и write должен совпадать с базовым типом файла). Так, в текстовый файл можно записать6 например, целое или вещественное число. При этом его внутреннее представление будет автоматически преобразовано в строчку символов, образующих изображение этого числа.
Рассмотрите простую программу, выполняющую чтение из текстового файла целых чисел и вывод на печать только четных чисел.
while not Eof(f) do
Задание. Напишите программу, с помощью которой можно сформировать текстовый файл, содержащий
- значения целого типа;
- значения вещественного типа;
- значения булева типа.
Для описанных выше случаев записи произвольной информации в текстовый файл в языке имеются дополнительные возможности, которые заключаются в задании размера поля записи. Если после записываемой переменной или выражения поместить символ двоеточия, а после него – любое выражение целого типа, то для выводимого значения будет отведено поле, размер которого (число символов) будет равен значению выражения. Следующая тривиальная программа наглядно показывает действие указателя поля:
for i := 8 to 12 do
Задание. Наберите программу, дополните ее выводом содержимого текстового файла на экран. Проанализируйте полученные результаты выполнения программы.
Управление размещением значений в текстовых файлах очень удобно при формировании структурированных файлов (списков, таблиц и т.п.), так как если изображение значения меньше размера поля, то оно всегда "прижимается" к его правому краю.
Кроме того, для вещественных типов имеется дополнительная возможность, позволяющая выводить число в формате с фиксированной точкой, что более наглядно по сравнению с форматом с плавающей точкой, который предусмотрен по умолчанию. Если после указателя размера поля задать через двоеточие еще одно выражение целого типа, то оно будет интерпретироваться как указание числа позиций для дробной части числа.
Char(n)– этот тип данных разрешает хранение набора символов длиной до 8000 знаков. Аргумент n определяет максимальное количество символов, его максимальное значение равно 8000 (255 для SQL Server 6.x). В таблице для хранения значений типа char выделяется указанное количество байт независимо от того, сколько символов было реально сохранено. Если пользователь сохраняет строку длиной менее объявленной, то сервер добавляет в конец строки необходимое количество пробелов. Если строка превышает объявленную длину, то строка усекается, и часть конечных символов будет потеряна.
Varchar(n) – этот тип подобен типу данных char с тем отличием, что количество выделяемого в таблице пространства зависит от реального числа байтов, которое занимает значение.
Nchar(n) – поведение сервера при работе с этим типом аналогично работе с типом данных char с тем отличием, что тип nchar используется для хранения символов Unicode. Каждый символ Unicode занимает два байта и, следовательно, максимальное количество символов, которое можно сохранить с использованием этого типа, равно 4000. Если в коде программы необходимо явно указать тип символьной строки как Unicode, то перед строкой ставится символ «N». Например, оператор SET присвоит переменной символьную строку в формате Unicode. Если символ «N» не указывается, то сервер предполагает, что строка указана не в Unicode.
Текстовые типы данных так же, как и символьные, позволяют хранить текстовые данные. Они обеспечивают хранение очень большого количества символов – до 2 Гбайт. К текстовым типам данных относятся:
Text–этот тип обеспечивает хранение блоков текста длиной до 2 31 –1 (2 147 483 647) символов. Как и для данных типа image,при работе с данными типа text сервер первоначально выделяет для хранения данных одну страницу (8 Кбайт). При необходимости выделяются дополнительные страницы, которые связываются в цепочку.
Ntext –при работе с большим объемом текста в формате Unicode используется тип данных ntext,обеспечивающий хранение до 2 30 –1 (1 073 741 823) символов. Хранение данных типа ntextосуществляется теми же методами, что и типов text и image.
Работа с текстовыми типами данных отличается от работы с символьными типами данных. SQL Server 7.0 предлагает набор специализированных функций для обработки текстовых данных. Эти функции перечислены в таблице.
Читайте, что это за форматы текстовых файлов: TXT, RTF, DOC, DOCX, HTML, PDF. Какие программы поддерживают и как можно редактировать, открывать и сохранять. Далее поговорим о них подробнее. Во время работы с документами можно далеко не сразу обратить внимание на доступное им разнообразие форматов. Далее мы подробнее остановимся на особенностях каждого из них.
Самый распространенный и простой формат текстовых файлов — TXT
Если говорить о том, какой формат текстовых файлов появился первым, это будет txt – его история началась практически одновременно с возникновением такого явления, как персональный компьютер. В файле имеется исключительно текст, форматирование, картинки и шрифты в txt не сохраняются. Данный формат можно считать одним из наиболее универсальных – его распознают сотни приложений для различных устройств.
Среди прочего, TXT можно открыть одним из следующих приложений:
- «Блокнот» — это самое простое средство для обработки текстовой информации. Приложение встроено в Windows. Приложение позволяет вводить и корректировать текст, сохранять информацию на ПК. Данное решение не теряет совой актуальности, поскольку при работе с информацией не всегда есть необходимость в использовании масштабных текстовых процессоров.
- WordPad – редактор, который также является частью ОС Windows. В приложении имеется большое число инструментов, однако его функциональность уступает решением Writer или Word. Программа берет истоки от компонента Windows Write, который является частью Windows 1.0. В редакторе доступно форматирование, а также печать текстовой информации.
- Word – это решение от корпорации Microsoft получило огромное распространение. Оно в значительной степени облегчает взаимодействие пользователя с текстовой информацией. Word полезен при ведении официальной и деловой переписки, обработке текстовых данных, работе с корреспонденцией. Программа отличается простотой и функциональностью. – это процессор с уникальным интерфейсом. При этом у пользователя есть возможность выбрать стиль схожий с Microsoft Word. При помощи данного инструмента можно просматривать документацию обозревателе интернета. Пользователь может скрыть отдельную информацию из документа, на ней возникнет особая черная полоса.
Форматы файлов текстовых документов начали стремительно развиваться, и компания Microsoft разработала решение Rich Text Format — RTF. Перед нами кросс-платформенный формат, способный хранить текстовые сведения. RTF способен сохранять форматирование и вставлять в текст различные объекты:
Формат rtf работает с технологией «управляющих» слов, они выделяются специальными символами и поэтому документ занимает больше места на диске.
RTF можно открыть одним из следующих приложений:
- Microsoft Works – это пакет, который позволяет создавать различные документы. Здесь есть инструменты для объединения с КПК, средство воспроизведения презентаций, менеджер графики, календарь-ежедневник, электронные таблицы, текстовый редактор и база данных. В приложение встроен особый «Центр запуска», в который входит несколько разделов.
- AbiWord – это бесплатное приложение, оно распространяется в соответствии с лицензией GNU. Процесс экспорта в этой программе имеет свои особенности, при использовании функции «Сохранить как», документу присваивается фирменный формат AbiWord , который используется не слишком активно. Удобнее для преобразования обратиться к функции «Сохранить копию».
- Nuance OmniPage – это компактное приложение с возможностью распознания символов. Благодаря возможности Google Desktop Search легко отыскать необходимые документы, указав имеющиеся в них слова. Приложение способно работать с фалами, в которых помимо также содержаться фотографии другие изображения.
- TextMaker – редактор, который способен работать не только в среде Windows, но и Windows CE, Windows Mobile, Android и Linux. Является частью пакета SoftMaker Office. Данное решение – альтернатива Pocket Word, которая существенно расширяет возможности форматирования и обработки текстов. В приложение встроена проверка орфографии.
Обсуждая распространенные форматы текстовых файлов следует отдельно сказать о doc. Данное решение также было создано корпорацией Microsoft, оно применялось редактором Word. Отметим, что файлы doc относятся к бинарным, их поддерживают практически все существующие сегодня текстовые редакторы. Данный формат поддерживает гиперссылки, вставку в текст картинок и прочих объектов, стили и форматирование.
Открыть DOC можно одним из следующих приложений:
- LibreOffice – это решение, которое дает возможность обрабатывать графики, презентации, базы данных, электронные таблицы и тексты. Данный пакет приложений распространяется свободно и переведен на множество языков. Во многом LibreOffice можно использовать, как альтернативу известным коммерческим решениям.
- Kingsoft Writer —пакет, разработанный разработчиками из Китая, как альтернатива решения Microsoft Office. Решение официально переведено на множество языков, среди которых интерфейсы на польском, русском, португальском, испанском, немецком, французском, английском. Существуют также версии данного решения для Linux и Android.
- OpenOffice – это пакет программ, который во многом успешно выступает конкурентом Microsoft Office и другим коммерческим решениям такого типа. Он практически не уступает конкурентам по качеству интерфейса. Данное решение поддерживается множеством операционных систем, среди которых Solaris, FreeBSD, Windows, MacOS, Linux.
Обсуждая форматы текстовых файлов нельзя пройти мимо doc x . Это усовершенствованный вариант doc, который был лицензирован и впервые появился вместе с пакетом Office 2007.
Открыть DOCX можно одной из следующих программ:
- Ability Write – это текстовый редактор с набором функций, близких к MS Word . В дизайне отличия несущественные, однако в Ability Write отсутствует проверка орфографии и грамматики для русского языка. Данное решение является частью пакета офисных программ Ability Office, который отличается нетребовательностью к ресурсам ПК.
- Panergy docXConverter – это приложение для конвертирования файлов docx, а также xlsx в форматы cvs и rtf. Инструмент позволяет работать с упомянутыми форматами документов даже в тех редакторах, которые изначально их не поддерживали. В преобразованном документе сохраняется форматирование оригинала.
Форматы, в основу которых положена технология HTML получили широкое распространение, среди них следует отметить MHT, CHM и HTM. Язык HTML создавался специально для разработки веб-страниц, однако его удобство, небольшой размер и универсальность привели к тому, что сейчас данное решение активно используется для хранения текстовой информации. Файл HTML легко воспроизвести базовыми инструментами ОС, он не требует установки стороннего программного обеспечения.
Компания Adobe создала данное решение для различных полиграфических целей. Файлы pdf оказались настолько удобными, что превратились в стандарт в сфере обмена документами.
Открыть PDF можно при помощи Adobe Reader . Речь идет о ряде программных решений, разработанных специально для управления и создания документов интересующего нас формата. Данный продукт позволяет работать с презентациями, формами и самостоятельно создавать файлы PDF. Документ можно дополнить видеофайлами, аудиозаписями и анимацией.
Также PDF можно открыть одним из следующих приложений:
- Foxit Reader ;
- Sumatra PDF ;
- IMSI TurboPDF ;
- Icecream PDF Converter .
Данный формат используется в документах OpenOffice. Он является открытым и выступает альтернативой коммерческому решению docx. Также позволяет добавлять в текстовую информацию гиперссылки, таблицы, изображения.
Открыть ODT можно одним из следующих приложений:
- TextMaker
- IBM Lotus Symphony
- TextMaker Viewer
- ALReader
- AbiWord
Форматы текстовых файлов для электронных книг
Существует особые текстовые форматы, которые созданы специально для чтения на электронных книгах. Для работы с подобными материалами требуется особое устройство или программное обеспечение. Документы, сохранные в таких форматах не поддерживают редактирование.
К ним можно отнести:
Как поменять формат текстовых файлов
Чтобы сохранить текстовый файл в определенном формате легче всего использовать функции приложения Microsoft Word. Алгоритм действий следующий:
- Любой версией Microsoft Word открываем документ.
- Нажимаем на «Файл»
- Переходим во вкладку «Сохранить как».
Далее, чтобы изменить формат текстового файла достаточно выбрать предпочтительный из выпадающего списка и указать место сохранения. Word способен самостоятельно определять текстовые форматы файлов, что позволяет легко преобразовывать документы.
Изменение txt
В случае с txt, проще внести перемены в расширение документа. Первое, что необходимо сделать, это включить показ расширений в операционной системе.
После описанных действий нажимаем правой кнопкой мыши на текстовом документе, используем функцию «Переименовать». Далее вместо .txt указываем, к примеру, .html, .rtf или .doc. При этом следует помнить, что, если попытаться изменить расширение документа Word путем переименования с открытием файла возникнут проблемы.
Файлы… что вообще может быть проще? Мы все привыкли создавать, удалять, редактировать, перекидываться файлами.
Но можем ли мы заглянуть внутрь каждого файла и понять как он устроен? Конечно можем, поэтому сегодня мы немного покопаемся в бинарном коде и пощупаем метаданные.
Заодно узнаем, почему iPhone зависает от SMS и распотрошим PowerPoint.
Почему форматов файлов так много?
Если бы мы просто могли взглянуть на сырые данные, которые хранятся внутри жесткого диска или SSD, то мы бы не увидели никаких файлов: мы бы увидели только нолики и единички. Потому как, в любом случае, в памяти компьютера всё хранится в виде сплошного потока двоичного кода.
Но как же тогда понять, где заканчивается один файл и начинается другой?
Поначалу эту проблему человечество решало брутально. Люди записывали один файл на один жесткий диск, чтобы уж точно не ошибиться. Поэтому раньше словом файл называли не отдельную область на жестком диске, а прям целое устройство. К примеру IBM 305.
CTSS (Compatible Time-Sharing System)
Но потом, люди придумали файловые системы. Если очень упростить, это такое оглавление в котором указано имя файла, где он начинается и его длина. А также всякие метаданные, типа время создания, изменения, и можно ли его перезаписывать.
Но для того чтобы прочитать файл, знать его местоположение и границы на жестком диске недостаточно, ведь нам нужно как-то расшифровать бинарный код.
Для этого и существуют различные форматы файлов. В большинстве операционных систем форматы файлов указываются в виде расширения, которое отделяется точкой от имени файла. А если вы не видите расширения, это нормально. Потому что, по умолчанию, современные ОС их скрывают, но можно поставить галочку в настройках.
Расширение даёт подсказку операционной системе и программам, о том какой тип данных он содержит и как это всё структурировано. Например, увидев файл droider.jpg операционная система и мы, люди, сразу понимаем, что это картинка в формате JPEG.
Естественно, для типов данных и разных задач оптимальной будет разная структура файла. Поэтому и форматов файлов существует огромная масса.
Поэтому давайте разберем, как устроены наиболее популярные форматы файлов от более простых к более сложным.
Один из самый простых форматов — это TXT. Это текстовый формат. Знаменитое приложение «Блокнот» в Windows работает как раз с этим форматом.
TXT — формат незамысловатый. Он может хранить в себе только простой неформатированный текст, то есть в нем нет никаких выделений, подчеркиваний, курсивов, отступов, разных шрифтов. Только голый текст, а точнее просто символы.
Каждый символ в TXT-формате хранится в виде бинарного кода.
То что мы с вами видим как осмысленный текст, операционная система видит вот так:
01001000 01100101 01101100 01101100 01101111 00101100 00100000 01110111 01101111 01110010 01101100 01100100 00100001
Каждые 8 цифр, то есть 8 бит этого кода — это отдельный символ.
Например, 01001000 — это “H”, 01100101 — это “e”, и так далее.
Подобрав правильную кодировку остается дело техники. Система сопоставляет бинарный код с таблицей кодировки UTF-8 и готово! Но что будет если система подберет кодировку неправильно? Вариантов не много, скорее всего мы увидим крякозябры:
И такое часто случается, так как TXT-файл не содержит никакой дополнительной информации о кодировке. И это большой недостаток формата.
И вдобавок, эту таблицу нужно было загрузить в оперативную память при загрузке компьютера, а у типового ПК в начале 80-х годов редко было больше 640 килобайт оперативки. А использовать 16-битные таблицы (65536 вариантов) было просто невозможно, такая таблица просто не влезла бы в память.
Но мощность компьютеров росла и проблема ушла. К таблицам с латинскими символами добавились кириллические, которые занимали уже не по 8 бит, а по 16 бит каждый. Поэтому текст на русском занимает в два раза больше памяти, при том же количестве символов.
11010000 10011111 11010001 10000000 11010000 10111000 11010000 10110010 11010000 10110101 11010001 10000010 00101100 00100000 11010000 10111100 11010000 10111000 11010001 10000000 00100001
11010000 10011111 — П
11010001 10000000 — р
10111000 11010000 — и
11010000 10110010 — в
Старики помнят лайфхак, если писать SMS на латинице, то влезет в два раза больше текста. Всё это как раз из-за кодировки.
Так вот, чтобы у операционной системы не было проблем с пониманием как прочитать файл. Помимо самих данных, в разные форматы стали добавлять данные о данных. То есть метаданные, которые хранятся прямо внутри файла и содержат дополнительную информацию о том, как этот файл прочитать.
Это простой аудиоформат, который содержит несжатый. Всё CD диски записаны в формате WAV.
Первые 44 байта классического WAV-файла содержат заголовок, к котором указывается полезнейшая информация:
- количество аудио каналов;
- частота дискретизации;
- битовая глубина;
- и многое другое.
Открытые и проприетарные форматы
Структура WAV хорошо известна и наверное такой файл сможет прочитать практически любой плеер. Всё потому, что WAV-файл — это пример открытого формата.
Есть и другие открытые форматы, которыми вы ежедневно пользуетесь. Например:
- язык разметки web-страниц — HTML;
- картинки — PNG;
- аудио в формате — OGG;
- архива — ZIP;
- видео — MKV;
- электронной книги — EPUB;
- и другие.
Проприетарные форматы всем прекрасны, но в отдельных случаях они препятствуют конкуренции в сфере программного обеспечения, так как приводят к замыканию на поставщике. Есть даже такой термин Vendor lock-in.
Старый офис
Например, раньше такая ситуация была с форматами Microsoft Office: DOC, XLS, PPT.
Мало того, что это были проприетарные форматы компании Microsoft и работали только с фирменным ПО. Так еще Microsoft постоянно меняли свою структуру файлов от одной версии MS Office к другой. И в результате? при выходе новой версии офисного пакета? файлы из старого редактора уже не читались новым, а наоборот — и подавно.
Такая ситуация не очень нравилась Европейскому Союзу. Поэтому, ЕС взъелся на тему ограничения конкуренции. В итоге, форматы файлов опубличили, и все научились хотя бы их читать, но для записи в старые форматы, по-прежнему, нужна лицензия Microsoft. И параллельно этому начали разрабатываться открытые форматы.
ODF и OOXML
1 мая 2006 года на свет появился формат формат ODF, что буквально расшифровывается как открытый формат документов для офисных приложений. Он был разработан консорциумом OASIS и Sun Microsystems.
- ODF — Open Document Format for Office Application.
- OASIS — Organization for the Advancement of Structured Information Standards.
Microsoft тоже не спал. Под давлением Европейского суда они объединились с рядом компаний в ассоциацию ECMA и разработали свой открытый формат Office Open XML, который появился на свет чуть позже в 2006 году.
OOXML стандартизирован European Computer Manufacturers Association. Standard ECMA-376
К привычным форматом конце добавилась буква X и мы получили: DOCX, XLSX, PPTX.
OOXML — Office Open XML (DOCX, XLSX, PPTX)
OOXML, в целом, очень похож на ODF. Он также основан на XML-разметке и также представляет из себя ZIP-архив. Поэтому вы также можете заглянуть внутрь офисных файлов при помощи любого архиватора. Можно даже вытащить картинки и даже подменить их, что бывает особенно удобно при работе с презентациями или когда вам присылают текстовый документ с картинками внутри файла.
Несмотря на кажущуюся простоту, формат реально сложный. Только основная документация — это 5 тысяч страниц. И это практически без картинок.
Тем не менее, кто-то всё таки смог прочитать всю эту документацию и поэтому на свет появились классные офисные пакеты, например МойОфис, которые умеют работать и ODF форматом, и с Office Open XML, и даже с устаревшими форматами типа DOC.
Но есть важная ремарка про старые форматы. Как правило, современный софт умеет их только читать, но не записывать, потому как это действие требует приобретение лицензии Microsoft. Впрочем, в наше время это действие, мягко говоря, бессмысленно.
Итого
Что мы в итоге узнали? Файлы бывают нескольких типов:
Самые базовые — бинарные. Такие форматы любят придумывать компании, чтобы никто не понял, как их программы хранят данные.
Более открытый вариант — xml-контейнеры. К счастью, большинство популярных офисных форматов сейчас такие. Если хотите работать со всеми этими файлами хоть дома, хоть на бегу, скачивайте программы МойОфис! На этом у нас сегодня всё.
Читайте также: