Чем принципиально отличается формат текстового файла от формата документа word
Говоря о текстовых редакторах, мы сразу представляем корифея, как Microsoft Word, который на многие годы занял пьедестал среди офисных приложений. И хотя, его первая версия появилась еще в 1986 году для платформы IBM, настоящую популярность он получил в девяностые уже среди пользователей Windows. Как и все продукты компании Microsoft в те времена, Word имел свой собственный закрытый формат документов DOC. Однако монополия на формат doc многих не устаивала, и на волне развития движения open source в 2000-ые появился альтернативный текстовый процессор с открытым форматом odt. В 2006-ом он получил международный стандарт ISO/IEC 26300.
И не смотря на множество негатива в его сторону, он получил популярность среди любителей программного обеспечения с открытым исходным кодом. Но попасть на рынок корпоративных клиентов этому формату все же не удалось. Слишком долго Microsoft был доминирующим продуктом в сфере офисного ПО. Огромное количество документов было создано в формате doc и огромное количество пользователей было обучено работе с Word.
Тем не менее, Microsoft пришлось ответить на появление нового открытого формата, и в версии MS Office 2007 появляется новый открытый формат DOCX. Назначение его ничем не отличается от DOC, но по своей сути это уже совсем другой формат, использующий принципы ODT. В это же время Microsoft снял завесу таинства со своего уже устаревающего формата DOC. Более того, в последующих версиях, MS Word уже поддерживал и ODT. Но и посессорные продукты не остались в стороне. Сейчас уже любой «уважающий себя» текстовый процессор поддерживает все три формата.
Теперь давайте немного подробнее рассмотрим каждый из этих форматов.
Формат DOC
Его название — это не аббревиатура, а сокращение от document. Этот формат появился еще в начале 90х и до сих пор остается в строю. Хотя в 2007 году он потерял актуальность в связи с появлением нового, целевого формата docx. Тем не менее, после раскрытия спецификаций этого формата в 2007ом, его стали поддерживать все современные текстовые процессоры, потому что к этому моменту накопилось огромное количество документов doc.
Его внутреннее устройство довольно сложное и представляет собой целую файловую систему. Это двоичный файл, и открыть его можно только в специальном текстовом процессоре, таком как MS Word или OpenOffice Text. Формат doc позволяет хранить внутри документа изображения, мультимедиа и другие файлы, но главное его достоинство – поддержка каскадных стилей.
Этот формат расширяет возможности rtf и позволяет использовать каскадные стили, таблицы, разметку листа, макросы, форматирование документа, изображения, диаграммы, различные метаданные. Таким образом, он покрывает большинство потребностей пользователей для электронных документов.
Формат ODF
Как уже говорилось выше, этот формат был создан альтернативой doc. Над созданием стандарта трудилось множество организаций, входивших в сообщество OASIS. И в 2006 году был принят его стандарт ISO/IEC 26300.
Документ основан на языке разметки XML, помещенный в ZIP архив. Помимо самого документа в архив включены файлы, на которые ссылается документ (рисунки), метаданные и др. Но благодаря использованию архивации, файл формата odf получается очень легковесным, по сравнению с doc. Раз уж мы говорим о текстовом процессоре, то правильным будет говорить odt, а не odf. Ведь ODF отписывает целое семейство форматов: для текстового процессора - odt, для табличного процессора ods, для электронных презентаций – odp.
Нативным (разработанным именно для него) офисным решением, созданным под формат ODF считается OpenOffice. Также, как и Microsoft Office он включает в себя целый набор офисных программ для работы с: текстом, таблицами, презентациями, векторной графикой, базой данных и формулами.
Ранее мы уже отмечали, что формат ODT поддерживают множество текстовых процессоров, как MS Word, так и опен сорс решения LibreOffice, OpenOffice, и бесплатный Google Document.
Естественно, первая генерация формата ODF 1.0 имела свои недостатки, например:
- Нет описания спецификации макросов;
- Нет описания применения цифровых подписей, хотя офисный пакет позволяет их использовать;
- В презентации нельзя вставлять таблицы, хотя MS PowerPoint это позволяет;
- Нет стандарта языка формул.
Некоторые из них были исправлены в версии 1.2. Однако основным недостатком по мнению пользователей является невозможность корректно воспроизводить документы формата doc, созданные ранее в MS Office. То есть они, конечно, открываются, но выглядят не так, как в нативной программе. А ведь к моменту появления OpenOffice большинство электронных документов было именно в формате doc. Но с форматом docx дела обстоят значительно лучше.
Так или иначе, но Microsoft Office практически не уступил своих позиций на рынке, а благодаря появлению открытого формата docx завоевал доверие сторонников open source.
Формат DOCX
Формат DOCX, он же Office Open XML, он же Microsoft Open XML, он же Office Open XML. Был создан в 2007 году в ответ на появление открытого ODF и использует тот же принцип создания файла – zip архив, в который помещается xml самого документа и файлы, на которые ссылается документ (изображения), а также файлы с метаданными. Преимуществом перед ODF можно назвать мощный бэкенд в виде MS Office. Миллионы пользователей не хотели бы отказываться от удобного инструмента ради перехода на бесплатный формат. А ведь закрытый формат doc обязывал корпоративных клиентов платить немало денег Американской корпорации. Таким образом, Microsoft сохранил своих клиентов, которые «поглядывали» в сторону ODF.
DOCX стандартизирован: он пользуется спецификациями ECMA-376, ISO/IEC 295000 Transitional и ISO/IEC 29500 Strict.
Сравнение
И если формат doc конструктивно отличается от docx, то docx и odt по сути братья. Оба они представляют собой zip-контейнеры с xml документами внутри. Каждый из них имеет свои плюсы и минусы. Но оба они превосходят формат doc хотя бы по критерию размер файла. Благодаря архивированию содержимого документа, размер файла получается значительно меньше – в 2-3 раза в зависимости от количества мультимедиа и графического контента.
Какой же из двух форматов предпочесть, docx или odt. Хотя текстовые процессоры обеспечивают поддержку форматов конкурентов, все же их отображение отличается не в лучшую сторону от оригинала. Поэтому нельзя сказать, что есть универсальное решение для всех форматов. Придется выбирать формат из сферы применения. Если речь идет о крупных предприятиях, которые использовали раньше MS Office, то очевидно, они имеют большой архив документов в формате doc да и обмен документами с другими предприятиями производится скорее всего в формате docx. Никто лучше MS Word не сможет отображать документы в собственных форматах, по крайней мере на текущий момент. В таком случае предпочтительно и впредь использовать MS Word, с форматом docx.
Если ваша цель уйти от платного офисного программного обеспечения и вас не сильно беспокоит совместимость форматов, то odt вполне способен заменить и doc, и docx. Многие крупные предприятия уже перешли на OpenOffice, а значит эта задача вполне посильная.
DOCX и ODT в генераторе отчетов
Так выглядит оригинальный отчет, который мы будем экспортировать в оба этих формата:
Давайте сделаем экспорт отчета в формат Microsoft Word (docx):
Вот, как он выглядит в MS Word:
А это экспорт в формат odt при просмотре в MS Word:
Экспорт в DOCX почему-то имеет мелкие шрифты внутри таблиц, но рамка соответствуют оригинальному отчету.
ODT оказался ближе к оригиналу по размеру шрифтов, но рамки никуда не годятся. Обратите внимание, что Word открыл odt с несколько худшим форматированием, чем OO Writer.
Также, как отображение документов одного формата в разных программах не одинаково, так же и генератор отчетов преобразует отчет в разные форматы по-разному.
Из всего вышерассмотренного можно сделать вывод, что даже использование одного формата не даст одинаково выглядящего документа в разных текстовых процессорах из-за разной реализации. Поэтому лучше использовать текстовый редактор с нативным форматом и не зацикливаться на универсальности.
Поговорим сегодня о текстовых файлах. Сюда включаются различные электронные текстовые документы, электронные книги и другие файлы, связанные с текстами.
Разберем основные текстовые форматы файлов и обсудим для чего они нужны и почему так называются:
Текстовые форматы электронных файлов
- PDF - Portable Document Format. На русский переводится как - портативный формат документа.
Вообще сам формат файла, был разработан компанией Adobe Systems аж в 1993 году.
Есть, кстати, фирменная программа для просмотра PDF файлов Adobe Reader, она бесплатная.
В целом этот формат файлов используется для представления различной печатной продукции в электронном виде.
Это могут быть журналы, книги, буклеты, листовки, визитки, открытки и так далее.
Такие фалы перед печатью имеют формат файла PDF, он позволяет рассмотреть каким будет итоговый печатный продукт.
А именно, как будет расположен текст, иллюстрации и так далее.
Еще данный текстовый формат может использоваться для пересылки электронных документов, например договоров и даже содержать в себе электронную подпись.
- EPUB - Electronic Publication. На русский язык переводиться как электронная публикация.
И действительно, этот формат файла позволяет комфортно читать различные электронные книги и журналы.
Данный формат файла был разработан в 2007 году и сейчас широко используется в электронных книгах и программах, которые позволяют читать текстовые файлы в электронном виде.
Данный формат файла удобно подстраивается под различные электронные устройства и позволяет открывать книги в цифровом формате.
Также внутри такого файла могут быть сноски и гиперссылки, которые задумал автор публикации, они открываются в этом же файле и дополняют информацию текста.
- WORD - переводится на русский как «слово». Данный текстовый формат разработан компанией Microsoft в 1983 году.
Такой формат файла используется для написания, редактирования и последующей печати различной документации, статей, рефератов, докладов и подобных текстовых файлов.
- TXT - text или по-русски «текст». Данный формат файла используется для написания только текстового файла.
Этот формат файла максимально прост и должен открыться в принципе на любой операционной системе.
На компьютере в ОС Windows можно создать этот текстовый файл простым способом.
Нажать на правую кнопку мыши на рабочем столе -> создать -> текстовый документ.
Такой формат подойдёт для создания каких-то списков или простых текстовых заметок.
- DOC -document. На русский язык переводится как «документ». Этот формат файла начала использовать Microsoft в 1990-х годах.
Он используется для создания текстовых файлов в программе Microsoft Word.
Есть также усовершенствованный формат DOCX - document XML.
- RTF - Rich Text Format. Что переводится как «обогащённый текстовый формат»
Этот формат текстового файла был разработан компанией Microsoft и стал использоваться с 1987 года.
Этот текстовый формат файла необходим для того, чтобы переносить текстовую информацию между различными операционными системами и программами.
Подытожим
В основном обычные пользователи используют текстовые форматы, которые приведены в статье, кроме RTF и DOCX.
Остальные текстовые форматы файлов более узконаправленные и используются программистами или разработчиками.
Тем не менее, такие форматы файлов как PDF, EPUB и Word значительно упрощают чтение электронного текста и делают его комфортным и удобным для использования.
Спасибо за чтение. Поставьте палец вверх, если информация была полезна и подписывайтесь на канал, чтобы не пропускать новых материалов 🙃
Документы Doc и DocX являются одними из самых распространенных форматов текстовых файлов. Созданные компанией Microsoft, они поддерживаются практически всеми программами, так или иначе работающими с текстами.
DocX был выпущен относительно недавно и главным его плюсом, относительно предшественника Doc, можно назвать меньший размер документа. В названии DocX, X означает Xml.
Однако в чем разница между Doc и DocX форматом, кроме отличий в размере файла? В этой статье мы подробно разберем преимущества каждого и сравним их. Обратите внимание, рассматриваемые форматы не имеют ничего общего с файлами DDOC и ADOC.
В чем разница между Doc и DocX?
Doc
Многие годы назад Microsoft Word использовал Doc в качестве текстового файла по-умолчанию. Этот формат присутствует в операционной системе с первого выпуска пакета Word для MS-DOS.
Вплоть до 2006 года, когда только был запущен Microsoft Word , он являлся проприетарным форматом. То есть являлся частной собственностью компании, которой был разработан, и мог использоваться только оригинальным пакетом приложений. С тех пор многое изменилось и формат Doc может быть открыт большинством сторонних текстовых редакторов.
Doc включен в такие популярные программы обработки текстовых файлов, как LibreOffice Writer, OpenOffice Writer, KingSoft Writer и другие, их список довольно велик.
Вы можете использовать данные программы для открытия и редактирования файлов Doc. Не менее популярно интернет приложение Google Поисковика — Google Docs . Оно позволяет не только сохранять написанные документы в Doc формате, но и загружать их на сайт для дальнейшей работы.
DocX
В 2007 году формат Doc вынужденно отходит на второй план, поскольку на сцену выходит новый DocX, созданный Microsoft как преемник устаревшего документа. Он был сделан в связи с растущей конкуренцией между свободными и открытыми форматами, такими как Open Office и ODF .
В DocX весь код был написан в формате Xml. Именно по этой причине к названию старого Doc-файла добавили букву платформы, на которой была создана свежая версия. Новое кодирование соответственно принесло свои изменения и дополнительные возможности в работе.
DocX, являющийся результатом стандартов, представленных под названием Office Open XML, принес такие улучшения, как уменьшение размера файлов. Данное изменение проложило путь компании к разработке форматов PPTX и XLSX.
Форматирование Doc в DocX
В подавляющем большинстве случаев, любое программное обеспечение, работающее с текстами, и которое не может открыть старый формат Doc, способно преобразовать его в DocX. То же самое можно сделать и в обратном направлении.
Данная проблема возникает в случае, если пользователь работает в Word 2003 или более ранних версиях приложения. В этом случае необходимо открыть файл DocX в Word 2007 или более поздней версии и пересохранить его в Doc.
Компания Microsoft всегда стремится к максимальной совместимости своего продукта. Поэтому для старых версий Word был выпущен соответствующий пакет совместимости, который можно установить для поддержки формата DocX.
Если ваш Word все же не поддерживает DocX, а нужен именно он, не стоит отчаиваться! Существуют такие приложения как Google Docs, LibreOffice Writer и ряд других, способных помочь конвертировать любой Doc-файл в DocX, RTF, TXT и т.д.
Какой формат использовать? Doc или DocX?
На самом деле, вопрос “что использовать” касательно Doc и DocX не стоит настолько остро, чтобы он стал делом принципа. Оба этих формата используются одинаково широко всеми программами, так или иначе работающими с текстом.
Тем не менее, DocX лучше, поскольку приводит к существенному уменьшению размеров файла. Такие документы гораздо легче пересылать по почте и открывать для чтения. Еще одним преимуществом DocX является его база — Office Open XML , что позволяет документу поддержание расширенных функций. Многие приложения постепенно отказываются от сохранения документов в формате Doc.
Подводя итоги, принципиальной разницы между форматами нет. Исключением здесь выступает вопрос размера файлов и того, что от поддержания Doc постепенно отказываются разные текстовые программы. Таким образом, рекомендуем переходить на использование DocX, если вы все еще вынуждены работать с Doc.
Как восстановить Doc и DocX файлы?
Потеря важной информации в современном цифровом мире далеко не редкость. Многие из нас сталкивались со случайным стиранием файла путем использования комбинации Shift + Del или, того хуже, сбоем жесткого диска, вследствие чего терялись все документы. Если вы узнаете в этом свою ситуацию, читайте дальше и мы непременно поможем вам вернуть утерянные Doc и DocX файлы!
Приложение Starus Office Recovery 2.6 станет хорошим выбором для любого офисного сотрудника, ежедневно работающего над большим количеством документов, которые крайне важны для его фирмы. Интуитивно понятный русскоязычный интерфейс, высокая производительность и точность сканирования позволят в короткие сроки найти и восстановить удаленные файлы.
Изучить информацию о восстановлении текстовых файлов подробнее вы можете в статье «Как восстановить документы Microsoft Office” .
Начиная с 2007 года обновленная версия Word (и Microsoft Office) для сохранения файлов стала использовать формат DOCX, вместо классического DOC. Это была не просто «экстремальная» версия формата 1990-х годов, дополнительный X в расширении обозначает стандарт Office Open XML.
В чём разница, и какой из них следует использовать? DOC – это формат документа, используемый Microsoft Word, а DOCX – его преемник. Оба являются относительно открытыми, но DOCX более эффективен и создает меньшие, менее повреждаемые файлы.
Если у Вас есть выбор, используйте DOCX, DOC необходим только в том случае, если файл будет использоваться версиями Word до 2007 года.
Краткая история формата DOC
Microsoft Word начал использовать формат DOC и соответствующее расширение файла более 30 лет назад в самом первом выпуске Word для MS-DOS. Word исполнял роль проприетарного процессора документов, формат также был проприетарным: Word был единственной программой, официально поддерживающей файлы DOC, до тех пор, пока Microsoft не откроет спецификацию в 2006 году, после чего она была перепроектирована.
В 90-х и начале 2000-х годов различные конкурирующие продукты могли работать с файлами DOC, хотя некоторые из более экзотических форматов и опций Word не поддерживались в других текстовых процессорах. Поскольку Office и Word были де-факто стандартами для офисных наборов, соответственно, закрытый характер формата файла, несомненно, помог Microsoft сохранить свое господство над такими продуктами, как Corel WordPerfect.
С 2008 года Microsoft несколько раз выпускала и обновляла спецификацию формата DOC для использования в других программах, хотя не все расширенные функции Word поддерживаются открытой документацией.
После 2008 года формат DOC был интегрирован в платные и бесплатные программы обработки текстов многих поставщиков. Это значительно упростило работу с более старыми форматами текстовых процессоров, и многие пользователи по-прежнему предпочитают сохранять документы в старом стандарте DOC.
Введение Office Open XML (DOCX)
Под давлением растущей конкуренции открытого исходного кода и его конкурирующего формата открытых документов (ODF), Microsoft приняла решение о введение открытого стандарта в начале 2000-х годов. Это привело к разработке формата файла DOCX вместе со своими компаньонами, такими как XLSX для электронных таблиц и PPTX для презентаций.
Стандарты были представлены под названием «Office Open XML» (не имеет отношения к программе Open Office), поскольку форматы были основаны на Extensible Markup Language, а не на более раннем и менее эффективном двоичном формате. Этот язык позволил получить несколько преимуществ, в первую очередь, меньшие размеры файлов, меньше шансов на взлом и сжатые изображения.
Формат DOCX на основе XML стал стандартом для Word в версии программного обеспечения 2007 года. В то время многие пользователи полагали, что новый формат DOCX был просто средством для Microsoft поэтапного отказа от более старых версий программного обеспечения и продажи новых копий, поскольку более старые версии Word и Office не могли читать новый XML файлы.
Это было не совсем так: Word 2003 может читать специальные форматы файлов Word XML, а обновления совместимости позднее были применены к другим версиям. Но, в любом случае, некоторые пользователи вручную сохраняли файлы в более раннем стандарте DOC вместо DOCX ради совместимости.
Десять лет спустя DOCX стал новым стандартом де-факто, хотя он не столь универсален, как более старый формат DOC-файлов, благодаря конкурентам, таким как ODF, и общему уменьшению традиционного использования текстового процессора.
Какой из них следует использовать
DOCX – лучший выбор для любой ситуации. Формат создает меньшие, более легкие файлы, которые легче читать и передавать. Открытый характер стандарта Office Open XML означает, что его можно прочитать практически любым полнофункциональным текстовым редактором, включая онлайн-инструменты, такие как Google Docs.
Единственной причиной использования старого формата DOC может быть восстановление некоторых файлов старше десяти лет или работа с очень устаревшим текстовым процессором.
В любом случае, лучше сохранить файл в DOCX или какой-либо другой современный стандарт, например ODF, для простого преобразования.
Видео: Разница между DOC и RTF | Сравните разницу между похожими терминами
Содержание:
DOC против RTF
И DOC, и RTF - это проприетарные форматы файлов документов, используемые Microsoft для программного обеспечения. RTF был представлен в 1987 году как формат межплатформенного обмена документами, а формат DOC первоначально использовался как формат файла для текстовых документов и использовался в текстовом процессоре Microsoft WordPerfect на протяжении 1990-х годов. Затем в Microsoft Word в качестве формата файла по умолчанию был выбран DOC с расширением файла .doc, и его общее использование было связано только с Microsoft Word.
Подробнее о DOC
На двоичном уровне формат DOC может содержать больше информации о форматировании текста, чем многие форматы файлов документов. Просто это означает, что файлы, закодированные в .doc, могут содержать текст с большим форматом. Формат файла DOC может содержать кодировку, которая позволяет добавлять в документ функции безопасности, такие как пароли и шифрование. С развитием программы Microsoft Word формат файла также был адаптирован к изменениям. Форматы файлов, используемые в версиях 1997–2003 годов, отличаются от версий, представленных до 1997 года. Формат файла по умолчанию для Word 2007 - это формат Office Open XML с расширением .docx; тем не менее, word может создавать документы со старыми форматами файлов.
Подробнее о RTF
Акроним RTF означает Расширенный текстовый формат, который представляет собой метод кодирования текста и графики для кросс-приложений и кросс-платформенных приложений. RTF - это в основном текстовый файл с дополнительными параметрами форматирования, такими как полужирный, курсив и подчеркивание. RTF может также содержать изображения, сведения о шрифтах и аннотации и имеет расширение файла .rtf. Наследование формата текстового файла для файлов RTF позволяет открывать их в большинстве текстовых редакторов для распознавания буквенно-цифровых символов в частях документа. Однако между читаемым текстом существуют дополнительные символы, которые являются управляющими кодами для дополнительного форматирования. Защита документов не является функцией RTF, и, следовательно, к информации может без труда получить доступ любой. Формат файла RTF также улучшился с версиями MS Word, последняя из которых была выпущена в 2008 году. Из-за простоты формата файла размер файла RTF намного меньше, чем у файла DOC.
Файлы RTF можно открывать, читать и редактировать во многих приложениях и программных платформах, независимо от того, что программное обеспечение, создавшее файл RTF и платформу, может отличаться. Однако версии RTF должны быть совместимы.
В чем разница между DOC и RTF?
• Несмотря на то, что и RTF, и DOC являются форматами файлов документов, RTF содержит основную информацию о форматировании, а DOC поддерживает сложное форматирование, выполненное в MS Word.
• RTF - это кроссплатформенный формат файла, тогда как DOC является проприетарным и используется как формат файла по умолчанию для Microsoft Word. Таким образом, только небольшое количество программного обеспечения может открывать файлы DOC.
• Размер файла в формате RTF относительно меньше по сравнению с файлом DOC, хотя файл DOC может иметь значительный размер в зависимости от форматирования.
• Функции безопасности не существуют для RTF, в то время как DOC поддерживает относительно хорошие функции защиты документов.
Читайте также: