Документ это текстовый файл в формате ascii
Компьютерные файлы в основном делятся на два типа: двоичные файлы и ASCII (также называемые текстовыми файлами).
Текстовые файлы представляют собой видимые символы, а двоичные файлы - невидимые символы, например изображения.
Двоичный файл: включен вASCIIИ расширенный ASCIIхарактерДанные или программные инструкции, записанные в файл.Компьютерный файлВ основном есть два типа: двоичные файлы и ASCII (также называемыеОбычный текстовый файл), графические файлы и текстовые редакторы и т. д.Компьютерная программаВсе относятся к двоичным файлам. Эти файлы содержат специальный формат и компьютерный код. ASCII - это простой текстовый файл, который может быть прочитан любой программой обработки текста.
Поскольку трудно четко различать концепции текстовых файлов и двоичных файлов, мы можем просто подумать, что если файл специально используется для хранения данных текстовых символов и не содержит данных, кроме символов, мы называем его текстовым файлом. Файлы снаружи являются двоичными файлами.
1 Причина, по которой следует различать два режима работы с файлами, - ввести в заблуждение людей, плохо знакомых с компьютерами.
Например, если статья написана на китайском языке, вы можете понять ее с первого взгляда и можете определить ее как текстовый режим.
Соответственно, тот же контент, если вы пишете на английском языке или Oracle, вы можете определить его как двоичный режим
На данный момент вы можете определить словарь Синьхуа как «блокнот». Используйте соответствующий, чтобы прочитать эту статью, это нормально
Если вы используете словарь Синьхуа, чтобы попытаться прочитать статью, написанную на английском языке, вы можете назвать ее искаженной.
2. Два метода открытия немного отличаются, то есть код перевода строки 0D0A указывает, что текст считает его символом, а двоичный бит распознавания составляет 2 символа.
Вы знаете, насколько неприятен текст.
4. Вы можете понимать текстовый файл как своего рода двоичный файл. В мире не существует так называемого текста, и он поддерживается только при переедании.
Будь то текстовый файл или кодировка unicode и ascii, это методы интерпретации файла.
Например, в файле есть слово «яблоко», и теперь его нужно открывать в китайском режиме, тогда будет отображаться «яблоко», но для содержимого файла это все еще яблоко , Не изменилась, изменилась только методика интерпретации.
Хорошо, чтобы ответить на вопрос lz:
1. Почему существует двухсистемный режим и режим текстового файла для открытия файла с помощью fopen?
Это два метода интерпретации
2. Есть ли разница в реализации двух методов открытия?
- это не столько метод открытия, сколько метод интерпретации содержимого файла.
Двоичный - это чтение и запись в байтах без каких-либо дополнительных действий.
В текстовом режиме выполняется возврат каретки и перевод строки.
09 июня 2014 г. 17:31:47Detourer-He Lijian Номер для чтения: 25955Подробнее
Принадлежность к столбцу:Класс C ++ онлайн
Разница между двоичными файлами и файлами ASCII (т.е. текстовыми файлами) представляет собой проблему для студентов, которые в течение короткого времени находились рядом с компьютером. В этой статье используются простые примеры, чтобы попытаться показать путь, в надежде помочь новичкам.
Тексты – это самый распространенный тип данных в компьютерном мире. Текстовую форму имеют не только источники, предназначенные для чтения, дискурсы. Многие компьютерные программы, описания изображений, сценарии работы операционных систем записываются в текстовом виде; и, хотя работать с такими описаниями могут только специалисты или специальные программы – лингвистические процессоры, они имеют все формальные признаки текста: алфавит, синтаксис и семантику.
Можно предположить, что в такой важной области, какой является тестовая форма представления информации, действуют стандарты, имеющие силу физических законов. К сожалению, это предположение ошибочно. Основной причиной "текстовой разноголосицы" является очень большое количество символов, требующихся для поддержки различных языков и сфер человеческой деятельности.
Для кодирования нескольких десятков европейских языков, использующих латинский алфавит, достаточно иметь полторы сотни символов. Каждый язык, базирующийся на собственном национальном алфавите, требует примерно сотни символов. Это славянские языки, греческий, иврит, арабский, санскрит и др. Для китайского, корейского и других языков, основанных на иероглифах, счет идет уже не на сотни, а на тысячи. Если учесть, что во многих областях человеческой деятельности используются специальные символы, например, для записи математических формул или знаки редакторской правки, то количество символов универсального алфавита уверенно приближается к десяти тысячам.
Чем же мы располагаем? В современных персональных компьютерах на один символ отводится восемь двоичных разрядов, т. е. байт. В такой системе кодирования можно записать 256 символов (два в восьмой степени). Исторически ситуация сложилась так, что стандартизованы только 128 символов с номерами (кодами) от 0 до 127. Они называются символами ASCII (American Standard Code for Information Interchange, американский стандартный код обмена информацией) и составляют первую половину кодовой таблицы. В состав ASCII входят важные управляющие символы, прописные и строчные буквы латинского алфавита, цифры, знаки препинания и некоторые спецсимволы.
Вторая половина кодовой таблицы может использоваться для различных целей, например, для кодирования национальных алфавитов или расширенного множества математических символов. Если набор ASCII является общим для большинства компьютерных платформ и операционных систем, то расширенные наборы имеют значительные различия. Существует несколько стандартов, которые определяют содержание всех 256 символов: ANSI, КОИ-8, EBCDIC и др. ANSI – это стандартная кодировка для платформы Windows, КОИ-8 широко используется различными версиями операционной системы Unix, кодировка EBCDIC применяется на машинах класса mainframe.
Самой решительной попыткой преодолеть недостатки систем кодирования, основанных на однобайтовом представлении символов, является сравнительно новый стандарт Unicode (ISO 10646). В этой системе кодирования символы представляются двумя байтами (шестнадцать двоичных разрядов), поэтому диапазон допустимых кодовых значений равен 65536 (два в шестнадцатой степени). Алфавит такой мощности с избытком покрывает все текущие и будущие потребности программистов и компьютерных пользователей.
ASCII
Файлы, в которые входят только символы первой половины кодовой таблицы, называются ASCII-файлами или текстовыми файлами. Текстовый файл представляет собой последовательность литер, которую для удобства чтения делят обычно на слова и строчки. Текстовые файлы намного беднее по оформлению, чем файлы, которые создают специальные текстовые редакторы. В них нельзя включить картинки или поля, они не имеют форматирования и сложной разметки и не обладают аппаратом ссылок и сносок; большинство декоративных элементов форматирования недоступно для текстовых файлов. Зато текстовые файлы являются аппаратно и программно независимыми и их можно использовать для обменов данными между различными программами и компьютерными платформами.
Текстовые файлы экспортируют текстовые редакторы и программы расчета электронных таблиц, в текстовой форме может существовать графика форматов EPS, PDF, DXF и др., любая программа на начальных стадиях разработки является текстовым файлом.
FreeHand может открывать, импортировать и передавать текстовые файлы в другие приложения. Одной из немногих проблем, которая сопровождает импорт текстовых файлов, является засорение данных "странными символами". Это часто происходит в тех случаях, когда FreeHand обменивается информацией с приложениями, работающими на других платформах.
Импорт текста ничем не отличается от импорта графики. Принятый в программу текст заполняет, по умолчанию, новый текстовый блок. Если щелкнуть курсором в любой точке монтажного стола, то размеры блока будут выбраны автоматически и подогнаны под объем текста. При помощи буксировки курсора можно задать собственные размеры блока для импортированного текста. Текст, не вошедший в блок, не теряется, а становится избыточным и загружается в буфер блока.
RTF (Rich Text Format) – это формат, разработанный фирмой Microsoft, для обменов форматированным текстом между программами и платформами. Документ в формате RTF состоит из информационной и управляющей частей, каждая из которых записывается в текстовом виде. Информационная часть передает содержательную сторону документа, управляющий раздел документа хранит сведения о его оформлении.
Для описания признаков форматирования и декоративных элементов документа используется специальный командный язык. Каждая управляющая конструкция языка представляет собой последовательность букв нижнего регистра, которая начинается с обратной косой черты (\) и заканчивается специальным разделителем. Разделителями могут быть пробелы, цифры, символы переноса и др.
Фирма Microsoft расширяет стандарт RTF, поэтому выразительные возможности формата постоянно увеличиваются. В настоящее время они примерно равны возможностями формата doc седьмой версии текстового редактора Word. Почти все, что можно создать в этой программе и сохранить в формате doc, можно записать в формате RTF.
FreeHand одинаково хорошо работает с файлами в формате RTF как на прием, так и на передачу. Работа с RTF-файлами имеет несколько особенностей:
Поговорим сегодня о текстовых файлах. Сюда включаются различные электронные текстовые документы, электронные книги и другие файлы, связанные с текстами.
Разберем основные текстовые форматы файлов и обсудим для чего они нужны и почему так называются:
Текстовые форматы электронных файлов
- PDF - Portable Document Format. На русский переводится как - портативный формат документа.
Вообще сам формат файла, был разработан компанией Adobe Systems аж в 1993 году.
Есть, кстати, фирменная программа для просмотра PDF файлов Adobe Reader, она бесплатная.
В целом этот формат файлов используется для представления различной печатной продукции в электронном виде.
Это могут быть журналы, книги, буклеты, листовки, визитки, открытки и так далее.
Такие фалы перед печатью имеют формат файла PDF, он позволяет рассмотреть каким будет итоговый печатный продукт.
А именно, как будет расположен текст, иллюстрации и так далее.
Еще данный текстовый формат может использоваться для пересылки электронных документов, например договоров и даже содержать в себе электронную подпись.
- EPUB - Electronic Publication. На русский язык переводиться как электронная публикация.
И действительно, этот формат файла позволяет комфортно читать различные электронные книги и журналы.
Данный формат файла был разработан в 2007 году и сейчас широко используется в электронных книгах и программах, которые позволяют читать текстовые файлы в электронном виде.
Данный формат файла удобно подстраивается под различные электронные устройства и позволяет открывать книги в цифровом формате.
Также внутри такого файла могут быть сноски и гиперссылки, которые задумал автор публикации, они открываются в этом же файле и дополняют информацию текста.
- WORD - переводится на русский как «слово». Данный текстовый формат разработан компанией Microsoft в 1983 году.
Такой формат файла используется для написания, редактирования и последующей печати различной документации, статей, рефератов, докладов и подобных текстовых файлов.
- TXT - text или по-русски «текст». Данный формат файла используется для написания только текстового файла.
Этот формат файла максимально прост и должен открыться в принципе на любой операционной системе.
На компьютере в ОС Windows можно создать этот текстовый файл простым способом.
Нажать на правую кнопку мыши на рабочем столе -> создать -> текстовый документ.
Такой формат подойдёт для создания каких-то списков или простых текстовых заметок.
- DOC -document. На русский язык переводится как «документ». Этот формат файла начала использовать Microsoft в 1990-х годах.
Он используется для создания текстовых файлов в программе Microsoft Word.
Есть также усовершенствованный формат DOCX - document XML.
- RTF - Rich Text Format. Что переводится как «обогащённый текстовый формат»
Этот формат текстового файла был разработан компанией Microsoft и стал использоваться с 1987 года.
Этот текстовый формат файла необходим для того, чтобы переносить текстовую информацию между различными операционными системами и программами.
Подытожим
В основном обычные пользователи используют текстовые форматы, которые приведены в статье, кроме RTF и DOCX.
Остальные текстовые форматы файлов более узконаправленные и используются программистами или разработчиками.
Тем не менее, такие форматы файлов как PDF, EPUB и Word значительно упрощают чтение электронного текста и делают его комфортным и удобным для использования.
Спасибо за чтение. Поставьте палец вверх, если информация была полезна и подписывайтесь на канал, чтобы не пропускать новых материалов 🙃
Те́кстовый файл — компьютерный файл, содержащий текстовые данные, как правило, организованные в виде строк.
Текстовым файлам противопоставляются двоичные файлы, в которых содержатся данные, не рассчитанные на интерпретацию в качестве текста (например, файлы, хранящие закодированные звук или изображение).
В отличие от термина «текстовый формат», характеризующего содержимое данных, термин «текстовый файл» относится к файлу и характеризует его как контейнер, хранящий такие данные.
Содержание
Описание
Текстовый файл представляет из себя последовательность символов (в основном печатных знаков, принадлежащих тому или иному набору символов). Это символы обычно сгруппированы в строки (англ. lines, rows ). В современных системах строки разделяются разделителями строк, в прошлом же применялось хранение строк в виде записей постоянной или переменной длины (см.: Перфокарта). Иногда конец текстового файла (особенно если в файловой системе не хранится информация о размере файла) также отмечается одним или более специальными знаками, известными как маркеры конца файла.
Текстовой файл может содержать как форматированный, так и неформатированный текст.
Преимущества и недостатки
- Универсальность — текстовый файл может быть прочитан (так или иначе) на любой системе или ОС, особенно если речь идёт об однобайтных кодировках вроде ASCII, которые не подвержены проблеме, характерной для других форматов файлов — для них не важна разница в порядке байтов или длине машинного слова на разных платформах.
- Устойчивость — каждое слово и символ в таком файле самодостаточны и, если случится повреждение байтов в таком файле, то обычно легче восстановить данные и продолжить обработку остального содержимого, в то время как у сжатых или двоичных файлов повреждении нескольких байтов может привести к невозможности восстановить всё содержимое файла. Многие системы управления версиями рассчитаны на текстовые файлы и с двоичными файлами могут работать только как с единым целым.
- Формат текстового файла крайне прост и его можно изменять текстовым редактором — программой, входящей в комплект практически любой ОС.
- У больших несжатых текстовых файлов низкая информационная энтропия — эти файлы занимают больше места, нежели минимально необходимо. Хотя эта избыточность и определяет повышенную устойчивость к сбоям в каналах передачи данных и при получении данных с носителей, например, с магнитной ленты.
- Некоторые операции с текстовыми файлами неэффективны. Например, если в файле встретится число, вычислительная система до начала операций с ним должна будет перевести его в свой внутренний формат, применив сравнительно сложную процедуру конвертации числа; чтобы перейти на 1000-ю строку, требуется считать 999 строк, идущих до неё; сложно заменить одну строку другой и т. д. Поэтому при работе с большими объёмами данных текстовые файлы применяют только как промежуточный формат, обеспечивающий интероперабельность.
Форматы, основанные на текстовых файлах
В силу своей простоты текстовые файлы нередко используются для хранения служебной информации (например, логов). Текстовый формат служит основой для многих более специализированных форматов (например, .ini, SGML, HTML, XML, TeX, исходных текстов языков программирования).
В текстовом файле текст может храниться как в неформатированном, так и форматированном или размеченном виде (например, Rich Text Format, HTML), где к каждому символу может быть применено форматирование (шрифт, начертание, размер и т. п.).
Расширения имён файлов
В DOS и Windows для файлов с неформатированным текстом обычно используется расширение .txt. Тем не менее, текстовыми могут являться файлы с любым другим расширением или без оного. Например, исходные коды программ обычно хранятся в файлах с расширениями, соответствующими языку программирования, на котором написаны программы (.bas, .pas, .c).
Форматированный тест (текст с разметкой) обычно хранится в файлах с расширением, соответствующим формату или языку разметки — .rtf, .htm, .html.
Кодировки
Unicode в текстовых файлах
Управляющие символы
Различные операционные системы придерживаются своего представления перевода строки и конца файла. В UNIX перевод строки состоит из одного символа LF (код 10), в Mac OS — из символа CR (код 13), а в DOS и Windows перевод строки кодируется последовательностью двух символов: CR и LF.
Помимо названных, в текстовых файлах применяются такие символы, как табуляция (код 9) и перевод страницы (код 12).
См. также
Примечания
- Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное.
- Проставив сноски, внести более точные указания на источники.
- Форматы файлов
- Форматы текстовых документов
- Форматы электронных книг
Wikimedia Foundation . 2010 .
Полезное
Смотреть что такое "Текстовый файл" в других словарях:
текстовый файл — Файл, содержащий строки написанной информации, которую можно непосредственно вывести на экран дисплея или принтер, используя обычные команды операционной системы. Файлы, создаваемые текстовыми процессорами не являются текстовыми, т.к. содержат… … Справочник технического переводчика
Файл (компьютер) — Файл (англ. file папка, скоросшиватель) концепция в вычислительной технике: сущность, позволяющая получить доступ к какому либо ресурсу вычислительной системы и обладающая рядом признаков: фиксированное имя (последовательность символов, число или … Википедия
ТЕКСТОВЫЙ ПРОЦЕССОР — (текстовый редактор), компьютерная система, предназначенная для создания и обработки текста. Если система может применяться только для этой цели, тогда она называется специализированным текстовым процессором. Более распространен персональный… … Научно-технический энциклопедический словарь
файл определения — Специальный текстовый файл, содержащий директивы, используемые для связывания объектных составляющих программ (или библиотеки) в выполняемый файл. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993]… … Справочник технического переводчика
файл инициализации — Специальный текстовый файл, используемый при загрузке среды и отдельных программ для начальной установки параметров. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные технологии в … Справочник технического переводчика
Файл — У этого термина существуют и другие значения, см. Файл (значения). Файл (англ. file) блок информации на внешнем запоминающем устройстве компьютера, имеющий определённое логическое представление (начиная от простой последовательности… … Википедия
файл — сущ., м., употр. сравн. часто Морфология: (нет) чего? файла, нет? файлу, (вижу) что? файл, чем? файлом, о чём? о файле; мн. что? файлы, (нет) чего? файлов, чем? файлам, (вижу) что? файлы, чем? файлами, о чём? о файлах 1. Файлом называется массив… … Толковый словарь Дмитриева
Файл конфигурации — или конфигурационный файл используется для хранения настроек компьютерных программ, в том числе и операционных систем. Как правило, конфигурационные файлы имеют текстовый формат и могут быть прочитаны и отредактированы пользователем программы.… … Википедия
Программы, которые поддерживают ASCII расширение файла
В следующем списке перечислены программы, совместимые с файлами ASCII, которые разделены на категории 3 в зависимости от операционной системы, в которой они доступны. ASCII файлы можно встретить на всех системных платформах, включая мобильные, но нет гарантии, что каждый из них будет должным образом поддерживать такие файлы.
Программы, обслуживающие файл ASCII
Windows
MAC OS
Linux
Как открыть файл ASCII?
Причин, по которым у вас возникают проблемы с открытием файлов ASCII в данной системе, может быть несколько. С другой стороны, наиболее часто встречающиеся проблемы, связанные с файлами ASCII Text Format, не являются сложными. В большинстве случаев они могут быть решены быстро и эффективно без помощи специалиста. Ниже приведен список рекомендаций, которые помогут вам выявить и решить проблемы, связанные с файлами.
Шаг 1. Получить Text editor
Наиболее распространенной причиной таких проблем является отсутствие соответствующих приложений, поддерживающих файлы ASCII, установленные в системе. Наиболее очевидным решением является загрузка и установка Text editor или одной из перечисленных программ: Windows Notepad, Nvu, NotePad++ text editor. Выше вы найдете полный список программ, которые поддерживают ASCII файлы, классифицированные в соответствии с системными платформами, для которых они доступны. Если вы хотите загрузить установщик Text editor наиболее безопасным способом, мы рекомендуем вам посетить сайт и загрузить его из официальных репозиториев.
Шаг 2. Проверьте версию Text editor и обновите при необходимости
Если проблемы с открытием файлов ASCII по-прежнему возникают даже после установки Text editor, возможно, у вас устаревшая версия программного обеспечения. Проверьте веб-сайт разработчика, доступна ли более новая версия Text editor. Разработчики программного обеспечения могут реализовать поддержку более современных форматов файлов в обновленных версиях своих продуктов. Если у вас установлена более старая версия Text editor, она может не поддерживать формат ASCII. Все форматы файлов, которые прекрасно обрабатывались предыдущими версиями данной программы, также должны быть открыты с помощью Text editor.
Шаг 3. Свяжите файлы ASCII Text Format с Text editor
Если у вас установлена последняя версия Text editor и проблема сохраняется, выберите ее в качестве программы по умолчанию, которая будет использоваться для управления ASCII на вашем устройстве. Метод довольно прост и мало меняется в разных операционных системах.
Изменить приложение по умолчанию в Windows
- Выберите пункт Открыть с помощью в меню «Файл», к которому можно щелкнуть правой кнопкой мыши файл ASCII.
- Нажмите Выбрать другое приложение и затем выберите опцию Еще приложения
- Чтобы завершить процесс, выберите Найти другое приложение на этом. и с помощью проводника выберите папку Text editor. Подтвердите, Всегда использовать это приложение для открытия ASCII файлы и нажав кнопку OK .
Изменить приложение по умолчанию в Mac OS
Шаг 4. Убедитесь, что файл ASCII заполнен и не содержит ошибок
Если вы выполнили инструкции из предыдущих шагов, но проблема все еще не решена, вам следует проверить файл ASCII, о котором идет речь. Вероятно, файл поврежден и, следовательно, недоступен.
1. ASCII может быть заражен вредоносным ПО - обязательно проверьте его антивирусом.
Если файл заражен, вредоносная программа, находящаяся в файле ASCII, препятствует попыткам открыть его. Рекомендуется как можно скорее сканировать систему на наличие вирусов и вредоносных программ или использовать онлайн-антивирусный сканер. ASCII файл инфицирован вредоносным ПО? Следуйте инструкциям антивирусного программного обеспечения.
2. Проверьте, не поврежден ли файл
3. Убедитесь, что у вас есть соответствующие права доступа
Иногда для доступа к файлам пользователю необходимы права администратора. Войдите в систему, используя учетную запись администратора, и посмотрите, решит ли это проблему.
4. Убедитесь, что в системе достаточно ресурсов для запуска Text editor
Если в системе недостаточно ресурсов для открытия файлов ASCII, попробуйте закрыть все запущенные в данный момент приложения и повторите попытку.
5. Убедитесь, что у вас установлены последние версии драйверов, системных обновлений и исправлений
Регулярно обновляемая система, драйверы и программы обеспечивают безопасность вашего компьютера. Это также может предотвратить проблемы с файлами ASCII Text Format. Возможно, что одно из доступных обновлений системы или драйверов может решить проблемы с файлами ASCII, влияющими на более старые версии данного программного обеспечения.
Читайте также: