В чем преимущество хранения текстов в файлах
1). В чём преимущества хранения текстов в файлах по сравнению с бумажным способом хранения?
2). Что такое гипертекст? Какие возможности представляет гипертекст пользователю?
3). Каков размер алфавита, используемого в компьютерах для представления текстов?
4). Сколько места в памяти занимает код одного символа?
5). Что такое таблица кодировки? Как называется таблица кодировки, используемая в большинстве современных персональных компьютеров?
6). Закодируйте в двоичной форме свою фамилию, записанную латинскими буквами, используя таблицу «Стандартная часть кода ASCII».(моя фамилия – Полевщикова).
7). Познакомьтесь с альтернативной частью кода ASCII, используемой в школьных компьютерах. Выясните, соблюдается ли принцип последовательного кодирования алфавита из русских букв (кириллица).
8). Закодируете короткую фразу на русском языке. Обменяйтесь полученными кодами с соседом по парте и декодируйте тексты друг друга.
9). Для чего предназначены текстовые редакторы (ТР)?
10). Изучите все элементы среды используемого вами текстового редактора. Какая информация содержится в строке состояния? Какие команды входят в меню, как они отдаются?
11). Перечислите основные режимы работы текстового редактора.
12). Какие основные начертания шрифтов используются в текстовом редакторе?
13). Что понимается под форматированием текста?
14). Что такое фрагмент текста?
15). Какие возможности предоставляет многооконный редактор?
16). Как осуществляется в текстовом редакторе поиск и замена?
17). Что такое орфографический контроль? На каком устройстве хранится орфографический словарь?
18). Какие файловые операции можно выполнять, работая в текстовом редакторе?
19). Как распечатать текст на бумаге? Какие технические и программные средства для этого необходимы?
20). Как воспользоваться режимом помощи?
пожалуйста, помогите с этим тестом!!просто меня не было на занятиях 3 недели. и пропустила 6 уроков. ну, чтобы повысить оценки до 4, она дала мне этот тест. Помогите пожалуйста!!умоляю!! кто правильно ответит = + 1О.
С 1991 года стало развиваться использование в компьютерной технике представления текстов в виде unicode, где на один символ может приходиться (чаще всего) 2 байта, но иногда и 3, и даже 4 байта.
1. В чем преимущества хранения текстов в файлах по сравнению с бумажным способом хранения?
Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу. Не нужно зачеркивать и перписывать заново.
Файлы компактно размещены, их можно удалить, если они не нужны, и помесить на их место другие файлы.
С помощью компьютера легко скопировать файлы в любом количестве на другие носители.
Файл c текстом можно быстро переслать другому человеку по электронной почте.
2. Что такое таблица кодировки? Какие таблицы кодировки вы знаете?
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. ASCII, ANSI, СР1251, UNICODE.
3. В чем заключается принцип последовательного кодирования?
Это означает, что в таблице кодировки буквы располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений.
4. Сколько места в памяти компьютера занимает код одного символа, если используется таблица кодировки ASCII?
2 8 = 256
8 битов = 1 байт
1 символ = 1 байт
5. Сколько места в памяти компьютера занимает код одного символа, если используется таблица кодировки UNICODE?
6. Что такое гипертекст? Какие возможности предоставляет гипертекст пользователю?
Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются гиперсвязями (гиперссылками). Гипертекст предоставляет возможность перемещаться по смысловым связям в тексте.
7. Познакомьтесь с кодовой страницей, используемой в школьных компьютерах. Выясните, соблюдается ли принцип последовательного кодирования алфавита из русских букв (их называют кириллицей).
8. Закодируйте короткую фразу на русском языке. Обменяйтесь с соседом по парте полученными кодами и декодируйте тексты друг друга.
Я люблю информатику
11010000 10101111 100000 11010000 10111011 11010001 10001110 11010000 10110001 11010000 10111011 11010001 10001110 100000 11010000 10111000 11010000 10111101 11010001 10000100 11010000 10111110 11010001 10000000 11010000 10111100 11010000 10110000 11010001 10000010 11010000 10111000 11010000 10111010 11010001 10000011
А теперь от обсуждения вопроса о том, что представляет собой компьютер, перейдем к ответу на вопрос, что умеет делать компьютер. Начиная с этой главы, мы будем знакомиться с применением компьютеров.
Первая область применения, которую мы рассмотрим, — работа с текстами. При ручной записи часто неприятную проблему составляет необходимость исправлять ошибки или вносить какие-то изменения в текст. При этом приходится зачеркивать, стирать, заклеивать, что портит вид текста. Необходимость переписывать текст ведет к потере времени и лишнему расходу бумаги.
Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу. Носителем текста становится память компьютера. Конечно, для длительного его сохранения это должна быть внешняя память.
Тексты на внешних носителях сохраняются в файлах.
Есть еще ряд преимуществ сохранения текстов в файлах на компьютерных носителях по сравнению с бумагой.
Во-первых, это компактное размещение. Например, на компакт-диске (700 Мб) можно разместить тексты более сотни книг объемом в 500 страниц каждая. А если использовать специальные методы сжатия, то это количество можно увеличить в несколько раз.
Во-вторых, если данный текст становится ненужным, то с помощью компьютера его легко удалить с носителя, поместив на это место другой файл.
В-третьих, с помощью компьютера легко скопировать файлы в любом количестве на другие носители.
В-четвертых, файл с текстом можно быстро переслать другому человеку по электронной почте. Для этого ваш компьютер и компьютер адресата должны иметь связь через компьютерную сеть.
Главное неудобство хранения текстов в файлах состоит в том, что прочитать их можно только с помощью компьютера. Человек может просмотреть текст на экране монитора или напечатать на бумаге, используя принтер.
Уже сейчас существуют издания, которые не печатаются на бумаге, а хранятся и распространяются в форме файлов. С распространением компьютеров число таких безбумажных изданий с каждым годом увеличивается. Представьте себе, что вся ваша личная библиотека разместится в коробке с дисками. Причем по объему информации она будет не меньше, чем сотни книг, собранных родителями. А экономя бумагу, Д1Ы сохраняем леса на нашей планете.
Практическая работа №3
«Редактируем и форматируем текст. Создаем надписи» (задание 1)
Задания для самостоятельного выполнения
2.5. Практическое задание. В текстовом редакторе открыть текстовый файл, содержащий форматирование, и сохранить файл в различных текстовых форматах. Сравнить вид и информационные объемы документов, сохраненных в различных форматах.
Cкачать материалы урока
Коротко о главном
С помощью компьютера можно создавать текстовые документы и хранить их на носителях внешней памяти в виде файлов.
Преимущества файлового хранения текстов: возможность редактирования, быстрого копирования на другие носители; возможность передачи текста по линиям компьютерной связи.
Каждый символ текста кодируется восьмиразрядным двоичным кодом. Для представления текстов в компьютере используется алфавит мощностью 256 символов.
В таблице кодировки каждому символу алфавита поставлен в соответствие порядковый номер и восьмиразрядный двоичный код. Международным стандартом является код АSСII — американский стандартный код для информационного обмена.
Как представляются тексты в памяти компьютера
А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.
Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и др. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.
Широко распространенным способом представления текстовой информации в компьютере является использование алфавита мощностью 256 символов. Один символ такого алфавита несет 8 битов информации: 2 8 = 256. 8 битов = 1 байт, следовательно (см. § 6):
Двоичный код каждого символа занимает 1 байт памяти компьютера.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие тому или иному символу. (Понятно, что это дело условное, можно придумать множество способов кодирования.)
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
На ЭВМ первых поколений для разных типов машин использовались различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange — американский стандартный код для обмена информацией). Точнее говоря, стандартной в этой таблице является только первая половина, т. е. символы с номерами от нуля (двоичный код 00000000) до 127(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, ОТ 10000000 до 11111111, составляют так называемую кодовую страницу. Например, кодовая страница номер 1251 (СР1251) содержит русский алфавит и используется в операционной системе Windows и ее приложениях. Таблицу кодировки, используемую в Windows, называют ANSI (American National Standart Institute -^Американский национальный институт стандартов). Первые половины таблиц ASCII и ANSI полностью совпадают.
В таблице 3.1 приведена стандартная часть кода ANSI (коды от 0 до 31 имеют особое назначение, не отражаются какими-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоичные коды.
Обратите внимание на то, что в этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.
Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:
01100110 01101001 01101100 01100101.
А теперь попробуйте решить обратную задачу. Какое слово записано следующим двоичным кодом:
01100100 01101001 01110011 01101011?
В таблице 3.2 приведена кодовая страница СР1251. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования. Однако это правило действует не во всех существующих кодовых страницах с русским алфавитом.
Помимо восьмиразрядной кодировки символов все большее распространение получает шестнадцатиразрядная — двухбайтовая кодировка. Международный стандарт такой кодировки носит название UNICODE.
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.
Задание 1
1. Откройте текстовый процессор MS Word.
2. С помощью меню Вид установите панель Рисование.
3. На панели Рисование найдите кнопку Вставить объект WordArt и с ее помощью вызовите коллекцию WordArt, содержащую различные варианты надписей.
4. Щелкните мышью на понравившейся вам надписи, затем — на кнопке ОК.
5. Рассмотрите раскрывшееся диалоговое окно Изменение текста WordArt. В нем можно выбирать шрифт, его размер и начертание. Нажав клавишу , очистите рабочее поле.
6. Введите текст надписи «ШКОЛА» и щелкните на кнопке ОК. На экране появится созданная вами красочная надпись.
7. Самостоятельно создайте еще три варианта надписей.
8. Созданные надписи можно перемещать, удалять, изменять. Для этого надпись нужно выделить. Выделите одну из надписей — поместите на нее указатель мыши и выполните щелчок левой кнопкой мыши. Надпись выделена, если вокруг нее появилась рамочка с квадратиками. Чтобы снять выделение, можно щелкнуть в любом месте вне надписи.
9. Измените расположение надписей на экране. Для этого:
1) выделите произвольную надпись;
2) удерживая нажатой левую кнопку мыши, перетащите надпись в другое место.
10. Оставьте на экране самую удачную надпись, а все другие удалите. Для этого:
1) выделяйте надписи;
2) нажимайте клавишу .
11. Выделите надпись. Обратите внимание на появившуюся панель WordArt. С ее помощью можно полностью изменить исходную надпись. Попытайтесь это сделать самостоятельно.
12. Сохраните файл в собственной папке под именем Школа и закройте программу.
Сохранение документов. В процессе сохранения документа необходимо прежде всего в файловой системе компьютера выбрать диск и папку, в которой файл документа необходимо сохранить.
Кроме того, необходимо выбрать формат файла, который определяет способ хранения текста в файле. Существуют универсальные форматы текстовых файлов, которые могут быть прочитаны большинством текстовых редакторов, и оригинальные форматы, которые используются только определенными текстовыми редакторами.
Формат Только текст (расширение в имени файла txt) является наиболее универсальным текстовым форматом. Файлы, сохраненные в этом формате, могут быть прочитаны приложениями, работающими в различных операционных системах. Достоинством формата является небольшой информационный объем файлов, а недостатком то, что не сохраняются результаты форматирования текста.
Расширенный текстовый формат (расширение в имени файла rtf) является универсальным форматом текстовых файлов, который сохраняет результаты форматирования. Недостатком формата является большой информационный объем файлов.
Формат Документ Word (расширение в имени файла doc) является оригинальным форматом текстового редактора Microsoft Word, полностью сохраняющим форматирование. Этот формат фактически является универсальным, так как понимается практически всеми текстовыми редакторами. В последней версии Microsoft Office используется формат DOCX, для перевода в формат DOC существуют конверторы.
Формат Weh-страница (расширение в имени файла htm или html) используется для хранения Web-страниц в компьютерных сетях, так как файлы имеют небольшой информационный объем, но сохраняется форматирование. Документы в формате WеЪ-страни- ца создаются в Web-редакторах, а также могут сохраняться в этом формате многими текстовыми редакторами. Достоинством формата является его универсальность, так как Web-страницы могут просматриваться с использованием специализированных программ (браузеров) в любых операционных системах.
Современные текстовые редакторы обеспечивают автоматическое, указанное пользователем, преобразование текстового файла из одного формата в другой при его открытии и сохранении.
Печать документа. Перед выводом документа на печать полезно выполнить предварительный просмотр документа. Это позволяет увидеть, как будет выглядеть документ, напечатанный на бумаге с использованием подключенного к компьютеру принтера.
Вид напечатанного документа (например, распределение текста по страницам) может зависеть от используемого принтера, так как могут несколько отличаться шрифты, используемые в разных принтерах.
При выводе документа на печать необходимо установить параметры печати: задать номера выводимых на печать страниц, количество копий документа и др.
Кроме того, целесообразно проверить установки самого принтера: ориентацию бумаги, качество бумаги, качество печати и др.
Контрольные вопросы
1. Какие существуют форматы текстовых файлов и чем они отличаются друг от друга?
2. В каком формате нужно сохранить файл, чтобы он мог быть прочитан в других приложениях с сохранением форматирования? Без сохранения форматирования?
3. Какие параметры необходимо установить перед началом печати документа?
4. Влияет ли на вид напечатанного документа выбор принтера? Почему?
Вопросы и задания
1. В чем преимущества хранения текстов в файлах по сравнению с бумажным способом хранения?
2. Что такое гипертекст? Какие возможности предоставляет гипертекст пользователю?
3. Каков размер алфавита, используемого в компьютерах для представления текстов?
4. Сколько места в памяти компьютера занимает код одного символа?
5. Что такое таблица кодировки? Как называется таблица кодировки, используемая в большинстве современных персональных компьютеров?
6. Закодируйте в двоичной форме свою фамилию, записанную латинскими буквами, используя табл. 3.1.
7. Познакомьтесь с кодовой страницей, используемой в школьных компьютерах. Выясните, соблюдается ли принцип последовательного кодирования алфавита из русских букв (их называют кириллицей).
8. Закодируйте короткую фразу на русском языке. Обменяйтесь с соседом по парте полученными кодами и декодируйте тексты друг друга.
Электронное приложение к уроку
Вернуться к материалам урока | |
Презентации, плакаты, текстовые файлы | Ресурсы ЕК ЦОР |
Видео к уроку |
Cкачать материалы урока
Компьютер работает с четырьмя видами информации: текстовой, графической, числовой, звуковой.
Создание текстовых документов и хранение их на магнитных носителях в виде файлов является одним из самых массовых применений ЭВМ.
Преимущества работы с текстом на компьютере:
1)экономия бумаги;
2)компактное размещение;
3)возможность многократного использования магнитного носителя для хранения разных документов;
4)возможность быстрого копирования на другие носители;
5)возможность передачи текста по линиям компьютерной связи.
Преимущества компьютерного документа по сравнению с бумажным
А теперь от обсуждения вопроса о том, что представляет собой компьютер, перейдем к ответу на вопрос, что умеет делать компьютер. Начиная с этой главы, мы будем знакомиться с применением ЭВМ.
Первая область применения, которую мы рассмотрим, — работа с текстами. При ручной записи часто неприятную проблему составляет необходимость исправлять ошибки или вносить какие-то изменения в текст. При этом приходится зачеркивать, стирать, заклеивать, что портит вид текста. Необходимость переписывать текст ведет к потере времени и лишнему расходу бумаги.
Имея компьютер, можно создавать тексты, не тратя на это лишнее время и бумагу. Носителем текста становится память ЭВМ. Конечно, для длительного его сохранения это должна быть внешняя память — магнитные или оптические диски.
Текст на внешних носителях сохраняется в виде файла.
Есть ряд преимуществ сохранения текстов в файловой форме на компьютерных носителях по сравнению с бумагой.
Во-первых, это компактное размещение. Например, текст толстой книги в 500 страниц помещается на маленькую дискету диаметром 9 см. А если использовать специальные методы сжатия, то размер текста, помещающегося на дискете, можно увеличить в несколько раз.
Во-вторых, если данный текст становится ненужным, то дискету, как бумагу, не надо выбрасывать или сдавать в макулатуру. С нее с помощью компьютера легко стереть этот текст и на его место записать новый.
В-третьих, с помощью компьютера легко скопировать файлы в любом количестве на другие носители.
В-четвертых, файл с текстом можно быстро переслать другому человеку по электронной почте. Для этого ваш компьютер и компьютер адресата должны иметь связь через компьютерную сеть.
Главное неудобство хранения текстов в файлах состоит в том, что прочитать их можно только с помощью компьютера. Человек может просмотреть текст на экране дисплея или напечатать на бумаге, используя принтер.
Уже сейчас имеются некоторые издания, которые не печатаются на бумаге, а хранятся и распространяются в форме файлов. Когда компьютеры станут такими же обычными предметами в каждом доме, как сейчас радио и телевизор, то безбумажных изданий станет еще больше. Представьте себе, что вся ваша личная библиотека разместится в коробке с дисками. Причем по объему информации она будет не меньше, чем сотни книг, собранных родителями. А экономя бумагу, мы сохраняем леса на нашей планете.
Как представляются тексты в памяти компьютера
А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.
Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.
Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 28 = 256. 8 битов = 1 байт, следовательно:
Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.
Понятно, что это дело условное, можно придумать множество способов кодирования.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — просто порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Для разных типов ЭВМ используются различные таблицы кодировки. С распространением персональных компьютеров типа IВМ РС международным стандартом стала таблица кодировки под названием АSCII (American Standart Code for Information Interchange — американский стандартный код для информационного обмена).
Точнее говоря, стандартной в этой таблице является только первая половина, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная с 10000000 и кончая 11111111, используются в разных вариантах. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
В таблице 1 приведена стандартная часть кода АSCII (коды от 0 до 31 имеют особое назначение, не отражаются какими-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоичные коды.
Обратите внимание на то, что в этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.
Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:
01100110 01101001 01101100 01100101.
А теперь попробуйте решить обратную задачу. Какое слово записано следующим двоичным кодом:
01100100 01101001 01110011 01101011?
В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.
Что такое гипертекст
Наиболее существенное отличие компьютерного текста от бумажного вы почувствуете, если встретитесь с текстом, информация в котором организована по принципу гипертекста.
Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются гиперсвязями (гиперссылками).
Чаще всего по принципу гипертекста организованы компьютерные справочники, энциклопедии, учебники. Такую «книгу» можно читать не только в обычном порядке, «листая страницы» на экране, но и перемещаясь по смысловым связям в произвольном порядке. Например, при изучении на уроке физики темы «Второй закон Ньютона» с помощью компьютерного учебника ученик прочитал определение закона «Сила равна произведению массы на ускорение». Ему захотелось вспомнить определение массы. Указав в тексте на слово «масса» (связанные понятия обычно выделяются цветом или подчеркиванием, а указывать на них удобно с помощью мыши), он быстро перейдет к разделу учебника, где рассказывается о массе тел. Прочитав определение «Масса — мера инертности тела», ученик может пожелать уточнить, что такое инертность. По гиперссылке он быстро выйдет на нужный раздел.
Как представляются тексты в памяти компьютера
А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.
Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и др. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.
Широко распространенным способом представления текстовой информации в компьютере является использование алфавита мощностью 256 символов. Один символ такого алфавита несет 8 битов информации: 2 8 = 256. 8 битов = 1 байт, следовательно (см. § 6):
Двоичный код каждого символа занимает 1 байт памяти компьютера.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие тому или иному символу. (Понятно, что это дело условное, можно придумать множество способов кодирования.)
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код — порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
На ЭВМ первых поколений для разных типов машин использовались различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange — американский стандартный код для обмена информацией). Точнее говоря, стандартной в этой таблице является только первая половина, т. е. символы с номерами от нуля (двоичный код 00000000) до 127(01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, ОТ 10000000 до 11111111, составляют так называемую кодовую страницу. Например, кодовая страница номер 1251 (СР1251) содержит русский алфавит и используется в операционной системе Windows и ее приложениях. Таблицу кодировки, используемую в Windows, называют ANSI (American National Standart Institute -^Американский национальный институт стандартов). Первые половины таблиц ASCII и ANSI полностью совпадают.
В таблице 3.1 приведена стандартная часть кода ANSI (коды от 0 до 31 имеют особое назначение, не отражаются какими-либо знаками и в данную таблицу не включены). Здесь приведены десятичные номера символов, символы, двоичные коды.
Обратите внимание на то, что в этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.
Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:
01100110 01101001 01101100 01100101.
А теперь попробуйте решить обратную задачу. Какое слово записано следующим двоичным кодом:
01100100 01101001 01110011 01101011?
В таблице 3.2 приведена кодовая страница СР1251. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования. Однако это правило действует не во всех существующих кодовых страницах с русским алфавитом.
Помимо восьмиразрядной кодировки символов все большее распространение получает шестнадцатиразрядная — двухбайтовая кодировка. Международный стандарт такой кодировки носит название UNICODE.
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.
Коротко о главном
С помощью компьютера можно создавать текстовые документы и хранить их на носителях внешней памяти в виде файлов.
Преимущества файлового хранения текстов: возможность редактирования, быстрого копирования на другие носители, передачи текста по линиям компьютерной связи.
В таблице кодировки каждому символу алфавита поставлен в соответствие порядковый номер и восьмиразрядный двоичный код. ANSI — международный стандарт кодирования символов, используемый в операционной системе Windows.
Гипертекст — это текст, организованный так, что его можно просматривать в последовательности смысловых связей между его отдельными фрагментами. Такие связи называются гиперсвязями (гиперссылками). Гиперссылка позволяет быстро перейти к просмотру того раздела, на который она указывает.
Читайте также: