Таблица в которой всем символам компьютерного алфавита
С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами. Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение.
Порядковый номер
Вторая половина таблицы кодов ASCII
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
В информатике под текстом понимается любая последовательность символов из определенного алфавита. Для применения компьютера при работе с текстовой информацией необходим компьютерный алфавит. Компьютерный алфавит состоит из букв, цифр, знаков препинания и других символов. Все символы представлены в компьютере в виде двоичного кода.
В отличие от кодирования чисел, в распоряжении человека нет правил или формул, которые позволили бы, зная любой символ алфавита, вычислить соответствующее ему число. Тем не менее, существуют подходы, позволяющие сопоставить символы и числа. Например, можно воспользоваться тем, что все символы в алфавите упорядочены. Поэтому каждому символу алфавита можно поставить в соответствие его порядковый номер. Соответствие между символом алфавита и его порядковым номером устанавливается с помощью таблиц кодировки, или, говоря другими словами, кодовых таблиц.
Поскольку символы в алфавите могут быть упорядочены разными способами, то для кодирования текста можно придумать и использовать разные таблицы кодировки, устанавливающие разные соответствия между символами и числами.
Так, в одной из международных таблиц кодировки компьютерного алфавита пробелу соответствует порядковый номер 32, знаку «!» - порядковый номер 33, цифре «0» - порядковый номер 48, цифре «1» - порядковый номер 49, строчной английской букве « a » - порядковый номер 97, а строчной английской букве « b » - порядковый номер 98 и т.д. Таким образом, все символы и их номера оказываются упорядоченными. Поэтому отдельные символы (буквы, цифры, знаки препинания), а значит, и составленные из них слова текста компьютер может автоматически сортировать, сравнивая порядковые номера символов (меньше, больше или равно).
Запись текста, как и запись числа, может содержать цифры (например, номер телефона, математическая или химическая формула, ответ к задаче). Однако, в отличие от числовых данных, которые можно сравнивать и с которыми можно выполнять арифметические операции, символы можно только сравнивать.
Поскольку информация в компьютере представлена в виде последовательности нулей и единиц, то порядковый номер каждого символа компьютерного алфавита переводится в двоичный код по известным правилам кодирования. При нажатии на клавишу клавиатуры с изображением символа компьютер, используя таблицу кодировки, производит замену этого символа соответствующим ему двоичным кодом. При выводе символа на экран двоичный код порядкового номера заменяется изображением символа.
Количество двоичных разрядов, необходимых для кодирования каждого символа, а значит, и количество битов памяти, требуемых для хранения символа, зависит от мощности компьютерного алфавита. Мощность компьютерного алфавита, который содержит все символы, расположенные на клавиатуре компьютера (прописные и строчные буквы английского и русского алфавитов, цифры, различные знаки), больше чем 128 символов (128=2 7 ), но меньше чем 256 (256=2 8 ). Поэтому для кодирования каждого символа такого компьютерного алфавита достаточно 8 двоичных знаков, и информационные вес одного символа составляет 8 бит, равных 1 байту. Значит, для хранения в компьютере одного из 256 символов компьютерного алфавита необходим 1 байт памяти.
В кодовой таблице ASCII :
- Порядковые номера с 0 по 31 соответствуют символам управляющих операций (переходу на следующую строку, удалению символа, табуляции и другим операциям);
- Порядковые номера с 32 по 63 соответствуют пробелу, знакам препинания, скобкам, знакам арифметических операций, цифрам и некоторым другим символам;
- Порядковые номера с 64 по 95 соответствуют заглавным буквам английского алфавита и некоторым другим символам;
- Порядковые номера с 96 по 127 соответствуют строчным буквам английского алфавита и некоторым другим символам.
ПРИМЕР. Определить объем памяти, необходимый для хранения слова « Hello », и закодировать это слово для хранения в памяти компьютера.
1)Определим объем памяти для хранения слова. Поскольку для хранения каждого символа из 256-символьного алфавита необходим 1 байт памяти (2 i = 256, i = 8 юит = 1 байт), то для хранения пяти символов, составляющих слово « Hello », необходимо 5 байт памяти ( I = i * k =1*5=5 байт).
2)Определим порядковые номера символов в основной части таблицы кодировки ASCII . Пяти английским буквам, входящим в слово « Hello », соответствуют порядковые номера: 72, 101, 108, 108, 111.
01001000 01100101 01101100 01101100 01101111.
Ответ. Для хранения слова « Hello » необходимо 5 байтов памяти, в битах которых необходимо сохранить двоичный код: 01001000 01100101 01101100 01101100 01101111.
Существует несколько вариантов дополнительной части кодовой таблицы ASCII для кодирования символов русского алфавита. Например, кодировка Windows -125, используемая в операционной системе MS Windows , а также кодировка КОИ-8, используемая в операционной системе Unix и при передаче текстовой информации с помощью компьютерных сетей.
Эти кодировки отличаются последовательностью расположения символов. В кодировке Windows -125 в алфавитном порядке вначале расположены прописные русские буквы, а затем строчные русские буквы. В кодировке КОИ-8 последовательность букв другая, следовательно, и кодирование букв другое. Поэтому тексты, закодированные с использованием одной кодировки, будут неправильно отображаться при декодировании с использованием другой кодировки. Например, слово «Привет», сохраненное в памяти компьютера с использованием кодировки Windows -125, будет выведено на экран монитора как «оПХБЕР» с использованием кодировки КОИ-8. Для перекодировки символов существуют программы-конвертеры, которые входят в состав операционных систем и приложений.
Для того, чтобы решить проблему стандартизации кодирования букв национальных алфавитов, была разработана таблица кодировки Unicode , в которой каждому символу компьютерного алфавита ставится в соответствие 16-разрядный двоичный код. Это дает возможность закодировать 65536 (2 16 = 65536) различных символов. Такая таблица кодировки позволяет разместить алфавиты языков большинства народов мира. Однако при этом коды символов становятся вдвое длиннее, что требует дополнительных ресурсов компьютера.
Таким образом, аналогично числам символы могут быть представлены в виде последовательности нулей и единиц. Существующие правила кодирования символов позволяют сопоставлять символы с числами и, наоборот, определять символ, зная число. Кодирование символов, их замена числами и запись с помощью двоичных кодов дает много преимуществ, в числе которых автоматизация поиска, сравнения и замены символов, возможность хранения, обработки и передачи текстов с помощью компьютерной техники.
Кодирование текстовой информации
Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Начиная с конца 60-х годов, компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время основная доля персональных компьютеров в мире (и большая часть времени) занята обработкой именно текстовой информации. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.
С точки зрения ЭВМ текст состоит из отдельных символов. К числу символов принадлежат не только буквы (заглавные или строчные, латинские или русские), но и цифры, знаки препинания, спецсимволы типа "=", "(", "&" и т.п. и даже (обратите особое внимание!) пробелы между словами.
Т радиционно для кодирования одного символа используется количество информации, равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события): К = 2 I = 2 8 = 256, т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.
Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.
В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, то есть преобразование кода символа в его изображение. Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.
Виды таблиц кодировок
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Для разных типов ЭВМ используются различные таблицы кодировки.
В качестве международного стандарта принята кодовая таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для информационного обмена), кодирующая первую половину символов с числовыми кодами от 0 до 127 ( коды от 0 до 32 отведены не символам, а функциональным клавишам).
Таблица кодов ASCII делится на две части.
Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).
Структура таблицы кодировки ASCII
Порядковый номер
Символы с номерами от 0 до 31 принято называть управляющими.
Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Символ 32 - пробел, т.е. пустая позиция в тексте.
Все остальные отражаются определенными знаками.
Альтернативная часть таблицы (русская).
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
Обращается внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.
Для букв русского алфавита также соблюдается принцип последовательного кодирования.
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251. Введена компанией Microsoft; с учетом широкого распространения операционных систем (ОС) и других программных продуктов этой компании в Российской Федерации она нашла широкое распространение.
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode.
Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
Внутреннее представление слов в памяти компьютера
с помощью таблицы ASCII
Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать - на экране монитора видна какая-то "абракадабра". Это происходит оттого, что на компьютерах применяется разная кодировка символов русского языка.
Таким образом, каждая кодировка задается своей собственной кодовой таблицей. Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.
Н апример, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово «ЭВМ» (Рис. 10), тогда как в других кодировках это будет бессмысленный набор символов.
К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы, встроенные в приложения.
ответьте пожалуста на вопросы)))только полным ответом..очень нужно))))
1) почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы.
2) С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов.
Очень срочно. задали сделать а я не знаюю)))))подскажите. только полным ответом)))))
1)При кодировании текстовой информации используется 256 символов потому-что текстовая информация не пишется буквами. А кодируется в системе кодом-0 и 1.Он может принимать любое количество нолей и единиц. И это будет какой-нибудь символ. Короче говоря, 256 символов-это "компьютерный алфавит"
1 Почему при кодировании текстовой информации в компьютере в большинстве кодировок используется 256 различных символов, хотя русский алфавит включает только 33 буквы?
ОТВЕТ (Текстовая информация (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) содержит 256 различных знаков.) ;
2 С какой целью ввели кодировку Unicode, которая позволяет закодировать 65 536 различных символов?
ОТВЕТ (чтобы закодировать не только русский и латинский алфавиты, цифры, знаки и математические символы, но и греческий, арабский, иврит и другие алфавиты).
2) unicode - стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков.
ответ в определении )))
1. Букв 33, но с учётом загланых и строчных уже 66, плюс знаки препинания, пробелы, плюс, минус, равно, тире, скобки, маркеры для списков и т. д.
В связи с двоичной системой счёта кодировать можно только определёное число цифр 2 в какой-то степени.
2^5=32 - этого мало даже для строчных букв.
2^6=64 - этого мало с учётом строчных и заглавных букв.
2^7=128 - этого мало с учётом спецсимволов
2^8=256 - ну это нормально.
2. Кодировка Unicod введена с целью поддержки большего колическва символов. Например для китайского языка она просто необходима.
Для русского языка она не представляет крайней нужды, но благодаря её можно работать более удобно.
Например вставить знак градуса без редактора формул °, или какую-гибудб греческую букву. А если документ в формате txt? то это вобще единственный способ их вставить.
Таким образом, кодировка Unicod была создана исключительно для увелечения символов с целью удобства в работе.
1) Когда компьютеры были большими, они оперировали байтами - 8 бит, 256 комбинаций. Удобно: 1 байт - 1 символ. Первый 128 отводились под буквы английского алфавита, цифры, знаки препинания и пр. Вторые 128 - под служебную информацию. Сейчас во вторых 128 символах размещают, как правило, буквы национальных алфавитов. Поэтому существуют "русифицированные" шрифты. Такой набор из 256 символов называется кодовой таблицей.
Существуют несколько кодовых таблиц (кодировок) для русского языка, например, KOI-8R и Windows-1251. Если текст набран в одной кодировке, то прочитать его в другой невозможно - позиции букв в таблице не совпадают. Это только одна из проблем маленькой (256 символьной) таблицы.
2) Чтобы решить многие проблемы с кодировкой ввели кодовую таблицу Unicode, в которой под символ отведено уже 2 байта, и одна таблица содержит в себе все символы почти всех национальных алфавитов в строго определенной комбинации. Таким образом документ в Unicode будет везде читаться одинаково.
Приложения переводчика двоичного кода
• Наиболее распространенное применение для этой системы счисления можно увидеть в компьютерных технологиях. В конце концов, основой всего компьютерного языка и программирования является двузначная система счисления, используемая в цифровом кодировании.
• Это то, что составляет процесс цифрового кодирования, беря данные и затем изображая их с ограниченными битами информации. Ограниченная информация состоит из нулей и единиц двоичной системы. Изображения на экране вашего компьютера являются примером этого. Для кодирования этих изображений для каждого пикселя используется двоичная строка.
• Если на экране используется 16-битный код, каждому пикселю будут даны инструкции, какой цвет отображать на основе того, какие биты равны 0 и 1. В результате получается более 65 000 цветов, представленных 2 ^ 16. В дополнение к этому вы найдете применение двоичной системы счисления в математической ветви, известной как булева алгебра.
• Ценности логики и истины относятся к этой области математики. В этом приложении заявлениям присваивается 0 или 1 в зависимости от того, являются ли они истинными или ложными. Вы можете попробовать преобразование двоичного в текстовое, десятичное в двоичное, двоичное в десятичное преобразование, если вы ищете инструмент, который помогает в этом приложении.
Структура таблицы кодировки ASCII
Бинарный в ASCII
Первоначально основанный на английском алфавите, ASCII кодирует 128 указанных семибитных целочисленных символов. Можно печатать 95 кодированных символов, включая цифры от 0 до 9, строчные буквы от a до z, прописные буквы от A до Z и символы пунктуации. Кроме того, 33 непечатных контрольных кода, полученных с помощью машин Teletype, были включены в исходную спецификацию ASCII; большинство из них в настоящее время устарели, хотя некоторые все еще широко используются, такие как возврат каретки, перевод строки и коды табуляции.
Например, двоичное число 1101001 = шестнадцатеричное 69 (i – девятая буква) = десятичное число 105 будет представлять строчный I в кодировке ASCII.
Порядковый номер
Каким же образом текстовая информация представлена в памяти компьютера?
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер – по их коду.
Удобство побайтового кодирования символов очевидно, поскольку байт – наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.
Что такое ASCII?
ASCII – это стандарт кодирования символов для электронной связи, сокращенный от Американского стандартного кода для обмена информацией. В компьютерах, телекоммуникационном оборудовании и других устройствах коды ASCII представляют текст. Хотя поддерживается много дополнительных символов, большинство современных схем кодирования символов основаны на ASCII.
ASCII – это традиционное название для системы кодирования; Управление по присвоению номеров в Интернете (IANA) предпочитает обновленное имя США-ASCII, которое поясняет, что эта система была разработана в США и основана на преимущественно используемых типографских символах. ASCII является одним из основных моментов IEEE.
10000000 – 11111111
Альтернативная часть таблицы (русская).
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
32 – 127
Двоичный переводчик
Двоичный переводчик – это инструмент для перевода двоичного кода в текст для чтения или печати. Вы можете перевести двоичный файл на английский, используя два метода; ASCII и Unicode.
Двоичная система счисления
Система двоичного декодера основана на числе 2 (основание). Он состоит только из двух чисел как системы счисления base-2: 0 и 1.
Хотя бинарная система применялась в различных целях в древнем Египте, Китае и Индии, она стала языком электроники и компьютеров современного мира. Это наиболее эффективная система для обнаружения выключенного (0) и включенного (1) состояния электрического сигнала. Это также основа двоичного кода в текст, который используется на компьютерах для составления данных. Даже цифровой текст, который вы сейчас читаете, состоит из двоичных чисел. Но вы можете прочитать этот текст, потому что мы расшифровали двоичный код перевод файл, используя двоичный код слова.
Двоичное число легче прочитать, чем выглядит: это позиционная система; поэтому каждая цифра двоичного числа возводится в степень 2, начиная с 20 справа. Каждая двоичная цифра в преобразователе двоичного кода относится к 1 биту.
Интересный факт
(01101001) (01101100011011110111011001100101) (011110010110111101110101) = Я тебя люблю
Кодирование
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.
32 - 127
Структура таблицы кодировки ASCII
Разница между ASCII и UTF-8
Преимущество двоичной системы счисления
Система двоичных чисел полезна для ряда вещей. Например, компьютер щелкает переключателями для добавления чисел. Вы можете стимулировать добавление компьютера, добавляя двоичные числа в систему. В настоящее время есть две основные причины использования этой компьютерной системы счисления. Во-первых, это может обеспечить надежность диапазона безопасности. Вторично и самое главное, это помогает минимизировать необходимые схемы. Это уменьшает необходимое пространство, потребляемую энергию и расходы.
00100000 - 01111111
Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Символ 32 - пробел, т.е. пустая позиция в тексте.
Все остальные отражаются определенными знаками.
0 - 31
UTF-8 (Юникод)
Unicode и универсальный набор символов (UCS) ISO / IEC 10646 имеют гораздо более широкий диапазон символов, и их различные формы кодирования начали быстро заменять ISO / IEC 8859 и ASCII во многих ситуациях. Хотя ASCII ограничен 128 символами, Unicode и UCS поддерживают большее количество символов посредством разделения уникальных концепций идентификации (с использованием натуральных чисел, называемых кодовыми точками) и кодирования (до двоичных форматов UTF-8, UTF-16 и UTF-32-битных). ).
Просмотр содержимого документа
««Двоичное кодирование. Двоичный алфавит. Двоичный код. Разрядность двоичного кода. Связь длины двоичного кода и количества кодовых комбинаций. Практическая работа №1. Кодирование информации»»
Тема урока: «Двоичное кодирование. Двоичный алфавит. Двоичный код. Разрядность двоичного кода. Связь длины двоичного кода и количества кодовых комбинаций.
Практическая работа №1. Кодирование информации»
Цели: сформировать у учащихся понимание процесса обмена информацией; показать различные виды кодирования информации; выявить преимущества двоичного кодирования различных видов информации.
Требования к знаниям и умениям:
Учащиеся должны знать:
что такое «код», «кодирование», «двоичное кодирование», бит;
почему в вычислительной технике используется двоичное кодирование информации;
как кодируются различные виды информации в вычислительной технике.
Учащиеся должны уметь:
— восстанавливать информацию по ее кодовому представлению.
Визуальная проверка выполнения домашнего задания.
Опрос по теме знаковая система
Естественные языки (носят
речь и письменность
Формальные языки (интернациональны, понятны всем)
-русский язык; – английский язык; -и т.д.
— командные языки опера
ционных систем;
Алфавит — набор основных символов, различимых по их начертанию
– кириллица — 33 буквы;
– латиница – 26 букв;
Алфавит жестко зафиксирован.
— изображения элементов
различных схем и др.
Синтаксис — правила для образования предложений языка
Формируется из большого числа правил, из которых существуют исключения
Наличие строгих правил
Грамматика — правила правописания
Физическая природа знаков
Изображения на бумаге, звуки (фонемы), электрические импульсы и т.д.
Информация
Нахождение площади прямоугольника
Правило дорожного движения
Призыв о помощи
3. Изложение нового материала
1. Кодирование информации
Когда человек или какой-либо другой живой организм или какое-то устройство участвуют в информационном процессе, то все они представляют информацию в той или иной форме. При выполнении домашнего задания вы также представляли информацию в различных формах.
Когда мы представляем информацию в разных формах или преобразуем ее из одной формы в другую, мы информацию кодируем.
Код — это система условных знаков для представления информации.
Кодирование — это операция преобразования символов или группы символов одного кода в символы или группы символов другого кода.
Человек кодирует информацию с помощью языка.
Язык – это знаковая форма представления информации.
В процессе обмена информацией кроме кодирования информации происходит и ее декодирование.
Теоретически и экспериментально было показано, что с технической точки зрения самым удобным и эффективным является использование двоичного кода, то есть набора символов, алфавита, состоящего из пары чисел . Поскольку двоичный код используется для хранения информации в вычислительных машинах, его еще называют машинным кодом.
Цифры 0 и 1, образующие набор , обычно называют двоичными цифрами, потому что они используются как алфавит в так называемой двоичной системе счисления. Система счисления представляет собой совокупность правил и приемов наименования и записи чисел, а так же получения значения чисел из изображающих их символов. Количество знаков в алфавите системе счисления обычно отражается в ее исчислении: двоичная, восьмеричная, десятичная, шестнадцатеричная и т.д.
Элементарное устройство памяти компьютера, которое применяется для изображения одной двоичной цифры, называется двоичным разрядом или битом.
Слово «бит» произошло от английского термина bit, представляющего собой сокращение словосочетания Binary digit – двоичная цифра.
Почему именно двоичное кодирование используется в вычислительной технике? Оказывается такой способ кодирования легко реализовать технически: 1 — есть сигнал, 0 — нет сигнала. Для человека такой способ кодирования неудобен тем, что двоичные последовательности получаются достаточно длинными. Но технике легче иметь дело с большим числом однотипных элементов, чем с небольшим числом сложных.
Как разные виды информации кодируются в компьютере?
В двоичной системе счисления для записи чисел используется всего две цифры — 1 и 0. С их помощью можно записать любое число. Во всем остальном эта система счисления не отличается от привычной для вас десятичной системы. Она обладает всеми теми же свойствами, в ней соблюдаются все основные законы выполнения арифметических операций.
3. Кодирование текстовой информации
Для кодирования текстовой информации в компьютере также применяется двоичное кодирование, т.е. представление текста в виде последовательности 0 и 1. Каждому символу алфавита сопоставили определенное целое число, которое и принято считать кодом этого символа.
Бит – это очень маленькая порция информации. Поэтому, так же как и при записи десятичных чисел, используется несколько десятичных разрядов – разряд единиц, разряд десятков, сотен и т.д., так и для записи двоичных чисел используется несколько двоичных разрядов, несколько битов.
Для хранения двоичных чисел в компьютере используется устройство, которое принято называть ячейкой памяти. / Память компьютера можно образно представить себе как автоматическую камеру хранения, состоящую из отдельных ячеек, в каждую из которых можно положить некоторое число./
Ячейки образуются из нескольких битов, так же как двоичные числа образуются из двоичных разрядов. В общем случае ячейки различных компьютеров могут состоять из различного количества битов. Поэтому, начиная с машин третьего поколения, стандартными являются те ячейки, которые состоят из восьми битов.
Элемент памяти компьютера, состоящий из восьми битов, называется байтом.
Преобразуйте двоичный текст в текстовый / английский или ASCII, используя prepostseoБинарный переводчик. Введите двоичные числа (например, 01000101 01111000 01100001 01101101 01110000 01101100 01100101) и нажмите кнопку Преобразовать
Вспомним некоторые известные нам факты:
Множество символов, с помощью которых записывается текст, называется алфавитом.
Число символов в алфавите – это его мощность.
Формула определения количества информации: N = 2 b ,
где N – мощность алфавита (количество символов),
b – количество бит (информационный вес символа).
В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным.
Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.
Единице измерения 8 бит присвоили название 1 байт:
Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
128 - 255
00000000 – 00011111
Символы с номерами от 0 до 31 принято называть управляющими.
Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.
Понятно, что это дело условное, можно придумать множество способов кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.
Первая половина таблицы кодов ASCII
Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.
Для букв русского алфавита также соблюдается принцип последовательного кодирования.
Символ
0 – 31
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Для разных типов ЭВМ используются различные таблицы кодировки.
Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).
Таблица кодов ASCII делится на две части.
Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от (00000000), до 127 (01111111).
00000000 - 00011111
Символы с номерами от 0 до 31 принято называть управляющими.
Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Символ
Вторая половина таблицы кодов ASCII
От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 ("CP" означает "Code Page", "кодовая страница").
Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.
Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.
С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.
Цель: сформировать у учащихся понимание процесса обмена информацией; показать различные виды кодирования информации; выявить преимущества двоичного кодирования различных видов информации.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
Для разных типов ЭВМ используются различные таблицы кодировки.
Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).
Таблица кодов ASCII делится на две части.
Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0(00000000), до 127 (01111111).
— Random Fact —
Первая половина таблицы кодов ASCII
Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.
Для букв русского алфавита также соблюдается принцип последовательного кодирования.
00100000 – 01111111
Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.
Символ 32 – пробел, т.е. пустая позиция в тексте.
Все остальные отражаются определенными знаками.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.
Понятно, что это дело условное, можно придумать множество способов кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.
128 – 255
Использование ASCII
ASCII важен, потому что при разработке компьютерам был дан общий язык.
В 1963 году ASCII впервые был коммерчески использован в качестве семибитного кода телепринтера для сети TWX (Teletype Writer eXchange) American Telephone & Telegraph. Первоначально TWX использовал предыдущую пятибитную ITA2, которую также использовала конкурирующая телепринтерная система Telex. Боб Бемер представил такие функции, как последовательность побега. По словам Бемера, его британский коллега Хью МакГрегор Росс помог популяризировать эту работу – «настолько, что код, который стал ASCII, впервые был назван Кодексом Бемера-Росса в Европе». Из-за его обширной работы ASCII, Бемер был назван "отцом ASCII".
До декабря 2007 года, когда кодировка UTF-8 превосходила ее, ASCII была наиболее распространенной кодировкой символов во Всемирной паутине; UTF-8 обратно совместим с ASCII.
Вспомним некоторые известные нам факты:
Множество символов, с помощью которых записывается текст, называется алфавитом.
Число символов в алфавите – это его мощность.
Формула определения количества информации: N = 2 b ,
где N – мощность алфавита (количество символов),
b – количество бит (информационный вес символа).
В алфавит мощностью 256 символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным.
Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.
Единице измерения 8 бит присвоили название 1 байт:
Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти.
10000000 - 11111111
Альтернативная часть таблицы (русская).
Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.
Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.
Читайте также: