Минимальная единица информации в текстовом процессоре это
Текстовый документ – запечатлённая письменно информация, которую можно передать с помощью речевого аппарата, вместе с нетекстовым содержимым (графика). Слово происходит из латинского языка, приблизительное значение – «свидетельство» или «доказательство». Ныне это и электронный, и бумажный носитель информации. Рассмотрим основные структурные единицы текстового документа. Выясним, зачем эти компоненты нужны.
Самые большие единицы измерения
Существуют еще более крупные величины в метрологии цифровых измерений:
1 Петабайт (Пб /Пбайт) = 1024 Тбайт = 2 10 Тбайт.
1 Эксабайт (Эб / Эбайт) = 1024 Пбайт = 2 10 Пбайт.
1 Зеттабайт (Зб / Збайт) = 1024 Эбайт = 2 10 Эбайт.
1 Йоттабайт (Йб / Йбайт) = 1024 Збайт = 2 10 Збайт.
Петабайты используют для измерения объема данных, обрабатываемых в интернете. Эксабайты удобно применять для хранения архивных документов. Зеттабайты и Йоттабайты необходимы для использования в будущем.
Измерение объема текстовой информации
Расчет информационного веса мультимедийного файла
Разберем способ подсчета количества данных на примере стандартной фотографии 10 на 15. Файл имеет размеры 1181х1772 пикселей. Для кодировки одного пикселя требуется 3 байта, следовательно, информационный объем файла вычисляется в следующей последовательности:
1181 х 1772 х 3 = 6 278 196 байт.
Чтобы перевести это количество в килобайты, разделим результат на 1024 и получим 6131,05 Кбайт. Для обозначения этой величины более удобно использовать мегабайты. Для перевода выполним следующее арифметическое действие:
6131,05 / 1024 = 5,99 Мбайт.
Примеры подсчета объема информации в мультимедиа, тексте
Понятие мультимедиа включает в себя файлы, содержащие изображения, звук и видео. Для определения веса такой формы информации чаще применяют килобайты и мегабайты.
Основные элементы
- Заголовок, заглавие, название (H1) – отражает суть, обозначает тематику содержимого, привлекает читателей.
- Подзаголовки H2 – H6 – главы, параграфы разного уровня, разбивающие статью на логические разделы. Обычно оделяются от абзацев иным цветом, начертанием, размером, часто выравниваются по центру. Добавляются через панель стилей.
- Оглавление – перечень подзаголовков с сохранением их иерархической структуры.
- Абзац – в текстовом редакторе это выделяемый автором фрагмент с законченной мыслью. Начинается со строки, на которую переместился курсор после нажатия клавиши
- Enter в Word и ему подобным приложениях. Первая строка обычно смещается вправо.
Сами абзацы представлены основным текстом, сносками, примечаниями. Состоят из более низких по иерархии элементов:
- Предложений – слово, их последовательность, ограниченная точками. Перед первым предложением в абзаце разделительный знак не ставится.
- Строк – символы, размещённые между левой и правой границами рабочей области, листа.
- Слов – последовательность символов, ограниченных разделительными знаками, пробелами.
- Символов – минимальная структурная единица документа: буква, цифра, спецсимвол.
- Подписи – реквизиты сторон.
Составляющими абзацев, созданных в текстовых процессорах, могут быть таблицы, сноски, колонтитулы, ссылки, примечания, пояснения, графические элементы, фигуры и прочее. К элементам и их группам применимо форматирование.
Структурированный документ повышает удобство работы и качество усвоения материала человеком, положительно отражается на его индексации поисковыми системами, если он загружается в интернет – руководство, статья для сайта, электронная книга.
Текст документа текстового редактора содержит следующие элементы:
- символ (минимальная единица текстовой информации);
- слово (любая последовательность символов, ограниченная с обоих концов служебными символами. Служебный символ - это пробел, точка, запятая, дефис и т.д.);
- предложение (любая последовательность символов между двумя точками);
- строка (любая последовательность символов между левой и правой границами абзаца);
- абзац (любая последовавтельность символов, замкнутая символом Возрат каретки - ).
Редактирование и форматирование
Редактирование — преобразование, обеспечивающее добавление, удаление, перемещение или исправление содержания документа.
Редактирование документа обычно производится путем добавления, удаления или перемещения символов или фрагментов текста.
Объектно-ориентированный подход дает возможность реализовать механизм встраивания и внедрения объектов (OLE — Object Linking Embedding). Этот механизм позволяет копировать и вставлять объекты из одного приложения в другое. Например, работая с документом в текстовом редакторе Word, в него можно встроить изображения, анимацию, звук и даже видеофрагменты и таким образом из обычного текстового документа получить мультимедиа-документ.
Форматирование — преобразование, изменяющее форму представления документа.
Любой документ состоит из страниц, поэтому в начале работы над документом необходимо задать значения параметров страницы: формат, ориентацию, поля и др. Стандартным является формат страницы А4 (21х29,7 см). Существуют две возможные ориентации страницы – книжная и альбомная. Для обычных текстов чаще используется книжная ориентация, а для таблиц с большим количеством столбцов – альбомная.
Абзац с литературной точки зрения – это часть текста, представляющая собой законченный по смыслу фрагмент произведения, окончание которого служит естественной паузой для перехода к новой мысли.
В компьютерных документах абзацем считается любой текст, заканчивающийся управляющим символом конца абзаца. Ввод конца абзаца обеспечивается нажатием клавиши ВВОД (ENTER).
Форматирование абзацев позволяет подготовить правильно и красиво оформленный документ.
В процессе форматирования абзаца задаются параметры его выравнивания (выравнивание отражает расположение текста относительно границ полей страницы), отступы (абзац целиком может иметь отступы слева и справа) и интервалы (расстояние между строк абзаца), отступ красной строки и др.
Форматирование шрифта (символов).
Символы – это буквы, цифры, пробелы, знаки пунктуации, специальные символы. Символы можно форматировать (изменять их внешний вид). Среди основных свойств символов можно выделить следующие: шрифт, размер, начертание и цвет.
Шрифт – это полный набор символов определенного начертания. Каждый шрифт имеет своё название, например Times New Roman, Arial, Comic Sans MS. Единицей измерения шрифта является пункт (1 пт = 0,367 мм). Размеры шрифтов можно изменять в больших пределах. Кроме нормального (обычного) начертания символов обычно применяют полужирное, курсивное, полужирное курсивное.
По способу представления в компьютере различаются шрифты растровые и векторные. Для представления растровых шрифтов служат методы растровой графики, символы шрифта — это группы пикселей. Растровые шрифты допускают масштабирование только с определенными коэффициентами.
В векторных шрифтах символы описываются математическими формулами и возможно произвольное их масштабирование. Среди векторных шрифтов наибольшее распространение получили шрифты типа TrueType.
Можно также установить дополнительные параметры форматирования символов: подчеркивание символов различными типами линий, изменение вида символов (верхний и нижний индекс, зачеркнутый), изменение расстояний между символами.
Если планируется цветная печать документа, то можно задать различные цвета для различных групп символов.
Символ — минимальная единица текстовой информации. Каждый символ имеет свой код.
Слово — произвольная последовательность букв и цифр, ограниченная с двух сторон служебными символами.
Строка — произвольная последовательность символов между левой и правой границами абзаца.
Абзац — в литературе часть текста, представляющая собой смысловое единство, окончание которой служит естественной паузой для перехода к новой мысли, и обычно выделяемая отступом в первой строке. В документе, оформляемом с помощью компьютера, абзац обычно завершается специальным символом конца абзаца.
Раздел – это часть документа, в пределах которой сохраняются основные настройки редактора, прежде всего такие, как размер и ориентация страницы. Раздел заканчивается вставкой в текст невидимого символа конца раздела. Любой документ содержит хотя бы один раздел.
В режиме разметки страницы на экране монитора имитируется лист бумаги, на котором создается документ. В этом режиме представление документа на экране полностью соответствует печатному. Этот режим удобен для форматирования документа при подготовке его к печати.
Процедуры форматирования и редактирования текста.
Операции форматирования Различают три основные операции форматирования: 1. “Форматирование символов”. При форматировании символов речь идет, в основном, об изменении стиля написания текста. Например, шрифт, интервал
2. “Форматирование абзацев”. Под форматированием абзацев понимается изменение размеров полей отдельных абзацев в тексте, изменение интервалов между строками и абзацами, выравнивание абзацев.
1. выравнивание абзацев (по левому краю, по центру, по правому краю);
3. изменение цвета фона и заливка;
4. установление рамок и линий нарисованных вокруг и внутри абзаца;
5. установку абзацных отступов;
6. установку отступа первой строки абзаца;
7. установку расстояния между строками;
8. установку расстояния между абзацами;
9. контроль положения абзаца на странице
3. “Форматирование страниц”. Под форматированием страниц понимается выбор размера бумаги, положение страниц при печати документа, установка верхних, нижних, левых и правых полей, выбор источника бумаги.
К функциям редактирования текста относятся следующие:
Копирование и перемещение фрагментов текста
Технология выполнения этих операций включает в себя несколько этапов:
· — выделение части текста (фрагмента);
· — перенос выделенного фрагмента в буфер промежуточного хранения;
· — перемещение курсора в нужное место документа;
· — копирование (перенос) выделенного фрагмента из буфера в место документа, указанное курсором.
Удаление текста.
Операция откатки. Во многих программных средствах, в том числе и в текстовом процессоре, предусмотрена операция откатки. Для реализации этой операции текстовый процессор фиксирует последовательность действий по изменению текста в виде последовательных шагов
Автоматизация создания и обработки текстовых электронных документов.
· Инструменты автоматизации редактирования:
Проверка орфографии
Автозамена, автотекст
Поиск и замена символов
· Инструменты автоматизации форматирования:
Автоперенос
Нумерация страниц
Стилевое форматирование
Создание оглавления
Нумерация таблиц, рисунков
Сортировка текста в списках и таблицах
Перекрестные ссылки в тексте
Электронная таблица, как электронный документ: понятие, области применения и цели создания.
Для представления данных в удобном виде используют таблицы. Компьютер позволяет представлять их в электронной форме, а это дает возможность не только отображать, но и обрабатывать данные. Класс программ, используемых для этой цели, называется электронными таблицами.
Особенность электронных таблиц заключается в возможности применения формул для описания связи между значениями различных ячеек. Расчет по заданным формулам выполняется автоматически. Изменение содержимого какой-либо ячейки приводит к пересчету значений всех ячеек, которые с ней связаны формульными отношениями и, тем самым, к обновлению всей таблицы в соответствии с изменившимися данными.
Применение электронных таблиц упрощает работу с данными и позволяет получать результаты без проведения расчетов вручную или специального программирования. Наиболее широкое применение электронные таблицы нашли в экономических и бухгалтерских расчетах, но и в научно-технических задачах электронные таблицы можно использовать эффективно, например для:
проведения однотипных расчетов над большими наборами данных;
автоматизации итоговых вычислений;
решения задач путем подбора значений параметров, табулирования формул;
обработки результатов экспериментов;
проведения поиска оптимальных значений параметров;
подготовки табличных документов;
построения диаграмм и графиков по имеющимся данным.
Одним из наиболее распространенных средств работы с документами, имеющими табличную структуру, является программа Microsoft Excel.
В действительности применение Microsoft Excel сегодня базируется на решении таких распространенных задач для компаний и предприятий в любой отрасли, как составление деловой графики, различных бланков, отчетности, иногда - полного баланса. На многих предприятиях электронные таблицы используются для обработки заказов, учета кадров, расчета налогов и зарплаты и многих других.
Но область применения электронных таблиц не ограничивается их использованием для задач учета. Наличие мощного аппарата инженерных и математических функций позволяет решать большой спектр задач в области технических и многих естественных наук, для быстрой обработки больших массивов данных.
Использование формул и функций в электронных таблицах. Абсолютная и относительная адресация.
Для вычислений в формулах используют различные виды адресации.
Адрес ячейки, изменяющийся при копировании формулы называется относительным. Он имеет вид В1, А3. По умолчанию программа Excel рассматривает адреса ячеек как относительные.
Относительная адресация ячеек – обычное явление при вычислениях по формулам. При копировании такой формулы вправо или влево будет изменяться заголовок столбца в имени ячейки, а при копировании вверх или вниз – номер строки.
Абсолютная адресация используется в том случае, когда нужно использовать значение,которое не будет меняться в процессе вычислений. Тогда записывают, например, так: =$А$5. Соответственно, при копировании такой формулы в другие ячейки текущего рабочего листа, в них всегда будет значение =$А$5. Для того, чтобы задать ячейке абсолютный адрес, необходимо перед номером строки и номером столбца указать символ “$” либо нажать клавишу F4.
45. Форматы данных в электронных таблицах. Форматирование ячеек.
Числовой формат
Формат числа может быть:
· целым или с дробной частью (например, 123, –456 или –123,45);
· дробным (например, 1/4 или 23/45);
· денежным (например, 123 р., –123,45р., 123,4512 р. или 123,4 р.);
· датой (например, 15.11.99 или 21 мар 98);
· временем (например, 14:30 или 2:30:53 PM).
Для целых и дробных чисел могут применяться разделители (разрядов) при вводе больших чисел (точки, пробелы и т.д.). Для целого, дробного денежного форматов чисел можно задать количество знаков в дробной части (после запятой).
Текст
В электронных таблицах текст – это совокупность символов, использующаяся для оформления таблицы (заголовки, пояснения и т.д.).
Формулы
Формула всегда начинается со знака = (равно). Она может содержать числа, адреса ячеек или диапазонов, имена функций, соединенные знаками операций +, –, * (умножить), / (разделить), ^ (возвести в степень) и скобками.
Минимальной единицей измерения количества информации является бит, а следующей по величине единицей – байт, причем
1 байт = 8 битов
В международной системе СИ используют десятичные приставки «Кило» (103), «Мега» (106), «Гига» (109),… В компьютере информация кодируется с помощью двоичной знаковой системы, поэтому в кратных единицах измерения количества информации используется коэффициент 2n.
1 килобайт (Кбайт) = 210 байт = 1024 байт
1 мегабайт (Мбайт) = 210 Кбайт = 1024 Кбайт
1 гигабайт (Гбайт) = 210 Мбайт = 1024 Мбайт
1 терабайт (Тбайт) = 210 Гбайт = 1024 Гбайт
Терабайт – очень крупная единица измерения информации, поэтому применяется крайне редко. Всю информацию, которое накопило человечество, оценивают в десятки терабайт.
Двоичное кодирование текстовой информации Начиная с конца 60-х годов компьютеры все больше стали использоваться для обработки текстовой информации, и в настоящее время большая часть персональных компьютеров в мире значительную часть времени занято обработкой именно ТЕКСТОВОЙ информации.
Для представления текстовой информации обычно используется 256 различных символов (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т. д.). Поставим вопрос: «Какое количество бит информации или двоичных разрядов необходимо, чтобы закодировать 256 различных символов?»
256 различных символов можно рассматривать как 256 различных состояний (событий). В соответствии с вероятностным подходом к измерению количества информации необходимое количество информации для двоичного кодирования 256 символов равно;
I = log2 256 = 8 бит = 1 байт
Следовательно, для двоичного кодирования 1 символа необходим 1 байт информации или 8 двоичных разрядов. Таким образом, каждому символу соответствует своя уникальная последовательность из восьми нулей и единиц.
Присвоение символу конкретного двоичного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. К сожалению, существуют пять различных кодировок русских букв, поэтому тексты — созданные в одной кодировке, не будут правильно отображаться в другой.
Наиболее распространенная кодировка — это стандартная кириллическая кодировка Microsoft Windows, обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая страница»). Все Windows-приложения, работающие с русским языком, поддерживают эту кодировку.
28 = 256 символов.
Для работы в среде операционной системы MS DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft — кодировка CP866.
Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Мае).
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.
Наконец, появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а целых 65 536. Эту кодировку поддерживает пакет Microsoft Office 97-2003.
Двоичное кодирование текста происходит следующим образом: при нажатии на определенную клавишу в компьютер передается определенная последовательность электрических импульсов, причем каждому символу соответствует своя последовательность электрических импульсов (нулей и единиц на машинном языке). Программа драйвер клавиатуры и экрана по кодовой таблице определяет символ и создает его изображение на экране.
Таким образом, тексты хранятся в памяти компьютера в двоичном коде и программным способом преобразуются в изображения на экране.
Двоичное кодирование графической информации
С 80-х годов бурно развивается технология обработки на компьютере ГРАФИЧЕСКОЙ информации. Компьютерная графика широко используется в компьютерном моделировании в научных исследованиях, компьютерных тренажерах, компьютерной анимации, деловой графике, играх и т. д.
В последние годы, в связи с резким ростом аппаратных возможностей персональных компьютеров, пользователи получили возможность обрабатывать ВИДЕО информацию.
Графическая информация на экране дисплея представляется в виде изображения. Которое формируется из точек (пикселей). В современных компьютерах разрешающая способность (количество точек на экране дисплея), а также количество цветов зависит от видеоадаптера и может меняться программно.
Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65 536 цветов (high color), 16 777 216 цветов (true color). Каждый цвет представляет собой одно из вероятных состояний точки экрана. Рассчитаем количество бит на точку, необходимых для режима true color: I = logs 65 536-16 бит = 2 байт.
Наиболее распространенной разрешающей способностью экрана является разрешение 800 на 600 точек, т.е. 480000 точек. Рассчитаем необходимый для режима true color объем видеопамяти: 1 = 2 байт 480 000 = 960 000 байт = 937,5 Кб. Аналогично рассчитывается объем видеопамяти, необходимый для хранения битовой карты изображений при других видеорежимах.
Минимальная единица измерения
Данные в ЭВМ хранятся и обрабатываются в двоичной системе, то есть буквы, цифры и другие символы выглядят как код из единиц и нулей. Вес одного двоичного знака равен одному биту.
Бит – это наименьшая единица измерения цифровых данных.
Осторожно! Если преподаватель обнаружит плагиат в работе, не избежать крупных проблем (вплоть до отчисления). Если нет возможности написать самому, закажите тут.
Более крупные единицы измерения
Возрастание объема данных, обрабатываемых вычислительными устройствами, привело к введению более крупных единиц измерения.
1 килобайт (Кб / Кбайт) = 1024 байт = 2 10 байт.
1 мегабайт (Мб / Мбайт) = 1024 килобайт = 2 10 Кбайт.
1 гигабайт (Гб / Гбайт) = 1024 мегабайт = 2 10 Мбайт.
1 терабайт (Тб / Тбайт) = 1024 гигабайт = 2 10 Гбайт.
В Кбайтах, Мбайтах, Гбайтах и Тбайтах измеряется объем запоминающих устройств. Максимальный объем современных жестких дисков достигает 14 ТБ. Биты, килобайты, мегабайты используются для измерения скорости передачи данных.
Структура документа: что это
Замечали, как выглядят текстовые файлы в программе Word или её аналогах? Это не сплошной текст. В них есть заголовки разного уровня, абзацы, зачастую – заглавие, сноски с пояснениями, ссылками на источники. Книги, даже написанные от руки лекции, имеют структуру: информация в них упорядочена особым образом для наглядности, быстрого анализа, навигации, оценки содержимого, упрощения восприятия данных. Причём структура документа иерархическая: сначала идёт заголовок, затем – подзаголовки, под ними – параграфы, состоящие из абзацев и т. д.
Структуру текстового документа определяет шаблон – это своего рода матрица, заготовка, файл со стилями. Последние применяются к файлу в момент его создания на основании копии шаблона. Он ускоряет работу – вместо нового набора и форматирования содержимого нужно лишь внести коррективы, заполнить поля заготовки, как при заполнении анкет.
Читайте также: