Организация данных в компьютерных системах кодирование информации структуры данных типы данных
Группу связанных между собой элементов данных называют обычно записью. Известны три основных типа организации данных и связей между ними: иерархический (в виде дерева), сетевой и реляционный.
В иерархической БД существует упорядоченность элементов в записи, один элемент считается главным, остальные – подчиненными. Данные в записи упорядочены в определенную последовательность, как ступеньки лестницы, и поиск данных может осуществляться лишь последовательным «спуском» со ступеньки на ступеньку. Поиск какого-либо элемента данных в такой системе может оказаться довольно трудоемким из-за необходимости последовательно проходить несколько предшествующих иерархических уровней. Иерархическую БД образует каталог файлов, хранимых на диске; дерево каталогов, доступное для просмотра в Norton Commander, – наглядная демонстрация структуры такой БД и поиска в ней нужного элемента (при работе в операционной системе MS-DOS). Такой же базой данных является родовое генеалогическое дерево.
Рисунок 12.1. Иерархическая модель базы данных
Эта база данных отличается большей гибкостью, так как в ней существует возможность устанавливать дополнительно к вертикальным иерархическим связям горизонтальные связи. Это облегчает процесс поиска требуемых элементов данных, так как уже не требует обязательного прохождения всех предшествующих ступеней.
Рисунок 12.2. Сетевая модель базы данных
Наиболее распространенным способом организации данных является третий, к которому можно свести как иерархический, так и сетевой – реляционный (англ. relation – отношение, связь). В реляционной БД под записью понимается строка прямоугольной таблицы. Элементы записи образуют столбцы этой таблицы (поля). Все элементы в столбце имеют одинаковый тип (числовой, символьный), а каждый столбец – неповторяющееся имя. Одинаковые строки в таблице отсутствуют. Преимущество таких БД – наглядность и понятность организации данных, скорость поиска нужной информации. Примером реляционной БД служит таблица на странице классного журнала, в которой записью является строка с данными о конкретном ученике, а имена полей (столбцов) указывают, какие данные о каждом ученике должны быть записаны в ячейках таблицы.
Рисунок 12.3. Реляционная модель базы данных
Совокупность БД и программы СУБД образует информационно-поисковую систему, называемую банком данных.
1. По технологии обработки данных базы данных делятся на централизованные и распределенные. Централизованная база данных хранится в памяти одной вычислительной системы. Если эта вычислительная Система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Этот способ использования баз данных часто применяют в локальных сетях ПК. Распределенная база данных состоит из нескольких, возможно, пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
2. По способу доступа к данным базы данных делятся на базы данных с локальным доступом и базы данных с удаленным (сетевым доступом). Системы централизованных баз данных с сетевым доступом предполагают различные архитектуры таких систем: файл-сервер; клиент-сервер.
Архитектура систем БД с сетевым доступом предполагает выделение одной из машин сети в качестве центральной (сервер файлов). На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы базы данных в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производится обработка. При большой интенсивности доступа к одним и тем же данным производительность такой информационной системы падает. Пользователи могут создавать также на рабочих станциях локальные БД, которые используются ими монопольно. Схема обработки информации по принципу файл-сервер изображена на рисунке.
В отличие от предыдущей системы, центральная машина (сервер базы данных), помимо хранения централизованной базы данных, должна обеспечивать выполнение основного объема обработки данных. Запрос на использование данных, выдаваемый клиентом (рабочей станцией), приводит к поиску и извлечению данных на сервере. Извлеченные данные транспортируются по сети от сервера к клиенту. Спецификой архитектуры клиент-сервер является использование языка запросов SQL.
Данный текст является ознакомительным фрагментом.
Продолжение на ЛитРес
Типы данных
Типы данных Приведенные в этой главе таблицы взяты непосредственно из оперативной справочной системы и представляют единую модель данных Windows (Windows Uniform Data Model). Определения типов можно найти в заголовочном файле BASETSD.H, входящем в состав интегрированной среды разработки
Типы данных
Типы данных В JScript поддерживаются шесть типов данных, главными из которых являются числа, строки, объекты и логические данные. Оставшиеся два типа — это null (пустой тип) и undefined (неопределенный
14.5.1 Типы данных
14.5.1 Типы данных Файл может содержать текст ASCII, EBCDIC или двоичный образ данных (существует еще тип, называемый локальным или логическим байтом и применяемый для компьютеров с размером байта в 11 бит). Текстовый файл может содержать обычный текст или текст, форматированный
20.10.3 Типы данных MIB
20.10.3 Типы данных MIB Причиной широкого распространения SNMP стало то, что проектировщики придерживались правила "Будь проще!"? Все данные MIB состоят из простых скалярных переменных, хотя отдельные части MIB могут быть логически организованы в таблицы.? Только небольшое число
Типы данных
Типы данных Несмотря на то, что типы данных подробно описаны в документации (см. [1, гл. 4]), необходимо рассмотреть ряд понятий, которые будут часто использоваться в последующих главах книги. Помимо изложения сведений общего характера будут рассмотрены также примеры
Типы данных
Типы данных Один из этапов проектирования базы данных заключается в объявлении типа каждого поля, что позволяет процессору базы данных эффективно сохранять и извлекать данные. В SQL Server предусмотрено использование 21 типа данных, которые перечислены в табл. 1.1.Таблица 1.1.
Пользовательские типы данных
Пользовательские типы данных Для объявления пользовательских типов, используют конструкцию вида:type имя_типа = описание_типа;К примеру, таким образом можно объявлять типы множеств, перечислимые типы и
Основные типы данных
Основные типы данных Ключевые слова: Основные типы данных определяются с помощью следующих семи ключевых слов: int, long, short, unsigned, char, float, double Целые со знаком: Могут иметь положительные и отрицательные значения.int: основной тип целых чисел для конкретной системы.long или long int:
1. Базовые типы данных
1. Базовые типы данных Типы данных, как и отношения, делятся на базовые и виртуальные.(О виртуальных типах данных мы поговорим чуть позже, посвятим этой теме отдельную главу.)Базовые типы данных – это любые типы данных, заданные в системах управления базами данных
Базовые типы данных
Базовые типы данных В языке Си реализован набор типов данных, называемых "базовыми" типами. Спецификации этих типов перечислены в таблице 3.1.Таблица 3.1. Базовые типы Спецификация типов Целые signed char знаковый символьный signed int знаковый целый signed short int знаковый
Типы данных
Типы данных Многие языки программирования при объявлении переменной требуют указывать, какой тип данных будет ей присваиваться. Например, в языке Java кодint i = 15;объявит переменную целого типа int с именем i и присвоит ей значение 15. В этом случае тип данных ставится в
Типы данных
12.2. Типы баз данных
12.2. Типы баз данных Группу связанных между собой элементов данных называют обычно записью. Известны три основных типа организации данных и связей между ними: иерархический (в виде дерева), сетевой и реляционный.Иерархическая БДВ иерархической БД существует
5.2.4. Типы данных
5.2.4. Типы данных Мы можем вводить в ячейки следующие данные: текст, числа, даты, также приложение Numbers предоставляет возможность добавлять флажки, ползунки и другие элементы управления. Аналогично MS Excel для выравнивания чисел, дат и текстовых данных в Numbers существуют
Любой носитель можно характеризовать параметром разрешающей способности (количеством данных, записанных в принятой для носителя единице измерения) и динамическим диапазоном (логарифмическим отношением интенсивности амплитуд максимального и минимального регистрируемого сигналов). От этих свойств носителя нередко зависят такие свойства информации, как полнота, доступность и достоверность. В базе данных, размещаемой на компакт-диске, проще обеспечить полноту информации, чем в аналогичной по назначению базе данных, размещенной на гибком магнитном диске, поскольку в первом случае плотность записи данных на единице длины дорожки намного выше.
В ходе информационного процесса данные преобразуются из одного вида в другой с помощью методов. Обработка данных включает в себя множество различных операций. В структуре возможных операций с данными можно выделить следующие основные:
· сбор данных информации с целью обеспечения достаточной полноты для принятия решений;
· формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;
· фильтрация данных — отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;
· сортировка данных — упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;
· · архивация данных — организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;
· защита данных — комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;
· транспортировка данных и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя — клиентом;
Под организацией данных понимается совокупность методов и средств, позволяющая эффективно использовать данные при решении информационных задач.
В любых автоматизированных системах данные организованы с помощью двух основных типов данных:
Под базой данных понимается упорядоченное или структурированное, определенным образом, информация, необходимая для решения информационных задач в АС.
БД выполняет сложные основные функции:
· преобразование к виду, удобному для обработки.
Внутримашинные базы данных представляют собой совокупность структурированных данных и управляющих программ, обеспечивающих работу с данными.
Внутримашинняя база данных состоит из двух основных частей:
· совокупности данных, представленных связанными файлами
· системы управления базой данных (СУБД), представляющие программное обеспечение обработки данных.
Данные в компьютере могут храниться с помощью двух основных способов:
1. файловая система
Данные, организованные в файловой системе (Windows) – это совокупность файлов и папок, упорядоченных в иерархическую структуру.
Основное отличие файловой системы от базы данных – файлы между собой не связаны, независимы. Преимущество файловой структуры заключается в простоте работы с данными. Недостатки заключаются в малой эффективности решения задач поиска и извлечения нужной информации.
В базе данных данные также хранятся в файле, но эти файлы связанны между собой в определенную структуру, основное значение которой – исключить дублирование данных, обеспечить их эффективный поиск, поддержку целостности данных так, чтобы при удалении (добавлении) данных структура не нарушалась.
В настоящее время, используют реляционные типы(relation - отношение) данных. В таких базах данных, данные связаны между собой специальными типами отношений, которые позволяют эффективно хранить и обрабатывать базу данных.
Преимущества:
1. это быстрый поиск нужной информации
2. сохранение целостности данных
3. исключение дублирующего ввода данных.
1. сложность создания и поддержки баз данных
2. специальные алгоритмические языки для описания структуры данных
3. сложность поддержания целостности данных
4. для работы с базой данных требуются специалисты высокой квалификации (администраторы базы данных).
Наиболее известные СУБД:
Задачи эффективного представления и хранения данных, в настоящее время, не решена до конца, поэтому пользователь всегда стоит перед проблемой выбора: «Какую СУБД использовать в своей информационной системе?»
СУБД Access предназначена для решения задач в информационной системе малых предприятий.
Под немашинной информацией БД понимается совокупность методов и средств кодирования, идентификации, хранения, поиска и извлечения данных, хранящихся в немашинной форме представления:
· Нормативно – справочный материал
· Подлинники документов (фото/киноматериал, накладные, видео/аудио материал, на кассетах с магнитной лентой).
Для немашинной информации центральную роль играют методы и технологии классификаций и кодирования информации. Существуют стандарты на методы классификации и кодирование информации, а также общероссийские классификаторы документов в различных прикладных областях.
Под типом данных (data type) понимается множество величин, объединенных определенными признаками и совокупностью допустимых преобразований.
Так, если в качестве объединяющего признака используется вид данных, то данные можно разделить на следующие типы:
Например, в MS Excel выделяются три основных типа данных: число, текст и формула.
Если в качестве объединяющего признака использовать способ представления данных в вычислительных системах (алгоритмических языках программирования), то данные можно разделить на следующие типы:
• целочисленный – используется для представления целых чисел;
• вещественный – используется для представления чисел с плавающей запятой (точкой);
• строковый – используется для представления строки символов;
• логический – используется для представления логических значений «ложь» или «истина»;
• указательный – используется для ссылки на другой объект и т. д.
Например, в объектно-ориентированном языке программирования Visual Basic вводятся следующие типы данных: целочисленный тип обозначается Byte (целые числа от 0 до 255); Long (целые числа двойной длины); Integer (целые числа от -32768 до 32767); Single (вещественные числа одинарной точности с плавающей точкой); Double (вещественные числа двойной точности с плавающей точкой); String (текстовая строка); Boolean (логические значения, true – «истина» и false – «ложь»); Object (ссылка на другой объект).
Если в качестве объединяющего признака выбрать пригодность данных к решению задач управления, то данные можно разделить на данные, которые:
• используются при принятии решений;
• обычно непосредственно не используются при принятии решений, но накапливаются для возможного использования в определенных ситуациях;
• не используются при принятии решений и их использование не предусматривается, такие данные избыточные.
Таким образом, в зависимости от принятого классификационного признака данные можно разделять на типы.
Под структурой данных (data structure) понимается множество элементов данных, которые определенным образом объединены и упорядочены.
Для объединения данных применяют линейные, табличные, иерархические и сетевые структуры.
Линейная структура данных, называемая также списком, – это упорядоченная структура, в которой адрес элемента данных однозначно определяется его индексом (номером). Примером линейной структуры может быть список сотрудников коммерческой фирмы и т. д. В списках обычно новый элемент начинается с новой строки. Если элементы располагаются в строку, вводят разделительные знаки между элементами.
Табличная структура данных – это упорядоченная структура, в которой адрес элемента данных однозначно определяется двумя числами – номером строки и номером столбца, на пересечении которых находится ячейка с исходным элементом. Характерным примером такой организации данных являются данные, записанные в соответствующие ячейки программы MS Excel.
Иерархическая структура данных – это упорядоченная структура, в которой адрес каждого элемента определяется путем (маршрутом доступа), идущим от вершины структуры к данному элементу. В иерархической структуре элементы распределены по уровням. Каждый элемент более высокого уровня может состоять из элементов нижнего уровня, а элемент нижнего уровня может входить в состав только одного элемента более высокого уровня. Примером такой структуры является левая часть окна утилиты «Проводник» операционной системы Windows (рис. 6.1) или почтовые адреса.
Сетевая структура – структура, в которой элементы связаны между собой произвольным образом, например сетевая база данных.
Кроме приведенных выше существуют структуры данных, определяемые той или иной предметной областью. Например, в системах управления базами данных (СУБД) данные могут быть объединены и упорядочены в следующие структуры:
В математических и других дисциплинах могут использоваться такие структуры данных, как массив (структурированный тип данных, состоящий из некоторого числа элементов одного типа), запись (совокупность элементов данных разного типа), множество (тип данных, состоящий из однотипных неповторяющихся элементов) и т. д.
Данный текст является ознакомительным фрагментом.
Продолжение на ЛитРес
Объекты VFS и их структуры данных
Объекты VFS и их структуры данных Виртуальная файловая система (VFS) объектно-ориентированна[69]. Общая файловая модель представлена набором структур данных. Эти структуры данных очень похожи на объекты. Так как ядро программируется строго на языке С, то, при отсутствии
Структуры данных
Структуры данных Первое, в чем следует разобраться, — это структуры данных, которые управляют работой библиотеки:• управляющая структура resmgr_attr_t• таблица функций установления соединения resmgr_connect_funcs_t• таблица функций ввода-вывода resmgr_io_funcs_t и еще одна внутренняя
11.7.1. Структуры данных
11.7.1. Структуры данных Хотя код в ladsh1.с поддерживает концепцию задания как множества процессов (предположительно, объединенных вместе каналами), он не предоставляет способа указания того, какие файлы использовать для ввода и вывода. Чтобы позволить это, добавляются новые
Структуры данных процесса
Структуры данных процесса Каждый процесс представлен в системе двумя основными структурами данных — proc и user, описанными, соответственно, в файлах <sys/proc.h> и <sys/user.h>. Содержимое и формат этих структур различны для разных версий UNIX. В табл. 3.1 приведены некоторые поля
Структуры данных
Структуры данных Структура данных socket, описывающая сокет, представлена на рис. 6.21. В этой структуре хранится информация о типе сокета (so_type), его текущем состоянии (so_state) и используемом протоколе (so_proto). Рис. 6.21. Структуры данных сокетаСокет является коммуникационным узлом
2.3 СТРУКТУРЫ ДАННЫХ ЯДРА
2.3 СТРУКТУРЫ ДАННЫХ ЯДРА Большинство информационных структур ядра размещается в таблицах фиксированного размера, а не в динамически выделенной памяти. Преимущество такого подхода состоит в том, что программа ядра проста, но в ней ограничивается число элементов
14.5 Типы данных, структуры файлов и методы пересылки
14.5 Типы данных, структуры файлов и методы пересылки На обоих концах соединения необходимо обеспечить единый формат для пересылаемых данных. Этот файл текстовый или двоичный? Он структурирован по записям или по блокам?Для описания формата пересылки используются три
1. Абстрактные структуры данных
1. Абстрактные структуры данных Структурированные типы данных, такие как массивы, множества, записи, представляют собой статические структуры, так как их размеры неизменны в течение всего времени выполнения программы.Часто требуется, чтобы структуры данных меняли свои
1. Древовидные структуры данных
1. Древовидные структуры данных Древовидной структурой данных называется конечное множество элементов-узлов, между которыми существуют отношения – связь исходного и порожденного.Если использовать рекурсивное определение, предложенное Н. Виртом, то древовидная
Проектирование структуры данных
Проектирование структуры данных Как и построение здания, построение базы данных начинается с проектирования. Чтобы понять, какая структура базы будет для вас наиболее удобной и полезной, следуйте нижеприведенным этапам проектирования.1. Для начала необходимо выяснить,
6.1. Оптимизация структуры данных
6.1. Оптимизация структуры данных Если «узким местом» вашей базы данных является одна или несколько таблиц, попробуем скорректировать структуру этих таблиц:• выбрать наиболее подходящий тип таблицы;• минимизировать объем данных в таблице;• пересмотреть набор
Глава 2 Ввод данных. Типы, или форматы, данных
Глава 2 Ввод данных. Типы, или форматы, данных Работа с документами Excel сопряжена с вводом и обработкой различных данных, то есть ин формации, которая может быть текстовой, числовой, финансовой, статистической и т. д. МУЛЬТИМЕДИЙНЫЙ КУРС Методы ввода и обработки данных
14. Структуры и другие типы данных
14. Структуры и другие типы данных СТРУКТУРЫ ДАННЫХСТРУКТУРНЫЕ ШАБЛОНЫ, ТЕГИ И ПЕРЕМЕННЫЕДОСТУПНЫЕ ЧАСТИ СТРУКТУРЫСТРУКТУРНЫЕ УКАЗАТЕЛИСТРУКТУРНЫЕ МАССИВЫФУНКЦИИ И СТРУКТУРЫОБЪЕДИНЕНИЯСОЗДАНИЕ НОВЫХ ТИПОВКЛЮЧЕВЫЕ СЛОВА struct, union, typedefОПЕРАЦИИ -> Успех программы
Полиморфные структуры данных
Полиморфные структуры данных Рассмотрим массив многоугольников:poly_arr: ARRAY [POLYGON]Когда некоторое значение x присваивается элементу этого массива, как в вызовеpoly_arr.put (x, some_index)(для некоторого допустимого значения индекса some_index), то спецификация класса ARRAY указывает, что тип
17. Абстрактные структуры данных
17. Абстрактные структуры данных Структурированные типы данных, такие как массивы, множества, записи, представляют собой статические структуры, так как их размеры неизменны в течение всего времени выполнения программы.Часто требуется, чтобы структуры данных меняли свои
20. Древовидные структуры данных
20. Древовидные структуры данных Древовидной структурой данных называется конечное множество элементов-узлов, между которыми существуют отношения – связь исходного и порожденного.Если использовать рекурсивное определение, предложенное Н. Виртом, то древовидная
В настоящее время во всех вычислительных машинах информация представляется с помощью электрических сигналов. При этом возможны две формы ее представления – в виде непрерывного сигнала (с помощью сходной величины – аналога) и в виде нескольких сигналов (с помощью набора напряжений, каждое из которых соответствует одной из цифр представляемой величины).
Первая форма представления информации называется аналоговой, или непрерывной. Величины, представленные в такой форме, могут принимать принципиально любые значения в определенном диапазоне. Количество значений, которые может принимать такая величина, бесконечно велико. Отсюда названия – непрерывная величина и непрерывная информация. Слово непрерывность отчетливо выделяет основное свойство таких величин – отсутствие разрывов, промежутков между значениями, которые может принимать данная аналоговая величина. При использовании аналоговой формы для создания вычислительной машины потребуется меньшее число устройств (каждая величина представляется одним, а не несколькими сигналами), но эти устройства будут сложнее (они должны различать значительно большее число состояний сигнала). Непрерывная форма представления используется в аналоговых вычислительных машинах (АВМ). Эти машины предназначены в основном для решения задач, описываемых системами дифференциальных уравнений: исследования поведения подвижных объектов, моделирования процессов и систем, решения задач параметрической оптимизации и оптимального управления. Устройства для обработки непрерывных сигналов обладают более высоким быстродействием, они могут интегрировать сигнал, выполнять любое его функциональное преобразование и т. п. Однако из-за сложности технической реализации устройств выполнения логических операций с непрерывными сигналами, длительного хранения таких сигналов, их точного измерения АВМ не могут эффективно решать задачи, связанные с хранением и обработкой больших объемов информации.
Вторая форма представления информации называется дискретной (цифровой). Такие величины, принимающие не все возможные, а лишь вполне определенные значения, называются дискретными (прерывистыми). В отличие от непрерывной величины, количество значений дискретной величины всегда будет конечным. Дискретная форма представления используется в цифровых электронно-вычислительных машинах (ЭВМ), которые легко решают задачи, связанные с хранением, обработкой и передачей больших объемов информации.
Для автоматизации работы ЭВМ с информацией, относящейся к различным типам, очень важно унифицировать их форму представления – для этого обычно используется прием кодирования.
Кодирование – это представление сигнала в определенной форме, удобной или пригодной для последующего использования сигнала. Говоря строже, это правило, описывающее отображение одного набора знаков в другой набор знаков. Тогда отображаемый набор знаков называется исходным алфавитом, а набор знаков, который используется для отображения, – кодовым алфавитом, или алфавитом для кодирования. При этом кодированию подлежат как отдельные символы исходного алфавита, так и их комбинации. Аналогично для построения кода используются как отдельные символы кодового алфавита, так и их комбинации.
Совокупность символов кодового алфавита, применяемых для кодирования одного символа (или одной комбинации символов) исходного алфавита, называется кодовой комбинацией, или, короче, кодом символа. При этом кодовая комбинация может содержать один символ кодового алфавита.
Символ (или комбинация символов) исходного алфавита, которому соответствует кодовая комбинация, называется исходным символом.
Совокупность кодовых комбинаций называется кодом.
Взаимосвязь символов (или комбинаций символов, если кодируются не отдельные символы исходного алфавита) исходного алфавита с их кодовыми комбинациями составляет таблицу соответствия (или таблицу кодов).
В качестве примера можно привести систему записи математических выражений, азбуку Морзе, морскую флажковую азбуку, систему Брайля для слепых и др.
В вычислительной технике также существует своя система кодирования – она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1 (используется двоичная система счисления). Эти знаки называются двоичными цифрами, или битами (binary digital).
Если увеличивать на единицу количество разрядов в системе двоичного кодирования, то увеличивается в два раза количество значений, которое может быть выражено в данной системе. Для расчета количества значений используется следующая формула:
где N – количество независимо кодируемых значений,
а m – разрядность двоичного кодирования, принятая в данной системе.
Например, какое количество значений (N) можно закодировать 10-ю разрядами (m)?
Для этого возводим 2 в 10 степень (m) и получаем N=1024, т. е. в двоичной системе кодирования 10-ю разрядами можно закодировать 1024 независимо кодируемых значения.
Кодирование текстовой информации
Для кодирования текстовых данных используются специально разработанные таблицы кодировки, основанные на сопоставлении каждого символа алфавита с определенным целым числом. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков, как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы. Но не все так просто, и существуют определенные сложности. В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время, наоборот, вызваны изобилием одновременно действующих и противоречивых стандартов. Практически для всех распространенных на земном шаре языков созданы свои кодовые таблицы. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, что до сих пор пока еще не стало возможным.
Кодирование графической информации
Кодирование графической информации основано на том, что изображение состоит из мельчайших точек, образующих характерный узор, называемый растром. Каждая точка имеет свои линейные координаты и свойства (яркость), следовательно, их можно выразить с помощью целых чисел – растровое кодирование позволяет использовать двоичный код для представления графической информации. Черно-белые иллюстрации представляются в компьютере в виде комбинаций точек с 256 градациями серого цвета – для кодирования яркости любой точки достаточно восьмиразрядного двоичного числа.
Для кодирования цветных графических изображений применяется принцип декомпозиции (разложения) произвольного цвета на основные составляющие. При этом могут использоваться различные методы кодирования цветной графической информации. Например, на практике считается, что любой цвет, видимый человеческим глазом, можно получить путем механического смешивания основных цветов. В качестве таких составляющих используют три основных цвета: красный (Red, R), зеленый (Green, G) и синий (Blue, B). Такая система кодирования называется системой RGB.
На кодирование цвета одной точки цветного изображения надо затратить 24 разряда. При этом система кодирования обеспечивает однозначное определение 16,5 млн различных цветов, что на самом деле близко к чувствительности человеческого глаза. Режим представления цветной графики с использованием 24 двоичных разрядов называется полноцветным (True Color).
Каждому из основных цветов можно поставить в соответствие дополнительный цвет, то есть цвет, дополняющий основной цвет до белого. Соответственно дополнительными цветами являются: голубой (Cyan, C), пурпурный (Magenta, M) и желтый (Yellow, Y). Такой метод кодирования принят в полиграфии, но в полиграфии используется еще и четвертая краска – черная (Black, K). Данная система кодирования обозначается CMYK, и для представления цветной графики в этой системе надо иметь 32 двоичных разряда. Такой режим называется полноцветным (True Color).
Если уменьшать количество двоичных разрядов, используемых для кодирования цвета каждой точки, то можно сократить объем данных, но при этом диапазон кодируемых цветов заметно сокращается. Кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.
Кодирование звуковой информации
Приемы и методы кодирования звуковой информации пришли в вычислительную технику наиболее поздно и до сих пор далеки от стандартизации. Множество отдельных компаний разработали свои корпоративные стандарты, хотя можно выделить два основных направления.
Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармоничных сигналов разной частоты, каждый из которых представляет правильную синусоиду, а следовательно, может быть описан числовыми параметрами, то есть кодом. В природе звуковые сигналы имеют непрерывный спектр, то есть являются аналоговыми. Их разложение в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства – аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). При таких преобразованиях часть информации теряется, поэтому качество звукозаписи обычно получается не вполне удовлетворительным и соответствует качеству звучания простейших электромузыкальных инструментов с «окрасом», характерным для электронной музыки.
Метод таблично-волнового синтеза (Wave-Table) лучше соответствует современному уровню развития техники. Имеются заранее подготовленные таблицы, в которых хранятся образцы звуков для множества различных музыкальных инструментов. В технике такие образцы называются сэмплами. Числовые коды выражают тип инструмента, номер его модели, высоту тона, продолжительность и интенсивность звука, динамику его изменения. Поскольку в качестве образцов используются «реальные» звуки, то качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.
Единицы измерения данных
Наименьшей единицей измерения информации является байт, равный восьми битам. Одним байтом можно закодировать одно из 256 значений. Существуют и более крупные единицы, такие как килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт) и терабайт (Тбайт).
1 Кбайт = 1024 байт
1 Мбайт = 1024 Кбайт = 2 20 байт
1 Гбайт = 1024 Мбайт = 2 30 байт
1 Тбайт = 1024 Гбайт = 2 40 байт
Данный текст является ознакомительным фрагментом.
Продолжение на ЛитРес
6.16.9 Кодирование вариантов
6.16.9 Кодирование вариантов Существуют два однобайтовых варианта, кодируемых следующим образом:No Operation 00000001End of Option List 00000000Оставшиеся варианты задаются несколькими битами. Каждый начинается октетом типа и октетом длины.Для рассматриваемых вариантов возникает следующий
6.16.13 Кодирование Timestamp
6.16.13 Кодирование Timestamp Вариант Timestamp (временная метка) содержит указатель, подполе переполнения и подполе флага. Подполе флага определяет один из трех возможных для временной метки форматов.Если в подполе флага содержится 0, то при каждом попадании в выделенном месте
15.11.2 Кодирование в XDR
16.13.4 Кодирование содержания
12.2. Запись информации в файлы и считывание информации из файлов
12.2. Запись информации в файлы и считывание информации из файлов Постановка задачи Требуется сохранить на диске информацию (например, текст, данные, изображения и
§ 1. Классификация и кодирование картографической информации
§ 1. Классификация и кодирование картографической информации При разработке ИО ключевое значение приобретает проблема классификации и кодирования элементов картографической информации. Не имея надежной системы классификации и кодирования, нельзя эффективно решать
1.2. Понятие информации. Общая характеристика процессов сбора, передачи, обработки и накопления информации
1.2. Понятие информации. Общая характеристика процессов сбора, передачи, обработки и накопления информации Вся жизнь человека так или иначе связана с накоплением и обработкой информации, которую он получает из окружающего мира, используя пять органов чувств – зрение,
Глава 2 Кодирование информации с помощью систем счисления
Глава 2 Кодирование информации с помощью систем счисления 2.1. Системы счисления Для записи информации о количестве объектов материального мира используются числа, которые разделяются по определенным признакам. На рис. 2.1 представлена классификация чисел по групповому
Глава 3 Кодирование текстовой и графической информации
Глава 3 Кодирование текстовой и графической информации 3.1. Кодирование текстовой информации При вводе текстовой информации в компьютер символы (буквы, цифры, знаки) кодируются с помощью различных кодовых систем, которые состоят из набора кодовых таблиц, размещенных на
3.1. Кодирование текстовой информации
3.1. Кодирование текстовой информации При вводе текстовой информации в компьютер символы (буквы, цифры, знаки) кодируются с помощью различных кодовых систем, которые состоят из набора кодовых таблиц, размещенных на соответствующих страницах стандартов для кодирования
3.2. Кодирование графической информации
3.2. Кодирование графической информации Графическая информация, представленная в виде рисунков, фотографий, слайдов, подвижных изображений (анимация, видео), схем, чертежей, может создаваться и редактироваться с помощью компьютера, при этом она соответствующим образом
Анализ поправок, принятых Госдумой, к закону «Об информации, информационных технологиях и о защите информации» Сергей Голубицкий
Читайте также: