Компьютерные данные типы данных обработка и управление
Функция "чтения" служит для ознакомления с работой. Разметка, таблицы и картинки документа могут отображаться неверно или не в полном объёме!
Реферат по медицинской информатике
на тему: «Компьютерные данные: типы данных, обработка и управление»
План 1 Компьютерные данные: типы данных
2. Система информационной обработки данных
3. Введение данных
Основные требования к базам данных и систем управление базами данных
-
Архитектура информационной системы, организованной с помощью БД
Основные шаги проектирования БД
Иерархическая модель данных
Сетевая модель данных.
Реляционная модель данных.
-
5 Заключение: Порядок выполнения практической работы
Компьютерные данные: типы данных, обработка и управление
Выделяют четыре основных типа данных:
- целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови, которые наблюдают под микроскопом);
- действительные числа: некоторая измеренная переменная (напр. температура или давление крови);
- код: условное обозначение некоторой переменной (напр., боль);
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность — это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных
включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
- обработка данных программным обеспечением;
Введение данных. Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя. Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных. Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных. Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с документацией данных в компьютере есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных включает в себя: пользователя, введение данных, интерфейс пользователя, обработка данных, представление данных.
Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему.
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
- обработка данных программным обеспечением;
Введение данных. Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя. Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных. Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных. Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 1. Средствами текстового редактора Libre (Open) Office Write создать электронный бланк консультативного заключения специалиста по образцу, приведенному ниже (Рис. A).
РАЗДЕЛ № 3. ПОНЯТИЕ БАЗЫ ДАННЫХ. СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ (СУБД)
В настоящее время жизнь человека настолько насыщена различного рода информацией, что для ее обработки требуется создание огромного количества хранилищ информации различного назначения.
Современные информационные системы характеризуются огромными объемами хранимых данных, сложной организацией, необходимостью удовлетворять разнообразные требования многочисленных пользователей. Основой информационной системы является база данных.
Целью любой информационной системы является обработка данных об объектах реального мира.
В широком смысле слова база данных – это совокупность сведений о конкретных объектах реального мира, в какой – либо предметной области.
КОМПЬЮТЕРНЫЕ ДАННЫЕ: ТИПЫ ДАННЫХ, ОБРАБОТКА И УПРАВЛЕНИЕ
Проблема выбора оптимальных способов хранения и обработки больших объемов медицинской информации уже давно является одной из актуальных проблем в системе организации здравоохранения. В структуре любого лечебного заведения существуют центры, куда поступает медицинская информация, которую следует хранить и обрабатывать. Длительное время считалось, что подобные вопросы сложно механизировать. Бумага использовалась как носитель информации, а большой интеллектуальный потенциал работников лечебных заведений применялся для ее обработки. Регистратура с огромными стеллажами и картотеками стала одним из символов лечебного заведения. С появлением ПК появилась возможность оптимизировать работу не только регистратуры, а и всего лечебного заведения.
Общая цель – уметь создавать и управлять базами данных для решения конкретных задач в медицине.
1. Интерпретировать типы медицинских данных и их характеристику.
2. Уметь трактовать классификацию баз данных (БД).
3. Интерпретировать понятиемоделей баз данных, их функции.
1. Типы данных и их характеристики.
2. Структура данных, управление данными, сохранение данных.
3. Типы и модели баз данных.
ГРАФ ЛОГИЧЕСКОЙ СТРУКТУРЫ К ТЕМЕ: « КОМПЬЮТЕРНЫЕ ДАННЫЕ: ТИПЫ ДАННЫХ,
ОБРАБОТКА И УПРАВЛЕНИЕ»
1. Герасимов А.Н. Медицинская информатика: Учебное пособие, с приложением на СД. – М.: ООО «Медицинское информационное агенство», 2008. – С.272-297.
2. Медицинская информатика: Учебник / И.П. Королюк. – 2 изд., перераб. и доп.
– Самара : ООО «Офорт» : ГБОУ ВПО «СамГМУ». 2012. – С. 9-45.
3. Герасевич В.А. Компьютер для врача: самоучитель. – 2-е изд., перераб. И доп.
– СПб.: БХВ-Петербург, 2004. – 512 с.
4. Тимошок Т.В. Microsoft Access 2003. Краткое руководство.: - М.: Издательский дом “Вильямс”, 2005. – 320 с.
1. Булах И.Е. Медицинская информатика в модулях. - Киев, Медицина, 2009. –
2. Гельман В.Я. Медицинская информатика: практикум. – СПб: Питер, 2001. –
3. Булах И.Е., Лях Ю.Е., Марценюк В.П., Хаимзон И.И. Медицинская информатика: учебник. – Тернополь: ТГМУ, 2008. – 309 с.
4. Edward H.Shortliffe. Medical Informatics. Computer Applications in Health Care and Biomedicine / editors, Edward H.Shortliffe, Leslie E. Perreault. – Second Edition. – Springer-Verlag New York, Inc., 2001. – 854 p.
КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ К ТЕМЕ 5
Медико-биологические данные, касающиеся здоровых людей и больных, могут быть систематизированы в следующие группы:
1. Количественные данные – это данные, которые можно измерить или расчитать: рост пациента, концентрация в крови форменных элементов и биологически активных веществ, заболеваемость туберкулезом в группе населения, количество ВИЧинфицированных больных и др.
2. Качественные данные – это данные, которые не поддаются точной оценке, хотя и могут быть ранжированы (т.е. систематизированы по условным баллам: один балл, два балла и т.д.). К таким данным относятся, например, цвет кожных покровов, наличие болей, качество жизни человека и др. Качественные признаки, которые могут быть отнесены только к двум категориям (их наличию или отсутствию), называются дихотомическими.
3. Статические картины органов человека или всего его тела: они отображают состояние пациента, различных участков патологически измененных тканей в данный момент времени. При этом используются чаще всего методы лучевой диагностики (рентгенологический, радионуклидный, ультразвуковой, магнитно-резонансный). Например, патологические изменения на рентгенограмме грудной клетки, сонограмме, изображение головного мозга на компьютерной томограмме. К статическим картинам относят также фотографии макропрепаратов и гистологических срезов, эндоскопические изображения.
4. Динамические картины органов человека – это данные, которые получаются при непрерывной регистрации (на мониторе или жестком диске компьютера) движущихся органов, например, сердца, легких, при изучении быстроменяющихся картин в результате прохождения по организму рентгеноконтрастных или радионуклидных веществ (при рентгенологическом исследовании пищеварительного тракта, радионуклидном исследовании сердца).
При исследовании кардиологического больного данные о состоянии сердца могут быть представлены в виде кривых электрической активности (ЭКГ), в виде визуального изображения отдельных камер сердца, сердечной мышцы при сонографии или магнитно-резонансной томографии, в виде количественной и качественной характеристики работающего сердца и протекающей в нем крови.
Выделяют четыре основных типа компьютерных данных:
- целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови, которые наблюдают под микроскопом);
- действительные числа: некоторая измеренная переменная (напр. Температура тела или давление крови);
- код: условное обозначение некоторой переменной (напр., боль);
- текст: разговорный язык (напр. текст истории болезни или документация событий во время мониторинга).
Одной из основных проблем, связанных с ведением документации с помощью
компьютера является точность и корректность отображения медицинских данных. Одной из основных проблем, связанных с документацией данных в компьютере
есть точность и корректность четырех разных видов данных.
Точность - это способность выполнить задачи без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту.
Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях.
Точность зависит от степени детализации. Примером может быть количество десятичных знаков при измерении той или другой величины. Вес тела, выраженная как 89.12 кг, имеет большую точность, чем вес, выраженному, как 89.1 кг.
Система информационной обработки данных включает в себя: пользователя,
введение данных, интерфейс пользователя, обработка данных, представление данных. Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописаны в компьютерной программе, которая сохраняется в памяти компьютера. Данные также сохраняются в памяти компьютера. Программа "знает", что делать с данными, где найти их и как подать результаты. Программист определяет все это заранее. Это короткое описание показывает, что для обработки данных на компьютере нужны оборудования и программа. Оборудования называют техническим обеспечением, а
программы - программным обеспечением. Технические средства и программное обеспечение вместе составляют вычислительную систему .
Вычислительные системы помогают в диагностично-терапевтичному цикле, в особенности на стадии наблюдения. Здесь вычислительные системы используются, для обеспечения пользователя данными, необходимыми, для принятия решения. В этой ситуации мы имеем дело с процессом обработки информации.
В процессе обработки информации различают пользователей и действия операционной системы компьютера:
- обработка данных программным обеспечением;
Введение данных. Пользователь работает с данными. Напомним, что информация происходит от данных. Ошибочные ли даже неточные данные не дают правильной информации. Компьютеры могут обработать данные, но они не могут генерировать информацию, утраченную во время введения, обработки данных в некоторой цепочке соображений.
Интерфейс пользователя. Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя.
В основанных на символьных интерфейсах, для общения с пользователем используется лишь клавиатура. Такие интерфейсы, обычно, характерны для традиционного стиля программирования, в котором программа определяет предшествующий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов.
Графические интерфейсы (их еще называют "оконные интерфейсы") быстро вытеснили основанные на символе интерфейс пользователя. Основным элементом графического интерфейса есть окно. Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.п..
Обработка данных. Процесс обработки данных предусматривает их анализ и преобразование таким образом, что необходимая информация может быть представлена пользователю.
Представление данных. Правильное представление информации пользователю есть важным для понимания правильности выводов. Важным есть тот факт, что пользователи могут конкретизировать вид представления информации (напр., как список или в графической форме). Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах. Данные могут подаваться и в мультимедийном формате.
ЗАДАНИЯ ДЛЯ ДОСТИЖЕНИЯ КОНКРЕТНЫХ ЦЕЛЕЙ ОБУЧЕНИЯ ПО ТЕМЕ 5
ПРАКТИЧЕСКОЕ ЗАДАНИЕ № 1 . Создать учебную реляционную базу данных, которая обеспечивала бы работу диагностической лаборатории «Invitero». Лаборатория проводит исследование в таких отраслях диагностики, как аллергология, биохимия, рентгенология, эндоскопия.
Используемые компьютерные программы
1. Операционные системы: Linux
2. Прикладные программы общего назначения: Libre (Open) Office Writer, Libre (Open) Office Calc.
3. Программы СУБД: Libre (Open) Office Base, dBase III Plus (DBF view 2000 v1.93, DBF navigator 2000 rus).
База данных содержит следующие таблицы:
А - общие сведения (ФИО, дата рождения, пол, адрес, код сотрудника, который проводил исследование)
1 Тема 3. Компьютерные данные: типы данных, обработка и управление. Типы данных и их характеристики. Известно, что информация может быть представлена в разных формах, на том или ином носителе. Понятие информации, данных, носителя информации мы рассмотрели на предыдущих практических занятиях. Теперь выясним типы данных, с которыми работает врач в своей профессиональной деятельности. Выделяют четыре типа данных: целые числа: некоторое дискретное число (напр., число лейкоцитов в образце крови); действительные числа : переменная, полученная при измерении того или иного показателя (напр., температура или давление крови); код: условное обозначение некоторой переменной (напр., боль); текст: разговорный язык (напр., текст истории болезни или документация событий во время мониторинга) Одной из основных проблем, связанных с документацией данных в компьютере является точность и корректность четырех разных видов данных. Точность - это способность выполнить задачу без погрешностей или ошибок. Данную характеристику можно трактовать еще и так: - это степень соответствия меры к определенному стандарту (Коллегиальный Словарь Webster). Корректность - это мера частоты появления ошибок в данных. Ошибки могут возникнуть во время сбора данных, наблюдений или же измерениях. Точность зависит от степени детализации. Например, количество десятичных знаков при измерении той или иной величины. Вес тела, выраженный как 89,12 кг, имеет большую точность, чем вес, выраженный, как 89,1 кг. Система информационной обработки данных: пользователь, введение данных, интерфейс пользователя, обработка данных, представление данных. Прежде чем компьютер сможет выполнить некоторое действие, ему нужно получить инструкции о том, как управлять данными. Эти инструкции прописанны в компьютерной программе, которая хранится в памяти компьютера. Программа «знает», что делать с данными, где их найти и как подать результаты. Программист (конструктор программы) определил все это заранее. Это краткое описание показывает, что для обработки данных на компьютере необходимо оборудование и программа. Оборудование называют техническим обеспечением, а программы - программным обеспечением. Техническое и программное обеспечение составляют вычислительную систему. В процессе обработки информации различают людей и действия операционной системы компьютера: пользователь; введение данных; интерфейс пользователя; обработка данных программным обеспечением; представление данных. Остановимся на перечисленных компонентах. Пользователей условно делят на такие группы: случайные пользователи знакомы с функциями программного обеспечения, но не до деталей; шаблонные пользователи знакомы с функциями программного обеспечения для ежедневных (шаблонных) рабочих нужд; эксперты заинтересованы в овладении спецификой программного обеспечения. Введение данных. Данные можно ввести вручную или автоматическими измерительными приборами (например, ЭКГ записывающее оборудование). 1
2 2 В процессе введения данных можно воспользоваться помощью компьютера для выявления ошибок в начальных данных. Соответствующее программное обеспечение разрешает выполнить: синтаксическую проверку; проверку семантической природы ошибки; диалоговую помощь. Все элементы данных имеют область и значения. Область определяет образец символов, которые будут введены пользователем. Семантический аспект данных - это его значение. Для диалога системы и пользователя используется определенная часть вычислительной системы - интерфейс пользователя. Его назначение - введение данных, управление работой программы и взаимодействие программы и пользователя. Различают два основных типа интерфейсов: основанные на символе; графические интерфейсы. В основанных на символе интерфейсах для общения с пользователем используется лишь клавиатура. Такие интерфейсы, как правило, характерны для традиционного стиля программирования, в котором программа определяет предыдущий и следующий шаг пользователя. Пользователь дает ответ на вопрос прописанный в программе. Эти вопросы могут быть запросами на введение данных или их выбор из ограниченного списка вариантов. Основным элементом графического интерфейса является окно. Поэтому их еще называют "оконные интерфейсы". Окно - это область на экране компьютера, которая имеет название (заголовок окна) и содержит текстовые поля, картины, кнопки, переключатели, и т.д. Пользователь может открыть несколько окон одновременно. При этом лишь одно из них является активным- с ним пользователь работает в данное время. Обработка данных. Процесс обработки данных предусматривает их анализ и преобразование с целью представления пользователю. Представление данных. Современная компьютерная технология не ограничена лишь показом данных в таблицах и графах, а разрешает конкретизировать вид их представления (напр., как список или в графической форме). Системы управления базами данных в медицине Типичный вопрос пользователей: «Чем отличается база данных (БД) от системы управления базой данных (СУБД)?» Это действительно не одно и тоже. БД это файл (документ), в котором в специальном формате хранятся данные. СУБД это программа, с помощью которой данные в базу вводятся, просматриваются, сортируются, фильтруются, разыскиваются, экспортируются (переводятся в форматы других СУБД) или, наоборот, импортируются. Базой данных называется поименная совокупность данных, с той минимальной чрезмерностью, которая необходимая для взаимосвязи данных, которая адекватно отображает состояние объектов и их отношения в рассматриваемой предметной области. СУБД называется совокупность языковых и программных средств, предназначенных для создания, управления и совместного использования БД многими пользователями. Создавая базу данных, пользователь стремится привести в порядок информацию о разных признаках объектов и быстро получить выборку данных с произвольным соединением признаков. Сделать это возможно только если данные структурированны. Структурирование - это введение соглашений о способах представления данных. Приведем пример неструктурированных данных, которые содержат сведения о студентах (номер личного дела, фамилия, имя, отчество и год рождения): Личное дело Сергеев Петр Михайлович, дата рождения 1 января 1976 г.; л/д 16593, Петрова Анна Владимировна, дата рождения 15 марта 1975 г.; личного дела 16693, дата рождения , Анохин Андрей Борисович Легко убедиться, что сложно организовать поиск необходимых данных, которые сохраняются в неструктурированном виде, а привести в порядок подобную информацию практически не возможно.
3 3 Чтобы автоматизировать поиск и систематизировать эти данные, необходимо выработать определенные соглашения о способах представления данных, например дату рождения нужно записывать одинаково для каждого студента, она должна иметь одинаковую длину и определенное место среди другой информации. Эти же замечания справедливы и для других данных (номер личного дела, фамилия, имя, отчество). личного Фамилия Имя Отчество Дата дела рождения Никулин Петр Михайлович Петренко Анна Владимировна Анохин Андрей Борисович Таблица 1 Итак, база данных (БД) - это поименная совокупность структурированных данных, которые относятся к определенной предметной области. Классификация баз данных По технологии обработки данных базы данных классифицируют на: Централизованную базу данных: хранится в памяти одной вычислительной системы, если эта вычислительная система является компонентом сети компьютеров с возможным распределенным доступом к такой базе. Такой способ использования баз данных часто применяют в локальных сетях ПК. Распределенную базу данных: состоит из нескольких частей, которые сохраняются в памяти разных компьютеров сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД). Жизненный цикл программного продукта, в том числе и СУБД, состоит в общем случае из таких стадий: проектирование, реализация, эксплуатация. Важнейшим фактором в жизненном цикле приложения, которое работает с базой данных, есть стадия проектирования. От того, насколько тщательно продуманна структура базы данных, насколько четко обозначенные связи между ее элементами зависит производительность системы. Основные шаги проектирования БД: 1. Определить информационные нужды БД; 2. Проанализировать объекты, которые нужно промоделировать в БД. 3. Определить атрибуты, которые идентифицируют каждый объект. 4. Определить правила, которые будут поддерживать целостность данных. 5. Установить связи между объектами. 6. Решить вопрос относительно надежности данных и их сохранения. Основные типы моделей данных Модель данных - это совокупность структур данных и операций их обработки. Рассмотрим три основных типа моделей данных: иерархическую, типа сеть и реляционную. Иерархическая модель данных. Объекты, связанные иерархическими отношениями, образовывают ориентированный граф (перевернутое дерево), пример которого подан на рис.2. К основным понятиям иерархической структуры относят: уровень, элемент (узел), связь. Пример иерархической модели - произвольная административная структура. Узел - это совокупность атрибутов данных, которые описывают некоторый объект. На схеме иерархического дерева узлы имеют вид вершин графа. Каждый узел на более низком уровне связан только с одним узлом, который находится на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), которая находится на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и других уровнях. Количество деревьев в базе данных определяется числом корневых записей. К каждой записи базы данных существует только один (иерархический) путь от корневой записи. Например, как видно из рисунка, для записи С4 путь проходит через записи А и ВЗ.
4 Пример, приведенный на следующем рисунке, иллюстрирует использование иерархической модели базы данных. 4 A B1 B2 B3 B4 B5 C1 C2 C3 C4 C5 C6 C7 C8 Рис.2. Пример иерархической модели Где А: Институт (специальность, название института, директор): например , Экономической информатики, Иванов И. В. В i : Группа (номер, староста), например В 1 В 2 В Петровская И. П. 112 Зайцев Р. В. 113 Никулин К. Л. С j : Студент (номер зачетной книжки, фамилия, имя, отчество), например, С 1 С 2 С Полищук Чернях Марчук Андрей Юлия Константин Петрович Николаевна Иванович Для рассмотренного примера иерархическая структура правомерна, так как каждый студент учится в определенной (только одной) группе, которая относится к определенному (только одному) институту. Модель данных типа сеть. В структуре типа сеть при тех же самых основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом. На рис.3 приведена структура типа сеть базы данных в виде графа. A B С D E H G L Рис. 3. Структура типа сеть
5 5 Примером сложной структуры типа сеть может служить структура базы данных, которая содержит сведения о студентах, которые принимают участие в научно-исследовательских роботах (НИРС). Возможно участие одного студента в нескольких НИРС, а также участие нескольких студентов в разработке одной НИРС. Графическое изображение описанной в примере структуры типа сеть, которая состоит только с двух типов записей, показано на рисунке 4. Единое отношение представляет собой сложная связь между записями в обеих направлениях. Пример структуры данных типа сеть: Работа (шифр, руководитель, область знаний), Студент (номер зачетной книжки, фамилия, группа) Марчук Полищук Копил Сидоренко П.И. Информатика 1009 Никифоров Г.П. Экономика 1008 Власенко В.П. Экология 1005 Диденко История И.М. Рис. 4. Сложная структура типа сеть Реляционная модель данных. Понятие реляционной (англ. relation - отношение) модели связано с разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. На языке математики отношения определяется таким образом. Пусть задано n множеств D 1,D 2,,D n. и отношение над этими множествами R. Если R является множеством наборов вида , где d 1 - элемент с D 1, d 2 элемент с D 2,, d n - элемент с D n. При этом наборы вида называются кортежами, а множества D 1 D 2,,D n - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов. Итак, реляционная модель ориентирована на организацию данных в виде двумерных таблиц, каждая из которых имеет следующие свойства: - каждый элемент таблицы - это один элемент данных; - все столбцы в таблице - однородные, т.е. все элементы в столбце имеют одинаковый тип (символьный, числовой и т.п.); - каждый столбец имеет уникальное имя; - одинаковые строки в таблице отсутствуют. В виде таблицы можно представить информацию о студентах, которые учатся в ВУЗе. Например, личного дела Фамилия, имя, отчество Дата рождения Курс Никулин Петр Михайлович Петренко Анна Владимировна Анохин Андрей Борисович Следующие термины являются эквивалентными: отношение, таблица, файл (для локальных БД); кортеж, строка, запись; Группа
6 6 атрибут, столбик, поле. БД считается нормализованной, если выполняются следующие условия: каждая таблица имеет главный ключ; все поля каждой таблицы зависят только от главного ключа; в таблицах отсутствуют группы повторных значений. Для успешной работы по много табличными БД, как правило, надо установить между ними связи. При этом выделяют базовую таблицу и подчиненную. Организация связей между элементами разных таблиц возможна, если одна таблица содержит первичный ключ другой. Это поле тогда имеет название внешний ключ. Связь между таблицами образовывается благодаря паре полей, одно из которых находится в базовой таблице, а второе - в подчиненной. Когда значение в связанном поле записи базовой таблицы и в поле подчиненной совпадают, то эти записи называются связанными. Различают такие виды взаимосвязей между отношениями: 1. Связь один-к-одному допускает связь между двумя объектами, представленными в виде таблиц, например, ПАЦИЕНТ и СОСТОЯНИЕ ОРГАНИЗМА ПАЦИЕНТА (каждому пациенту отвечает конкретное состояние организма). 2. Связь один-к-многим допускает связь с одним объектом нескольких других, например, ПАЦИЕНТ и ВРАЧ (каждому врачу отвечает несколько пациентов. 3. Связь много-к-многим в явном виде в реляционных БД не поддерживается, однако есть способы косвенной реализации такой связи. Она допускает связь нескольких объектов с несколькими другими, например, ПАЦИЕНТ и ЛЕЧЕБНОЕ ЗАВЕДЕНИЕ (пациенты могут обслуживаться в разных лечебных заведениях) или связь ПАЦИЕНТЫ - ХИМИОПРЕПАРАТЫ (один пациент может использовать во время лечения разные химические препараты, вместе с тем как каждый химиопрепарат может употребляться разными пациентами. Языковые средства систем управления базами данных Язык описания данных (ЯОД - Shema Definision Language) часто называют языком определения данных. Описание данных средствами ЯОД называют схемой базы данных. Она включает описание логической структуры данных в рамках тех правил, которые регламентированы моделью данных используемой СУБД. ЯОД некоторых СУБД обеспечивает возможность задачи ограниченого доступа к данным или полномочиям пользователей. Язык манипулирования данными (ЯМД - Shema Manipulation Language) разрешает использовать предусмотренные в системе операции над данными из базы данных, т.е. содержит набор операторов манипулирования данными, которое разрешает заносить данные, удалять, модифицировать или выбирать их. В современных СУБД обычно поддерживается единый интегрированный язык, который содержит все необходимые средства для работы с базой данных (начиная от ее создания) и базовый пользовательский интерфейс, который обеспечивает роботу с базами данных. Наиболее популярным и стандартным для реляционных СУБД является язык SQL (Structured Query Language), разработанная фирмой IBM. Сами по себе данные в компьютерной форме не интересуют пользователя, если отсутствуют средства доступа к ним. Доступ к данным осуществляется в виде запросов, которые формулируются стандартным языком запросов. Сегодня для большинства СУБД таким языком является SQL.
БАЗЫ ДАННЫХ (БД). СИСТЕМЫ УПРАВЛЕНИЯ БД
БАЗЫ ДАННЫХ (БД). СИСТЕМЫ УПРАВЛЕНИЯ БД Общие положения Цель любой информационной системы - обработка данных об объектах реального мира. В широком смысле слова база данных - это совокупность сведений о
Читайте также: