Скачать 0.61 Mb.
|
Часть VI БАЗы ДАННЫХ Информационная система – система, реализующая автоматизированный сбор, обработку и манипулирование данными и включающая технические средства обработки данных, программное обеспечение и соответствующий персонал. Цель любой информационной системы - обработка данных об объектах реального мира. Основой информационной системы является база данных. База данных (БД) – это поименованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области. Под предметной областью принято понимать часть реального мира, подлежащего изучению для организации управления и, в конечном счете, автоматизации. Объектом (сущностью) предметной области называется элемент предметной области, информацию о котором мы сохраняем. Объектом может быть человек, предмет, событие. Каждый объект характеризуется рядом свойств – атрибутов. Атрибутом называется поименованная характеристика объекта. Например, объект студент, атрибуты – фамилия, имя, отчество и год рождения. Главная цель создания баз данных состоит в обобществлении функций обновления, ведения и пополнения хранимой информации, а также справочной информации. База данных является одним из основных структурных компонентов автоматизированных систем управления (АСУ), систем автоматизации проектирования (САПР), обучающих систем (АОС) и др. Основное характерное свойство баз данных - их независимость от рабочих программ, с которыми они взаимодействуют. Эта независимость проявляется в возможности изменения содержания, объема и организации хранимой информации без последующей модификации рабочих программ, пользующихся данной информацией. Для обеспечения независимости баз данных необходимо хранить описание накопленной информации вместе с самой информацией, обеспечить возможность коллективного доступа к любой части хранимых сведений, а также строить рабочие программы таким образом, чтобы при их выполнении могла осуществляться настройка в соответствии с текущим состоянием базы данных. База данных является основной структурной частью банка данных, который может включать одну или несколько таких баз. ^ – совокупность конкретных и обобщенных сведений об определенной сфере деятельности или части окружающего мира. База знаний – совокупность данных и правил вывода, хранящихся в памяти ЭВМ. Создавая БД, пользователь стремится упорядочить информацию по различным признакам и быстро производить выборку с произвольным сочетанием признаков. Большое значение при этом приобретает структурирование данных. ^ – это введение соглашений о способах представления данных. В современной технологии БД предполагается, что создание БД, ее поддержка и обеспечение доступа пользователей к ней осуществляется централизованно с помощью специального программного инструментария – системы управления БД. ^ – это комплекс программных и языковых средств, предназначенных для создания, ведения и совместного применения БД многими пользователями. ^ По технологии обработки данных БД подразделяются на централизованные и распределенные. Централизованная БД хранится в памяти одной вычислительной системы. Если эта вычислительная система является компонентом сети ЭВМ, возможен распределенный доступ к такой базе. Такой способ использования БД часто применяется в локальных сетях ПК. Распределенная БД состоит из нескольких возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой БД осуществляется с помощью системы управления распределенной БД (СУРБД). По способу доступа к данным БД разделяются на БД с локальным доступом и БД с удаленным (сетевым) доступом. Архитектура централизованных БД с сетевым доступом различается местом хранения информации и обработки информации. Различают следующие архитектуры:
^ предполагает выделение одной из машин сети в качестве центральной (сервер файлов). Здесь находится централизованная БД, которая совместно используется пользователями со своих рабочих станций. Запрашиваемые пользователями файлы БД передаются на рабочие станции, где и производится их обработка. ^ подразумевает, что центральная машина (сервер БД) помимо функции хранения информации, обеспечивает и ее обработку (поиск и извлечение данных). Запрашиваемые пользователем данные (а не файлы, как в случае архитектуры файл – сервер) передаются по сети от сервера пользователю (клиенту). ^ Ядром любой БД является модель данных. Модель данных – это совокупность структур данных, ограничений целостности и операций их обработки. Различают иерархическую, сетевую и реляционную модели данных. 6.2.1. Реляционная модель данных Реляционная модель БД организуется и хранится в форме таблиц. Все современные БД (DBASE, PARADOX, АССESS) имеют реляционную модель данных. Понятие "реляционный" (relation (анг) – отношение) связано с разработками американца Е.Кодда, специалиста в области систем баз данных. В реляционных БД выделяют следующие структурные элементы: таблица, запись, поле (рис.6.1). Таблица - основной структурный объект БД. Таблица – это совокупность экземпляров записей одной структуры. Запись - основной структурный элемент таблицы и является совокупностью логически связанных полей (строка таблицы). Поле – элементарная единица логической организации данных, которая соответствует неделимой единице информации – реквизиту (столбец таблицы). ^ ![]() Рис.6.1. Пример реляционной таблицы В таблице обязательно указываются поля, которые являются ключами. Ключ может быть первичным или вторичным. Первичный ключ – это одно (простой ключ) или несколько полей (составной ключ), однозначно идентифицирующих запись. Такие поля не могут повторяться в различных записях (например, номер по порядку). ^ – это одно или несколько полей, которые выполняют роль поисковых или группировочных признаков, поэтому, в отличие от первичного ключа, значения вторичного ключа могут повторяться в различных записях. Таким образом, по значению первичного ключа можно найти уникальный (единственный) экземпляр записи, а по вторичному ключу несколько записей. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
При описании реляционной модели часто используют понятия отношение, кортеж и домен. Отношения представлены таблицами, строки которых соответствуют записям (кортежам), а столбцы – полям, атрибутам отношений (доменам). 6.2.2. Иерархическая модель данных Иерархические БД – базы, в которых используются структуры в виде деревьев. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Дерево представляет собой иерархию элементов, называемых узлами. Узел – это совокупность атрибутов данных, описывающих некоторый объект. На самом верхнем уровне иерархии имеется один и только один узел – корень (рис.6.2) – уровень 1. ![]() Рис.6.2. Иерархическая модель данных Каждый узел, кроме корня, связан с одним узлом на более высоком уровне, называемом исходным для данного узла. Ни один элемент не имеет более одного исходного. Каждый элемент может быть связан с одним или несколькими элементами на более низком уровне (уровни 2, 3 и т.д.). Они называются порожденными. Таким образом, к каждой записи БД существует только один (иерархический) путь от корневой записи. Например, как видно из рис.6. для записи С4 путь проходит через записи А и В3. Применялась на носителях типа магнитной ленты. 6.2.3. Сетевая модель данных Сетевая модель организует данные в виде сетевой структуры. Структура называется сетевой, если в отношениях между данными порожденный элемент имеет более одного исходного. Эта система отношений образует произвольную сеть. Допускается, что любой элемент сети может быть связан с любым количеством других элементов (рис.6.3). ![]() Рис.6.3. Сетевая модель данных ^ Система управления базами данных представляет собой пакет программ, посредством которого реализуется централизованное управление БД и обеспечивается доступ к данным. СУБД реализует интерфейс между пользователем и БД. Посредством СУБД обеспечивается создание, загрузка и обновление данных, создание запросов, ввод, вывод, совместное использование и защита данных. Для этого СУБД обладает следующими средствами:
^ Проектирование БД включает:
6.4.1. Анализ предметной области Первым этапом проектирования БД является анализ предметной области. На данном этапе анализируются запросы пользователей, выбираются информационные объекты и их атрибуты. Анализ предметной области обычно проходит в три этапа:
6.4.1.1. Анализ концептуальных требований и информационных потребностей На этом этапе выявляются требования пользователей к разрабатываемой БД (к вводу, хранению, обновлению, изменению и выводу информации). Требования могут быть уточнены при выполнении конкретных задач. Для примера можно привести часть вопросов к пользователям при составлении БД для учета студентов вуза (типа таблицы на рис.6.1). Сколько студентов учится в вузе? Сколько факультетов в вузе? Какие формы обучения на каждом факультете? Сколько студентов на каждом факультете и курсе по каждой форме обучения? Сколько специальностей на каждом факультете? Сколько дисциплин читается на каждом курсе по каждой специальности и форме обучения? Сколько преподавателей в вузе? Как часто обновляется информация в БД? Сколько лекционных аудиторий и аудиторий для проведения семинарских и практических занятий? Сколько раз в день, сколько человек и кто пользуется БД? Понятно, что этот ряд вопросов может быть продолжен в зависимости от целей, для которой создается БД (учета социологической информации, учебной успеваемости и т.д.). 6.4.1.2. Выявление информационных объектов и связей между ними Второй этап анализа предметной области состоит в выборе информационных объектов, задании необходимых атрибутов для каждого объекта, выявление связей между объектами и их типов, определение ограничений, накладываемых на информационные объекты. Проиллюстрируем выявление информационных объектов и связей между ними опять на примере БД для учета студентов вуза. Объект – студент. Атрибуты – номер, фамилия, имя, отчество, дата рождения, пол, факультет, специальность, отделение, год поступления, курс. Объект сессия. Атрибуты – номер, оценка 1, оценка 2, оценка 3 и т.д. Объект стипендия. Атрибуты – номер, результат, вид, сумма, надбавки. Объект – преподаватель. Атрибуты – код преподавателя, фамилия, имя, отчество, научная степень, звание, год рождения, факультет, кафедра. Под ограничением целостности обычно понимают логические ограничения, накладываемые на конкретные значения атрибутов информационных объектов. Например, введем некоторые ограничения для некоторых атрибутов объекта студент:
6.4.1.3. Типы связей Все информационные объекты предметной области, каким-то образом соотносятся друг с другом, т.е. связаны друг с другом. Различают следующие типы связей:
Связь один к одному (1 : 1) предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует не более одного экземпляра информационного объекта Б и наоборот, например, связь между объектами Студент и Стипендия, где каждый студент имеет определенный набор оценок в каждую сессию, т.е. Студент ↔ Стипендия. ^ (1 : М) предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует 0 и более экземпляров объекта Б, но каждый экземпляр объекта Б связан не более чем с одним экземпляром объекта А, например, связь между объектами Стипендия и сессия, где установленный размер стипендии по результатам сдачи сессии может повторяться для различных студентов, т.е. Стипендия ‹ — ›› сессия ^ (М : М) предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует 0 и более экземпляров объекта Б, и наоборот, например, связь между объектами Студент и преподаватель, т.к. один студент обучается у многих преподавателей и один преподаватель обучает многих студентов, т.е. Студент ‹‹ — ›› преподаватель. 6.4.1.4. Проектирование концептуальной схемы базы данных Концептуальная модель или информационная структура БД включает описание информационных объектов и их взаимосвязей в рассматриваемой предметной области. Концептуальная модель применяется для структурирования предметной области с точки зрения и с учетом информационных интересов пользователя и не зависит от программного обеспечения СУБД. Концептуальная модель должна быть стабильной. Может изменяться программное обеспечение и аппаратные решения хранения информации, но концептуальная модель остается неизменной или расширяется за счет включения дополнительных данных. Одной из самых распространенных моделей концептуальной схемы является модель "сущность – связь". Основными элементами данной модели являются сущности и связи. В качестве сущности могут выступать место, предмет, личность, явление. Так, для БД "Успеваемость" сущность (объект) – студент, а экземпляр сущности конкретный объект – Петров П.П. 6.4.2. Логическое проектирование Основной задачей логического проектирования является разработка логической схемы, ориентированной на выбранную СУБД. Этот этап проектирования БД полностью ориентирован на инструментальные средства компьютера в отличие от анализа предметной области. Этап логического проектирования включает:
В случае выбора реляционной СУБД каждый прямоугольник концептуальной схемы (рис.6.4) отображается в таблицу. Столбцы в таблице отображают атрибуты сущности и имеют уникальные имена, например, как на рис.6.1. |
![]() | Новые термины и понятия: программа, программное обеспечение, базовое программное обеспечение, системное программное обеспечение,... | ![]() | Структуры и алгоритмы обработки данных: учебно-метод пособие для студ спец. «Программное обеспечение информационных технологий» всех... |
![]() | «Искусственный интеллект», «Программное обеспечение информационных технологий» | ![]() | Программное обеспе́чение (произношение обеспече́ние не рекомендуется) — наряду с аппаратными средствами, важнейшая составляющая информационных... |
![]() | Гис это информационная система, обеспечивающая сбор, хранение, обработку, анализ и отображение пространственных данных и связанных... | ![]() | Какие ис вырабатывают информацию, на основании которой человек принимает решение |
![]() | Системы наблюдений в методе межскважинной сейсмотомографии. Технология сейсмотомографических исследований. Программное обеспечение... | ![]() | Программное обеспечение (ПО) [software] — это совокупность программ, использующихся для решения задач на ЭВМ |
![]() | Статистика-отрасль практической деятельности которая имеет своей целью сбор-обработку, анализ, и публикацию полученных данных об... | ![]() | Ос опирается на базовое программное обеспечение пк, входящее в его систему bios (базовая система ввода-вывода) |