Информатика. Определения. 19. 12. 2012




Скачать 331.04 Kb.
НазваниеИнформатика. Определения. 19. 12. 2012
страница1/2
Дата публикации26.08.2013
Размер331.04 Kb.
ТипДокументы
zadocs.ru > Информатика > Документы
  1   2
Информатика. Определения. 19.12.2012
Совокупность программного обеспечения и электронного информационного хранилища, разрабатываемая как единая система и предназначенная для автоматизации определенного рода деятельности будет называться информационной системой.
Проектирование  —  это выбор способа, который позволит с помощью имеющихся технологий, учитывая заданные ограничения, выполнить функциональные требования системы
Информационное обеспечение  —  совокупность единой системы классификации и кодирования информации, унифицированных документов и вспомогательных информационных массивов (обычно – классификаторы, таблицы кодирования и пр.) 
^ Техническое обеспечение  —  комплекс технических средств, предназначенных для обеспечения работы информационной системы и ее пользователей, и документация на них.
^ Программное обеспечение —  общесистемные и специальные программные продукты, а также техническая документация.
Организационное обеспечение  —  комплекс мероприятий и руководящих документов, регламентирующих взаимодействие работников с техническими средствами и между собой в процессе разработки и эксплуатации информационной системы.
^ Математическое обеспечение  — совокупность математических методов, моделей и алгоритмов, использующихся для управления системой и  реализации прикладных задач.
^ Лингвистическое обеспечение  — множество языков, использующихся при разработке и эксплуатации ИС (языки программирования, языки общения, набор словарей и пр.). 
^ Правовое обеспечение  — совокупность правовых норм, определяющих создание, юридический статус и функционирование информационных систем, регламентирующих порядок получения, преобразования и использования информации. 

------------------------------------------------------------------------

^ Безопасность информационных систем — это защищенность информации и поддерживающей инфраструктуры от случайных или преднамеренных воздействий естественного или искусственного характера, которые могут нарушить доступность, целостность или конфиденциальность информации. 
^ Под защитой информации будем понимать  —  комплекс мер, направленных на обеспечение информационной безопасности. 
Под угрозой безопасности информации будем понимать — действие или событие, которое может привести к  нарушению достоверности, целостности или конфиденциальности хранящейся, передаваемой или обрабатываемой информации. 
^ Атака – попытка реализовать угрозу. 

Злоумышленник – тот, кто осуществляет атаку. 

Источник угрозы – потенциальный злоумышленник. 

Окно опасности - промежуток времени от начала возникновения возможности использовать слабое место в защите до момента, когда это слабое место будет ликвидировано.

------------------------------------------------------------------------

^ Базой данных будем называть именованную часть информационного хранилища,   структура которой описывается на языке некоторой модели данных.  

Описание структуры конкретной базы данных называется схемой базы данных.
Атрибуты бывают полезные для поиска и бесполезные.

Наиболее важные образуют ключ.

Ключ – это один ли несколько атрибутов объекта, по которому объект можно однозначно определить.

Если нет естественного ключа, придумывают искусственный – «суррогатный».
Каждый атрибут должен иметь уникальное имя.

У каждого атрибута должен быть свой тип данных.

Объект может обладать любым количеством атрибутов.

Ни один из экземпляров объектов не может обладать более чем одним значением для ее атрибута.
^ Первичный ключ - атрибут или группа атрибутов, однозначно идентифицирующих объект. Первичный ключ может состоять из нескольких атрибутов, тогда подчеркивается каждый из них. 
Объект и его атрибуты соединяются ненаправленными дугами.

-------------------------------------------------------------------------

Иерархическая модель:

Атрибут (элемент данных) - наименьшая единица структуры данных.

Запись - именованная совокупность атрибутов. Использование записей позволяет за одно обращение к базе получить некоторую логически связанную совокупность данных. Именно записи изменяются, добавляются и удаляются. 

^ Тип записи определяется составом ее атрибутов

Экземпляр записи - конкретная запись с конкретным значением элементов.
Реляционная модель:

Похожа на таблицы

Столбцы – атрибуты

Строки – данные

Шапка таблицы – имена атрибутов
Термины:

Домен – множество возможных значений какого-либо атрибута.

Таблица - отношение.

Экземпляр– конкретное наполнение базы данных.

^ Конкретное наполнение таблицы – тело отношения.

Заголовок (схема) – совокупность атрибутов отношения.

Заголовок + тело = значение отношения.

Строка таблицы называется кортежем.

Отношение – это подмножество декартова произведения доменов атрибутов.
^ Ключ – это один или несколько атрибутов объекта, значения которых позволяют однозначно отличить объект от других.

Первичный ключ – минимального множества атрибутов, являющегося подмножеством заголовка данного отношения, составное значение которых уникально определяет кортеж отношения.

В реляционной БД не может быть двух одинаковых кортежей в одной таблице.

Ключи: естественные и суррогатные.
^ Реляционная алгебра – механизм манипулирования реляционными данными.
Две группы операций РА:

теоретико-множественные операции (объединения отношений; пересечения отношений; взятия разности отношений; взятия декартова произведения отношений.)  и специальные реляционные операции (ограничение отношения (селекция) – горизонтальная вырезка; проекцию отношения –  вертикальная вырезка; соединение отношений (по условию, эквисоединение и естественное соединение); деление отношений.).
Результатом селекции  является отношение, заголовок которого совпадает с заголовком отношения-операнда, а в тело входят те кортежи отношения-операнда, для которых значением условия ограничения является true. 
Операция проекции дает " вертикальный срез " отношения, в котором удалены все возникшие при таком срезе дубликаты кортежей.

---------------------------------------------------------------------

^ Ключ – набор атрибутов, который функционально определяет все остальные.
1 нормальная форма (НФ)– значения не являются множествами и кортежами.

Фирма, НЕ (Город, Улица, Дом), Товар

Имя, (Телефон1, Телефон2…)
Атрибут называется первичным, если входит в состав любого возможного ключа.

^ 2 нормальная форма – 1 НФ + любой атрибут, не являющийся первичным, полностью зависит от любого его ключа, но не от подмножества ключа.

(Фирма, Адрес, Телефон, Товар, Цена)
Транзитивная зависимость: пусть A, B, C – атрибуты, A–>B, B–>C, A не зависит от B и B не зависит от C. Тогда говорят, что C транзитивно зависит от A (A–>C).

^ 3 нормальная форма – если отношение находится во 2 нормальной форме и любой атрибут, не являющийся первичным, нетранзитивно зависит от любого возможного ключа.
Примеры:

3 нормальная форма – (Город, Индекс, Адрес)

2 нормальная форма, но не 3 нормальная форма – (Универмаг, Товар, Номер отдела, Заведующий)

УТ –>Н, УН–>З, ключ – УТ.
^ Нормальная форма Бойса–Кодда – если X–>A, A (не принадлежит) X, то ключ R (принадлежит) Х.

(Город, Индекс, Адрес) – 3 нормальная форма, но не форма Бойса–Кодда. 

Если разобьем на две (Город, Индекс), (Индекс, Адрес), пропадает зависимость Город, Адрес–>Индекс.
Вывод:

Каждая схема отношений может быть приведена к форме Бойса–Кодда, так что декомпозиция обладает свойством соединения без потерь.

Любая схема может быть приведена к 3 нормальной форме с соединением без потерь и с сохранением функциональной зависимости.

Но не всегда можно привести к форме Бойса–Кодда с сохранением функциональных зависимостей. 

-----------------------------------------------------------------------

^ Многозначная зависимость.

Пусть А и B - два атрибута отношения R. Между этими атрибутами существует многозначная зависимость (МЗ), обозначаемая А->>B, если значению а атрибута А, соответствует множество значений {b1, b2, …, bk} атрибута B. 

Это множество устойчиво, т.е. сохраняется при любом вхождении многозначной зависимости в отношение.
Пример:

Каждый служащий может участвовать в нескольких проектах, но в каждом проекте, в котором он участвует, им должны выполняться одни и те же задания.
4 НФ

Отношение R(AR) находится в четвертой нормальной форме, если в структуре МЗ, определенной на множестве атрибутов AR, имеются только тривиальные МЗ зависимости и/или такие нетривиальные МЗ, что левая часть любой из них является ключом R.

-----------------------------------------------------------------------

^ SQL ( англ. Structured Query Language — «язык структурированных запросов») — универсальный компьютерный язык, применяемый для создания, модификации и управления данными в реляционных базах данных. SQL основывается на исчислении кортежей.

SQL является, прежде всего, информационно-логическим языком, предназначенным для описания, изменения и извлечения данных, хранимых в реляционных базах данных. SQL нельзя назвать языком программирования.

^ Объекты базы данных

Таблицы

Индексы

Представления

Триггеры

Процедуры
Определение атрибутов таблицы

  { имя столбца }

  { тип данных}

  [ значение по умолчанию]

  [ список ограничений ]

----------------------------------------------------------------

Индексы.

2 способа организации:

1. В виде кучи. Поиск в неупорядоченном файле – в среднем половина файла m/2.

2. Отсортированный файл.
Индекс – это избыточная структура, служит для ускорения поиска. Простейший индекс строится на основе В-дерева.
CLUSTERED

Использует возможность физического индексирования данных.

В результате будут отсортированы данные в самой таблице согласно порядку этого индекса.

Добавление информации в таблицу приводит к изменению физического порядка данных. 

Кластерным может быть только один индекс в таблице.
^ Индексная запись состоит из ключа и данных.
Таблица упорядочена по значению ключа.

Для каждого блока данных в индекс помещаем минимальное значение ключа и адрес блока.

С индексными блоками поступаем так же, наращивая уровни, пока на верхнем уровне не будет только один блок.
В-дерево

Имеет внутренние и листовые страницы.

Листовые вершины находятся на самом нижнем уровне дерева, все остальные - внутренние.

В-дерево – сбалансированная структура, т.е. от корня до любой листовой страницы одинаковое число шагов.

листовые страницы связаны одно- или двунаправленным списком.
^ Способы определения индекса:

автоматическое создание индекса при создании первичного ключа;

автоматическое создание индекса при определении ограничения целостности UNIQUE;

создание индекса с помощью команды CREATE INDEX.
^ Некластерный уникальный индекс:

В индексный файл для каждой записи помещаем пару: значение ключа +

- адрес записи, если нет кластерного индекса

- указатель на значение записи из кластерного индекса

В новый индексный уровень помещаем минимальное значение ключа и адрес индексного блока.

Наращивая уровни, пока не появится уровень из одного блока.
^ Виды индексов:

B-деревья

Hash-индексы

Индексы на основе битовых карт

R-деревья

-------------------------------------------------------------------

Hash-индекс

Выбираем количество участков, в которых будем размещать записи.

Подбираем функцию перемешивания, которая от ключевого столбца будет выдавать номер участка.

В памяти храним таблицу адресов участков.
Для размещения таблицы отводится заданное количество участков.

Есть функция  hash(key)=n, где n – номер участка.

В памяти хранится таблица адресов участков.

Проблема – неравномерность размещения записей, возникновение коллизий.
^ Функции Hash мультипликативный метод: 

Размер таблицы hashTableSize есть степень 2n. 

Значение key умножается на константу, затем от результата берется n бит. 

В качестве такой константы Кнут рекомендует золотое сечение (sqrt(5) - 1)/2 = 0.6180339887499. 
Индексы на основе битовых карт

Нужны тогда, когда у столбца может быть ограниченное число значений.

В индексе столько строк, сколько значений у столбца.

В каждой строке:

значение столбца

битовая последовательность длиной по количеству строк таблицы, в кот. 1 означает, что в данной строке атрибут принимает заданное значение.
Индексы на основе битовых карт обычно создаются быстрее и могут занимать удивительно мало места. 

Размер индекса на основе битовых карт существенно зависит от распределения данных. 

Индексы на основе битовых карт обычно выбираются стоимостным оптимизатором, если для выполнения запроса можно использовать несколько таких индексов. 

Изменения столбцов, входящих в индексы на основе битовых карт, а также вставки и удаления данных могут вызывать существенные конфликты блокировок. 

Изменения столбцов, входящих в индексы на основе битовых карт, а также вставки и удаления данных могут весьма существенно "ухудшать" индексы.

--------------------------------------------------------------------

^ Многомерное индексирование:
R-деревья 

Структура для поиска протяженных объектов – окружаем объекты ограничивающим прямоугольником.
X-деревья

Гибрид линейного просмотра и иерархической структуры: 

для данных, которые при разбиении на кластеры будут давать много перекрытий, организуется линейный просмотр.
M-деревья

На основе мультимедийных характеристик объекта определяем относительные расстояния между объектами.
K-Means

Выбираем  «центры  масс», притягиваем объекты к ближайшему центру, пересчитываем центры масс.

---------------------------------------------------------------

^ Процедуры и функции.
Процедурные средства манипулирования данными:

Для реализации логики приложения на стороне базы данных.

Создание хранимых процедур и функций.

Создание триггеров.

Хранимые процедуры хранятся в базе данных и выполняются в рамках процессов СУБД, а не клиента.
Триггер – блок, выполняемый автоматически каждый раз, когда происходит определенное событие.

-в отличие от процедуры, которая должна быть вызвана явно.

Событие – INSERT, UPDATE и DELETE для таблицы, представления.

-для запроса нельзя определить триггер.

Когда использовать триггеры (и когда не надо):

Централизованные глобальные операции, выполняемые вне зависимости от текущего пользователя или приложения.

Не нужно реализовывать триггерами возможности, достигаемые использованием декларативных средств СУБД (ограничения целостности).

Избегайте сложных цепочек триггеров.
^ Основные параметры триггера:

-Имя триггера

-Имя таблицы

-Время срабатывания: AFTER(FOR) или INSTEAD OF;

-Событие: INSERT, UPDATE, DELETE;

-Тело триггера.
Последовательность срабатывания однотипных триггеров произвольна.
^ Применение триггеров:

Защита:

-запрещение доступа в зависимости от значений данных

Учет:

-ведение журналов изменений.

Целостность данных:

-сложные правила целостности;

-сложная ссылочная целостность.

Производные данные:

-автоматическое вычисление значений.

-----------------------------------------------------------------------------

Транзакции.
Транзакция  – это последовательность операций, производимых над базой данных и переводящих базу данных из одного непротиворечивого (согласованного) состояния в другое непротиворечивое (согласованное) состояние.
Транзакция:

-некоторое неделимое действие над базой данных, осмысленное с точки зрения пользователя;

-логическая единица работы системы.

----------------------------------------------------------------------------

Конфликты:

Пара операций из расписания, такая, что

-Операции принадлежат разным транзакциям

-Работают с одним элементом данных

-По крайней мере одна из двух –операция записи

Конфликты присутствуют в любом нетривиальном расписании.
Множество конфликтов расписания содержит пары, в которых первая операция предшествует второй (и пары находятся в конфликте).

Расписания эквивалентны, если их множества конфликтов совпадают.

Расписание называется сериализуемым, если оно эквивалентно по конфликтам серийному.
^ Критерий сериализуемости:

Граф конфликтов (граф сериализуемости):

-Вершины соответствуют транзакциям;

-Дуги проводятся для каждого конфликта в направлении конфликта.

Расписание сериализуемо по конфликтам тогда и только тогда, когда граф сериализуемости не содержит контуров.
^ План доказательства:

Граф конфликтов серийного расписания не может иметь контуров, потому что транзакции упорядочены и все дуги направлены от начала к концу расписания.

Если граф не имеет контуров, эквивалентное серийное расписание можно построить с помощью топологической сортировки графа.
^ Сериализуемость по коммутативности:

Любые операции чтения коммутируют

Любые операции над разными элементами коммутируют.

Расписание сериализуемо по коммутативности, если его можно преобразовать в серийное перестановками соседних операций.

Сериализуемость по коммутативности эквивалентна сериализуемости по конфликтам.
^ Диспетчер транзакций:

Модель СУБД: диспетчер (транзакций) и исполнитель запросов.

Требования к диспетчеру транзакций: корректность и производительность Пессимистические и оптимистические протоколы.

^ Использование замков:

Операции установки lr(x), lw(x) и снятия замка ur(x), uw(x).

Cовместимость замков: замки для одного элемента данных несовместимы, если они устанавливаются разными транзакциями и по крайней мере один из них - на запись. 

Попытка установки несовместимого замка переводит транзакцию в состояние ожидания.

Проблемы, связанные с использованием замков: корректность, тупики, производительность.
^ Протокол блокирования 2PL:

Для каждой операции необходимо предварительно установить замок, все замки должны быть сняты до завершения транзакции.

Транзакция не может устанавливать новые замки после того, как она сняла какой-либо из замков.
Тупики:

W2(x) w2(y) r1(y) r2(x)

Транзакции, попавшие в тупик, должны быть оборваны.

Граф ожиданий:

Вершины –активные транзакции;

Дуги проводится из ожидающей транзакции в транзакцию, установившую несовместимые замки.

Тупик имеет место тогда и только тогда, когда в графе ожиданий имеется контур
^ Блокировкой (замком) называется временное ограничение на выполнение некоторых операций обработки данных. Блокировка может быть наложена как на отдельную строку таблицы, так и на всю базу данных.

Управлением блокировками на сервере занимается менеджер блокировок, контролирующий их применение и разрешение конфликтов.
^ Протокол для деревьев WTL:

База данных структурирована как дерево.

Протокол:

-все замки –на запись;

-для установки замка необходимо иметь установленный замок на родительскую вершину (кроме корня дерева);

-снятие замков возможно в любое время и не препятствует установке новых замков.

----------------------------------------------------------------------------

^ Варианты завершения транзакции:

-Фиксация

-Откат транзакции
Фиксация транзакции

Если все операторы выполнены успешно и в процессе выполнения транзакции не произошло никаких сбоев программного или аппаратного обеспечения, транзакция фиксируется.
^ Фиксация транзакции — это действие, обеспечивающее запись на диск изменений в базе данных, которые были сделаны в процессе выполнения транзакции.
Фиксация транзакции:

До фиксации допустимо восстановление базы данных в то состояние, в котором она была на момент начала транзакции. 

^ Фиксация транзакции означает, что все результаты выполнения транзакции становятся постоянными. 

Они станут видимыми другим транзакциям только после того, как текущая транзакция будет зафиксирована. До этого момента все данные, затрагиваемые транзакцией, будут "видны" пользователю в состоянии на начало текущей транзакции.
^ Откат транзакции

Если в процессе выполнения транзакции случилось нечто такое, что делает невозможным ее нормальное завершение, база данных должна быть возвращена в исходное состояние. 

Откат транзакции — это действие, обеспечивающее аннулирование всех изменений данных, которые были сделаны в теле текущей незавершенной транзакции.

---------------------------------------------------------------------------

^ Восстановление оборванных транзакций: откат:

Обрывы транзакций могут быть вызваны ошибками при выполнении приложений или невозможностью выполнить транзакцию сериализуемым образом

Операции обрыва можно заменить на выполнение отката для всех операций записи, включаемых в расписание в обратном порядке с последующей фиксацией
Восстановимость:

Восстановимость расписаний: транзакции должны фиксироваться до того, как их результаты используются другими транзакциями.
^ Восстановление после системных отказов

Необходим рестарт сервера БД

Для того, чтобы восстановление было возможным, необходимо вести журнал обновлений

При нормальной работе БД все изменения записываются в журнал

При рестарте журнал используется для повторения операций и для отката незавершенных транзакций.
^ Алгоритм восстановления при рестарте

Фаза просмотра: найти все зафиксированные и активные транзакции (прямой просмотр журнала)

Фаза наката (redo): при прямом просмотре, выполнить все операции зафиксированных транзакций

Фаза отката (undo): обратный просмотр журнала, откат всех операций незавершенных транзакций.
^ Завершение восстановления

После завершения фазы отката необходимо

Записать на диск все измененные блоки БД

После записи БД можно очистить журнал

Возобновить нормальную работу системы.

----------------------------------------------------------------------------

^ Информационный поиск – это отрасль знания, которая занимается представлением, хранением и доступом к информационным ресурсам.

Информационный ресурс – это любой материальный объект, который фиксирует какие-либо знания и может быть включен в определенное собрание.
^ Виды информационных ресурсов:

По форме различают:

-текстовые (книги, журналы, рукописи), 

-графические  (чертежи, схемы, графики, планы, карты, диаграммы), 

-аудиовизуальные (звукозаписи, видеозаписи, фильмы) информационные ресурсы.
Документ в задаче ИП:

Содержательно законченный текстовый информационный ресурс

Уникальный идентификатор. 

Метаданные – это структурированная информация о документе, например, библиографические сведения, информация о качестве документа, отзывы других пользователей. 

Суррогаты - представление документа в виде заголовка, имени автора, аннотации, ключевых слов и т. д.


^ Общая схема процесса поиска

Использование специальных тематических каталогов и реализуется в классификационных ИПС. Для поиска документа в этом случае используются его название, выходные данные, тематика и другие реквизиты. 
^ Поисковые машины - словарные ИПС, использует для поиска словари, составленные из терминов, описывающих содержание индексированных документов, с которыми работают программные средства, называемые поисковыми машинами. 
^ Поиск информации состоит из четырех этапов:

-определение (уточнение) информационной потребности и формулировка информационного запроса;

-определение совокупности возможных держателей информационных массивов (источников);

-извлечение информации из выявленных информационных массивов;

-ознакомление с полученной информацией и оценка результатов поиска.
^ Характеристики качества поиска - релевантность:

-ИП, сформулированная на информационно-поисковом языке, называется запросом. 

-Степень соответствия ответов поисковой системы запросу пользователя, а значит, и его информационной потребности, называется релевантностью.
^ Виды релевантности:

Пертинентность – степень соответствия информации из документа и реальной ИП пользователя. Это истинная и наиболее трудноопределимая релевантность. 

  1   2

Добавить документ в свой блог или на сайт

Похожие:

Информатика. Определения. 19. 12. 2012 iconВопросы к экзамену по дисциплине Информатика I 2012/2013
Информатика как наука: определения информатизации общества и информатики; цель, задачи и главная функция информатики; определения...

Информатика. Определения. 19. 12. 2012 iconИнформатика определения (информация, данные, сигналы)
Информатика— наука о способах получения, накопления, хранения, преобразования, передачи, защиты и использования информации

Информатика. Определения. 19. 12. 2012 iconИнформатика
Информатика. Учебное пособие для студентов всех специальностей — Караганда: кэу, 2012 г. 246 с

Информатика. Определения. 19. 12. 2012 iconУчебно-методический комплекс 230700 «прикладная информатика» профиль...
Тема Основные понятия информационного менеджмента (ИМ): определения, основные понятия отрасли ит, цель, элементы, объекты и процессы...

Информатика. Определения. 19. 12. 2012 icon1. Основные понятия и определения
Термин "информатика" (франц informatique) происходит от французских слов information (информация) и automatique (автоматика) и дословно...

Информатика. Определения. 19. 12. 2012 iconМетодические указания к выполнению контрольных работ по дисциплине «Информатика»
Задания и методические указания к выполнению контрольных работ по дисциплине «Информатика». Екатеринбург, фгаоу впо «Российский государственный...

Информатика. Определения. 19. 12. 2012 iconБеларусь Принят Палатой представителей 31 мая 2012 года Одобрен Советом...
Статья Основные термины и их определения, используемые для целей настоящего Кодекса

Информатика. Определения. 19. 12. 2012 iconМетодические указания по курсу "Информатика" для лабораторных и контрольных...
...

Информатика. Определения. 19. 12. 2012 iconВопрос что такое информатика, экономическая информатика? Предмет экономической информатики

Информатика. Определения. 19. 12. 2012 iconИнформатика ответы на вопросы
Информатика-наука об информации, способах её представления, обработки и преобразовании

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
zadocs.ru
Главная страница

Разработка сайта — Веб студия Адаманов