2.1 Модели и архитектура БД

Использование модели данных при работе с БД неизбежно по нескольким причинам. Во-первых, модель дает общий язык пользователям, работающим с данными. Во-вторых, модель может обеспечить предсказуемость результатов работы с данными. Становится возможным объяснить пользователю, почему он получил конкретный результат при просмотре или изменении данных, и наоборот, работающий с базой может предвидеть, какого сорта он получит результат. За время существования разработок программных систем предложено много различных моделей разной степени распространенности.

Реляционная модель данных

Наиболее популярной с начала 80-х гг. была и до сих пор остается реляционная модель данных. Она первая получила математическое описание, и она экономна по части базовых понятий. Первое повлекло возможность тщательного и интенсивного исследования свойств этой модели (немедленно реализованного в обширной литературе), а второе сделало ее привлекательной для программистов и пользователей.

В реляционной модели считается, что все данные ИС представлены в виде таблиц. Строки в каждой таблице - это кортеж неструктурированных единиц данных. Набор кортежей, составляющий таблицу, образует математическое отношение, таким образом, модель данных представляется множеством таблиц-отношений (называемых R-таблицами), отсюда название "реляционная", т.е. модель, представленная отношениями [19].

Атрибуты строк-кортежей (и таблиц-отношений) - это значения из заданных наравне с таблицами областей определения ("доменов"). Разные столбцы в одной и той же или в разных таблицах могут иметь одну и ту же область определения, а могут - разные.

Значения атрибутов в таблице-отношении могут иметь только один определенный вид функциональной зависимости друг от друга, а именно, все значения в произвольном кортеже должны по отдельности зависеть только от значений столбца или группы столбцов - одних для всего отношения. Такой столбец или группа столбцов, называются ключевыми, а значения атрибутов в них - ключами.

Реляционная база данных - это набор R-таблиц и только R-таблиц. Считается, что никаким иным образом (переменные, массивы и т.п.) данные в базе не представлены. В рамках реляционной теории имеется список операций, которые можно осуществлять над R-таблицами, причем так, что результатом снова будет R-таблица. Обычно это следующие операции:

·           Базовые операции:

-ограничение - исключение из таблицы некоторых строк;

-проекция - исключение из таблицы некоторых столбцов;

-декартово произведение - из двух таблиц получается третья по принципу декартова произведения двух множеств строк;

-объединение - объединение множеств строк двух таблиц;

-разность - разность множеств строк двух таблиц;

-присвоение - именованной таблице присваивается значение выражения над R-таблицами.

·           Производные операции:

-группа операций соединения;

-пересечение - пересечение множеств строк двух таблиц;

-расширение - добавление новых столбцов в таблицу;

-суммирование - в новой таблице с меньшим, чем в исходной, числом строк, строки получены как агрегирование (например, суммирование по какому-то столбцу) строк исходной [15].

Если можно говорить об основной идее использования реляционного подхода в СУБД, то это именно предсказуемость результатов работы с данными, обеспечиваемая математическим аппаратом в основе этого подхода. Ничего другого для объяснения пользователю, почему он получил тот, а не иной результат, не требуется. А, учитывая, что набор основных понятий достаточно прозрачен, получается, что результат не просто предсказуем, но и относительно просто предсказуем. То же можно сказать не только о запросах, но и о манипулировании моделью с помощью перечисленных операций над таблицами. Реляционная модель данных, несмотря на ее достоинства, совсем не идеальна. В ряде случаев она не позволяет ясно (или вовсе) отразить особенности предметной области: всего лишь одной из иллюстраций тому служит отсутствие прямых средств выражения иерархии. Поэтому постоянно ведутся поиски других моделей, которые, впрочем, все также имеют свои сильные и слабые стороны.

Объектно-ориентированная модель данных

Моделью данных, привлекающей нарастающее внимание с конца 80-х гг., является объектная, или "объектно-ориентированная" модель. Основными понятиями, с которыми оперирует эта модель, являются следующие:

-объекты, обладающие внутренней структурой и однозначно идентифицируемые уникальным внутрисистемным ключом;

-классы, являющиеся по сути типами объектов;

-операции над объектами одного или разных типов, называемые "методами";

-инкапсуляция структурного и функционального описания объектов, позволяющая разделять внутреннее и внешнее описания (в терминологии предшествовавшего объектному модульного программирования - "модульность" объектов);

-наследуемость внешних свойств объектов на основе соотношения "класс-подкласс" [5].

К достоинствам объектно-ориентированной модели относят:

-возможность для пользователя системы определять сложные типы данных (используя имеющийся синтаксис и свойства наследуемости и инкапсуляции);

-наличие наследуемости свойств объектов;

-повторное использование программного описания типов объектов при обращении к другим типам, на них ссылающимся [3].

К недостаткам объектно-ориентированной модели можно отнести:

-отсутствие строгих определений, разное понимание терминов и различия в терминологии, например, изъявляется готовность изложить восемь различных толкований такого базового понятия, как "наследуемость";

-как следствие - эта модель не исследована столь тщательно математически, как реляционная;

-отсутствие общеупотребимых стандартов, позволяющих связывать конкретные объектно-ориентированные системы с другими системами работы с данными [17].

Некоторые специалисты основным и главным отличием объектно-ориентированной модели от реляционной считают наличие уникального системного идентификатора. Эта разница связана с одним интересным семантическим явлением. Дело в том, что в реляционной модели объект целиком описывается его атрибутами.

Модель "объектов-ролей"

Еще одной моделью данных, имеющей конкретную реализацию, является модель "объектов-ролей", предложенная еще в начале 70-х годов. В отличие от реляционной модели в ней нет атрибутов, а основные понятия - это объекты и роли, описывающие их. Роли могут быть как "изолированные", присущие исключительно какому-нибудь объекту, так и существующие как элемент какого-либо отношения между объектами. Модель служит для понятийного моделирования, что отличает ее от реляционной модели. Модель "объектов-ролей" сейчас привлекает большое внимание специалистов, однако до промышленных масштабов ее использования, сравнимых с двумя предыдущими, ей пока далеко [15].

Концептуальная модель данных

 Концептуальная модель наиболее полно отвечает потребностям проектирования баз знаний и построена на ряде принципов, которые мы сейчас рассмотрим. Есть две большие области понятий в концептуальной модели. Обе они построены по принципу иерархического дерева. Первая область – это дерево типов данных, вторая – дерево данных. Дерево типов описывает структуру данных дерева данных, поэтому без дерева типов нет никакой логической целостности дерева данных.

Уровень упрощения – уровень детализации представления об объекте реального мира, достаточный нам для его описания и последующего использования.

Свойство объекта – это одна из характеристик объекта реального мира, информацию, о которой мы будем хранить в базе данных.

События – набор реакций объекта на изменения внешних условий, описанных в нашей базе данных.

Тип – набор свойств и событий объекта, описанных как единый комплекс. При этом, в зависимости от уровня упрощений, у нас может быть свойством типа другой тип.

Объект – совокупность типов и свойств, объединенных в один тип, способный описать объект реального мира.

Связь – это свойство типа или свойства типа, характеризующая взаимосвязь типов в дереве данных или способ изменения значения свойства объектного типа соответственно. Бывают три типа связей: включение в дереве данных, вставка из другого типа значения свойства типа и ссылка на экземпляр типа в дереве данных. Включение позволяет строить дерево данных.

Наследование – это способ описания дерева типов [19].

Имея такие богатые возможности, концептуальная модель долгое время была не реализована. Авторами концептуальной модели были Смит и Смита – американские ученые, написавшие ряд статей в 1972 – 1976 годах, которые, по общему мнению, считались утопией.

Инфологическая модель данных

Наиболее близка к концептуальной модели, модель “Сущность-связь”, хоть и значительно более ущербная с точки зрения пользователя. Основными конструктивными элементами инфологических моделей, являются сущности, связи между ними и их свойства.

Сущность – любой различимый объект.

Атрибут – поименованная характеристика сущности.

Связь – ассоциирование двух или более сущностей.

Ключ – минимальный набор атрибутов, по значениям которых можно однозначно найти требуемый экземпляр сущности. Как правило – это первичный ключ в таблице базы данных.

К. Дейт определяет три основных класса сущностей: стержневые, ассоциативные и характеристические, а также подкласс ассоциативных сущностей – обозначения [8].

Ассоциативная сущность – это связь вида "многие-ко-многим".

Характеристическая сущность (характеристика) – это связь вида "многие-к-одной" или "одна-к-одной" между двумя сущностями (частный случай ассоциации). Единственная цель характеристики в рамках рассматриваемой предметной области состоит в описании или уточнении некоторой другой сущности. Это что-то вроде перечисления.

Обозначающая сущность или обозначение – это связь вида "многие-к-одной" или "одна-к-одной" между двумя сущностями и отличается от характеристики тем, что не зависит от обозначаемой сущности.

Архитектура БД

Эффективность функционирования информационной системы (ИС) во многом зависит от ее архитектуры. В настоящее время перспективной является архитектура клиент-сервер. В достаточно распространенном варианте она предполагает наличие компьютерной сети и распределенной базу данных, включающей корпоративную базу данных (КБД) и персональные базы данных (ПБД). КПД размещается на компьютере-сервере, ПБД размещают на компьютерах сотрудников подразделений, являющихся клиентами корпоративной БД.

Сервером определенного ресурса в компьютерной сети называется компьютер (программа), управляющий этим ресурсом, клиентом-компютер (программа), использующий этот ресурс. В качестве ресурса компьютерной сети могут выступать, к примеру, базы данных, файловые системы, службы печати, почтовые службы. Тип сервера определяется видом ресурса, которым он управляет.

Достоинством организации информационной системы по архитектуре клиент-сервер - удачное сочетание централизованного хранения, обслуживания и коллективного доступа к общей информации с индивидуальной работой пользователей над персональной информацией. Архитектура клиент-сервер является удачное сочетание централизованного хранения, обслуживания и коллективного доступа общей корпоративной информации с индивидуальной работой пользователей над персональной информацией. Она допускает различные варианты реализации.

Исторически первыми появились распределенные ИС с применением файл-сервера. В таких ИС по запросам пользователей файлы базы данных передаются на персональные компьютеры (ПК), где и производится их обработка. Недостатком такого варианта архитектуры является высокая интенсивность передачи обрабатываемых данных. Причем, зачастую передаются избыточные данные: вне зависимости от того, сколько записей из базы данных требуется пользователю, файлы базы данных передаются целиком.

Структура распределенной ИС, построенной по архитектуре клиент-сервер с использованием сервера баз данных. При такой архитектуре сервер базы данных обеспечивает выполнение основного объема обработки данных. Формируемые пользователем или приложением запросы поступают к серверу БД в виде инструкций языка SQL. Сервер базы данных выполняет поиск и извлечение нужных данных, которые затем передаются на компьютер пользователя. Достоинством такого подхода в сравнении предыдущим является заметно меньший объем передаваемых данных.

Для создания и управления персональными БД и приложений, работающих с ними, используются СУБД, такие как Access Visual FoxPro фирмы Microsoft, Paradox фирмы Borland.

Корпоративная БД создается, поддерживается и функционирует под управлением сервера БД, например Microsoft SQL Server или Oracle Server.

В зависимости от размеров организации и особенностей решаемых задач информационная система может иметь одну из следующих конфигураций

-компьютер-сервер, содержащий корпоративную и персональные базы;

- компьютер-сервер и персональные компьютеры с ПБД;

-несколько компьютеров-серверов и персональных компьютеров с ПДБ [20].

Использование архитектуры клиент-сервер дает возможность постепенного наращивания информационной системы предприятия, во-первых, по мере развития предприятия; во-вторых, по мере развития самой информационной системы

Разделение общей БД на корпоративную БД и персональную БД позволяет уменьшить сложность проектирования БД по сравнению с централизованным вариантом, а значит снизить вероятность ошибок при проектировании и стоимость проектирования.

Важнейшим достоинством применения БД в информационных системах является обеспечение независимости данных от прикладных программ. Это дает возможность пользователям не заниматься проблемами представления данных на физическом уровне: размещения данных в памяти, методов доступа к ним и т.д.

Такая независимость достигается поддерживаемым СУБД многоуровневым представлением данных в БД на логическом (пользовательском) и физическом уровнях. Благодаря СУБД и наличию логического уровня представление данных обеспечивается отделение концептуальной (понятийной) модели БД от ее физического представления в памяти компьютера.


Информация о работе «Современные информационные продукты и услуги»
Раздел: Информатика, программирование
Количество знаков с пробелами: 44693
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
78258
0
0

... в секторе научной и технической информации. Небольшие коммерческие структуры были вынуждены либо прекратить свою деятельность, либо ориентироваться на платежеспособного потребителя. Производство же информационных продуктов и услуг в сфере научной и технической информации вновь сосредоточилось в рамках государственных структур, финансирование которых было сведено к минимуму. Третий этап начался в ...

Скачать
9802
0
1

... или организаций, предлагаю­щих однородные информационные продукты и услуги. Инфраструктуру информационного рынка можно представить следующим образом: Выделим пять секторов рынка информационных продуктов и услуг. 1-й сектор—деловая информация, состоит из следующих частей: • биржевая и финансовая информация — котировки ценных бумаг, валютные курсы, учетные ставки, рынок товаров и капиталов, ...

Скачать
43589
0
0

... больших массивов информации, особенно в таких случаях, когда продуктом является информация не только текстового характера, но и зрительные и звуковые образы.   2.7. Другие виды информационных и вычислительных продуктов и услуг. - Аппаратные средства. К ним относятся: оборудование и устройства, из которых состоит компьютер, в частности центральный процессор, оптические считывающие устройства, ...

Скачать
30750
0
0

... страхование имущества и информации; ·          организация службы информационной безопасности; ·          сервисное обслуживание. 2. Развитие информационного (интеллектуального) рынка в России на пример ИТ-услуг В настоящее время рынок ИТ-услуг (мы имеем в виду ИТ-услуги, оказываемые внешними поставщиками) – наиболее динамично развивающийся сегмент отечественного ИТ-рынка. Однако ...

0 комментариев


Наверх