1.6.5 Хранение информации
Хранение и накопление информации вызвано ее многократным использованием, применением постоянной информации, необходимостью комплектации первичных данных до их обработки; осуществляется на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования группировочному признаку.
Хранение информации – это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.
Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.
Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии (рис. 1.16).
В результате реализации такого алгоритма документ, независимо от формы представления поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.
Этап хранения информации может быть представлен на следующих уровнях: внешнем, концептуальном (логическом), внутреннем, физическом.
Рис. 1.16. Алгоритм процесса подготовки информации к хранению
Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе их хранения.
Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).
Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.
Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.
Способы организации хранения информации связаны с ее поиском – операцией, предполагающей извлечение хранимой информации.
Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней и применяемые для работы с файлами, графическими базами данных и т. д.
Маркер (mark, marker) – метка на носителе информации, обозначающая начало или конец данных либо их части (блока).
В современных носителях информации используются маркеры:
- адреса (адресный маркер) – код или физическая метка на дорожке диска, указывающие на начало адреса сектора;
- группы – маркер, указывающий начало или конец группы данных;
- дорожки (начала оборота) – отверстия на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.
- конца файла – метка, используемая для указания окончания считывания последней записи файла;
- ленты (ленточный маркер) – управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;
- сегмента – специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого.
Хранение информации в ЭВМ связано с процессом ее арифметической обработки и с принципами организации информационных массивов, поиска, обновления, представления информации и др.
Важным этапом автоматизированного этапа хранения является организация информационных массивов.
Массив (от англ. array) – упорядоченное множество данных.
Информационный массив – система хранения информации, включающая представление данных и связей между ними, т. е. принципы их организации.
С учетом этого рассматриваются следующие структуры организации информационных массивов: линейная, многомерная.
В свою очередь, линейная структура данных делится на строки, одномерные массивы, стеки, очереди, деки и др.
Строка – это представление данных в виде элементов, располагающихся по признаку непосредственного следования, т. е. по мере поступления данных в ЭВМ.
Одномерный массив – это представление данных, отдельные элементы которых имеют индексы, т. е. поставленные им в соответствие целые числа, рассматриваемые как номер элемента массива.
Индекс обеспечивает поиск и идентификацию элементов, а следовательно, и доступ к заданному элементу, что облегчает его поиск по сравнению с поиском в строке.
Идентификация – процесс отождествления объекта с одним из известных объектов.
Стек – структура данных, учитывающая динамику процесса ввода-вывода информации, использующая линейный принцип организации хранения, реализующий процедуру обслуживания "последним пришел – первым ушел" (первым удаляется последний поступивший элемент).
Очередь – структура организации данных, при которой для обработки информации выбирается элемент, поступивший ранее всех других.
Дека – структура организации данных, одновременно сочетающая рассмотренные виды.
Нелинейные структуры хранения данных используют многомерные структуры (массивы) следующих видов: деревья, графы, сети.
Элемент многомерного массива определяется индексом, состоящим из набора чисел. Формой представления прямоугольного массива является матрица, каждое значение которой определяется индексом требуемого элемента массива. Так, в двухмерном массиве элементы обозначаются двумя индексами, а в трехмерном – тремя.
Массивы по своей структуре близки к файлам и отличаются от последних двумя основными признаками:
- каждый элемент массива может быть явно обозначен, и к нему имеется прямой доступ;
- число элементов массива определяется при его описании.
Организация хранения данных в многомерном массиве может быть представлена в виде логических структур информационных массивов. В этих массивах структуры данных компонуются в виде записей, располагающихся различным образом. С учетом этого выделяют следующие основные структуры информационных массивов: последовательную, цепную, ветвящуюся, списковую.
В последовательной структуре информационного массива записи располагаются последовательно, нахождение требуемой записи осуществляется путем просмотра всех предшествующих. Включение новой записи в информационный массив требует смещения всех записей, начиная с той, которая добавляется. Обновление информационных массивов при последовательной структуре требует перезаписи всего массива.
В цепной структуре информационные массивы располагаются произвольно. Для логической связи отдельных записей необходима их адресация, т. е. каждая предыдущая запись логически связанного информационного массива должна содержать адрес расположения последующей записи. Если с определенного уровня, значения в записях повторяются в различных сочетаниях, то в целях экономии памяти возможен переход от цепной структуры к ветвящейся.
В ветвящейся структуре информационного массива сначала размещается запись, отображающая признак объекта с небольшим числом значений, далее они повторяются в записях в различных сочетаниях. Это дает возможность перейти от некоторой основной записи к другим в зависимости от запроса, не повторяя основную запись.
Чтобы устранить повторяющиеся записи и соответствующие им поля из памяти, их удаляют из основного массива и объединяют в дополнительный небольшой информационный массив. В нем записи упорядочиваются по какому-либо признаку без повторений, тогда в основном массиве вместо удаленного информационного поля указываются адреса записей, размещенных в дополнительном массиве. Данная структура является удобной при реорганизации информационной базы, поскольку повторяющиеся записи легко могут быть заменены, так как хранятся в дополнительном массиве, основной массив подвергается при этом незначительным изменениям. Однако эта структура требует дополнительного объема памяти.
Списковая структура информационных массивов характеризуется наличием списка, который содержит набор данных, определяющих логический порядок организации информационного массива.
Список включает имя и адрес поля данных. В памяти ЭВМ элементы списка физически разнесены, но связаны друг с другом логически за счет адресных ссылок.
Поле данных в зависимости от характера хранимой информации может быть выражено двоичным разрядом, словом фиксированной либо переменной длины, а также набором отдельных слов.
Формализовано список может быть реализован в виде таблицы, где имена списка и поля данных сопоставлены с адресами, выбранными произвольно по мере наличия свободных мест в запоминающем устройстве. В случае необходимости повторений какой-либо информации рекомендуется многократно обращаться по адресу, который может входить в несколько списков, т. е. применить механизм многократных адресных ссылок.
Списковая структура с механизмом адресных ссылок может быть представлена в виде графа древовидной структуры. В нем каждый элемент списка включает в себя маркерное поле, поле данных и адресное поле. Маркерное поле предупреждает, имеется ли ссылка на другой список или она отсутствует. В зависимости от этого в маркерном поле ставится знак минус или плюс.
Списки так же могут быть показаны ориентированными графами с полями, в которых возможна ссылка вперед и назад. Возникает так называемый симметричный список, и появляется возможность движения в структуре данных в разных направлениях.
Рассмотренные списковые структуры информационных массивов имеют следующие особенности:
- высокую логическую простоту;
- относительно большое количество времени доступа, обусловленное адресным обращением к данным, при котором к каждому элементу списка необходимо иметь ссылку;
- значительное возрастание объема памяти запоминающего устройства по сравнению с последовательной структурой организации информационных массивов, обусловленное адресным обращением к данным.
С учетом рассмотренных структур формирования информационных массивов можно представить ряд способов организации массивов (рис. 1.17) в запоминающих устройствах ЭВТ.
Рис. 1.17. Способы организации массивов информации в запоминающем устройстве ЭВТ
На физическом уровне любые записи информационного поля представляют в виде двоичных символов. Обращение к памяти большого объема требует большой длины адреса. Если память имеет емкость 2n слов, то для поиска таких слов потребуются n-разрядные адреса. В микропроцессорах восьмиразрядные слова дают возможность обращаться к 256 ячейкам памяти, что оказывается недостаточно для хранения информации в автоматизированных системах. Если непосредственно обращение к любой ячейке невозможно, переходят к страничной организации памяти.
В этом случае выбирают область памяти емкостью 2n слов и называют страницей, обращение к которой осуществляется командой, содержащей n-разрядное адресное поле. В микропроцессорах обычно используют страницы размером 256 слов.
Принципы адресации, объемы памяти, количественные характеристики зависят от функционального назначения запоминающих устройств, разделяющимся по уровням функциональной иерархии на сверхоперативные, оперативные, постоянные, полупостоянные, внешние, буферные.
С хранением информации связаны следующие понятия: носитель информации (память), внутренняя память, внешняя память, хранилище информации.
Носитель информации – это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг), которую можно назвать оперативной (быстрой) памятью или внутренней памятью, поскольку ее носитель находится внутри нас.
Другие носители информации можно назвать внешними (по отношению к человеку), например бумага, которая, непригодна в обычных (не специальных) условиях для длительного хранения информации: на нее оказывают вредное воздействие температурные условия.
Для ЭВТ по материалу изготовления различают бумажные, металлические, пластмассовые, комбинированные и другие носители; по принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.; по методу считывания различают контактные, магнитные, электрические, оптические. Хранение информации осуществляется на специальных носителях.
Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе, которые бывают прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается такими параметрами, как время доступа, емкость памяти и плотность записи. Хранение больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.
Хранилище информации – это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования, например архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ: анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т. е. упорядоченность, классификация хранимых документов. Она необходима для удобства ведения хранилища: пополнения новыми документами, удаления ненужных, поиска информации и т. д.
Основные свойства хранилища информации: объем хранимой информации, надежность хранения, время доступа (т. е. время поиска нужных сведений), наличие защиты информации.
Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Для описания хранения данных используют те же понятия: носитель, хранилище данных, организация данных, время доступа, защита данных. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных и банками данных.
Таким образом, хранение информации представляет собой процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.
... вычислительной техники, а также принципы функционирования этих средств и методы управления ими. Из этого определения видно, что информатика очень близка к технологии, поэтому ее предмет нередко называют информационной технологией. Предмет информатики составляют следующие понятия: а) аппаратное обеспечение средств вычислительной техники; б) программное обеспечение средств вычислительной техники ...
... – набор утилит и некоторые инструментальные программы (пользовательский интерфейс). К третьему уровню относятся все остальные программы. Программы второго и третьего уровней хранятся в файлах. Программное обеспечение первого уровня является машинно-зависимым [computer-independent]. То есть для каждого микропроцессора или семейства ЭВМ набор данных программ уникален. Операционная система имеет ...
... Вы сможете работать на своем компьютере. От выбора ОС зависят также производительность вашей работы, степень защиты Ваших данных, необходимые аппаратные средства и т.д. [9] 5. Персональная ЭВМ: развернутая структура; структура программного обеспечения; выбор ПЭВМ (если возможно, то по прайс-листу некоторой фирмы). Развернутая структура (тонкие линии показывают управляющие связи, толстые – ...
... » (Zero Administration Initiative), которая будет реализована во всех следующих версиях Windows. SMS- сервер управления системами У SMS две задачи — централизовать управление сетью и упростить распространение программного обеспечения и его модернизацию на клиентских системах. SMS подойдет и малой, и большой сети — это инструмент управления сетью на базе Windows NT, эффективно использующий ...
0 комментариев