1.6.6 Системы хранения данных
В последнее время применение компьютерной техники претерпевает значительные изменения, связанные с переходом к созданию интегрированных (объединенных) информационных систем, предназначенных осуществлять согласованное управление данными в пределах предприятия (организации), координировать работу отдельных подразделений, автоматизировать операции по обмену информацией как в пределах отдельных групп пользователей, так и между несколькими организациями, отстоящими друг от друга на десятки и сотни километров. Основой для построения подобных систем служат локальные вычислительные сети (ЛВС). Их характерной чертой является предоставление пользователям возможности работать в универсальной информационной среде с функциями коллективного доступа к данным.
Рост объемов данных, возросшие требования к надежности хранения и быстродействию доступа к данным делают необходимым выделение средств хранения в отдельную подсистему вычислительного комплекса – систему хранения данных. Роль и важность ее определяются постоянно возрастающей ценностью информации в современном обществе, возможность доступа к данным и управления ими является необходимым условием для успешного выполнения информационных процессов.
Система хранения данных предназначена для организации их надежного хранения, а также отказоустойчивого, высокопроизводительного доступа серверов к устройствам хранения. В настоящее время объем и стоимость обрабатываемой информации с каждым годом увеличиваются и, как следствие, повышаются требования по надежности, доступности и совокупной стоимости владения используемых систем хранения данных. Помимо высоких показателей производительности, доступности и низкой стоимости необходимо обеспечить требуемую функциональность – объем хранения и число подключаемых серверов.
Дисковые массивы сегодня являются основными устройствами хранения данных, однако обработка информации, формирование логической структуры ее хранения (дисковых томов и файловых систем) осуществляется на серверах. В процесс доступа к данным, помимо процессоров и памяти сервера, вовлечены установленные в нем адаптеры (Host Bus Adapter – HBA), работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие HBA с операционной системой, менеджер дисковых томов, файловая система и менеджер памяти операционной системы.
Если дисковый массив выполнен в виде отдельного устройства, то для его подключения к серверам используется определенная инфраструктура. В зависимости от протокола доступа (транспорта), реализованного в HBA и дисковом массиве, она может быть как простой шиной (протокол SCSI), так и сетью (протокол Fibre Channel (FC)). Если это сеть, то в ней используется активное оборудование – концентраторы и коммутаторы, работающие по протоколу FC, маршрутизаторы протокола FC в другие протоколы (обычно в SCSI). Таким образом, помимо устройств хранения данных в состав СХД необходимо еще добавить инфраструктуру доступа, связывающую серверы с устройствами хранения.
Сетевой инфраструктурой, объединяющей большое количество серверов и устройств хранения, необходимо управлять и отслеживать ее состояние. Это реализуется "подручными" средствами – встроенными утилитами серверов, массива и операционной системы, бесплатными утилитами или "самописными" скриптами. Каждое из устройств в СХД имеет несколько объектов, требующих управления и контроля состояния, например дисковые группы и тома у массивов, порты у массивов и коммутаторов, адаптеры в серверах. Как только число объектов управления в СХД начинает исчисляться десятками, управление такой конфигурацией отнимает у администраторов слишком много времени и сил и неизбежно приводит к ошибкам. Справиться с такой задачей можно, только используя полномасштабную систему управления.
Система хранения данных должна включать следующие подсистемы и компоненты:
1. Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные высокопроизводительные дисковые массивы используют технологию Fibre Channel для подключения к ним серверов и доступа к дискам внутри массива. Они могут масштабироваться до десятков терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций: виртуализации дискового пространства, разграничения доступа к дисковому пространству, создания Point-In-Time (PIT) копий данных и репликации данных между массивами. К устройствам хранения данных также относятся ленточные, магнитооптические и CD/DVD библиотеки.
2. Инфраструктуру доступа серверов к устройствам хранения данных, которая создается в настоящее время на основе технологии "сеть хранения данных" (Storage Area Network – SAN). SAN является высокопроизводительной информационной сетью, ориентированной на быструю передачу больших объемов данных.
В основе концепции SAN лежит возможность соединения любого из серверов с любым устройством хранения данных, работающим по протоколу Fibre Channel. Сеть хранения данных образуют волоконно-оптические соединения, Fibre Channel Host Bus Adapters (FC-HBA) и FC-коммутаторы, обеспечивающие в настоящее время скорость передачи 200 Мбайт/с и удаленность между соединяемыми объектами до нескольких десятков километров.
3. Систему резервного копирования и архивирования данных, предназначенную для создания резервных копий и восстановления данных. Она позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.
4. Программное обеспечение управления хранением данных, предназначенное для решения задач управления хранением данных, например, для разметки дисковых томов или повышения производительности доступа к данным прикладного ПО. Это достигается за счет того, что встроенное в массивы программное обеспечение собирает статистику по интенсивности работы с данными и исходя из нее принимает решение о перемещении данных на диски, производительность которых соответствует скорости обращения к данным.
5. Систему управления, предназначенную для мониторинга и управления уровнем качества сервиса хранения данных. Она тесно интегрируется с системой управления вычислительным комплексом. Основой системы управления СХД являются средства управления аппаратными ресурсами сети хранения данных. Их интеграция с другими системами дает возможность контролировать ресурсы СХД и управлять ими на всех уровнях – от дисков в массиве до файловой системы сервера.
Для защиты от отказов отдельных дисков используют технологии RAID (кроме RAID-0), использующие дублирование данных, хранимых на дисках. Уровень RAID-5 хотя и не создает копий блоков данных, но все же сохраняет избыточную информацию, что тоже можно считать дублированием. Для защиты от логического разрушения данных (разрушение целостности базы данных или файловой системы), вызванного сбоями в оборудовании, ошибками в программном обеспечении или неверными действиями обслуживающего персонала, применяется резервное копирование, которое тоже является дублированием данных. Для защиты от потери данных вследствие выхода из строя устройств хранения по причине техногенной или природной катастрофы данные дублируются в резервный центр.
Отказоустойчивость доступа серверов к данным достигается дублированием путей доступа. Применительно к SAN дублирование заключается в следующем: сеть строится как две физически независимые сети, идентичные по функциональности и конфигурации. В каждый из серверов устанавливается как минимум по два адаптера FC-HBA. Первый из них подключается к одной половинке SAN, а второй – к другой. Отказ оборудования, изменение конфигурации или регламентные работы на одной из частей SAN не влияют на работу другой. В дисковом массиве отказоустойчивость доступа к данным обеспечивается дублированием RAID-контроллеров, блоков питания, интерфейсов к дискам и к серверам. Для защиты от потери данных зеркалируют участки кэш-памяти, участвующие в операции записи, а электропитание кэш-памяти резервируют батареями. Пути доступа серверов к дисковому массиву тоже дублируются. Внешние интерфейсы дискового массива подключаются к обеим половинкам SAN.
Все предлагаемые решения обладают высокой степенью масштабирования, что позволяет сначала использовать небольшую и относительно дешевую систему хранения данных и по мере своего развития модернизировать ее в систему хранения данных корпоративного уровня, отвечающую заданным требованиям по надежности хранения и доступности информации.
Структура системы хранения данных имеет несколько уровней.
... вычислительной техники, а также принципы функционирования этих средств и методы управления ими. Из этого определения видно, что информатика очень близка к технологии, поэтому ее предмет нередко называют информационной технологией. Предмет информатики составляют следующие понятия: а) аппаратное обеспечение средств вычислительной техники; б) программное обеспечение средств вычислительной техники ...
... – набор утилит и некоторые инструментальные программы (пользовательский интерфейс). К третьему уровню относятся все остальные программы. Программы второго и третьего уровней хранятся в файлах. Программное обеспечение первого уровня является машинно-зависимым [computer-independent]. То есть для каждого микропроцессора или семейства ЭВМ набор данных программ уникален. Операционная система имеет ...
... Вы сможете работать на своем компьютере. От выбора ОС зависят также производительность вашей работы, степень защиты Ваших данных, необходимые аппаратные средства и т.д. [9] 5. Персональная ЭВМ: развернутая структура; структура программного обеспечения; выбор ПЭВМ (если возможно, то по прайс-листу некоторой фирмы). Развернутая структура (тонкие линии показывают управляющие связи, толстые – ...
... » (Zero Administration Initiative), которая будет реализована во всех следующих версиях Windows. SMS- сервер управления системами У SMS две задачи — централизовать управление сетью и упростить распространение программного обеспечения и его модернизацию на клиентских системах. SMS подойдет и малой, и большой сети — это инструмент управления сетью на базе Windows NT, эффективно использующий ...
0 комментариев