6.4.5 Зеркалирование, дублирование и заполнение.
Некоторые ОС, включая NetWare и Windows NT Server, позволяют осуществлять зеркалирование дисков на нескольких дисковых каналах, обеспечивая таким образом дополнительный уровень избыточности. Как упоминалось ранее, Novell называет последний подход дублированием дисков. В сочетании с заполнением дисков дублирование может обеспечить большую по сравнению с однодисковыми системами производительность и в целом способно обогнать аппаратные реализации RAID-5. Поскольку каждая половина зеркальной пары дисков использует отдельный дисковый канал, запись на диски, в отличие от случая, когда диски находятся на одном и том же HBA, может производиться одновременно. Также дублирование допускает раздельный поиск - процесс разделения запросов на чтение между дисковыми каналами для более быстрого их выполнения. Эта функция вдвое повышает производительность при чтении дисков, поскольку оба канала параллельно ищут различные блоки из одного набора данных. Это также сокращает влияние на производительность при записи на диск, поскольку один канал может читать данные, в то время как второй производить запись.
NetWare поддерживает до восьми дисковых каналов (некоторые адаптеры SCSI предоставляют несколько каналов), что означает, что возможно иметь несколько каналов для каждой дублированной пары. Есть возможность даже по выбору организовать до восьми отдельных зеркальных каналов. Windows NT Server также предоставляет программные зеркалирование и дублирование, но пока не поддерживает параллельную запись и раздельный поиск.
Выбирая избыточную дисковую систему, необходимо учитывать четыре основных фактора: производительность, стоимость, надежность и защиту от сбоев.
Что касается производительности, встроенные возможности серверной операционной системы являются основным фактором, особенно когда в игру вступает избыточность дисков. Как уже указывалось ранее, дублирование дисков NetWare в сочетании с заполнением дисков дает лучшую производительность, чем аппаратно- или программно-реализованный RAID. Однако производительность аппаратного RAID в целом выше производительности встроенных дисковых служб Windows NT Server. Вообще говоря, в течение нескольких лет технология и производительность систем RAID постоянно улучшаются.
Другая потенциальная проблема производительности систем RAID - это восстановление данных в случае аварии. До недавних пор, если диск ломался, приходилось отключать массив RAID для его реставрации. Также, если необходимо изменить размер массива (увеличить или уменьшить его емкость), надо было сделать полную резервную копию системы, а затем переконфигурировать и переинициализировать массив, стирая во время этого процесса все данные. В обоих случаях система довольно долго оказывается недоступна.
Для решения данной проблемы Compaq разработала контроллер Smart Array-II, позволяющий наращивать емкость массива без переинициализации существующей конфигурации массива. Другие производители, в том числе Distributed Processing Technology (DPT), объявили, что их контроллеры в не столь отдаленном будущем будут выполнять схожие функции. Многие из новых массивов имеют утилиты для различных операционных систем, с помощью которых массив можно реставрировать после замены испорченного устройства без отключения сервера. Однако учтите, что эти утилиты съедают много ресурсов сервера и тем самым отрицательно влияют на производительность системы. Во избежание такого рода трудностей, реставрацию системы следует проводить в нерабочие часы.
В отраслевых изданиях и публикациях производителей RAID неоднократно поднимались дискуссии на тему разницы в стоимости зеркалирования, дублирования и реализаций RAID. Зеркалирование и дублирование дают 100-процентное удвоение дисков и (в случае дублирования) HBA, в то время как реализации RAID имеют один HBA и/или контроллер RAID плюс на один диск больше, чем та емкость, которую необходимо иметь в итоге. Согласно этим аргументам, RAID дешевле, поскольку число необходимых дисков меньше. Это может быть верно, если ограничения на производительность включенных в операционную систему программных реализаций RAID, как, например, в Windows NT, терпимы. В большинстве случаев, однако, чтобы добиться соответствующей производительности, необходим выделенный контроллер RAID.
Диски и стандартные адаптеры SCSI относительно недороги, в то время как высококачественный контроллер RAID может стоить до 4500 долларов. Чтобы определить стоимость системы, необходимо продумать оптимальные конфигурации для всех составляющих. Например, если нужно приблизительно 16 Гбайт адресуемого дискового пространства, то можно реализовать зеркальную конфигурацию с двумя дисками по 9 Гбайт на канал и получить некоторый избыток емкости. В случае RAID-5, по соображениям производительности и надежности, лучше остановиться на пяти дисках по 4 Гбайт, чтобы увеличить число шпинделей для чередования данных и тем самым общую производительность массива.
При использовании внешней дисковой подсистемы стоимость зеркальной конфигурации составит примерно 10500 долларов за 18 Гбайт доступного пространства. Эта цифра основана на реальных розничных ценах: 2000 долларов за один диск, 250 - за один HBA и 300 - за каждую внешнюю дисковую подсистему вместе с кабелями. Система RAID-5, сконфигурированная на 16 Гбайт адресуемого пространства с использованием пяти дисков по 4 Гбайт, будет стоить около 12800 долларов. Эта цифра основана на реальных розничных ценах массива DPT RAID-5.
Многие системы RAID включают в себя фирменные, разработанные производителем, компоненты. Как минимум, фирменными являются корпус и задняя панель. HBA и контроллеры RAID тоже часто бывают фирменными. Некоторые производители применяют также нестандартные держатели и шины для дисков. Кто-то предоставляет их отдельно за разумную цену, кто-то - только вместе с диском и, как правило, по высокой цене. Последний подход может оказаться дорогостоящим, когда необходимо починить или расширить систему. Другой способ, которым поставщик загоняет нас в угол, - предоставление ПО администрирования и наблюдения за дисками, работающее только с конкретными компонентами. Избегая, когда это возможно, нестандартных компонентов, стоимость обычно удается снизить.
При сравнении надежности избыточных дисковых систем надо учесть два фактора: возможность сбоя системы или сбоя любого ее компонента и вероятность потери данных из-за сбоя компонентов. (К сожалению, RAID или зеркалирование не могут спасти от основной причины потери данных - ошибки пользователя!)
Возможен расчет оценки вероятности сбоев, используя следующую формулу:
P = t / Tc,
где t - время работы, а Tc - комбинированное время наработки на отказ компонентов.
При работе без сбоев в течение года (8760 часов) и Tc гипотетического диска 300000 часов, вероятность сбоя становится равной 3%, или немногим менее чем один случай из 34. По мере того как число компонентов растет, вероятность сбоя любого компонента увеличивается. Как RAID, так и зеркализация увеличивают вероятность сбоя, но уменьшают вероятность потери данных.
Таблица 6, взятая из бюллетеня Storage Dimensions (http://www.storagedimensions.com/raidwin/wp-ovrvw.html.) под названием Отказоустойчивые системы хранения данных для непрерывно работающих сетей, показывает рассчитанную по приведенной выше формуле вероятность сбоя, соотнесенную с вероятностью потери данных для четырех заполняемых дисков, пятидискового массива RAID и восьми зеркальных дисков. (Предполагается, что все диски имеют одинаковый размер и все три системы предоставляют одинаковую полезную емкость).
Хотя зеркалирование в сочетании с заполнением из-за увеличения количества дисков имеет большую статистическую вероятность сбоя диска, оно также имеет и значительно меньшую вероятность потери данных при сбое диска. Кроме того, при правильно спроектированной дублированной системе время восстановления может быть значительно короче.
Заполнение (4 диска) | RAID-5 (5 дисков) | Зеркалирование или дублирование + заполнение (8 дисков) | |
Вероятность сбоя диска | 11,68% | 14,60% | 23,36% |
Вероятность потери данных при сбое диска | 11,68% | 0,00467% | 0,00187% |
Таблица 6: Оценки вероятности сбоя.
Этот пример не учитывает многие факторы. Для получения статистически правильной цифры должно быть посчитано среднее время наработки на отказ всех компонентов дисковой системы, включая HBA, шлейфы, шнуры питания, вентиляторы и блоки питания. Разумеется, эти вычисления говорят только о том, что может случиться при данной надежности предполагаемых компонентов, но вовсе не обязательно, что это произойдет.
При выборе дисковой системы необходимо четко знать, какие компоненты не продублированы. В системах RAID это могут быть HBA, контроллеры RAID, блоки питания, кабели питания и шлейфы. Одно из преимуществ дублирования с раздельными дисковыми подсистемами на каждом канале - ликвидация большинства единичных мест, где могут произойти сбои.
0 комментариев