Ульяновский Государственный Университет
2000
Записка по курсовой работе
“Менеджер управления распределенными вычислениями в локальной сети”
Выполнил: студент группы ПМ-52
Никифоров Ю.В.
Преподаватель: Дулов Е.В.
2000
1. Модель среды параллельного программированияВ качестве физической архитектуры параллельного компьютера используется локальная сеть LAN Ethernet. Таким образом, параллельный компьютер состоит из некоторого количества процессоров P, соединенных между собой линией передачи данных.
В модели параллельного программирования используются две абстракции: задача(task) и канал(channel).
Данная модель характеризуется следующими свойствами:
1. Параллельное вычисление состоит из одного или более одновременно исполняющихся задач (процессов), число которых может изменяться в течение времени выполнения программы.
2. Задача - это последовательная программа с локальными данными. Задача имеет входные и выходные порты, которые служат интерфейсом к среде процесса.
3. В дополнение к обычным операциям задача может выполнять следующие действия: послать сообщение через выходной порт, получить сообщение из входного порта, создать новый процесс и завершить процесс.
4. Посылающаяся операция асинхронная - она завершается сразу, не ожидая того, когда данные будут получены. Получающаяся операция синхронная: она блокирует процесс до момента поступления сообщения.
5. Пары из входного и выходного портов соединяются очередями сообщений, называемыми каналами. Каналы можно создавать и удалять. Ссылки на каналы (порты) можно включать в сообщения, так что связность может измениться динамически.
6. Процессы можно распределять по физическим процессорам произвольным способами, причем используемое отображение (распределение) не воздействует на семантику программы. В частности, множество процессов можно отобразить на одиночный процессор.
2. Временные характеристики параллельной программыВремя выполнения программы – время, прошедшее с момента запуска первого процессора до момента завершения выполнения последнего (получения результата).
T = f (N, P, U, …)
где N - размерность задачи, P - количество процессоров, U - количество задач параллельного алгоритма.
Во время выполнения каждый процессор может находиться в трёх состояниях: вычисление (computation), обмен данными (communication) и ожидание (idle). Соответственно, определяется время нахождения процессора в каждом из них:
Следовательно, время выполнения T может быть определено следующим образом:
или
Время вычисления алгоритма Tcomp может быть равным времени выполнения соответствующего не распараллеленного (последовательного) алгоритма и зависит от размерности N задачи. Если параллельный алгоритм вносит дополнительные вычисления, тогда время вычисления зависит также и от количества задач U и процессоров P.
Время обмена данными алгоритма Tcomm это время, затраченное на прием и передачу данных между задачами. Существуют два вида обмена данными: между процессорами и внутри процессора. Первый тип обмена осуществляется между задачами находящимися на разных процессорах, т.е. по каналу связи. Второй тип обмена происходит, если взаимодействующие задачи находятся на одном процессоре, поэтому в данном случае обмен осуществляется гораздо быстрее, чем в первом, и по экспериментальным данным этим временем можно пренебречь.
Время передачи пакета данных между процессорами можно представить в виде следующего выражения:
где ts – время инициализации передачи, tw – время передачи единицы (слова) данных. Таким образом, в идеале имеем линейную зависимость времени передачи от длины данных.
Но в сети типа Ethernet для обмена данными для всех процессоров используется единственный канал связи. Если два процессора хотят передать данные в одно и то же время, реально будет передавать только один из них, а второй будет ожидать окончания передачи первого. Т.е. имеет место разделение канала связи во времени. Если S – количество конкурирующих процессоров нуждающихся в передаче данных, то предыдущая формула изменится следующим образом:
Таким образом, реальная пропускная способность канала равна S-1.
Время ожидания (простоя) алгоритма Tidle. Процессор может простаивать в одном из двух случаев:
· при отсутствии загруженных на него задач;
· при отсутствии входных данных задачи.
Во втором случае избавится от простаивания можно следующим образом. Когда задача блокируется в ожидании входных данных можно на данном процессоре запустить другую задачу, для которой имеются входные данные. Как только для первой задачи поступят данные прекратить выполнение второй. Данный метод оправдан только при низкой стоимости переключения задач. Также можно подключать разные каналы для одной и той же задачи при низкой стоимости данной операции.
Более удобной мерой качества параллельной программы, чем время выполнения, является эффективность. Она характеризует полноту использования алгоритмом ресурсов параллельного вычислительной среды независимо от размерности самой задачи. Относительная эффективность определяется как:
где T1 – время выполнения на одном процессоре, Tp – время выполнения на P процессорах.
Относительное ускорение:
- это коэффициент уменьшения времени выполнения на P процессорах.
3. Методы измерения временных характеристик в реальном времениИмеется три вида методов сбора информации о производительности параллельной программы:
· рабочий профиль программы (execution profile) представляет собой общее время, проведенное в различных участках программы;
· счетчики событий или совокупного времени;
· трассировка событий.
Рабочий профиль формируется автоматически для каждого процессора. При этом используется метод выборки данных через фиксированные промежутки времени, поэтому точность измерения не столь высока. По результатам можно построить гистограмму рабочих величин, например, определить задачу, которая забирает наибольшую часть вычислительного времени параллельного алгоритма на текущий момент.
Счетчик представляет собой переменную, которая может быть увеличена каждый раз при наступлении определенного события. Счетчик может использоваться для подсчета количества вызовов данной процедуры, общего количества переданных или принятых сообщений, общего размера переданных или принятых данных для каждого процессора, задачи или канала. Некоторые счетчики встроены в библиотеки среды параллельного программирования, и можно заводит новые путем вставки соответствующих вызовов библиотеки в исходный код задач.
Другой вариант счетчика – интервальный таймер. Он может использоваться для точного измерения времени выполнения определенных участков кода программы (задачи). Поэтому с помощью таймера можно измерять такой критичный ресурс процессора как производительность.
Информация, накопленная счетчиками, может использоваться в рабочих профилях программы.
Трассировка событий предоставляет наиболее детальную низкоуровневую информацию о производительности параллельной программы. Эта информация представляет собой записи с отметкой о времени наступления события, типом события, именем задачи, взаимодействующей задаче и др.
Трассировка событий может использоваться для локализации источников простоя и временной перегрузки программы, и так называемых «узких мест» в каналах передачи данных.
Полученные трассировочные данные могут также использоваться в рабочем профиле программы и счетчиках.
4. РеализацияМетрики. Измеряемые параметры производительности программы будем называть метриками, по сути, они те же счетчики. Каждая метрика представляет собой целое беззнаковое 32-битное число или unsigned long. Для каждого канала, задачи и процессора имеется стандартный внутренний набор метрик, который вычисляется автоматически или с участием программиста задач. Также имеется дополнительный массив ячеек для нестандартных метрик, размер его ограничен.
Ссылка на ячейки производится путем указания номера ячейки, аналогично массивам, начиная с нуля.
Для вычисления метрик используются три абстракции:
· точки контроля – это места вызова функций сбора данных о производительности (вход/выход процедуры и др.);
· примитивы – функции изменения значений метрик, запуска/останова таймеров;
· предикаты – условия вызова примитивов, основанные на метриках или локальных данных задачи.
Примитивы:
· установка счетчика в данное значение (setCounter);
· увеличение счетчика на заданную величину (addCounter);
· уменьшение счетчика на заданную величину (subCounter);
· установка таймера на данный счетчик (setTimer);
· запуск таймера (startTimer);
· останов таймера (stopTimer).
Пример: сколько времени данная функция проводит, посылая сообщения?
void foo ()
{
add (fooFlag); // fooFlag является признаком входа в функцию
. . .
sub (fooFlag);
}
sendMessage ()
{
if (fooFlag)
startTimer ();
. . .
if (fooFlag)
stopTimer ();
}
Ресурсы – все интересующие нас объекты параллельной системы (процессоры, каналы, задачи). Ресурсы упорядочены в некоторое количество иерархий. В каждой иерархии представлены объекты определенного типа. На нижнем уровне иерархии находятся конкретные объекты данного типа, существующие на данный момент в системе. На следующем более высоком уровне они собираются по определенному признаку, например в объекты, содержащие их.
Пример иерархии каналов показан на рисунке.
Иерархии ресурсов позволяют определить детализацию собираемой информации о производительности. Каждый более высокий уровень базируется на информации предоставляемой более низким уровнем. В примере с иерархией каналов, на самом нижнем уровне вычисляются метрики конкретных каналов. На уровне процессоров вычисляются общие метрики, такие как усредненные или суммарные значения метрик всех каналов на конкретном процессоре. На самом высоком уровне – всей системы – вычисляются общие метрики для всех каналов в системе.
Кроме иерархии каналов определены иерархии ресурсов процессоров и задач.
Иерархическая организация информации используется при анализе характеристик и производительности параллельных программ в реальном времени.
Для сбора информации используется метод сэмплирования (от английского sampling), т.е. периодического считывания текущих данных. Поступление очередного набора данных назовем сэмплом (sample).
Кольцо служебных каналов. Сбор информации о текущей производительности производится главным процессором (или задачей), называемой диспетчером или менеджером. Для этого используются служебные каналы, которые равноценны определенным ранее каналам. Из возможных структур сети служебных каналов, две из которых показаны на рисунке, выбрано “кольцо”.
При необходимости определенной информации диспетчер посылает запрос по служебному каналу, который не содержит данных. Каждый процессор, принимая запрос, дополняет его своей информацией и посылает дальше по служебному каналу, следующему процессору. В результате прохождения запроса по всем процессорам системы он возвращается к диспетчеру с накопленной информацией.
Целесообразность использования кольца служебных каналов (по сравнению с “веником”):
1. Небольшое общее количество односторонних каналов (N+1 вместо 2N);
2. Как следствие, разгрузка канала обмена диспетчера (нагрузка распределяется между всеми процессорами системы);
3. Более низкие требования к производительности диспетчера (есть время на обработку информации между соседними сэмплами);
4. Простота контроля загруженности канала сэмплирования (наряду со стандартными метриками каналов введены счетчики посланных и принятых запросов в диспетчере, в заголовок запроса включено поле – время отправления, по которому при возвращении запроса определяется время его осуществления);
... сети. Коммутатор поддерживает и глобальные связи с топологией "точка-точка" по линиям T1/E1, позволяя связывать несколько локальных сетей, построенных на его основе, друг с другом. Рис. 7.1. Структура коммутатора ES/1 Коммутатор ES/1 работает по технологии коммутации с буферизацией, что позволяет ему транслировать протоколы канального уровня, осуществлять пользовательскую фильтрацию, сбор ...
... стоимость создания такой сети без учета затрат на подключения к сети каждой конкретной квартиры. Рисунок 2.1 – Общий вид расположения домов Основными целями проектирования «домашней» локальной сети, являются: 1) совместная обработка информации; 2) совместное использование файлов; 3) централизованное управление компьютерами; 4) контроль за доступом к информации; 5) централизованное ...
... и в старых версиях Ethernet, а кабельные системы этих стандартов совместимы, для перехода к 100BaseT от 10BaseT требуются меньшие капитальные вложения, чем для установки других видов высокоскоростных сетей. Кроме того, поскольку 100BaseT представляет собой продолжение старого стандарта Ethernet, все инструментальные средства и процедуры анализа работы сети, а также все программное обеспечение, ...
... интерфеса и интерфейса локольной сети · Предложение о выборе вариантов загрузки При этом возможен вариант запгрузки как с SCSI устройства (диск, CDROM, лента, …) так и через локальную сеть. Загрузочный диск должен быть предварительно сконфигурирован. Так как обьем Boot ROM не может быть большим, в его задачи входит загрузка вторичного загрузчика ...
0 комментариев