Бекмуратов К.А.
Рассматривается один из возможных принципов усложнения решающего правила непрерывного пространства признаков, порождаемого опорными объектами конкретного образа. Предложена процедура нахождения предельного значения размерности признакового пространства, в котором возможно кусочно-линейное разделение образов и гарантированы требуемые качество и надежность распознавания, необходимые в системах управления.
В работе [1] описан метод формирования пространства непрерывных признаков, приводящий к безошибочному разделению образов. Введено понятие непрерывного признака и показано, что если набирать пространство только из определенных в [1] признаков, то можно достичь безошибочного разделения образов.
В данной работе так же, как и в [2], рассмотрим случай, когда в пространстве непрерывных признаков размерности n безошибочное разделение обучающей последовательности невозможно.
Пусть на некотором множестве мощности объектов определены подмножества при , представляющие собой образы на обучающей выборке
Допустим, что - подмножество на , соответствующее конкретному образу , а - подмножество на , соответствующее остальным образом
Требуется с использованием обучающую выборки найти решающее правило , указывающее принадлежность любого объекта из одному
из заданных образов или с вероятностью ошибки, не превышающей , достигаемой с надежностью (1-), и определить целесообразности усложнения решающих правил при синтезе непрерывных признаковых пространств.
Если обучающая последовательность не может быть безошибочно разделима выбранным решающим правилом, то в общем случае справедлива теорема Вапника - Червоненкиса [3], смысл которой состоит в том, что если в n-мерном пространстве признаков решающее правило совершает ошибок при классификации обучающей последовательности длины , то с вероятностью можно утверждать, что вероятность ошибочной классификации составит величину, меньшую ,
,
где N- число всевозможных правил заданного класса, которое можно построить в пространстве заданной размерности.
Предположим, что в процессе обучения из последовательно поступивших непрерывных свойств относительно опорных объектов синтезирована подсистема непрерывных признаков. В зависимости от состава случайной и независимой выборки процесс обучения может остановиться при любом значении n, но если разделение конкретной обучающей выборки наступило в n-мерном пространстве, то число N всевозможных решающих правил в классе не должно превышать числа всех подмножеств множества, состоящего из элементов, т.е.
,
где
.
Логарифмируя получим
(1)
Если учесть , то (1) принимает вид
, (2)
где можно оценить в виде
(3)
Подставляя (3) в (2), получаем
(4)
Используя теорему Вапника-Червоненкиса [3], можно вычислить предельную размерность пространства
, (5)
которая при заданных гарантирует требуемые e и h.
Пусть вычислено максимально допустимое значение размерности пространства в виде (5) и в этом пространстве фиксирована линейная решающая функция
(6)
Далее, для того чтобы в процессе обучения синтезировать пространство, в котором линейное решающее правило (6) безошибочно разделило бы обучающую выборку длины , и при этом размерность пространства не превышала бы , необходимо на признаки наложить дополнительные требования. Зная предельную размерность простанства (8), можно оценить минимально допустимую разделяющую силу каждого выбираемого признака в виде
Минимально допустимая разделяющая сила признака позволяет при синтезе непрерывного пространства использовать не все признаки, а выбирать только те, разделяющая сила которых удовлетворяет неравенству
Допустим, что в синтезированном пространстве непрерывных признаков размерности n линейная решающая функция (9) совершает ошибки с частотой . Тогда рассмотрим соотношение
, (7)
где N* - соответствует решающему правилу, работающему с частотой ошибки , N**- безошибочно разделяющая обучающая последовательность длины .
С использованием этого соотношения, можно установить целесообразность усложнения решающего правила в случае, если в пространстве размерности n ещё не достигнуто безошибочное разделение обучающей выборки.
Известно [3], что если вместо линейного правила используется кусочно-линейное и оно безошибочно разделяет обучающую выборку длины l, то в соответствии (7) вместо n следует выбирать величину
n=nk+k , (8)
где k - число линейных решающих правил, составляющих искомое кусочно - линейное правило. Используя соотношения (7) и (8), ответим на вопрос: стоит ли усложнять решение, если линейное правило в пространстве размерности n не обеспечивает безошибочного разделения обучающей выборки. Для этого нужно сделать подстановку:
, (9)
В этом случае усложнение решающего правила, определяемое числом k, не приведёт к снижению вероятности ошибки, если будет выполнено соотношение (7) после подстановки (8). Из этого условия можно найти такое значение k, выше которого теряет всякий смысл усложнение решающего правила, действующего в пространстве непрерывных признаков размерности n:
. (10)
Таким образом, если выбирать n и k согласно (5) и (10), то процедура позволяет, при синтезе пространства, использовать не все признаки, а выбирать только те, разделяющая сила которых позволяет при заданных обеспечить требуемые значения ε и η.
Список литературы
1. Бекмуратов. К.А. Процедура формирования непрерывных признаковых пространств при последовательном обучении. Узб. Журнал // «Проблемы информатики и энергетики».- 1994.-№4.-С.17-20.
2. К.А. Бекмуратов. Пошаговая проверка целесообразности усложнения решающего правила при последовательном обучении задаче распознавания. Узб. Журнал // «Проблемы информатики и энергетики». -2000. -№1. – С. 16-19.
3. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов.(Статистические проблемы обучения). – М.: Наука, 1974. –С. 415.
Похожие работы
... его, человек высказывает гипотезы, продвигающие его к знанию распознающей деятельности в природе, что позволяет ему успешно решать стоящие задачи. Рассматриваемый курс “Основы построения систем распознавания образов” и должен научить пониманию того, что лежит в основе современных гипотез распознавательной деятельности и как на этой основе упомянутые задачи решаются.1.1.2. Краткая история вопроса ...
... именно по этой причине современное распознавание образов само питается идеями этих дисциплин. Не претендуя на полноту (а на нее в небольшом эссе претендовать невозможно) опишем историю распознавания образов, ключевые идеи [5, c. 107]. 2. Определения Прежде, чем приступить к основным методам распознавания образов, приведем несколько необходимых определений. Распознавание образов (объектов, ...
... мальне значення показникунадійності, при якому приймається рішення про орєінтованийзвязок назвем порогом показника надійності і позначимо (). Для можливості порівняння результатів у різних парах змінних в одній задачі системного синтезу корисно ввести відносний показник надійності. Відносним показником надійності ηij приняття рішення про напрям звязку між змінними xj → xi (стрілка в ...
... звеньях основной акцент делается на получение и передачу информации в вышестоящие органы. В вышестоящих органах возрастает число задач, связанных с планированием, управлением и обработкой информации. В каждом звене имеется своя автоматизированная система, которая в свою очередь может иметь несколько уровней. Так специальная система состоит из объектов центрального звена, объектов среднего уровня ...
0 комментариев