1.2.2. Системы распознавания
До этого мы говорили о проблеме распознавания в целом, о теории, о возможности замены человека автоматом. Теперь сосредоточим внимание на практическом применении соответствующих знаний. При этом обратим внимание и на то, что те практические реализации методов распознавания , о которых в этих случаях шла речь, носят название систем распознавания (СР).
Здесь необходимо подчеркнуть, что именно центральную задачу распознавания образов представляет построение на основе систематических теоретических и экспериментальных исследований эффективных вычислительных средств (объединяемых в понятии “системы распознавания”) для отнесения описаний с объектов, явлений, процессов к соответствующим классам.
Широкий круг задач, возлагаемых на такие системы, определяется приведенным нами определением самого понятия “распознавание” и включает выяснение по разнородной, часто неполной, нечеткой, искаженной и косвенной информации факта, обладают ли изучаемые объекты, явления, процессы, ситуации фиксированным конечным набором свойств, позволяющим отнести их к определенному классу. Сюда входят как непосредственно задачи распознавания и классификации, так и такие задачи, в результате решения которых на основе распознавания требуется выяснить, в какой области из конечного числа областей будут находиться некоторые процессы через определенный промежуток времени.
Отсюда понятно, что к задачам распознавания должны относиться задачи технической и медицинской диагностики, геологического прогнозирования, прогнозирования свойств химических соединений, распознавания свойств динамических и статических объектов в сложной фоновой обстановке и при наличии активных и пассивных помех, прогнозирования урожая, обнаружения лесных пожаров, управления производственными процессами.
Разработки систем распознавания, начатые с 50-х годов, исчисляются тысячами. Сегодня уже трудно назвать такую отрасль науки и сферы производства, где СР не используются или не будут. При этом применение методов распознавания в ряде направлений науки и техники оказывает обратное влияние на эти направления, поистине революционизирующее влияние.
Рассмотрим некоторые применения.
1) Системы технической диагностики.
Их внедрение - важнейший фактор повышения эффективности использования машин и технологического оборудования, резкого сокращения расходов на эксплуатацию.
Исторически сложившаяся тенденция усложнения, а значит удорожания машин постоянно увеличивает затраты на эксплуатацию. Выход - переход к системам технической диагностики (распознавания состояния машин), например, безразборный поиск неисправностей. В результате вместо планово-предупредительного ремонта - ремонт по фактической необходимости. Например, в инструкции по эксплуатации автомобиля предусмотрены плановые технические обслуживания через 500 км, 1000 км, 2000 км и т.д. Если же его оснастить системами распознавания состояний, то от плановых ТО можно было бы отказаться заменив их обслуживанием отдельных узлов и систем по необходимости.
2) Медицинская диагностика.
Автоматизированные системы диагностики в медицине - путь увеличения
- широты и глубины охвата симптомов;
( рассчитывать только на память врача во всех ситуациях очень трудно. Лучше функцию памяти отдать компьютеру)
-оперативности;
(компьютер обеспечит почти мгновенный результат)
-достоверности.
(диагноз компьютера не зависит от внешних факторов, как это случается с человеком)
3) Сельское хозяйство.
Области применения здесь:
-распознавание размеров урожая по данным космических наблюдений;
-уменьшение ручного труда при сортировке плодов по форме, цвету и размерам и т.п.
4) Военное дело.
Сложные системы вооружения:
-автоматический функциональный контроль технического состояния систем и ввод резервирующих;
-роботы, обслуживающие фазированные антенные решетки радаров.
На основе рассмотренного можно уже ответить на вопрос, что же представляет собой СР.
В первом приближении:
“СР - это автоматическое вычислительное устройство, предназначенное для распознавания образов (каких? можно уже не повторяться).
Заметим, что это очень поверхностное определение. Сегодня физически СР это и вычислительная машина как один составляющий элемент СР;
-это и такие часто более дорогостоящие технические средства, как средства обнаружения распознаваемых объектов (например, патологических изменений того или иного органа человека);
-это и средства измерений параметров обнаруженных объектов (без них не получить признаков распознавания);
-это и математическое обеспечение, в составе которого: методы и алгоритмы обработки измерительной информации; методы и алгоритмы определения признаков распознавания; методы и алгоритмы непосредственно распознавания объектов, явлений , процессов ( построения решающих правил отнесения объектов к тому или иному классу); методы и алгоритмы в некотором смысле оптимального управления процессом распознавания; методы и алгоритмы оценки эффективности СР как на стадии проектирования, так и в процессе ее функционирования;
-наконец, для больших систем это и коллектив подготовленных специалистов обеспечивающих жизненный цикл существования системы.
Рассмотрим подробнее отдельные элементы.
а) Средства обнаружения распознаваемых объектов.
К ним в разных областях применения относятся:
в медицине:
-рентгеновские аппараты;
-аппараты УЗИ;
-ЯМР-томографы;
-энцефалографы;
-рентгеновские томографы;
-кардиографы и т.д.
в военном деле:
-радиолокаторы;
-оптические (лазерные) локаторы;
-лазерные дальномеры;
-приемники гамма-излучения;
-сонары - ультразвуковые локаторы.
Средства обнаружения представляют дорогостоящую часть СР. Но этим дорогостоящая часть СР не ограничивается.
б) Средства сопряжения.
Для сопряжения средств обнаружения с ЭВМ необходимы специальные электронные устройства аппаратного интерфейса. Эти составные части СР также достаточно дорогостоящи.
в)Средства измерений параметров распознаваемых объектов,явлений, процессов.
Средства измерений часто входят в состав обнаружителей (РЛС - измерение дальностей, углов, Рс/Рш).
г) Методы и алгоритмы обработки измерительной информации
Часто для получения признаков распознавания или параметров , которые их обусловливают необходима специальная математическая обработка (пример, для РЛС - определение дальностей целей по временной задержке сигналов, угловых координат по разности фаз, коэффициентов лобового сопротивления целей по координатам и их производным и т.п.).
Сам процесс назначения признаков - творческий процесс, говорят - эвристический, зависящий от человека.
д) Методы и алгоритмы принятия решения о принадлежности объектов распознавания.
е) Методы и алгоритмы оптимального управления распознаванием.
ж) Методы и алгоритмы оценки эффективности распознавания.
Как алгоритмы принятия решений, так и управление распознаванием, так и оценка эффективности определяются сложностью систем распознавания и представляют концентрированное применение комплекса математических операций соответствующего назначения.
з) Э В М
Наконец, ЭВМ. Это обязательный элемент современной СР. Вся обработка измерений с целью выделения признаков распознавания, вся математика классификации, управления и оценки эффективности выполняется ЭВМ. Само развитие теории и методов распознавания обязано появлению ЭВМ.
и) Коллектив подготовленных специалистов.
Такая составляющая на первый взгляд не имеет отношения к системе. Однако без коллектива подготовленных специалистов трудно обойтись в больших системах, решения которых чрезвычайно ответственны. В таких системах оценка эффективности - это показатель, которым пользуются с момента создания СР и до конца ее существования. При этом пользуются этим показателем специалисты, а не система. А сама необходимость такого использования связана с тем, что в процессе работ появляется возможность повысить эффективность СР за счет получения новых данных и уточнения параметров системы в результате анализа специалистами конкретного случая распознавания с последующим уточнением этими специалистами имеющихся параметров. То есть, система в течение своей жизни (говорят - “жизненного цикла”) изменяется (динамизм системы).
Таким образом, СР - сложная динамическая система, состоящая в общем случае из коллектива подготовленных специалистов и совокупности технических средств получения и переработки информации, обеспечивающих на основе специально сконструированных алгоритмов решение задачи классификации соответствующих объектов, явлений или процессов.
После того, как описан состав и функции элементов СР, для завершения общих представлений о проблеме распознавания можно провести и некоторые поверхностные сравнения технических СР и такой совершенной СР, как человек.
Так рецепторы человека, к которым мы относим зрительные, слуховые, осязательные, обонятельные и вкусовые рецепторы - это средства обнаружения, а иногда и измерения характеристик распознаваемых объектов, явлений, процессов. Тут аналогия полнейшая.
Далее на пути оперирования с информацией у технических СР стоит устройство сопряжения с ЭВМ. Естественными аналогами его являются биологические средства связи человеческих рецепторов с мозгом, выполняющим роль ЭВМ.
Но это, пожалуй, - все, что мы сегодня знаем наверняка. И вопросов здесь больше, чем ответов:
-какие функции выполняют рецепторы в части первичной обработки результатов обнаружения объектов, явлений;
-каковы характеристики линий передачи данных от рецепторов к мозгу как ЦВС;
-какие признаки выделяет система обработки;
-какие алгоритмы использует мозг для решения задачи классификации, оптимального управления процессом распознавания;
-как человеку удается избавиться от специфичности, свойственной техническим СР и т.д.
В процессе нашего дальнейшего изучения предмета Вы сами поставите еще много нерешенных в этом плане вопросов. А их разрешение чрезвычайно важно для построения быстродействующих и высокоэффективных технических СР, помогающих человеку в его повседневной практике.
Достижение соответствующих целей - задачи XXI века.
Л Е К Ц И Я 2.1.
Проблематика задач создания систем распознавания на описательном уровне
При изучении первой темы мы уже создали представления о проблеме распознавания в целом. Казалось бы, можно было бы теперь сразу перейти к теоретическому осмысливанию составляющих этой проблемы. Однако какие это составляющие, как они соотносятся друг с другом в общей постановке проблемы, этого пока не было возможности выделить.
Поэтому, прежде чем перейти к формальной постановке соответствующих задач, постараемся рассмотреть их и осмыслить на описательном уровне.
Итак, мы уже знаем, что распознавание образов в технике - необходимый элемент процесса механизации и автоматизации машин, устройств и систем для
-замены человека там, где используется тяжелый физический труд;
-реализации быстрых реакций в управлении там, где нет времени на раздумье;
-замены человека в так называемых рутинных операциях, то есть, повторяющихся действиях, не требующих умственных усилий.
Уже протяжении 4-х десятков лет эти потребности реализовывались в таких конкретных на приложениях, как создание специалзированных роботов, техническая и медицинская диагностика, метеопрогноз, формализованная оценка общественных, экономических и социальных явлений и процессов. На это, начиная с 50-х годов, были направлены усилия научной и инженерной мысли.
В результате сопоставления конкретных решений и разработок оказалось, что несмотря на многообразие и особенности приложений, задачи создания систем распознавания имели много общего, не зависящего от указанной специфики.
Вот почему для выработки методических подходов теории распознавания имело смысл выделять общие повторяющиеся приемы, а их число естественно должно быть ограниченным и легко объединяемым в задачи. Сами же эти задачи должны были явиться ключевыми для создания любой системы распознавания. В результате оказалось, что найденный методический подход к построению систем распознавания образов инвариантен к предметной области.
Постараемся осмыслить эту инвариантность построения СР , рассмотрев простые реализации систем.
А. Распознавание стороной А самолетов стороны В (этот пример мы будем часто использовать в последующем, постепенно его усложняя).
Здесь фактически требуется создать автоматическую систему, обеспечивающую стороне А решение указанной задачи.
Понятно, что цель создания такой системы - оборона стороны А от возможного нападения, а следовательно - предотвращение возможного ущерба.
Первое, с чего естественно начать эту работу - провести изучение и анализ всей возможной информации об авиации стороны В и собрать необходимые данные.
Как эта информация может быть получена:
-из открытой печати (часто многие характеристики самолетов не скрываются);
-из разведданных;
-из экспериментальных наблюдений самолетов стороны В и измерений их характеристик (например, с помощью РЛС);
-из экспериментальной обработки данных, полученных по макетам и моделям соответствующих самолетов стороны В
(наземные стенды или электродинамические расчеты); и т.д.
Какие это характеристики? Это - численность экипажей, высоты полета, крейсерские скорости, дальности полета, число двигателей и т.д.
Рассматриваемое изучение позволит обнаружить в том числе и способы, которые применяет или предполагает применять сторона В для преодоления противовоздушной обороны (ПВО) стороны А и которые будут ухудшать возможности распознавания. Например, США по программе Стелс разработали бомбардировщик-невидимку для радиолокационных средств - В1).
Таким образом мы должны получить все мыслимые и существующие характеристики самолетов (признаки).
Второй шаг, логично следующий из проведенного изучения - на основе знания тактико-технических характеристик средств противодействия стороне В, имеющихся у стороны А, и знаний авиации стороны В можно выделить ситуации применения ее, существенно отличающиеся по возможному ущербу и по возможности его предотвращения.
Это фактически соответствует разделению самолетов стороны В на классы, для каждого из которых стороне А известно, что нужно предпринять.
В результате может оказаться, что классов 3 (А1- бомбардировщики, А2 - штурмовики ,А3 - истребители), а средств противодействия - 2 (S1 - ЗУР, S2 - истребители с их вооружением).
При этом наиболее эффективно их распределить следующим образом:
А1 - S1
А2 - S2
А3 - S1
то есть, классы А1 и А3 с точки зрения противодействия желательно объединить в один класс.
Если же средств противодействия - 3 (S1- ЗУР для больших высот, S2 - ЗУР маловысотные, S3 - истребители с их вооружением), то классы можно не объединять, а использовать стратегию
А1 - S1
А2 - S2
А3 - S3
Третий шаг по созданию системы распознавания самолетов стороны В - выбор измерителей.
Для обозначенных классов авиации из анализа имеющихся у стороны А средств наблюдения за самолетами (РЛС, ОЛС и т.п.) и полного перечня признаков соответствующих самолетов, полученных на первом нашем этапе разработки (например, крейсерские скорости, высоты полета, длины фюзеляжей, размахи крыльев, число двигателей и т.п.) выделить такие, которые могут быть определены по данным имеющихся средств измерений.
Здесь возможны и разочарования: может не оказаться таких средств измерений. Тогда принимается решение о их создании.
Итак, по каждому самолету мы имеем № характеристик - признаков. Но это еще ничего не дает нам для решения задачи. Мы не знаем, как разделить самолеты, пользуясь этими признаками по классам.
Для этого и нужен 4-й шаг - априорное описание классов. То есть, необходимо на языке выбранных признаков описать каждый класс самолетов или тактических способов их применения.
При этом в описании каждого класса должны содержаться сведения:
- о наличии или отсутствии признаков качественного характера (тип двигателя, наличие постановщика помех, тип помех и т.п.);
- о диапазонах или законах распределения признаков, имеющих количественное выражение.
Следует заметить, что все выбранные признаки должны получить соответствующее содержание (свое) для каждого класса.
На этом подготовительный этап работы заканчивается .
Теперь, если с помощью выбранных средств наблюдений за воздушными целями обнаружен неизвестный самолет и измерены (оценены) его признаки, то сопоставление полученных апостериорных данных (по результатам проведенных опытных измерений) с априорными (доопытным описанием классов) позволяет произвести его распознавание (отнесение к соответствующему классу А1,А2 самолетов стороны В).
Здесь априорные данные - доопытное признаковое описание классов;
апостериорные данные - послеопытный набор признаков классифицируемого самолета.
Рассмотрим вторую возможную реализацию СР.
Б. Распознавание заболеваний сердца. Требуется построить такого рода автоматическую систему.
1-й шаг создания такой системы - изучение всей информации о заболеваниях сердца.
На первый взгляд эта задача кажется более легкой, чем распознавание самолетов, так как все сведения носят открытый характер. Однако обольщаться здесь не следует. В процессе пристального ее изучения может обнаружиться, что некоторые стороны изучения явления человечеству пока еще неизвестны.
В результате мы должны иметь здесь все возможные характеристики заболеваний (признаки):
-зубцы кардиограмм;
-поведение пульса;
-поведение артериального давления и т.п.
2-й шаг - изучение всего арсенала средств лечения заболеваний и разделения их по классам, для которых известно, что нужно конкретно предпринимать для лечения (По самолетам мы также добивались разделения их по классам).
В результате может оказаться, что:
-число средств лечения (S1, S2...) больше числа классов заболеваний (А1, А2,....); тогда их просто комплексируют или принимают решение о дополнительном распознавании противопоказаний;
-некоторые классы требуют одинаковых средств лечения (например, хирургическое вмешательство); тогда классы объединяют.
3-й шаг - из анализа имеющегося арсенала средств медицинской диагностики (кардиограф, фонокардиограф, УЗИ, рентген, анализ крови и т.д., и т.п.) и признаков классов заболеваний выделяют те признаки, которые реально определить имеющимися средствами ( Здесь возможны и решения о создании новых специальных средств диагностики).
Заметим, что те же действия предпринимались и для измерения признаков самолетов стороны В.
4-й шаг - на языке отобранных признаков описывается аналогично самолетам каждый класс заболеваний сердца, то есть, составляется перечень значений признаков каждого класса.
При этом для каждого класса должны быть выделены сведения:
-о наличии или отсутствии признаков качественного характера;
-о диапазонах или законах распределения признаков, имеющих количественное выражение.
Здесь также следует заметить, что все выбранные признаки должны получить соответствующее содержание (свое) для каждого класса.
Теперь, если с помощью выбранных средств диагностики состояний сердца оценены признаки, характеризующие его деятельность, то сопоставление полученных апостериорных данных (по результатам опытных измерений) с априорными (доопытным описанием классов) позволяет произвести распознавание конкретного класса заболеваний или отсутствие заболеваний вообще.
Эти два примера показали, что подходы к построению систем распознавания практически ничем не отличаются, несмотря на специфику самих создаваемых систем.
В результате мы получили общие представления о последовательности решения и составляющих задачи создания системы распознавания. В результате отмечаем, что несмотря на различие предметных областей подходы к построению СР - одинаковы. Система распознаваний заболеваний сердца строилась также, как и система распознавания самолетов, но заменить ее она не позволяет. Точно также СР самолетов не может применяться для решения задач распознавания заболеваний сердца.
Системы распознавания объектов (явлений), создаваемые человеком всегда узко специализированы в отличии от его собственных природных возможностей.
Что же касается общего подхода к построению любой системы, то теперь, если у нас имеется некоторая совокупность объектов или явлений, которые необходимо распознавать (классифицировать), на основе обобщения действий при создании СР в 2-х рассмотренных примерах мы знаем, что последовательность решения соответствующих задач следующая:
-в соответствии с выбранным принципом совокупность объектов или явлений подразделяется на ряд классов (говорят: назначается алфавит классов);
-разрабатывается совокупность признаков (говорят: словарь);
-на языке словаря признаков описывается каждый класс;
-выбираются и (или) создаются средства определения признаков;
-на вычислительных средствах реализуется алгоритм сопоставления апостериорных и априорных данных и принимается решение о результатах распознавания.
В то же время, несмотря на выполненное определение последовательности действий, проведенное рассмотрение не позволяет ответить на следующие вопросы:
-как лучше производить разбиение объектов (самолеты, заболевания и пр.) по классам;
-как накапливать и обрабатывать априорную информацию;
-из каких соображений выбирать признаки;
-как описывать классы на языке признаков;
-на основе каких методов сравнивать априорную и апостериорную информацию;
-когда и как появляется вся система распознавания.
Все эти вопросы являются предметом рассмотрения в пределах читаемого курса. Мы будем их детализировать все более глубоко по мере освоения предмета.
На последний вопрос следует дать предварительный ответ до того, как мы проведем упомянутое углубленное изучение. Система должна появляться с самого начала изучения вопроса. Этот вариант ее должен представлять собой модель-прообраз будущей системы распознавания. Сейчас мы должны понять только одно - без такой модели создание СР чаще всего невозможно вообще. Без нее мы не сможем выбрать ни набор классов, ни перечень признаков, ни средства измерений их, ни решающие правила, обеспечивающие в комплексе, во взаимосвязи требуемое качество решений о принадлежности. Это обусловлено тем, что полная информация для создания СР на момент начала ее создания всегда отсутствует и без экспериментальной отработки всего процесса принятия решений не всегда ясно, какая информация может вообще потребоваться. Поэтому модель должна позволить методом последовательных приближений внутренней структуры системы к требуемой достигнуть желаемого результата. В то же время вопросы моделирования СР не могут быть рассмотрены на нынешнем уровне полученных знаний. Поэтому моделирование СР - предмет дальнейшего изучения курса "Основ построения систем распознавания образов"
Итак, главные выводы:
1. Задачи, решаемые в процессе создания систем распознавания, инвариантны относительно предметной области, имеют много общего, основываются на едином методологическом подходе.
2. Каждая система распознавания индивидуальна и предназначается только для одного вполне конкретного вида объектов или явлений.
Если найдена сфера применения распознавания, то соответствующая система должна разрабатываться заново с учетом новых специфических свойств объектов (явлений), определяющих как систему измерений характеристик, так и словарь признаков, алфавит классов и алгоритм принятия решений.
... именно по этой причине современное распознавание образов само питается идеями этих дисциплин. Не претендуя на полноту (а на нее в небольшом эссе претендовать невозможно) опишем историю распознавания образов, ключевые идеи [5, c. 107]. 2. Определения Прежде, чем приступить к основным методам распознавания образов, приведем несколько необходимых определений. Распознавание образов (объектов, ...
... звеньях основной акцент делается на получение и передачу информации в вышестоящие органы. В вышестоящих органах возрастает число задач, связанных с планированием, управлением и обработкой информации. В каждом звене имеется своя автоматизированная система, которая в свою очередь может иметь несколько уровней. Так специальная система состоит из объектов центрального звена, объектов среднего уровня ...
... свойства), которые сами являются результатами или компонентами промежуточных стадий этого процесса. 3. Афизикальные принципы формопорождения в процессах психического отражения Проведенный анализ методологических оснований естественнонаучного исследования непосредственно-чувственного отражения, а также способов его моделирования в технических системах привел нас к выводу о том, что в психологии, ...
... , но только для обычных последовательных вычислительных машин. А какие же ещё машины смогут решить все вышеперечисленные проблемы? – спросите Вы. Совершенно верно, это нейросети. 2. Возможность использования нейросетей для построения системы распознавания речи Классификация - это одна из «любимых» для нейросетей задач. Причем нейросеть может выполнять классификацию даже при обучении без ...
0 комментариев