3.2.3. Методы обеспечения достоверности
Предусмотрено несколько методов обеспечения высокой достоверности работы системы считывания изображения. К их числу относятся следующие:
- на основе эвристических процедур,
- на основе генерации контрольного изображения.
Кратко рассмотрим существо этих методов.
1. В системе предусмотрены эвристические процедуры, основанные на отыскании предполагаемых мест потери штриха либо появления ложного штриха.
Система обращается к этим процедурам в случаях, когда не удается завершить построение того или иного типа фрагмента изображения. Она сообщает оператору о внесенных коррекциях.
2. Порождаемое системой контрольное изображение при безошибочном вводе и обработке должно выглядеть как исходное. Генерация контрольного изображения осуществляется с помощью матриц линий и точек. В случае обнаружения несоответствий вносятся исправления. Их ввод осуществляется с помощью директив коррекции.
В директиве коррекции указываются координаты узла координатной сетки и предписывается либо удалить либо поместить линию или точку в этот узел. В случае, если корректировка касается линии, то в директиве должна содержаться информация о ее направлении.
число ошибок было равным 3-4. При этом оператор вносит исправления, относящиеся к 3-4 узлам
координатной сетки. Программная обработка на ЭВМ в среднем составляла величину 30 мин. Время сверки контрольного документа - 10 мин.
3. По сравнению со сколочными системами время ввода информации в ЭВМ сокрашалось в несколько раз. Однако программная обработка имеет узко специализированный характер. Это обусловлено жесткими требованиями, накладываемыми на линии изображения, а также отсутствием в программе средств распознавания символов.
ЛЕКЦИЯ №4
Тема: “Обработка изображений, автоматически считанных с документации”
4.1. Общие сведения
Обработка изображений представляет собой многоэтапный процесс информационного преобразования, в ходе которого осуществляется последовательный переход от одной формы описания к другой.
В качестве дискретной первичной формы будем рассматривать черно-белую мозаику, получаемую в памяти ЭВМ.
Большая часть изображений черно-белых документов строится с помощью одних и тех же изобразительных средств(линий, символов),поэтому имеет смысл выделить специально этап обработки для получения описания отрезков линий. Они задаются координатами его концов и кодов символов с указанием координат их расположения на поле изображения.
Результирующая форма для универсального этапа, которую мы назовем дискретной вторичной формой, состоит из списка отрезков и списка символов.
Запись первого списка состоит из полей, предназначенных для задания координат концов отрезков.
Запись второго списка служит для координатной привязки символа к полю документа и указания кода символа.
Универсальный этап обработки должен обеспечить решение двух задач:
- отделение символов,
- разделение несимвольной части изображения на отдельные элементарные отрезки.
Указанные задачи являются разнородными, поэтому перед их решением целесообразно разложить изображение на символьную и несимвольную части. Каждая из частей подвергается специализированной обработке.
Рассмотрим задачу отделения символов.
4.2. Отделение символов в дискретной первичной форме
Предварительно определим понятие символа.
Назовем группой единиц множество единиц в одной строке матрицы, не разделенной нулями. Две группы единиц, лежащие в соседних строках изображения, с координатами концов по оси абсцисс a, b и c, d называются связными, если справедливо хотя бы одно из соотношений:
a Ь c Ь b;
a Ь d Ь b;
c - 1 = b;
d + 1 = a.
На рис.9.a приведены примеры связных групп единиц, а на рис. 9.б - несвязных. Под символом будем понимать множество связных групп единиц, для которых минимальный охватывающий их прямоугольник имеет размеры, принадлежащие интервалам размеров символов по высоте и ширине (рис.10 ). Подобное определение символа создает риск отделения части несимвольной информации.
Сущность задачи отделения символов из исходной матрицы I, описывающей изображение в дискретной первичной форме, сводится к нахождению в исходной матрице фрагмента, который содержит символы. Далее каждый такой фрагмент переписывается в отдельный кадр. Кадр представляет собой двоичную матрицу, размеры которой должны быть не меньше максимальных размеров символов. Затем, содержимое этих матриц анализируется в блоке распознавания.
Рис. 9. Отношение связности групп единиц:
a - связные группы; б - несвязные группы.
Рис. 10. Символ как фрагмент связных групп единиц
4.3. Алгоритм отделения
Выполняется однократный просмотр матрицы I .
При этом осуществляется :
1. Получение информации о том, что связные конфигурации по размерам не превышают размеры символов.
2. Проверка связности между группами единиц (на основе указанных соотношений).
3. Фиксация результатов.
Для фиксации результатов такого просмотра используются маски, каждая из которых представляет собой область прямоугольной формы, состоящую из единиц. При этом используется поле масок M. Поле масок представляет собой двоичную матрицу, совпадающую по размерам с исходным полем изображения I. При совмещении поля изображения с полем масок каждая маска покрывает фрагмент поля I, содержащий связную конфигурацию единиц.
Каждая маска для выделяемой с ее помощью конфигурации имеет минимальные размеры, т.е. играет роль минимального охватывающего прямоугольника.
Проверка метрических ограничений, накладываемых на связные конфигурации, называемые символами, осуществляется достаточно просто, когда в распоряжении имеется соответствующая маска.
Более подходящей для решения задачи разделения изображения на символьную и несимвольную части является полигональная форма описания изображения.
... литературе как "рабочая станция" (PC). Рис. 3. Структура рабочей станции проектирования электронных систем. Рис. 4. Структура ПО САПР. 4. Иерархические уровни представления электронных устройств Основным методом проектирования с применением САПР является блочно-иерархический метод или метод декомпозиции сложного объекта на подсистемы (блоки, узлы, компоненты). В этом случае ...
... него среде, знакомой ему по версии "AutoCAD 14. Однако более 400 усовершенствований делают работу конструктора существенно удобней и проще. 2. Технология автоматизированного проектирования в системе AutoCAD 2.1 Основы AutoCAD Чертить в системе AutoCAD — значит, формировать на экране дисплея изображение из отдельных графических элементов (примитивов), которые вводятся при помощи ...
... актуальностью информации, идентифицировать ошибки и избежать перепроектирования (по оценкам компании Aberdeen, не менее 70 % затрат на производство и сопровождение продукции приходится на этап проектирования). PLM-система способна предоставить пользователю информацию в форме, соответствующей выполняемым функциям в жизненном цикле создаваемого продукта: трехмерные модели, схематические диаграммы, ...
... являются Лоцман:PLM компании Аскон, PDM STEP Suite, разработанная под НПО "Прикладная логистика", Party Plus компании Лоция-Софт и т.д. Итак, термин САПР (система автоматизации проектирования) подразумевает комплексный подход к разработке изделия и включает совокупность систем CAD/CAM/CAE. Развитие систем геометрического моделирования, анализа и расчета характеристик изделия сопровождается ...
0 комментариев