2. Распределение функций операторов.
Мощные системы ввода данных обычно функционируют по принципу конвейера. Специализация повышает производительность труда, а также позволяет практически неограниченно масштабировать систему. Например, всегда можно увеличить количество мест операторов сканирования, не вмешиваясь в работу операторов распознавания, верификаторов, и так далее.
3.Масштабируемость системы.
Благодаря распределению функций между операторами, система оказывается состоящей из узкоспециализированных модулей. При этом количество модулей каждого вида определяется только особенностями конкретной ситуации и может быть при необходимости легко изменено. Эта особенность делают систему более гибкой и управляемой, что существенно удешевляет комплекс ввода в целом.
4. Очередность заданий.
Важным для таких систем является понятие маршрута движения пакета. Пакеты движутся по системе не произвольным образом, а в соответствии с заданной схемой маршрутизации. Простейшим примером схемы маршрутизации может служить линейная схема: станция сканирования — станция распознавания — станция верификации — станция корректировки — станция экспорта. Основное преимущество системы, использующей очереди заданий, — равномерное распределение нагрузки по всем ресурсам (операторам) системы. Как только, например, оператор верификации освободился от задания и сообщил о своей готовности продолжить работу, на его рабочее место доставляется очередной пакет форм, стоящий следующим в очереди пакетов на верификацию [3].
2.3 Требования к системам массового ввода стандартных форм
Основные требования к системам обработки форм:
1. Соответствие предъявляемым функциональным требованиям.
Решение о внедрении системы обработки форм, а также выбор того или иного приложения должны производиться с учётом, в первую очередь, типа обрабатываемых документов и вида содержащихся в них данных. Для одних целей использование таких приложений может быть эффективно, в то время как для других, напротив, — вести к лишним расходам.
Поскольку производится обработка образов документов с распознаванием содержащихся в них данных, они должны быть спроектированы с учётом максимально удобного сканирования, а данные — внесены таким образом, чтобы их было удобно распознавать. Помимо типа документов и вида данных нужно оценить количество подлежащей обработке информации. Наиболее эффективно применение систем в тех случаях, когда за день обрабатываются сотни или более форм (ряд систем позволяет справляться и с несколькими тысячами документов).
2. Точность распознавания.
Модуль распознавания текста встроен в систему обработки форм. Существуют две его разновидности, основанные на технологиях оптического распознавания: OCR, которая применяется к напечатанным машинным способом символам, и так называемое интеллектуальное распознавание — ICR, способное работать с написанными вручную символами. Первая из технологий появилась давно и в настоящий момент хорошо проработана и широко распространена. Несмотря на то, что ICR базируется на концепции нейронных сетей, начавшей своё развитие относительно недавно, сегодня это тоже достаточно популярная и совершенная технология.
В табл.1 приведены основные характеристики методов распознавания.
Таблица 1
Характеристики методов распознавания
Метод | Точность распознавания, % | Процент нераспознанных символов | Процент символов, распознанных ошибочно |
Вручную | 97-98 | — | 3 |
OCR | 99,5 | 1-2 | 0,1 |
ICR | 90-95 | 10-30 | 0,9-2 |
Как видно из таблицы, ни один из доступных способов не гарантирует полного отсутствия ошибок в тексте, однако чем выше точность распознавания и меньше количество не распознанных символов, тем больше вероятность того, что вложенные деньги окупятся быстрее. Пользователи систем OCR и ICR сталкиваются с ошибками двух типов: во-первых, это символы, которые система вообще не способна распознать, и, во-вторых, — те, что распознаются ошибочно. Причём последние наиболее опасны, так как ошибка, вполне вероятно, может остаться незамеченной. Первых также не должно быть слишком много, иначе редактирование затягивается на длительный срок, и эффективнее ввести информацию вручную. Диапазон значений, указанных в таблице, зависит от уровня систем: более дорогие, как правило, обеспечивают лучшие показатели.
3. Наличие эффективной системы редактирования.
Нельзя построить системы со 100%-м распознаванием форм и полностью исключить действия человека. Но их надо минимизировать и построить систему так, чтобы человек с максимальным удобством и скоростью исправлял выявленные ошибки. Лучше всего при редактировании иметь перед глазами содержимое формы полностью (или части формы), где выделены «сомнительно» распознанные символы. Оператор просматривает и вносит необходимые изменения, после чего подтверждает ввод данных.
... текста и его обработки, таблицы, форматирования и редактирования. Текстовый редактор: назначение и основные возможности. Редактирование и форматирование текста. Вставка таблицы в текстовый документ. Редактирование и форматирование таблиц. Данные, с которыми работают текстовые редакторы – это символьная информация. Наименьший единицей символьной информации является один символ. Слова – ...
... на рынке продуктов требует не только хорошего понимания конечной задачи, но и отличного знания рынка программного обеспечения. Рассмотрим подробнее основные подсистемы интеграции СЭД. 2.1 Системы автоматизации делопроизводства и документооборота Функции автоматизации делопроизводства и документооборота в том или ином виде представлены в любой системе автоматизации документооборота. В ...
... , поэтому при изменении стиля Обычный изменятся все основанные на нем стили. Стиль Обычный не основан ни на одном из стилей. Элементы текстовых документов, которые вводятся в документ в процессе его редактирования и форматирования: · Колонтитулы (Вид / Колонтитулы) · Символ (Вставка / Символ) · Ссылка (сноски; названия рисунков, таблиц, формул; ...
... и время; просмотреть и скопировать колонтитулы других разделов; переключиться между верхним и нижним колонтитулами. Редактирование колонтитулов завершают щелчком на кнопке Закрыть или и о игорной командой Вид ^ Колонтитулы. Проверка правописания Текстовый процессор Word существенно облегчает создание грамотных и литературно правильных документов. Проверка текста и исправление ошибок в нем ...
0 комментариев