8. Выполнить результирующую последовательность действий.

9. Перейти к пункту 1.

Разумеется, этот цикл не обладает статусом идеала: это скорее пример того, в каких терминах могут формулироваться общие планы построения системы обработки естественного языка. Более узко ставится проблема в том направлении, которое связано с именем Р.Шенка: 1) отображение предложений в их смысловое представление; 2) хранение в памяти и осуществление умозаключений относительно полученного смысла; 3) перевод смыслового представления на естественный язык. Основные режимы работы в этом направлении – перифразирование и умозаключение.

Необходимо учитывать то, что ОЕЯ с помощью ЭВМ («искусственная ОЕЯ») отлична от ОЕЯ человеком (т.е. «естественной ОЕЯ») в следующих отношениях:

а) последняя не может ограничиться анализом и синтезом вне контекста ситуации во всех ее деталях;

б) последняя не только преодолевает неоднозначности естественного языка, но и эксплуатирует их в своих целях.

Языковой процессор, разрабатываемый коллективом Р.Шенка, функционируя в интерактивном режиме, должен находить наиболее вероятную для данного предложения интерпретацию, а не просто выявлять все возможные способы истолкования предложений: человек обычно не замечает тех неоднозначностей в тексте, которые чересчур скрупулезная система обработки естественного языка способна, в принципе, выявить. Анализ происходит пословно, от начала к концу предложения, в результате однократного, а не многократного «прохода» по предложению: обычно же число проходов достигает пяти. Кроме того, система обработки естественного языка обладает знаниями о мире в той мере, какая необходима для решения проблем анализа.

Система ОЕЯ, разумеется, – не самоцель. Ее задачи упорядочены и определяют «уровни ОЕЯ». Так, неязыковым целям подчинены процедуры, направляющие любой вид ОЕЯ; этим процедурам, в свою очередь, подчинен уровень речевых актов (при интерпретации или порождении отдельных высказываний). Самый низкий уровень составляют процедуры собственно языковой обработки (языковой анализ).

Общими для предложенных систем ОЕЯ являются следующие компоненты: ЕЯ -> ФР -> ИНТ -> СОД -> БД. А именно, естественно-языковой вход (ЕЯ) переводится в форму репрезентации (ФР) знаний; интерпретатор (ИНТ) устанавливает связь между репрезентацией для положений дел в (ФР) и, посредством языка системы обработки данных (СОД), банком данных (БД). В рамках этих систем операции, связанные с обработкой текста («лингвистические вычисления» обладают различными свойствами; анализ проведенных на сегодняшний день разработок показывает скорее не то, в чем они состоят, а то, чем эти операции не являются: они работают не исключительно аддитивно, не исключительно одна за другой (последовательно), не исключительно на микроуровне и не статистическим образом.

История ОЕЯ

Предыстория ОЕЯ определена многими факторами, из которых можно выделить в особенности два: 1) попытки моделирования нейронов в виде логического устройства, связанные с именами МакКаллоу и Питтса; 2) зарождение «информационной» парадигмы – взгляда на числа и на текст как на то, что представляет общее понятие «информации» (Шеннон), обладающее количественными характеристиками, со всеми вытекающими последствиями для математической теории информации. Понятие «информативность» принадлежит указанной парадигме.

Собственно же историю ОЕЯ иногда представляют как состоящую из трех этапов:

1. Начало 1950-х – начало 1960-х годов. Идея «информации» привела к концепции «машинного перевода» как установления той информации, которая скрыта за предложением на естественном языке, и выражения ее на другом – целевом языке. Язык информационного содержания был назван «языком-посредником». На этом этапе была введена и идея эвристического поиска, а также языка программирования для решения задач ОЕЯ (наиболее популярным языком, начиная с этого времени, был ЛИСП, введенный и описанный впервые в работе.

2. «Эпоха обработки семантической информации» (примерно 1962-1973 гг.). Ее основные идеи: а) необходимо использовать ограниченные содержательные области для моделирования ОЕЯ; б) следует построить как можно больше систем для обработки ограниченных подъязыков, присвоив этим системам статус «экспертов» в таких областях, а затем объединить все эти системы в одну, в рамках «крупного эксперта», определяющего, какой из подчиненных должен начать работать на конкретном этапе обработки, при решении конкретной задачи – концепция «крупного переключения»; в) использование «ключевых слов», управляющих выбором конкретных действий по ходу обработки текста; г) перевод естественного языка на формальные языки (некоторые из формальных языков при этом обладают собственными исчислениями, типа исчисления предикатов формальной логики; имеются языки поиска в базе данных. Эту эпоху иногда называют эрой «инженерного подхода»: основной упор делался на решение конкретных (как правило, прикладных) задач, без попытки моделировать психологическую реальность.

Начало 1970-х годов ознаменовалось интересом к обработке семантической информации; появились даже первые ростки интереса ж «когнитивной науке» (названной в те же годы «когитологией»).

В результате исследований этой «эпохи» выяснилось: а) даже в очень простых ситуациях (использование языка гораздо более разнопланово, чем можно было бы ожидать; б) специализация той или иной системы ОЕЯ и перспектива расширения этой системы находятся в серьезном конфликте между собой; в) репрезентации для языковых выражений, используемые в рамках таких систем (скажем, формальные языки), весьма неточны и неадекватны выразительным способностям естественного языка; г) приходится поступиться очень многими типами выражений, реально используемых на естественном языке (в частности, выражениями для физических событий и действий, описаниями сцен, карт, путей, предписаниями; реальными разговорами, спорами, дебатами, обсуждениями, эмоционально окрашенными высказываниями и высказываниями об эмоциональных состояниях; метаописаниями теорий; поэтическим языком, юмором, иронией, ложью и т.п. – т.е. всем, что требует гораздо более богатого метаязыка, чем тот, который могут на сегодняшний день предоставить в наше распоряжение существующие нотации логики).

3. Современная эпоха (1970-1995 гг.). В это время в центре внимания находятся следующие проблемы: а) соотнесенность речевых актов, фокусов внимания и общих (для ЭВМ и человека) презумпций; б) использование «новаторского» потенциала языка (в частности, интерпретация метафор); в) постройте прикладных систем, понимающих естественный язык (а не просто его обрабатывающих), г) обработка высказываний о пространственных событиях; д) введение факторов «здравого смысла» в состав логического вывода систем ОЕЯ, в частности, учет степени правдоподобности при интерпретировании высказываний.

Система, «понимающая» естественный язык

Смоделировать понимание и обработку естественного языка – это не одно и то же. Так, мы можем (не понимая полностью или частично) манипулировать символами, повторить сказанное на чужом (и непонятном нам) языке и т.п. Все это, пусть огрубление, соответствует ситуации ОЕЯ без понимания. С другой стороны, сам факт того, что мы нечто понимаем, равносилен тому, что мы над выражением производим определенные лингвистические операции. Таким образом, понимание естественного языка – специальный случай ОЕЯ. Многие из построенных систем ОЕЯ не понимают естественного языка в том смысле, который разумно вкладывать в термин «понимание».

Прежде всего, не все такие системы обладают целенаправленностью: выработка собственных целей, планирование, воплощение стратегий в виде тех или иных тактических приемов, «прослеживание» результатов этих приемов и предсказание (предвидение) дальнейших результатов – все это пока еще не более чем проект хорошей системы ОЕЯ. Так, система SHRDLU обладает системой планирования, но цели в ней достигаются не посредством высказываний; и кроме того, эта система не в состоянии распознавать цели человека: в диалоге с ЭВМ именно человек обладает инициативой. Несколько более замаскировано отсутствие целенаправленности в системах ЭЛИЗА и ДОКТОР. Только сравнительно недавно целенаправленность и моделирование намерений вошли в круг интересов разработчиков ОЕЯ.

Другое временное упущение: понять новое высказывание в диалоге или в тексте – значит, кроме прочего, связать его с тем, что было сказано раньше. В системах «искусственного интеллекта» эта задача решается, в основном, опосредованно, в два шага:

1) сначала, на основании протокола анализа предшествующего диалога или текста, активируются «фреймы», или «скрипты» (т.е., неформально говоря, те схемы из базы знаний, в которые можно уложить поступившую новую информацию), а затем

2) новое, текущее сообщение сопоставляется с этими схемами (но не с предшествующими предложениями непосредственно).

В результате, в частности, упускается такая возможность, реально используемая на самом деле в общении между людьми, как «ловля на слове», непоследовательность в употреблении терминов и т.п.

Третье отличие состоит в слабой реализованности влияния контекста непосредственно на направление работы анализатора. Так, в большинство систем ОЕЯ имеется две отдельные подсистемы: а) анализатор («парзер») перерабатывает входной текст в некоторую промежуточную форму (на язык синтаксических деревьев – как в системах типа, на упрощенный естественный язык – как в работе или на язык понятийных примитивов – как у Шенка), а затем б) подсистема логического вывода строит репрезентацию для значения входного текста (посредством заполнения недостающих деталей в репрезентации, полученной на выходе из анализатора); тогда включаются те неупомянутые события, которые связывают в единое целое факты, упоминаемые в тексте. Часто представленные другие компоненты (система ответа на вопросы и система построения аннотации к статье) скорее демонстрируют достигнутость понимания, чем являются частью процесса понимания. Назначение промежуточного представления для значения текста всегда одно и то же: защитить систему логического вывода от «капризов» естественного языка. Однако эта направленность не выдержана последовательно: логический вывод всегда бывает при этом связан с дополнительным анализом – на основе теперь уже промежуточной репрезентации. Но на работе анализатора никак не сказывается (в названных системах) то, к каким выводам придет система логического вывода. Попытка восполнить это упущение сделана разработчиками системы FRUMP, где знания о мире отделены от чисто языковых сведений, не где, тем не менее, контекстная информация влияет на процесс анализа, В этой системе содержатся, среди прочего, два модуля: Предсказыватель (предсказывает ограничения на то, что может дальше появиться в тексте) и Выяснитель (верифицирует эти гипотезы Предсказывателя). Однако эта система находится в стадии проектирования.

Другой вид проблем: отношение между синтаксисом и семантикой в рамках анализа предложения. Имеем здесь, как минимум, три возможности:

1) при переходе от предложения к представлению его значения сначала полностью восстанавливается синтаксическая структура предложения; на втором же этапе эта структура переводится в семантическое представление;

2) между синтаксисом и семантикой нет никаких барьеров, семантическая структура получается прямо, исходя из текстового вида предложения;

3) построение частичных синтаксических репрезентаций перемежается установлением частичных же семантических репрезентаций (т.е. синтаксис и семантика различаются, не в анализа взаимодействуют не прямолинейным образом). Третье решение является компромиссным между первыми двумя; в особенности оно удовлетворяет противников последовательного анализа, которые считают, что при ОЕЯ необходимо допускать возможность той ситуации, когда различные типы информации и процедур вызываются более одного раза на различных этапах обработки входного выражения.

В обобщенном виде компромиссный подход может быть охарактеризован как «модульная концепция ОЕЯ». Одно из достоинств этого подхода – организационное упрощение: можно разделить всю задачу на несколько подзадач, которые поручаются разным исследователям или группам исследователей; получаемые же в результате «модули» работают во взаимодействии друг с другом, но не «вмешиваясь» во внутреннюю технику операций друг друга.

Несомненно, переработка естественного языка в целях создания лингвистического обеспечения искусственного интеллекта представляет собой процесс, сложность которого трудно переоценить. Попытки создать «естественный язык для искусственного интеллекта» предпринимаются снова и снова, так что представляется вполне возможным, что в ближайшем будущем появится система языка для искусственного разума, идентичная естественной.


Заключение

Последние 20 лет в центре внимания разработчиков искусственного интеллекта находится вопрос о моделировании той деятельности человека, результатом которой является речь.

Описание процессов получения, переработки, хранения и передачи информации затрудняется тем, что данные процессы происходят в мозге человека и недоступны для непосредственного исследования.

Высказывается мнение, что, изучая процесс обработки языка в мозге человека, исследователь мысленно прослеживает тот путь, который проходит этот человек, воспринимая и интерпретируя какой-либо текст.

Исследования процессов обработки языка непосредственно связаны с прикладными задачами. На их основе разрабатываются модели лингвистического обеспечения искусственного интеллекта.

В данной работе я не стала останавливаться на всех методиках анализа и обработки естественного языка, так как вопрос лингвистического обеспечения искусственного интеллекта весьма обширен. По той же причине в предложенном подходе были рассмотрены исключительно общие положения и некоторые примеры к ним. Был затронут только синтаксический подход, кроме которого существует также, например, морфологический и лексический.


Использованная литература:

1.         Демьянков В.З. Основы теории интерпретации и ее приложения в вычислительной лингвистике, М.: Изд-во Моск. ун-та, 1985

2.         Краткий словарь когнитивных терминов, М.: Филологический факультет МГУ им. М.В. Ломоносова, 1996

3.         Мышление, когнитивные науки, искусственнный интеллек,т М.: Центральный совет философских (методологических) семинаров при Президиуме АН СССР, 1988.


Информация о работе «Лингвистическое обеспечение искусственного интеллекта»
Раздел: Иностранный язык
Количество знаков с пробелами: 63058
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
139056
8
19

... промышленность и транспортировка нефтепродуктов, энергетика, металлургия, машиностроительная промышленность, медицина, прогнозирование и мониторинг и другие. В начале 60-х годов в рамках исследований по искусственному интеллекту (ИИ) сформировалось самостоятельное направление - экспертные системы (ЭС). В задачу этого направления входит исследование и разработка программ (устройств), использующих ...

Скачать
220912
4
1

... и прикладная морфология вновь являются важным полигоном для лингвистичес- кой теории и практики. Обеспечение взаимодействия с ЭВМ на естественном языке (ЕЯ) является важнейшей задачей исследований по искусственному интеллекту (ИИ). Базы данных, пакеты прикладных программ и экспертные системы, основанные на ИИ, требуют оснащения их гибким интерфейсом для многочисленных пользователей, не желающих ...

Скачать
112862
1
7

... абстракции ранее разработанного и успешно используемого приложения, как это было сделано при разработке системы EMYCIN на основе MYCIN. 1.4. Экспертные системы Практическим полем применения баз знаний являются экспертные системы (ЭС). Экспертная система – это система искусственного интеллекта, включающая знания об определенной слабо структурированной и трудно формализуемой узкой предметной ...

Скачать
64295
0
0

... структуры. PROSPECTOR — экспертная система, созданная для содействия поиску коммерчески оправданных месторождений полезных ископаемых.   2. Перспективы и тенденции развития AI Сообщения об уникальных достижениях специалистов в области искусственного интеллекта (ИИ), суливших невиданные возможности, пропали со страниц научно-популярных изданий много лет назад. Эйфория, связанная с первыми ...

0 комментариев


Наверх