2. Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.


АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.


2 основные задачи АИПС:

· хранение информации

· поиск и выдача информации


Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ.


Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ.


Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.


Результатом поисковой операции является выборка релевантных ПОДов.


Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.


В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...)


выделение нужной пользователю информации осложняется двумя обстоятельствами:

· несоответствие между формулировкой запроса и реальной информацией нужной потребителю

· перевод запроса в ПОЗ


Мера соответствия документа информационной потребности называется пертенетностью.

Соответствие документа запросу называется релевантностью:

· смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)

· формальная (соответствие документа поисковому предписанию)


ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.


Классификация ИПЯ:


предкоординированные ИПЯ

присутствует заранее заданная классификационная схема

посткоординируемые ИПЯ

отсутствует заранее заданная классификационная схема


Типы классификаций


иерархическая

задает дерево знаний, например всей литературы по лингвистике

алфавитно-предметная

например, телефонный справочник

фасетная

опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета


Фасетная классификация: фильмы:

жанр цвет формат

Ж1

Ж2

Ц1 цветной

Ц2 черно-белый

Ф1 широкоформатный

фасетная формула: Ж1 Ц2 Ф1


Общие недостатки предкоординированных ИПЯ:

· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков

· все классификации имеют недостаточную глубину

· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование


Посткоординируемые ИПЯ:


семантические коды

в ЛЕ в явном виде заданы парадигматические отношения


дескрипторы

оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство


Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель;

RX коды

ручное индексирование

грамматики мешочного типа

(теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов.

позиционно-скобочные грамматики

сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения:


сетевые грамматики

в явном виде задается смысл связи между элементами текста (Скрэгг)



ИПЯ с ПСГ:

· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.

· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду


4



Информация о работе «Лингвистика»
Раздел: Иностранный язык
Количество знаков с пробелами: 113359
Количество таблиц: 21
Количество изображений: 1

Похожие работы

Скачать
32962
0
0

... и единицах текста, о законах связности, о средствах реализации связности (к их числу относятся замещения и коннекторы), о статусе предложения и актуального членения и др. Популярности исследований по лингвистике текста в указанный период способствовало также широко распространенное ощущение, в соответствии с которым эти исследования рассматривались как вносящие вклад в преодоление разделения ...

Скачать
25507
0
0

... ". Примечательно, что и на последней встрече когнитологов в Стокгольме летом 1999 г. Б. Петере подчеркивал необходимость решения этой задачи - разъяснения семантики термина "когнитивный", - хотя ему и кажется, что в сочетании "когнитивная лингвистика" прилагательное имеет скорее идентифицирующее, нежели дескриптивное значение (Peeters 1999: 52). Хотела бы отметить также, что в момент составления и ...

Скачать
72939
0
0

... с другом, создавая новую лингвистическую единицу; они могут «приклеиваться» к глагольной или именной основе в виде аугментов, будущих флексий, будущих расширителей. Таким образом, «непарадигматическая» лингвистика, в нашем понимании, это некая лингвистическая дисциплина, пытающаяся приблизиться к описаниям протоязыка Стадии I и проследить механизм возникновения словоформ, имеющих флексию, через ...

Скачать
44543
0
0

... широкого спектра знаний. Основному же термину «юрислингвистика» 10 лет – он был введён в 1999 году Н.Д. Голевым, доктором филологических наук, профессором, академиком СО РАН ВШ. §2 Проблемы становления современной юридической лингвистики Социальные функции языка исключительно широки. В литературе по социальной лингвистике регулярно отмечаются выходы языка в культуру, религию, этногенез, ...

0 комментариев


Наверх