2. Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.
АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.
2 основные задачи АИПС:
· хранение информации
· поиск и выдача информации
Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ.
Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ.
Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.
Результатом поисковой операции является выборка релевантных ПОДов.
Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.
В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...)
выделение нужной пользователю информации осложняется двумя обстоятельствами:
· несоответствие между формулировкой запроса и реальной информацией нужной потребителю
· перевод запроса в ПОЗ
Мера соответствия документа информационной потребности называется пертенетностью.
Соответствие документа запросу называется релевантностью:
· смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)
· формальная (соответствие документа поисковому предписанию)
ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.
Классификация ИПЯ:
предкоординированные ИПЯ присутствует заранее заданная классификационная схема | посткоординируемые ИПЯ отсутствует заранее заданная классификационная схема |
Типы классификаций
иерархическая задает дерево знаний, например всей литературы по лингвистике | алфавитно-предметная например, телефонный справочник | фасетная опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета |
Фасетная классификация: фильмы:
жанр | цвет | формат |
Ж1 Ж2 | Ц1 цветной Ц2 черно-белый | Ф1 широкоформатный |
фасетная формула: Ж1 Ц2 Ф1
Общие недостатки предкоординированных ИПЯ:
· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков
· все классификации имеют недостаточную глубину
· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование
Посткоординируемые ИПЯ:
семантические коды в ЛЕ в явном виде заданы парадигматические отношения | дескрипторы оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство | |||||
Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель; RX коды ручное индексирование | грамматики мешочного типа (теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов. | позиционно-скобочные грамматики сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения: | сетевые грамматики в явном виде задается смысл связи между элементами текста (Скрэгг) |
ИПЯ с ПСГ:
· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.
· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду
4
... и единицах текста, о законах связности, о средствах реализации связности (к их числу относятся замещения и коннекторы), о статусе предложения и актуального членения и др. Популярности исследований по лингвистике текста в указанный период способствовало также широко распространенное ощущение, в соответствии с которым эти исследования рассматривались как вносящие вклад в преодоление разделения ...
... ". Примечательно, что и на последней встрече когнитологов в Стокгольме летом 1999 г. Б. Петере подчеркивал необходимость решения этой задачи - разъяснения семантики термина "когнитивный", - хотя ему и кажется, что в сочетании "когнитивная лингвистика" прилагательное имеет скорее идентифицирующее, нежели дескриптивное значение (Peeters 1999: 52). Хотела бы отметить также, что в момент составления и ...
... с другом, создавая новую лингвистическую единицу; они могут «приклеиваться» к глагольной или именной основе в виде аугментов, будущих флексий, будущих расширителей. Таким образом, «непарадигматическая» лингвистика, в нашем понимании, это некая лингвистическая дисциплина, пытающаяся приблизиться к описаниям протоязыка Стадии I и проследить механизм возникновения словоформ, имеющих флексию, через ...
... широкого спектра знаний. Основному же термину «юрислингвистика» 10 лет – он был введён в 1999 году Н.Д. Голевым, доктором филологических наук, профессором, академиком СО РАН ВШ. §2 Проблемы становления современной юридической лингвистики Социальные функции языка исключительно широки. В литературе по социальной лингвистике регулярно отмечаются выходы языка в культуру, религию, этногенез, ...
0 комментариев