2. Информационно-поисковая система

Рассмотрим постановку задачи поиска в общем виде. Для этого необходимо ответить на три вопроса: что искать, то есть, какие источники информации, где искать (места размещение этих источников) и как искать (какие инструменты для этого использовать).

Каковы основные источники информации, представленные в Интернете? Это документы WWW, статьи в группах новостей и списках рассылки, файлы в библиотеках файлов, справочники адресной информации организаций и людей (электронная почта, адрес, телефон), статьи в тематических базах данных, энциклопедиях.

 Можно искать нужные источники информации вручную, узнавать адреса из специализированных журналов по информатике и Интернету, использовать специальные бумажные справочники с классифицированными по категориям адресами. В Интернете необходимо научиться пользоваться специальными инструментами, цель которых - собирать данные об информационных ресурсах и предоставлять пользователям услугу быстрого поиска.

Информационно-поисковая система – это программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Программной частью поисковой системы является поисковая машина (поисковый движок) - комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.

Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.

Релевантность - это соответствие результатов поиска сформулированному запросу.

Рассмотрим ИПС для всемирной паутины (WWW).

(World Wide Web) - распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов.

Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.

В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.

·  Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.

Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.

Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с ссылкой на первоисточник.

Адреса популярных каталогов:

Зарубежные каталоги:

Yahoo - www.yahoo.com

Magellan - www.mckinley.com

Российские каталоги:

@Rus - www.aport.ru

Улитка - www.ulitka.ru

·  Поисковая машина - поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.

Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, формируется программой-роботом.

Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы.

Зарубежные поисковые машины:

Google - www.google.com

Altavista - www.altavista.com

Excite - www.excite.com

HotBot - www.hotbot.com

Российские поисковые машины:

Яndex - www.yandex.ru (или www.ya.ru)

Рэмблер - www.rambler.ru

·  Метапоисковая система - это поисковый инструмент, посылающий ваш запрос одновременно на несколько поисковых систем, каталогов и иногда, в так называемую невидимую (скрытую) паутину - собрание онлайновой информации, не проиндексированной традиционными поисковыми системами. Собрав результаты, метапоисковая система удаляет дублированные ссылки и, в соответствии со своим алгоритмом, объединяет/ранжирует результаты в общем списке.

В отличие от отдельных поисковых систем и директорий, метапоисковые системы не имеют собственных баз данных.

Метапоисковые системы экономят достаточно много времени, избавляя от необходимости вводить запрос в каждой отдельной поисковой системе. Результаты, в большинстве случаев - в высшей степени релевантны. Метапоисковые системы могут использоваться вебмастерами для выяснения, присутствует ли их сайт в главных поисковых системах, какие у него рейтинги и насколько популярны ссылки.

Метапоисковые системы различаются между собой:

- системы, которые объединяют, ранжируют результаты на одной странице;

- системы, которые группируют результаты по поисковым системам на одной длинной странице;

- системы, которые открывают для каждой используемой поисковой системы новое окно;

- Поисковые утилиты - программные поисковые средства.

Адреса известных метапоисковых систем:

MetaCrawler - www.metacrawler.com

SavvySearch - www.savvysearch.com

Поиск источников информации.

Обсудим проблему поиска такого источника информации, как статьи в группах новостей. Поиск в группах новостей поддерживает, например, поисковый сервер Alta vistа. Следует отметить, что поисковые системы WWW весьма оперативно индексируют группы новостей и содержат информацию о статьях, реально существующих в сети. Для поиска в архивах новостей существуют специализированные системы, самой известной из которых является система Deja (www.deja.com). Эта система позволяет проводить как поиск отдельных статей, содержащих введенный термин, так и поиск определенных групп новостей, посвященных обсуждению заданной темы.

Сегодня ИПС являются наиболее мощным механизмом поиска сетевых информационных ресурсов Internet. К сожалению, в российском секторе Internet пока не наблюдается активного изучения этой проблемы. Такая работа может быть сосредоточена в рамках таких проектов, как Россия On-line компании SovamTeleport, но здесь пока наблюдаются ссылки на чужие поисковые машины. Развитие ИПС для Internet в США началось два года назад, учитывая отечественные реалии и темпы развития технологий Сети в России, можно надеяться, что у нас еще все впереди.


Информация о работе «Информационные системы и их виды»
Раздел: Информатика, программирование
Количество знаков с пробелами: 30822
Количество таблиц: 1
Количество изображений: 0

Похожие работы

Скачать
29552
0
5

... системного подхода, общепризнанного в методологии современного научного познания сложных систем. Несмотря на различия в специфике бизнеса основные требования менеджеров высшего звена к маркетинговой информационной системе достаточно стандартны: 1) программа-минимум - анализ динамики бизнеса (продажи, рентабельность) в различных разрезах (продукты, клиенты, менеджеры); - управление и оценка ...

Скачать
44401
0
1

... распознавание и аннотирование. Последняя функция, в частности, дает возможность наносить на дополнительные слои произвольные пометки, сохраняя при этом первооснову. 5. Роль и значение корпоративных информационных систем в решении задач маркетинга В современных условиях решение большинства задач маркетинга уже немыслимо без применения современных информационных технологий. Большинство КИС, ...

Скачать
54263
18
7

... ; реализовать проект, учитывая все требования к интерфейсной и функциональной частям. Предмет исследования: автоматизация информационной системы с учётом всех требований к применяемому для разработки программному обеспечению. Объект исследования: станция технического обслуживания, систему которой необходимо автоматизировать для упрощения и удобства работы сотрудников. 1. Анализ предметной ...

Скачать
26725
0
3

... из одного формата к другому и обратно. Вот эта часть программного обеспечения, которую мы выделили чисто логически и принято называть бизнес логикой. Рис.1.1 Структура информационной системы Формально информационные системы можно разделить на автономные и сетевые. Причем к сетевым информационным системам мы относим и такие, которые эпизодически синхронизируют свои информационные хранилища ...

0 комментариев


Наверх