2. Информационно-поисковая система
Рассмотрим постановку задачи поиска в общем виде. Для этого необходимо ответить на три вопроса: что искать, то есть, какие источники информации, где искать (места размещение этих источников) и как искать (какие инструменты для этого использовать).
Каковы основные источники информации, представленные в Интернете? Это документы WWW, статьи в группах новостей и списках рассылки, файлы в библиотеках файлов, справочники адресной информации организаций и людей (электронная почта, адрес, телефон), статьи в тематических базах данных, энциклопедиях.
Можно искать нужные источники информации вручную, узнавать адреса из специализированных журналов по информатике и Интернету, использовать специальные бумажные справочники с классифицированными по категориям адресами. В Интернете необходимо научиться пользоваться специальными инструментами, цель которых - собирать данные об информационных ресурсах и предоставлять пользователям услугу быстрого поиска.
Информационно-поисковая система – это программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Программной частью поисковой системы является поисковая машина (поисковый движок) - комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Главной задачей любой ИПС является поиск информации релевантной информационным потребностям пользователя. Очень важно в результате проведенного поиска ничего не потерять, то есть найти все документы, относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная характеристика процедуры поиска - релевантность.
Релевантность - это соответствие результатов поиска сформулированному запросу.
Рассмотрим ИПС для всемирной паутины (WWW).
(World Wide Web) - распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Всемирную паутину образуют миллионы web-серверов.
Основными показателями ИПС для WWW являются пространственный масштаб и специализация. По пространственному масштабу ИПС можно разделить на локальные, глобальные, региональные и специализированные. Локальные поисковые системы могут быть разработаны для быстрого поиска страниц в масштабе отдельного сервера. Региональные ИПС описывают информационные ресурсы определенного региона, например, русскоязычные страницы в Интернете. Глобальные поисковые системы в отличие от локальных стремятся объять необъятное - по возможности наиболее полно описать ресурсы всего информационного пространства сети Интернет.
В общем случае, можно выделить следующие поисковые инструменты для WWW: каталоги, поисковые системы, метапоисковые системы.
· Каталог - поисковая система с классифицированным по темам списком аннотаций со ссылками на web-ресурсы. Классификация, как правило, проводится людьми.
Поиск в каталоге очень удобен и проводится посредством последовательного уточнения тем. Тем не менее, каталоги поддерживают возможность быстрого поиска определенной категории или страницы по ключевым словам с помощью локальной поисковой машины. База данных ссылок (индекс) каталога обычно имеет ограниченный объем, заполняется вручную персоналом каталога. Некоторые каталоги используют автоматическое обновление индекса.
Результат поиска в каталоге представляется в виде списка, состоящего из краткого описания (аннотации) документов с ссылкой на первоисточник.
Адреса популярных каталогов:
Зарубежные каталоги:
Yahoo - www.yahoo.com
Magellan - www.mckinley.com
Российские каталоги:
@Rus - www.aport.ru
Улитка - www.ulitka.ru
· Поисковая машина - поисковая система с формируемой роботом базой данных, содержащей информацию об информационных ресурсах.
Отличительной чертой поисковых машин является тот факт, что база данных, содержащая информацию об Web-страницах, формируется программой-роботом.
Поиск в такой системе проводится по запросу, составляемому пользователем, состоящему из набора ключевых слов или фразы.
Зарубежные поисковые машины:
Google - www.google.com
Altavista - www.altavista.com
Excite - www.excite.com
HotBot - www.hotbot.com
Российские поисковые машины:
Яndex - www.yandex.ru (или www.ya.ru)
Рэмблер - www.rambler.ru
· Метапоисковая система - это поисковый инструмент, посылающий ваш запрос одновременно на несколько поисковых систем, каталогов и иногда, в так называемую невидимую (скрытую) паутину - собрание онлайновой информации, не проиндексированной традиционными поисковыми системами. Собрав результаты, метапоисковая система удаляет дублированные ссылки и, в соответствии со своим алгоритмом, объединяет/ранжирует результаты в общем списке.
В отличие от отдельных поисковых систем и директорий, метапоисковые системы не имеют собственных баз данных.
Метапоисковые системы экономят достаточно много времени, избавляя от необходимости вводить запрос в каждой отдельной поисковой системе. Результаты, в большинстве случаев - в высшей степени релевантны. Метапоисковые системы могут использоваться вебмастерами для выяснения, присутствует ли их сайт в главных поисковых системах, какие у него рейтинги и насколько популярны ссылки.
Метапоисковые системы различаются между собой:
- системы, которые объединяют, ранжируют результаты на одной странице;
- системы, которые группируют результаты по поисковым системам на одной длинной странице;
- системы, которые открывают для каждой используемой поисковой системы новое окно;
- Поисковые утилиты - программные поисковые средства.
Адреса известных метапоисковых систем:
MetaCrawler - www.metacrawler.com
SavvySearch - www.savvysearch.com
Поиск источников информации.
Обсудим проблему поиска такого источника информации, как статьи в группах новостей. Поиск в группах новостей поддерживает, например, поисковый сервер Alta vistа. Следует отметить, что поисковые системы WWW весьма оперативно индексируют группы новостей и содержат информацию о статьях, реально существующих в сети. Для поиска в архивах новостей существуют специализированные системы, самой известной из которых является система Deja (www.deja.com). Эта система позволяет проводить как поиск отдельных статей, содержащих введенный термин, так и поиск определенных групп новостей, посвященных обсуждению заданной темы.
Сегодня ИПС являются наиболее мощным механизмом поиска сетевых информационных ресурсов Internet. К сожалению, в российском секторе Internet пока не наблюдается активного изучения этой проблемы. Такая работа может быть сосредоточена в рамках таких проектов, как Россия On-line компании SovamTeleport, но здесь пока наблюдаются ссылки на чужие поисковые машины. Развитие ИПС для Internet в США началось два года назад, учитывая отечественные реалии и темпы развития технологий Сети в России, можно надеяться, что у нас еще все впереди.
... системного подхода, общепризнанного в методологии современного научного познания сложных систем. Несмотря на различия в специфике бизнеса основные требования менеджеров высшего звена к маркетинговой информационной системе достаточно стандартны: 1) программа-минимум - анализ динамики бизнеса (продажи, рентабельность) в различных разрезах (продукты, клиенты, менеджеры); - управление и оценка ...
... распознавание и аннотирование. Последняя функция, в частности, дает возможность наносить на дополнительные слои произвольные пометки, сохраняя при этом первооснову. 5. Роль и значение корпоративных информационных систем в решении задач маркетинга В современных условиях решение большинства задач маркетинга уже немыслимо без применения современных информационных технологий. Большинство КИС, ...
... ; реализовать проект, учитывая все требования к интерфейсной и функциональной частям. Предмет исследования: автоматизация информационной системы с учётом всех требований к применяемому для разработки программному обеспечению. Объект исследования: станция технического обслуживания, систему которой необходимо автоматизировать для упрощения и удобства работы сотрудников. 1. Анализ предметной ...
... из одного формата к другому и обратно. Вот эта часть программного обеспечения, которую мы выделили чисто логически и принято называть бизнес логикой. Рис.1.1 Структура информационной системы Формально информационные системы можно разделить на автономные и сетевые. Причем к сетевым информационным системам мы относим и такие, которые эпизодически синхронизируют свои информационные хранилища ...
0 комментариев