2.2.3. Поисковая система Апорт

Примеры простых запросов

Обычно запрос представляет из себя просто одно или несколько слов, например:

микропроцессоры компании Intel

 

По такому запросу находятся документы, в которых встречаются все слова запроса. Есть, правда, ограниченное число слов (союзы, предлоги и т.п.), которые в запросе игнорируются, так как не несут сами по себе смысловой нагрузки. Например, по запросу:

яблоки на снегу

 

будут найдены все документы, в которых встречаются одновременно два слова: "яблоко" и "снег". Где в пределах документа расположены слова, в какой грамматической форме они находятся — не важно

Стоит еще раз подчеркнуть важное и очень полезное свойство Апорта: независимо от того, в какой грамматической форме вы пишите в запросе слово, оно находится в документах во всех своих формах. Например, по запросу:

человек шел

 

будут найдены среди прочих и документы, содержащие текст "люди идут". Распознавание всех форм работает для обычных слов русского языка. Для экзотических слов, неологизмов и т.п. оно не проходит. В этом случае может пригодиться оператор "*" (звездочка). Например, вы хотите найти все, касающееся деятельности президента России, в том числе и документы, содержащие слово "ельцинизм". Воспользуйтесь запросом:

ельцин*

 

Он позволит вам найти то, что вы хотите (а также документы со словами Ельцинище, ельцинцы, ельциненок и т.п), поскольку звездочка заменяет собой любое число любых букв

Поиск по адресам (по URL)

 

Вы можете искать документы не только по всему русскоязычному Интернету, но и по его части. Самый простой случай — поиск по определенному серверу. Например

url=www.intel.ru собака

 

По данному запросу будут найдены все документы на сервере www.intel.ru, содержащие слово "собака". Возможно, вам интересно, а что будет, если написать просто:

url=www.intel.ru

 

В этом случае вы получите список всех документов, расположенных на указанном вами сервере

Вы можете ограничивать поиск и сильнее — одним из каталогов сервера. Например:

url=www.intel.ru/sobaki/ сенбернар

 

По данному запросу документы, содержащие слово "сенбернар", будут искаться только в каталоге /sobaki (и его подкаталогах) московского сервера корпорации Intel.

2.2.4. List.ru

На главной странице в верхней ее части расположены ссылки на наиболее популярные проекты. Ниже, под логотипом каталога, поисковая форма. В правой колонке и нижней части страницы - блоки самых актуальных новостей. Список ссылок на основные категории каталога занимает центральную часть. Цифры рядом с названием категории показывают количество сайтов, содержащихся в ней. Записанные мелким шрифтом заголовки отсылают при нажатиии на подкатегории раздела. Щелкнув по любому из названий, Вы попадете в соответствующую рубрику и под логотипом List.ru увидите полный путь до нее, начиная с главной страницы. Каждый промежуточный уровень структуры доступен по отдельной ссылке.Поиск в каталоге реализован таким образом, что в результате запроса могут быть найдены как отдельные сайты, так и рубрики. Поиск будет успешным URL, название, описание, ключевые слова. Допускается использованием языка запросов Яндекс. Расположенная рядом с поисковой формой ссылка "Структура каталога" открывает в отдельном окне полный рубрикатор каталога. Реализована возможность перехода из рубрикатора в любую выбранную подкатегорию. Более детальное тематическое деление текущей рубрики представлено списком ссылок. Помеченные символом @ приведут в подкатегории, структурно входящие в другие разделы, но содержащие близкую по содержанию информацию. Если Вы хорошо представляете, в какой рубрике содержатся нужные ресурсы, лучше перейти в нужную подкатегорию, воспользовавшись любым из предоставляемых средств навигации по каталогу. В противном случае можно искать их в полном списке. Каталог организован таким образом, что все сайты, содержащиеся на нижних уровнях структуры, представлены и в рубриках.Показываемый ниже список ресурсов упорядочен в алфавитном порядке, но, выбрав соответствующую сортировку ("По времени добавления" или "По переходам"), можно просмотреть их по порядку добавления в каталог (начиная с самых "свежих") или в зависимости от популярности среди посетителей каталога. Ссылка с названия сайта открывает в отдельном окне его зарегистрированную в данной рубрике страницу. Пометки RUS и ENG означают наличие на сайте страниц, соответственно на русском и английском языках. В красных скобках (Заходов: ххх.хх) показано среднесуточное количество переходов на ресурс со страниц List.ru.

2.2.5. Поисковая система AltaVista

Индексирование в этой системе осуществляется при помощи робота. При этом робот имеет следующие приоритеты:

слова содержащиеся в теге <title> имеют высший приоритет; ключевые фразы в <Meta> тэгах; ключевые фразы, находящиеся в начале странички; ключевые фразы в ALT - ссылках ключевые фразы по количеству вхождений\присутствия слов\фраз;

Если тэгов на странице нет, использует первые 30 слов, которые индексирует и показывает вместо описания (tag description)

Наиболее интересная возможность AltaVista - это расширенный поиск. Здесь стоит сразу оговориться, что, в отличие от многих других систем AltaVista поддерживает одноместный оператор NOT. Кроме этого, имеется еще и оператор NEAR, который реализует возможность контекстного поиска, когда термины должны располагаться рядом в тексте документа. AltaVista разрешает поиск по ключевым фразам, при этом она имеет довольно большой фразеологический словарь. Кроме всего прочего, при поиске в AltaVista можно задать имя поля, где должно встретиться слово: гипертекстовая ссылка, applet, название образа, заголовок и ряд других полей. К сожалению, подробно процедура ранжирования в документации по системе не описана, но видно, что ранжирование применяется как при простом поиске, так и при расширенном запросе. Реально эту систему можно отнести к системе с расширенным булевым поиском.

3.Примеры запросов


В системе Апорт был сделан запрос «вакуум-испарительный кристаллизатор».Система сообщила следующие результаты (первые три):

Апорт

1

 Тамбовский государственный технический университет

http://www.tstu.ru

О университете - история; список факультетов, специальностей; персоналии ведущих ученых и др. Рассказ о Тамбовском региональном центре информатизации высшей школы: устав, перспективные проекты, результаты. О Тамбове и области: история, культура, ссылки на страницы образовательных учреждений, туризм.

Похожие сайты 36 0000

http://www.tstu.ru/win/katalog/okp/36.htm, 04.11.1998 (проверено 08.12.2000), 104 kb, Windows 1251 ... 36 1428 4 - комбинированные 36 1429 5 - прочие 36 1430 5 Кристаллизаторы / 36 1431 0 - с вращающимися барабанами 36 1432 6 - емкостные 36 1433 ... сосудов и аппаратов 36 1600 9 Фильтры жидкостные 36 1610 3 Вакуум-фильтры / 36 1611 9 - барабанные наружные 36 1612 4 - барабанные наружные ...

Реконструкция текста

Остальные найденные на сайте страницы (1)

 2

 Институт тепло- и массообмена им. А.В. Лыкова АН Беларуси

http://www.itmo.by

Информация об институте и его лабораториях. Новости и события. Анонсы проводимых конференций и семинаров. Материалы "Инженерно-физического журнала".

Похожие сайты IFZh, 1984

http://www.itmo.by/jepter/SODER/461984r/contr46.html, (проверено 10.11.2000), 41 kb, koi8-r ... Майоров В. А. , Васильев Л. Л. Физические особенности испарительного жидкостного охлаждения пористого металлокерамического тепловыделяющего элемента ... ...

... Бодров В. В. Определение тепловых параметров тонкостенных кристаллизаторов барабанного типа ...622 Новиков Н. П. , Игнатенко К. И. , Михайлова Г. ... примеси в кремнии n типа при высокотемпературном нагреве в вакууме ...693 Булгак И. А. , Скоропанов А. С. , Вечер А. А. , Проценко Г. ... ...

... А. А. Эффективность геттерирования при массопереносе в вакууме ...949 Агеенко И. С. , Ильясов С. Г. , Красников В. В. , Тюрев Е. ...

Реконструкция текста

Остальные найденные на сайте страницы (1)

3

 WWW server of Tambov state technical university

http://www.tixm.tambov.su

 36 0000

http://www.tixm.tambov.su/win/katalog/okp/36.htm, 04.11.1998 (проверено 18.12.2000), 104 kb, Windows 1251 ... 36 1428 4 - комбинированные 36 1429 5 - прочие 36 1430 5 Кристаллизаторы / 36 1431 0 - с вращающимися барабанами 36 1432 6 - емкостные 36 1433 ... сосудов и аппаратов 36 1600 9 Фильтры жидкостные 36 1610 3 Вакуум-фильтры / 36 1611 9 - барабанные наружные 36 1612 4 - барабанные наружные ...

Реконструкция текста

Остальные найденные на сайте страницы (1)

В системе Яндекс был сделан то т же запрос, система ответила, что ничего не найдено.

3. Список использованной литературы

Павел Храмцов "Поиск и навигация в Internet".
http://www.osp.ru/cw/1996/20/31.htm

Обучение Интернет-профессиям. Search engine Expert.
http://searchengine.narod.ru/archiv/se_2_250500.htm

Андрей Аликберов "Несколько слов о том, как работают роботы поисковых машин".
http://www.citforum.ru/internet/search/art_1.shtml

 


Информация о работе «Поисковые системы»
Раздел: Компьютерные науки
Количество знаков с пробелами: 20632
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
52941
1
1

... заиндексированы и доступны для поиска, благодаря существованию "быстрой базы", которая обновляется два раза в день, а при необходимости может обновляться быстрее. На сегодняшний день индексная база поисковой системы Рамблер состоит из 8 частей, каждая из которых живет своей независимой жизнью. Весь Интернет условно разделен на 7 секторов и называется своим цветом: красный, оранжевый, желтый, ...

Скачать
38650
0
0

... заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка.   Понятие информационных поисковых систем. Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций. Опыт и практика ...

Скачать
9787
0
0

... энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы. 1. Основные методы поиска информации в Интернете Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей ...

Скачать
36994
0
12

... в запрос, расположены в документе рядом, то такой документ более полно удовлетворяет запросу. Так как большинство систем осуществляет интеллектуальный поиск в Интернете, то степень соответствия запросу, определённая поисковой системой, не всегда будет совпадать с вашими представлениями. Следует отметить, что при выполнении запроса поисковая система не ищет документ непосредственно в Интернете. ...

0 комментариев


Наверх