2. Поисковые системы
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, то есть уместность результата), полнота базы, учёт морфологии языка.
Индексация информации осуществляется специальными поисковыми роботами.
В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Улучшение поиска — это одна из приоритетных задач сегодняшнего Интернета.
2.1 Использование поисковых систем на Западе
По данным компании Net Applications в декабре 2007 года использование поисковых систем на Западе распределялось следующим образом:
Google — 77,04 %
Yahoo — 12,46 %
MSN — 3,33 %
Microsoft Live Search — 2,57 %
AOL — 2,12 %
Ask — 1,38 %
AltaVista — 0,13 %
Excite — 0,07 %
Lycos — 0,02 %
All the Web — 0,02 %
В вышеприведенный отчёт не входят российские поисковики, такие как, например, Яндекс, Рамблер или Nigma.
По данным аналитической компании comScore все поисковые сайты в декабре 2007 года обработали 66 млрд 221 млн поисковых запросов.
Яндекс попал в статистику и находится на 9-ом месте.
2.2 История поисковых систем
Одним из первых инструментов поиска в интернете (до WWW) был Archie.
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993.
Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор.
Первой полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой системой стала «WebCrawler», запущенная в 1994.
В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах.
Кроме того, это был первый поисковик, о котором было известно в широких кругах.
В 1994 был запущен «Lycos», разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как «Excite», «Infoseek», «Inktomi», «Northern Light» и «AltaVista».
В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как «Yahoo!».
Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность.
В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины Rambler и Aport.
23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и метапоиска.
Из международных машин такого плана наибольшую известность получила «Clusty» компании Vivísimo.
В 2005 году на российских просторах при поддержке МГУ запущен поисковик Nigma, поддерживающий автоматическую кластеризацию.
В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака ключевых слов.
Nigma тоже экспериментировала с визуальной кластеризацией.
3. Русскоязычные поисковые системы
Большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском и др.
Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что в основном индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык или другими способами ограничивают своих роботов русскоязычными сайтами.
Яндекс (46,3 % Рунета)
Mail.ru (8,9 % Рунета)
Rambler (3,3 % Рунета)
Nigma (0,5 % Рунета)
Генон (0,1 % Рунета)
Gogo.ru (<0,1 % Рунета)
Aport (<0,1 % Рунета)
Из перечисленных поисковых систем не все имеют собственный поисковый алгоритм — так QIP.ru используют поисковый механизм Яндекса, Mail.ru использует Google, а Nigma сочетает в себе как свой алгоритм, так и сборную выдачу от других поисковиков.
Заключение
Поиск, с применением поисковых машин, является самым распространенным и эффективным методом поиска чего-то конкретного в сети Интернет.
Хотя остальные методы ничем не хуже, только они применяются очень редко и только в том случае, если при помощи поисковой машины ничего нельзя найти.
Пользоваться поисковыми машинами удобно и легко.
Список использованных источников
1. http://www.ucheba.ru – УЧЕБА.RU
2. http://textbook.vadimstepanov.ru/index.html - ИНТЕРНЕТ В ПРОФЕССИОНАЛЬНОЙ ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ
3. http://www.proweb.ru/articles/oglavlenie/glava4/poisk - Группа компаний "Вебдом«
4. http://newsmir.ucoz.ru/load/1-1-0-9 - Лента новостей
5. http://simbiont-club.webzone.ru/search.htm - поисковые системы
6. http://www.seoded.ru/ssilki/poiskoviki.html - seoded.ru
... лучше учитывают и такую исторически сложившуюся особенность российских Интернет-ресурсов, как сосуществование нескольких кодировок кириллицы.2. Обзор и характеристика поисковых систем сети Internet 2.1 Rambler Для поиска русскоязычной информации в Интернете лучше использовать русские поисковые системы. В этом опыте и в следующих других мы будем искать информацию с помощью нескольких систем ...
... Windows у каждого DOS-приложения было собственное руководство пользователя и тем самым требовалось отдельно изучать каждое приложение. 2 ОСНОВНЫЕ ПРИЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ 2.1 Основные требования к поиску К результатам поиска предъявляются требования полноты охвата ресурсов, достоверности полученной информации, минимальных затрат времени и максимальная скорость поиска. ...
... заключается в том, что нет необходимости узнавать, где расположена найденная информация, достаточно выбрать требуемую запись из списка. Понятие информационных поисковых систем. Автоматизированная поисковая система – система, состоящая из персонала и комплекса средств автоматизации его деятельности, реализующая информационную технологию выполнения установленных функций. Опыт и практика ...
... подобная программа будет включена в план ФПКП, то оплата труда специалистов, проводящих повышение квалификации, будет производиться из средств ФПКП. Глава 2. Образовательные возможности компьютерной сети 2.1 Электронная почта Наиболее распространенной коммуникационной технологией и соответствующим сервисом в компьютерных сетях стала технология компьютерного способа пересылки и обработки ...
0 комментариев