СЕТИ ЭВМ И ТЕХНОЛОГИИ РАСПРЕДЕЛЕННОЙ ОБРАБОТКИ ДАННЫХ.
Поисковые ресурсы Internet.
Поисковые средства Internet представлены следующими категориями:
Справочники
Каталоги
Поисковые машины
Метапоисковые машины
Порталы
Существуют два вида справочников - онлайн, размещенных в сети, и в печатном виде. В справочниках приводятся URL информационных ресурсов. Наиболее популярным является справочник "Желтые страницы Интернет". В справочнике имеется рубрикатор включающий следующие базовые категории:
Экономика и финансы
Услуги
Торговля
Сети и телекоммуникации. Интернет.
Регионы и города
Производства
Право и политика
Отдых и развлечение
Образование
Наука и техника
Медицина и здоровье
Культура и искусство
Компьютерные технологии
Дом и семья
На сайте имеется возможность добавление новых ресурсов, которые впоследствии будут опубликованы в бумажной версии "Желтые страницы". Работает подписка на обновления сайта - передача по почте пользователю ссылок на новые внесенные в каталог ресурсы по выбранным ресурсам.
Все каталоги Internet построены по принципу "от общего - к частному" и обладают удобной древовидной структурой (вложенных категорий). Каталоги позволяют осуществлять поиск по ключевым словам. Однако каталоги обладают существенным недостатком - субъективизмом, т.к. решение о включении того или иного ресурса в каталог принимается работниками службы обслуживающей каталог. Кроме того, каталоги не успевают быстро реагировать на изменения ресурсного содержания сети. Тем не менее каталогов в сети значительно больше чем других поисковых ресурсов. Наиболее популярным является каталог YAHOO (http://www.yahoo.com), который является частью портала Yahoo. Несмотря на громадное количество ресурсов, каждый кандидат на собственную строчку в каталоге Yahoo проходит строжайший отбор, поэтому этот каталог считается самым представительным.
Из русскоязычных каталогов наибольшую популярность заслужил LIST.RU (http://www.list.ru), Кроме каталогов общего назначения в сети присутствует множество тематических каталогов, например, каталог для женщин WWWOMEN ONLINE (http://wwwomen.ru), детский каталог KINDER.RU (http://www.kinder.ru), каталог научных ресурсов RUSINTELLECT (http://rusintellect.ru).
Рейтинги - это каталоги, в которых вывод результатов поиска упорядочен (ранжирован). Пользователь очень редко просматривает больше трех страниц с результатами поиска. Поэтому субъективно он оценивает точность по "верхним" документам. Даже если нужный документ найден, но расположен на двухсотой позиции, скорее всего, он никогда не будет найден пользователем. Характеристикой упорядочения является рейтинг, вычисляемый по двум характеристикам:
"хиты" - общее количество посещений данного ресурса за определенный период;
"хосты" - уникальное количество посещений данного ресурса за тот же период.
При каждом посещении ресурса "хиты" увеличиваются на единицу. При этом проверяется IP-адрес посетителя, если за заданный промежуток времени такого адреса на было, то "хосты" увеличиваются на единицу, в противном случае остаются неизменными. Промежуток времени на котором определяется рейтинг может быть различным (сутки, неделя, месяц и т.п.). Рейтинг является службой, которая оказывает услуги пользователю как платные (http://www.spylog.com), так и бесплатные (http://top100.rambler.ru). Для включения ресурса в рейтинг владелец ресурса должен подать в службу рейтинга заявку. Если заявка принимается, то на сайте пользователя размещается значок (баннер) участника рейтинга например:
C этого момента Рейтинг отслеживает посещение сайта (или каких-либо его страниц) вычисляя характеристики упорядочения.
Принцип работы поисковых и метапоисковых машин был рассмотрен выше (раздел "Основные принципы поиска информации в Internet"). Укажем наиболее популярные поисковые машины:
Google: (http://www.google.com) - наиболее популярная поисковая машина (до 85% всех обращений);
AltaVista: (http://www.altavista.com) - наиболее популярная до появления Google поисковая машина;
Bing: (http://www.bing.ru) - многоязычная поисковая система
Yandex: (http://www.yandex.ru) - наиболее популярная поисковая машина в русскоязычном сегменте WWW;
Rambler: (http://www.rambler.ru) - сервер "все в одном" - есть рейтинговая служба, поисковая машина и другие средства облегчающие работу пользователя;
Aport: (http://www.aport.ru) - поисковая машина, уступающая по мощности двум предыдущим, но обладающая оригинальным алгоритмом сканирования.
В русскоязычном сегменте WWW среди метапоисковых машин наиболее популярны:
Poisk: (http://www.informika.ru/windows/intern/poisk/main.html) - позволяет отправить запрос на зарубежные и отечественные поисковые машины (не более пяти);
Search: (http://search.da.ru) - дает возможность пользователю отбора из 15 русскоязычных поисковых машин.
Nigma: (http://www.nigma.ru/) - выдает результаты поиска в сгруппированном виде.
Metabot: (http://www.metabot.ru) - позволяет вести поиск по четырем направлениям: по России, зарубежным странам, по FTP, по группам новостей.
Под порталом понимают сервер предоставляющий пользователю не только поисковую машину, но и другие услуги Internet, например почтовый ящик и прочее. Блестящим примером портала может cлужить портал (его называют "мультипортал") "Кирилл и Мефодий" (http://www.km.ru).
Часто необходимо обратится к справочной и энциклопедической информации. Для этой цели можно рекомендовать мега-энциклопедический архив "РУБРИКОН" (http://www.rubricon.com), являющегося лучшим (пока платным) энциклопедическим ресурсом Internet.
Проверьте усвоение Предыдущий раздел Следующий раздел Оглавление