Поиск в Байнете

Где искать? Рано или поздно, такой вопрос возникает у любого белорусского пользователя Интернета. Ответ очевиден - искать надо с помощью поисковых систем. А это специально созданные узлы WWW, основная функция которых состоит в поиске информации среди различных информационных ресурсов Интернета (серверы WWW, FTP, Gopher, телеконференции, UseNet, списки адресов E-mail). Бывают они разные и классифицируются по методам поиска информации. Существует три основных типа таких систем: поисковые каталоги, поисковые индексы и гибридные системы поиска.

В поисковый каталог информация заносится по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Результатом является постоянно обновляющийся иерархический (древовидный) каталог, на верхнем уровне которого собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные web-страницы и серверы вместе с кратким описанием их содержимого. Предметные каталоги предоставляют также возможность автоматического поиска по ключевым словам. Только поиск происходит не в содержимом самих web-серверов, а в их кратких описаниях, хранящихся в каталоге. Поисковые каталоги обеспечивают высокое качество поиска и по уровню сортировки документов намного превосходят поисковые индексы, проигрывая им по количеству просмотренных документов.

Поисковые или автоматические индексы (spiders, crawlers) постоянно исследуют Интернет с целью пополнения своих баз данных. Обычно это не требует никаких усилий со стороны человека. Программа, в которую загрузили несколько тысяч общеизвестных URL-адресов, будучи запущена на компьютере с доступом к WWW, начинает автоматически скачивать из сети документы по этим URL. Причем из каждого нового документа она извлекает все содержащиеся в нем ссылки и добавляет их в свою базу адресов. Преимуществами этих систем являются большие базы данных и высокая скорость обработки запросов. К недостаткам можно отнести очень большое количество ссылок на выходе, причем большая часть этих документов имеет весьма отдаленное отношение к нужной теме.

Гибридные системы поиска сочетают в себе поисковые каталоги и индексы. Существуют ещё и метапоисковые системы (поисковые службы), которые рассылают запросы пользователя одновременно нескольким поисковым серверам и обращаются к некоторым другим источникам информации. Затем они объединяют полученные результаты и представляют их пользователю в виде HTML-страницы с активизируемыми URL-ссылками.

Какие же есть белорусские поисковые системы и как их можно найти? Конечно, существуют такие поисковики, которые известны практически всем. Ну что там у нас на слуху? All.by, poisk.com, br.by. Также можно спросить у своих знакомых и друзей. И, наконец, просто поискать в уже известных нам поисковиках. Так и поступим, а заодно и проверим их, устроив своеобразное тестирование. Для этого везде будем вводить одинаковый текст запроса, например, "каталог ресурсов", и посмотрим, где и сколько будет соответствий. Попутно обратим внимание на количество ресурсов, заявленных в этих каталогах и на их рубрикатор. Кстати, под ресурсом понимается сайт в целом, а под документом - информация, находящаяся на какой-либо страничке сайта. Итак, поехали. А результаты приведём в таблице 1.

 
Таблица 1: Белорусские поисковики и каталоги с функцией поиска
Название поисковой службы Кол-во ресурсов Кол-во категорий Выдано ресурсов после запроса Соответствие запросу
"XXI век" vek.virtualave.net ? - 39 7
"Белорусские ресурсы" BelResource.com.by 6781 9 12 6
Poisk.com 1103 8 1 0
"Белорусский рейтинг" Br.by 996 14 9 5
All.by 1827 8 22 14
Agapov.com 304 14 25 6
"*.BY" search.promedia.minsk.by ? - 18 817 документов 11
"Зубр" Zubr.com 487 12 38 18

Как видно из таблицы, по соответствию запросу, бесспорным лидером этого эксперимента оказался Zubr.com. И количество выданных ссылок реально просмотреть, и соответствий достаточно. Обидно только, что количество ресурсов пришлось считать самому, как говорится, вручную. На втором месте поисковый индекс и каталог All.by. Здесь, кстати, представляется информация не только о количестве ресурсов, содержащихся в базе, но и о количестве документов - 60 070, что, кстати, представляет отдельный интерес. Выдаваемая информация делится на две части: ссылки на ресурсы и ссылки на документы. Очень удобно. Кстати, кто ещё не знает, all.by - это новое имя и лицо старого-доброго 09.open.by.

На третьем месте - поисковая служба *.by. Как вы заметили, только *.by выдаёт в результате ссылки на документы, а не на сайты. Не знаю, у кого хватит сил и нервов просмотреть всю эту кучу документов. Лично меня хватило на 60 ссылок, в которых я и нашёл 11 соответствий. Вполне возможно, что если просмотреть всё, то можно найти и больше, но это уже не для меня. Есть на этом сайте и приятные вещи, а именно: дополнительные параметры запросов, с помощью которых можно повысить точность выдаваемых ссылок, а также снизить их количество.

Интересно получилось с poisk.com. При поиске по каталогу он выдал только одну ссылку на российский каталог list.ru. Причём, если посмотреть в рубрикаторе, то имеется 13 ссылок на каталоги ресурсов. Почему же они не были выданы при поиске? У poisk.com имеется ещё возможность поиска в Yandex-Беларусь. Вот он-то и вывалил ссылки на 479 документов, а это не менее 76 серверов. Просмотрев первые 20 ссылок, я нашел 9 соответствий, а дальше, честно говоря, было просто лень смотреть. Кстати, у poisk.com имеется неплохой расширенный поиск, в котором указывается страна, город, язык, зона, рубрика и др. параметры, что тоже может облегчить поиск. Ну а остальные поисковики выдали по 5-7 соответствий.

Что же мы нашли в результате поиска? Приведем ещё одну таблицу (2) уже с результатами поиска по белорусским каталогам ресурсов. Здесь оцениваемыми параметрами будут количество ресурсов и категорий первого уровня, то есть те категории, которые находятся на заглавной странице каталога.

Таблица 2: Белорусские каталоги без функции поиска
Название Количество ресурсов Количество категорий
"Акавiта" akavita.kryvia.net 734 54
"Винт" bsm.unibel.by/vint 140 24
"Новый век" highwebs.com/vek 436 A…Я и A…W
"Белорусские домашние страницы" www.kv.by/belhome 69 6
"Интересные www-сайты в и о Беларуси" аc.by/country ~4000 16
"Minsk in Person" mips.virtualave.net 31 -
"БИФ" bif.by 311 12
"Весь Белорусский Интернет" danila.w3.to ~400 39

Теперь для анализа будем использовать данные обеих таблиц. Итак, все каталоги можно разделить по количеству ресурсов на два типа. К примеру, на каталоги, содержащие до 1 000 ресурсов и, соответственно, более 1 000. Как видно из таблиц, к первому типу относится большинство каталогов - 10. Ко второму относится только 5 каталогов. Но заметьте, что у каталогов первого типа рубрикатор, в основном, больше. Взять, к примеру "Акавiту", "Весь белорусский Интернет" или "Винт". Здесь "Акавiта" вообще лидер, по количеству рубрик дальше всех ушла. С одной стороны, это удобно - всё перед вами, и не надо лазить по всему дереву каталога, чтобы найти интересующую категорию. Но, с другой стороны, глаза просто разбегаются, когда смотришь на эти 54 рубрики.

Второй тип каталогов берёт своё количеством ресурсов. Взять, к примеру, BelResource.com.by. Пускай у него всего только 9 категорий первого уровня, но зато более 6 700 ресурсов. Прежде всего это каталог белорусских ресурсов, но здесь регистрируются не только белорусские сайты. К этому же типу относится еще один привлекательный каталог - "Интересные www-сайты в и о Беларуси". Дело в том, что этот каталог дает ссылки на многоязычные информационные ресурсы, посвящённые нашей стране. Хотите узнать, что пишут и думают о нас в других странах, тогда вперёд. Причём каталог постоянно находится в стадии развития и пополняется почти ежедневно. Там есть что посмотреть и почитать, если, конечно, вы знаете ещё какой-нибудь язык, кроме русского. Например, здесь можно почитать о Минске на французском или итальянском языках.

Итак, какие же всё-таки будут итоги? Просмотрев каталоги, я пришёл к выводу, что:

  • информацию о компьютерах и Интернете лучше всего искать на belresource.com. by, all.by, br.by, poisk.com;
  • о науке и образовании - belresource.com.by, all.by, br.by, zubr.com, аc.by/country;
  • о политике - all.by, br.by, poisk.com, аc.by/country, belresource.com.by, аkavita.kryvia.net;
  • о культуре и искусстве - belresource.com.by, аc.by/country, all.by, аkavita.kryvia.net, poisk.com;
  • о бизнесе - belresource.com.by, all.by, аkavita.kryvia. net, poisk.com, zubr.com;
  • о здоровье и медицине - belresource.com.by, all.by, br.by, аkavita.kryvia.net;
  • о новостях и СМИ - all.by, br.by, poisk.com, аc.by/country, belresource.com.by, zubr.com;
  • об отдыхе и развлечениях - belresource.com.by, all.by, poisk.com, br.by, аkavita.kryvia.net.

А что касается результатов по запросам, то они, конечно, относительны. Ведь если взять другой текст, то и результат может получиться совершенно отличным от данного. Не берусь утверждать, какой поисковик или каталог лучше. Об этом можно спорить очень и очень долго. Лучший вариант - если вы сами попробуете поработать с той или иной поисковой службой и впоследствии выберете именно то, что вам нравится и подходит. Я сделал именно так, и теперь вряд ли перестану дружить с All.by.

Игорь ЯКОВЛЕВ,
инф. агентство "Веспол",
vespol@tut.by

Версия для печатиВерсия для печати

Номер: 

46 за 2000 год

Рубрика: 

Internet
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!