Поисковая система - это система, которая занимается сбором информации о ресурсах
Internet и ее систематизацией для того, чтобы упростить пользователю доступ к
интересующей его информации.
Информационно-поисковые системы классифицируют прежде всего по особенностям
функционирования на
- каталоги(directories),
- поисковые машины(search engines);
также по охвату информационных ресурсов на
по типу и тематике информационных ресурсов на
- универсальные;
- специализированные.
Остановимся подробней на классификации первого типа.
Каталоги — это, по сути, большие электронные энциклопедии, тематически
структурированные и тем самым обеспечивающие возможность сужать круг поиска.
При вызове в своем браузере каталога на экран выводится общий список тем,
озаглавленных, например, следующим образом: «Наука и образование»,
«Люди и общество», «Компьютеры и Интернет»,
«Бизнес и коммерция», «Средства массовой информации»...
Здесь, вместо того чтобы сразу загрузить в строку поиска слово «мама»,
мы движемся вглубь, например, по следующей схеме: люди и общество —
здравоохранение — советы молодым мамам. И только там либо
«перелистываем» собранные по данной теме сайты, либо вводим искомое
определение в строку поиска в данном разделе. Существуют и тематические каталоги,
коллекционирующие сайты лишь определенной направленности.
Поисковые же машины определяют всю паутину Сети как огромную базу данных.
Здесь при вводе какого-либо термина программа выдает перечень документов,
содержащих искомое определение. И чем опытнее и умнее сёрфер (специалист по
поиску в Сети), чем конкретнее вводимое им определение (лучше, если это будет
словосочетание), тем меньший объем результатов или перечень сайтов, содержащих
введенные слова, выдаст машина. Круг сузится, но уже посредством включения в
работу более сложных мыслительных процессов, нежели выбор тем и разделов.
На первый взгляд работать с каталогами значительно проще. Но здесь есть одно
существенное «но». Большинство каталогов создаются путем добавления
авторами своих сайтов к уже существующему списку вручную. А как быть, если крайне
важная для вас информация лежит на сайте, автор которого пока не успел или
просто не захотел вносить его в базу открытого вами каталога?..
Потому-то поисковые машины более популярны среди пользователей, хотя и требуют
некоторых навыков. Ведь, как мы уже поняли, ввод единичного термина в
поисковую строку успеха не приносит.
Поисковые машины — огромные склады слов, постоянно пополняемые путем
периодического автоматического сканирования виртуального информационного
пространства и индексирования его содержания. Тут тоже существуют свои,
изобретенные программистами, законы виртуальной логистики. С помощью хитроумных
программ типа «пауков» и «червей» поисковые системы с
разной периодичностью «ворошат» содержимое WWW-паутины,
«отмечая галочкой» старые запасы, занося в память свежую
«добычу» и удаляя уже не существующие или вышедшие из
употребления данные.
Все это добро с указанием ссылок на «полки» — хост-серверы, сайты, отдельные
страницы, строки и предложения бережно хранится в виде огромных индекс-файлов,
к которым вы и обращаетесь при каждом запросе.
Чтобы определить, хороша поисковая машина или нет, нужно ее хорошенько
«прощупать». Основными критериями при этом, на мой взгляд, можно считать,
- охват лексической базы (все ли слова запоминаются системой, или
только названия, заголовки, составные первых двух страниц текста, или вообще
лишь ключевые термины, запрограммированные создателями сайтов).
- как часто система перепроверяет содержимое сети.
- «понимает» ли поисковая машина морфологические особенности.
- практичность самого интерфейса, возможность использовать
дополнительные функции.
Вообще говоря, деление поисковых средств на каталоги и поисковые машины весьма
условное. Ведь фактически все веб-справочники снабжены поисковым модулем той
или иной конфигурации, в то же время многие поисковые системы оборудованы
справочными разделами.
Различия в мощности и чисто поисковых принципах разных систем порой приводят
к тому, что разные поисковые средства дают разные, порой противоречащие друг
другу ответы на один и тот же запрос. Этим воспользовались разработчики
поисковых орудий особого рода - так называемых метапоисковых машин.
К ним, например, относится «Meta Crawler» (http://www.metacrawler.com/),
главное достоинство которого заключаются в умении рассылать вводимые в него
запросы по другим системам, а затем суммировать результаты. Таким образом,
пользователь, вводя поисковое предписание в MetaCrawler, фактически одновременно
обращается к десятку различных поисковых систем. Этим гарантируется
«объективность» полученных результатов, однако, учитывая уже
упоминавшиеся различия в подходах к обработке терминов разными системами,
результат может оказаться не всегда релевантным запросу.
Используемая литература:
Для откликов и предложений обращаться сюда