ТГТУ
 
 
 
 
 
 

Сегодня, 06 Декабря 2023
Пн
Вт
Ср
Чт
Пт
Сб
Вс
    
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
Понятия, принципы, ...
Поисковая система - это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации. Информационно-поисковые системы классифицируют прежде всего по особенностям функционирования на
  • каталоги(directories),
  • поисковые машины(search engines);
также по охвату информационных ресурсов на
  • глобальные,
  • локальные;
по типу и тематике информационных ресурсов на
  • универсальные;
  • специализированные.
Остановимся подробней на классификации первого типа.

Каталоги — это, по сути, большие электронные энциклопедии, тематически структурированные и тем самым обеспечивающие возможность сужать круг поиска. При вызове в своем браузере каталога на экран выводится общий список тем, озаглавленных, например, следующим образом: «Наука и образование», «Люди и общество», «Компьютеры и Интернет», «Бизнес и коммерция», «Средства массовой информации»...

Здесь, вместо того чтобы сразу загрузить в строку поиска слово «мама», мы движемся вглубь, например, по следующей схеме: люди и общество — здравоохранение — советы молодым мамам. И только там либо «перелистываем» собранные по данной теме сайты, либо вводим искомое определение в строку поиска в данном разделе. Существуют и тематические каталоги, коллекционирующие сайты лишь определенной направленности.

Поисковые же машины определяют всю паутину Сети как огромную базу данных. Здесь при вводе какого-либо термина программа выдает перечень документов, содержащих искомое определение. И чем опытнее и умнее сёрфер (специалист по поиску в Сети), чем конкретнее вводимое им определение (лучше, если это будет словосочетание), тем меньший объем результатов или перечень сайтов, содержащих введенные слова, выдаст машина. Круг сузится, но уже посредством включения в работу более сложных мыслительных процессов, нежели выбор тем и разделов.

На первый взгляд работать с каталогами значительно проще. Но здесь есть одно существенное «но». Большинство каталогов создаются путем добавления авторами своих сайтов к уже существующему списку вручную. А как быть, если крайне важная для вас информация лежит на сайте, автор которого пока не успел или просто не захотел вносить его в базу открытого вами каталога?..
Потому-то поисковые машины более популярны среди пользователей, хотя и требуют некоторых навыков. Ведь, как мы уже поняли, ввод единичного термина в поисковую строку успеха не приносит.

Поисковые машины — огромные склады слов, постоянно пополняемые путем периодического автоматического сканирования виртуального информационного пространства и индексирования его содержания. Тут тоже существуют свои, изобретенные программистами, законы виртуальной логистики. С помощью хитроумных программ типа «пауков» и «червей» поисковые системы с разной периодичностью «ворошат» содержимое WWW-паутины, «отмечая галочкой» старые запасы, занося в память свежую «добычу» и удаляя уже не существующие или вышедшие из употребления данные.

Все это добро с указанием ссылок на «полки» — хост-серверы, сайты, отдельные страницы, строки и предложения бережно хранится в виде огромных индекс-файлов, к которым вы и обращаетесь при каждом запросе.

Чтобы определить, хороша поисковая машина или нет, нужно ее хорошенько «прощупать». Основными критериями при этом, на мой взгляд, можно считать,
  • охват лексической базы (все ли слова запоминаются системой, или только названия, заголовки, составные первых двух страниц текста, или вообще лишь ключевые термины, запрограммированные создателями сайтов).
  • как часто система перепроверяет содержимое сети.
  • «понимает» ли поисковая машина морфологические особенности.
  • практичность самого интерфейса, возможность использовать дополнительные функции.

Вообще говоря, деление поисковых средств на каталоги и поисковые машины весьма условное. Ведь фактически все веб-справочники снабжены поисковым модулем той или иной конфигурации, в то же время многие поисковые системы оборудованы справочными разделами.

Различия в мощности и чисто поисковых принципах разных систем порой приводят к тому, что разные поисковые средства дают разные, порой противоречащие друг другу ответы на один и тот же запрос. Этим воспользовались разработчики поисковых орудий особого рода - так называемых метапоисковых машин. К ним, например, относится «Meta Crawler» (http://www.metacrawler.com/), главное достоинство которого заключаются в умении рассылать вводимые в него запросы по другим системам, а затем суммировать результаты. Таким образом, пользователь, вводя поисковое предписание в MetaCrawler, фактически одновременно обращается к десятку различных поисковых систем. Этим гарантируется «объективность» полученных результатов, однако, учитывая уже упоминавшиеся различия в подходах к обработке терминов разными системами, результат может оказаться не всегда релевантным запросу.



Используемая литература:
  • Краснянский М.Н., Кузьмина Н.В., Лагутин А.В., Орлова Л.П., Пунина Т.Г. «Основы работы в Интернет» (http://www.tambov.fio.ru)
  • Андрей Кобяков. «Приступим к работе?» (http://www.mediasprut.ru)
Для откликов и предложений обращаться сюда mailto..
Счастье не в счастье, а лишь в его достижении
Федор Михайлович Достоевский
 
Cервер дистанционного образования ТГТУ Поисковый сервер ТГТУ
Copyright © 2005-2013, Управление информатизации ТГТУ, ТамбовЦНИТ, отдел ЦТО