ТГТУ
Тамбовский виртуальный университет
 
 
 
 
 
 

Сегодня, 02 Декабря 2020
Пн
Вт
Ср
Чт
Пт
Сб
Вс
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
   
Понятия, принципы, ...
Поисковая система - это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации. Информационно-поисковые системы классифицируют прежде всего по особенностям функционирования на
  • каталоги(directories),
  • поисковые машины(search engines);
также по охвату информационных ресурсов на
  • глобальные,
  • локальные;
по типу и тематике информационных ресурсов на
  • универсальные;
  • специализированные.
Остановимся подробней на классификации первого типа.

Каталоги — это, по сути, большие электронные энциклопедии, тематически структурированные и тем самым обеспечивающие возможность сужать круг поиска. При вызове в своем браузере каталога на экран выводится общий список тем, озаглавленных, например, следующим образом: «Наука и образование», «Люди и общество», «Компьютеры и Интернет», «Бизнес и коммерция», «Средства массовой информации»...

Здесь, вместо того чтобы сразу загрузить в строку поиска слово «мама», мы движемся вглубь, например, по следующей схеме: люди и общество — здравоохранение — советы молодым мамам. И только там либо «перелистываем» собранные по данной теме сайты, либо вводим искомое определение в строку поиска в данном разделе. Существуют и тематические каталоги, коллекционирующие сайты лишь определенной направленности.

Поисковые же машины определяют всю паутину Сети как огромную базу данных. Здесь при вводе какого-либо термина программа выдает перечень документов, содержащих искомое определение. И чем опытнее и умнее сёрфер (специалист по поиску в Сети), чем конкретнее вводимое им определение (лучше, если это будет словосочетание), тем меньший объем результатов или перечень сайтов, содержащих введенные слова, выдаст машина. Круг сузится, но уже посредством включения в работу более сложных мыслительных процессов, нежели выбор тем и разделов.

На первый взгляд работать с каталогами значительно проще. Но здесь есть одно существенное «но». Большинство каталогов создаются путем добавления авторами своих сайтов к уже существующему списку вручную. А как быть, если крайне важная для вас информация лежит на сайте, автор которого пока не успел или просто не захотел вносить его в базу открытого вами каталога?..
Потому-то поисковые машины более популярны среди пользователей, хотя и требуют некоторых навыков. Ведь, как мы уже поняли, ввод единичного термина в поисковую строку успеха не приносит.

Поисковые машины — огромные склады слов, постоянно пополняемые путем периодического автоматического сканирования виртуального информационного пространства и индексирования его содержания. Тут тоже существуют свои, изобретенные программистами, законы виртуальной логистики. С помощью хитроумных программ типа «пауков» и «червей» поисковые системы с разной периодичностью «ворошат» содержимое WWW-паутины, «отмечая галочкой» старые запасы, занося в память свежую «добычу» и удаляя уже не существующие или вышедшие из употребления данные.

Все это добро с указанием ссылок на «полки» — хост-серверы, сайты, отдельные страницы, строки и предложения бережно хранится в виде огромных индекс-файлов, к которым вы и обращаетесь при каждом запросе.

Чтобы определить, хороша поисковая машина или нет, нужно ее хорошенько «прощупать». Основными критериями при этом, на мой взгляд, можно считать,
  • охват лексической базы (все ли слова запоминаются системой, или только названия, заголовки, составные первых двух страниц текста, или вообще лишь ключевые термины, запрограммированные создателями сайтов).
  • как часто система перепроверяет содержимое сети.
  • «понимает» ли поисковая машина морфологические особенности.
  • практичность самого интерфейса, возможность использовать дополнительные функции.

Вообще говоря, деление поисковых средств на каталоги и поисковые машины весьма условное. Ведь фактически все веб-справочники снабжены поисковым модулем той или иной конфигурации, в то же время многие поисковые системы оборудованы справочными разделами.

Различия в мощности и чисто поисковых принципах разных систем порой приводят к тому, что разные поисковые средства дают разные, порой противоречащие друг другу ответы на один и тот же запрос. Этим воспользовались разработчики поисковых орудий особого рода - так называемых метапоисковых машин. К ним, например, относится «Meta Crawler» (http://www.metacrawler.com/), главное достоинство которого заключаются в умении рассылать вводимые в него запросы по другим системам, а затем суммировать результаты. Таким образом, пользователь, вводя поисковое предписание в MetaCrawler, фактически одновременно обращается к десятку различных поисковых систем. Этим гарантируется «объективность» полученных результатов, однако, учитывая уже упоминавшиеся различия в подходах к обработке терминов разными системами, результат может оказаться не всегда релевантным запросу.



Используемая литература:
  • Краснянский М.Н., Кузьмина Н.В., Лагутин А.В., Орлова Л.П., Пунина Т.Г. «Основы работы в Интернет» (http://www.tambov.fio.ru)
  • Андрей Кобяков. «Приступим к работе?» (http://www.mediasprut.ru)
Для откликов и предложений обращаться сюда mailto..
Для научного развития необходимо признание полной свободы личности, личного духа, ибо только при этом условии может одно научное мировоззрение сменяться другим, создаваемым свободной, независимой работой личности.
Владимир Иванович Вернадский
 
Cервер дистанционного образования ТГТУ Поисковый сервер ТГТУ
Copyright © 2005-2013, Управление информатизации ТГТУ, ТамбовЦНИТ, отдел ЦТО