DataparkSearch является поисковой машиной, использующей SQL, и предназначенной
для организации поиска на одном или многих веб-серверах. DataparkSearch состоит
из двух частей. Первая часть - индексирующий механизм (indexer). Indexer
пробегает по ссылкам и сохраняет в базе данных все найденные слова и новые
ссылки. Вторая часть состоит из CGI-программы, предоставляющей возможность
поиска в данных, собранных indexerом.
Основные возможности:
- Поддержка схем URL: http, https, ftp, nntp и news.
- Виртуальная схема URL htdb для индексирования SQL баз данных.
- Встроенные парсеры для типов документов: text/html, text/xml, text/plain, audio/mpeg (MP3) и image/gif.
- Возможность выполнения внешних парсеров для остальных типов документов.
- Возможность индексирования многоязычных сайтов используя механизм согласования содержимого.
- Поиск всех форм слов на основе аффиксов и словарей ispell.
- Поддержка стоп-листов и списков синонимов.
- Поддержка логических запросов.
- Возможность сортировки результатов по релевантности, популярности, дате последнего измненения и по важности (произведению релевантности на популярность).
- Поддержка большого числа наборов символов.
- Поиск без учёта акцентов символов.
- Разбиение на слова фраз японского, китайского, корейского и тайского языков.
- mod_dpsearch - поисковый модуль для веб-сервера Apache.
DataparkSearch отделился от mnoGoSearch CVS версии 3.2.16 27 ноября 2003 года
как DataparkSearch версии 4.16. Первая версия mnoGoSearch была выпущена в
ноябре 1998. До октября 2000, когда проект был передан Lavtech.Com Corp. и
переименован в mnoGoSearch, поисковый движок носил имя UDMSearch.
Для более подробного знакомства с DataparkSearch можно обратиться на сайт
«Поисковый движок DataparkSearch» (
http://www.dataparksearch.org/).
Для откликов и предложений обращаться сюда