ОСНОВНЫЕ НЕДОСТАТКИ СУЩЕСТВУЮЩИХ ПОИСКОВЫХ СИСТЕМ и МЕТОДЫ ИХ УСТРАНЕНИЯ

M7
На сайте с 03.04.2002
Offline
2
m7
5963

ОСНОВНЫЕ НЕДОСТАТКИ СУЩЕСТВУЮЩИХ ПОИСКОВЫХ СИСТЕМ

1. При подсчете релевантности (коэффициента соответствия запросу) практически не учитывается:

o ДОСТОВЕРНОСТЬ НАЙДЕННЫХ ДОКУМЕНТОВ

o ХАРАКТЕРИСТИКИ ПОЛЬЗОВАТЕЛЯ (системы не контролируют уровень предоставляемой информации для, например, домохозяйки и профессора)

2. Найденные документы сгруппированы по принадлежности к сайтам (месту размещения), а не по ТЕМАТИЧЕСКОМУ НАПРАВЛЕНИЮ содержания документов.

3. Должным образом не осуществляется индексация данных в ТАБЛИЧНОМ ВИДЕ.

4. Большинство систем не предоставляет возможности УТОЧНЕНИЯ ПОИСКОВЫХ ОТЧЕТОВ по тематическому направлению содержания документов.

5. В связи с разным форматированием одного и того же информационного содержания документов на разных сайтах системы не могут РАСПОЗНАТЬ одинаковых по содержанию документов.

МЕТОДЫ УСТРАНЕНИЯ ОСНОВНЫХ НЕДОСТАТКОВ

· УРОВЕНЬ НАДЕЖНОСТИ документов и ХАРАКТЕРИСТИКИ ПОЛЬЗОВАТЕЛЕЙ значительно влияют на место документов в поисковом отчете.

· При поступлении документа в систему АВТОМАТИЧЕСКИ определяется его тематическая направленность.

· Поиск осуществляется как в текстовых документах, так и в документах в ТАБЛИЧНОМ ВИДЕ по запросам на естественном языке.

· Поисковый отчет СГРУППИРОВАН по тематикам документов.

· Существует возможность УТОЧНЕНИЯ поискового отчета по темам (подтемам) тематической структуры системы ( Пример интерфейса уточнения поискового отчета по темам: http://www.Lupa.ru/ ).

Документы в системе имеют 3 уровня достоверности (надежности):

1. Документы, прошедшие МОДЕРАТИВНЫЙ КОНТРОЛЬ ( например, энциклопедические статьи, научная и художественная литература, информация о товарах и услугах ).

2. Документы, имеющие СПЕЦИАЛЬНЫЕ СКРЫТЫЕ ТЭГИ форматирования согласно ОТКРЫТОМУ СТАНДАРТУ.

3. Все остальные документы.

Специальные скрытые тэги форматирования помогут:

1. ИНДЕКСИРОВАТЬ данные в табличном виде.

2. АВТОМАТИЧЕСКИ ОПРЕДЕЛЯТЬ тематическую направленность содержания документов.

3. Решить ПРОБЛЕМУ РАСПОЗНАВАНИЯ одинаковых по содержанию документов.

С уважением, Михаил Сидоренко.

E-Mail: m7@m7.ru

F
На сайте с 15.11.2000
Offline
116
#1

Эта тема также обсуждалась с Ильей Сегаловичем, чтобы не повторяться, рекомендую вначале прочесть: http://forum.yandex.ru/index.xhtml?pr=&id_note_forum=1010067&by_count_days=10&regim=1&cur_page=1&by_count_page=75#ID_1010067

С уважением,

Александр Садовский.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий