Поиск знаний - Knowledge retrieval
Поиск знаний стремится вернуть информацию в структурированной форме, совместимой с когнитивными процессами человека, в отличие от простых списков элементов данных. Он опирается на ряд областей, включая эпистемологию (теорию познания), когнитивную психологию , когнитивную нейробиологию , логику и умозаключения , машинное обучение и открытие знаний , лингвистику и информационные технологии .
Обзор
В области поисковых систем установленные подходы включают:
- Системы поиска данных, такие как системы управления базами данных , хорошо подходят для хранения и поиска структурированных данных.
- Информационно-поисковые системы, такие как поисковые машины в Интернете , очень эффективны при поиске соответствующих документов или веб-страниц .
Оба подхода требуют от пользователя часто читать и анализировать длинные списки наборов данных или документов, чтобы извлечь смысл.
Цель систем поиска знаний - снизить нагрузку на эти процессы за счет улучшенного поиска и представления. Это улучшение необходимо для использования растущих объемов данных, доступных в Интернете.
Сравнение с данными и поиск информации
Поиск данных и поиск информации - это более ранние и более простые формы доступа к информации.
Получение данных | Поиск информации | Поиск знаний | |
---|---|---|---|
Матч | Логическое совпадение | частичное совпадение, лучшее совпадение | частичное совпадение, лучшее совпадение |
Вывод | дедуктивный вывод | индуктивный вывод | дедуктивный вывод , индуктивный вывод , ассоциативное рассуждение , рассуждение по аналогии |
Модель | детерминированная модель | статистическая и вероятностная модель | семантическая модель , модель вывода |
Запрос | искусственный язык | естественный язык | структура знаний , естественный язык |
Организация | таблица, индекс | таблица, индекс | блок знаний, структура знаний |
Представление | число, правило | естественный язык, язык разметки | граф понятий , логика предикатов , продукционное правило , фрейм, семантическая сеть , онтология |
Место хранения | база данных | коллекции документов | база знаний |
Полученные результаты | набор данных | разделы или документы | набор единиц знаний |
Поиск знаний фокусируется на уровне знаний. Нам необходимо изучить, как извлекать, представлять и использовать знания в данных и информации. Системы поиска знаний предоставляют пользователям знания в структурированном виде. По сравнению с поиском данных и поиском информации, они используют разные модели вывода , методы поиска, организацию результатов и т. Д. В таблице 1, расширяющей сравнение ван Рейсбергена разницы между поиском данных и поиском информации, суммируются основные характеристики поиска данных, поиска информации и т. Д. и поиск знаний. Ядром поиска данных и поиска информации являются подсистемы поиска. Получение данных дает результаты через логическое соответствие. Для поиска информации используется частичное совпадение и наилучшее совпадение. Поиск знаний также основан на частичном совпадении и наилучшем совпадении.
С точки зрения вывода, при извлечении данных используется дедуктивный вывод , а при извлечении информации - индуктивный вывод. Принимая во внимание ограничения, связанные с допущениями различных логик, традиционные логические системы (например, подмножество Хорна логики первого порядка ) не могут эффективно рассуждать. Ассоциативное рассуждение, рассуждение по аналогии и идея объединения рассуждений и поиска могут быть эффективными методами рассуждения в веб-масштабе.
С точки зрения поиска, системы поиска знаний сосредоточены на семантике и лучшей организации информации. Поиск данных и поиск информации организуют данные и документы путем индексации, в то время как поиск знаний организует информацию, указывая связи между элементами в этих документах.
Рамки для систем поиска знаний
С точки зрения информатики была предложена и подробно исследована логическая структура, сосредоточенная на нечеткости запросов знаний. Были исследованы языки разметки для обоснования знаний и соответствующие стратегии, которые могут служить в качестве возможных основ логических рассуждений для поиска знаний на основе текста.
С точки зрения когнитивной науки , особенно с точки зрения когнитивной психологии и когнитивной нейробиологии, нейробиологическая основа поиска знаний в человеческом мозге была исследована и может служить когнитивной моделью для поиска знаний.
Связанные дисциплины
Поиск знаний может быть основан на следующих связанных теориях и технологиях:
- Теория знаний : получение знаний, организация знаний, представление знаний, проверка знаний, управление знаниями.
- Когнитивная наука : когнитивная психология, когнитивная нейробиология, когнитивная информатика, формирование концепций и обучение, принятие решений, взаимодействие человека с компьютером .
- Машинное обучение и открытие знаний : предварительная обработка, классификация, кластеризация, прогнозирование, постобработка, теория статистического обучения .
- Логика и вывод : логика высказываний, логика предикатов, логика атрибутов, универсальная логика , индуктивный вывод , дедуктивный вывод, ассоциативное рассуждение, рассуждение по аналогии, приблизительное рассуждение.
- Информационные технологии : теория информации , информатика , информационно - поисковая, системы управления базами данных, системы , основанные на знаниях , основанные на правилах системы, экспертные системы , системы поддержки принятия решений , интеллектуальный агент технологии.
- Лингвистика : вычислительная лингвистика , понимание естественного языка , обработка естественного языка .
Темы, перечисленные под каждой записью, служат в качестве примеров и не составляют полный список. И многие смежные дисциплины должны быть добавлены по мере развития области.