Онтология (информатика) - Ontology (information science)

В информатике и информатики , онтология включает в себя представление, формальное именование и определение категорий, свойств и отношений между понятиями, данными и организаций , которые обосновывают один, многие или все домены дискурса . Проще говоря, онтология - это способ показать свойства предметной области и то, как они связаны, путем определения набора концепций и категорий, которые представляют предмет.

Каждая академическая дисциплина или область создает онтологии, чтобы ограничить сложность и организовать данные в информацию и знания. Новые онтологии улучшают решение проблем в этой области. Перевод научно - исследовательских работ в каждой области является проблемой легче , когда специалисты из разных стран поддерживать контролируемый словарь по жаргоне между каждым из их языков.

Этимология

Соединение слово онтологии комбайнов на - , от греческого ὄν , на ( ген. Ὄντος, Ontos ), т.е. «бытие, то , что есть», которая является настоящим причастием из глагола εἰμί , Эняйте , то есть «быть, я ", и -λογία , -logia , то есть" логический дискурс ", см. классические соединения для этого типа словообразования.

Хотя этимология гречески, старейшее сохранившееся запись самого слова, в Нью - латинской форме ontologia , появился в 1606 году в работе Ogdoas Сколастик по Джакобу Лорхарда ( Lorhardus ) и в 1613 году в лексиконе philosophicum по Рудольфу Gockel ( Goclenius ).

Первое появление онтологии на английском языке, записанное OED ( Оксфордский словарь английского языка , онлайн-издание, 2008 г.), произошло в книге Гидеона Харви Archeologia Philosophica Nova или « Новые принципы философии » .

Обзор

Что общего в онтологиях информатики и философии , так это попытка представить сущности, идеи и события со всеми их взаимозависимыми свойствами и отношениями в соответствии с системой категорий. В обеих областях ведется значительная работа по проблемам инженерии онтологий (например, Куайн и Крипке в философии, Сова и Гуарино в информатике), а также ведутся дискуссии о том, в какой степени возможна нормативная онтология (например, фундаментализм и когерентизм в философии, BFO и Cyc в искусственном интеллекте). Прикладная онтология считается духовным преемником предшествующей работы в философии, однако многие текущие усилия больше касаются создания контролируемых словарей узких областей, чем первых принципов , существования фиксированных сущностей или того, могут ли устойчивые объекты (например, пердурантизм и эндурантизм ) быть онтологическими. первичнее процессов .

В каждой области используются онтологические допущения для создания явных теорий, исследований и приложений. Например, определение и онтология экономики являются первоочередной задачей в марксистской экономике , но также и в других областях экономики . Пример экономики, опирающейся на информатику, возникает в случаях, когда имитационное моделирование или модель предназначены для принятия экономических решений, таких как определение того, какие капитальные активы подвергаются риску и в какой степени (см. Управление рисками ).

Искусственный интеллект сохранил наибольшее внимание в отношении прикладной онтологии в таких подполях, как обработка естественного языка в машинном переводе и представление знаний , но редакторы онтологий часто используются в ряде областей, таких как образование, без намерения внести свой вклад в ИИ.

История

Онтологии возникают из области философии, известной как метафизика , которая занимается вопросами типа «что существует?» и «какова природа реальности?». Одна из пяти традиционных ветвей философии, метафизика, занимается исследованием существования через свойства, сущности и отношения, такие как отношения между частностями и универсалиями , внутренними и внешними свойствами или сущностью и существованием . Метафизика была постоянной темой обсуждения с момента письменной истории.

С середины 1970-х годов исследователи в области искусственного интеллекта (ИИ) признали, что инженерия знаний является ключом к созданию больших и мощных систем ИИ. Исследователи искусственного интеллекта утверждали, что они могут создавать новые онтологии в качестве вычислительных моделей, которые позволяют использовать определенные виды автоматизированных рассуждений , что было лишь незначительным успехом . В 1980-х годах сообщество ИИ начало использовать термин онтология для обозначения как теории моделируемого мира, так и компонента систем, основанных на знаниях . В частности, Дэвид Пауэрс ввел слово онтология в ИИ для обозначения реального мира или роботизированного заземления, опубликовав в 1990 году обзоры литературы, в которых особое внимание уделялось обоснованной онтологии в связи с призывом к докладам для Летнего симпозиума AAAI по машинному обучению естественного языка и онтологии, с расширенная версия опубликована в бюллетене SIGART и включена в качестве предисловия к протоколу. Некоторые исследователи, черпая вдохновение в философских онтологиях, рассматривали вычислительную онтологию как разновидность прикладной философии.

В 1993 году широко цитируемая веб-страница и статья Тома Грубера «К принципам проектирования онтологий, используемых для обмена знаниями» использовали онтологию как технический термин в информатике, тесно связанный с более ранними представлениями о семантических сетях и таксономиях . Грубер ввел этот термин как спецификацию концептуализации :

Онтология - это описание (как формальная спецификация программы) концепций и отношений, которые формально могут существовать для агента или сообщества агентов. Это определение согласуется с использованием онтологии как набора определений понятий, но более общего характера. И это другое значение слова, чем его используют в философии.

Пытаясь отделить онтологии от таксономий и аналогичных усилий по моделированию знаний , основанных на классах и наследовании , Грубер заявил (1993):

Онтологии часто приравниваются к таксономическим иерархиям классов, определениям классов и отношениям подчинения , но онтологии не обязательно ограничиваются этими формами. Онтологии также не ограничиваются консервативными определениями  - то есть определениями в традиционном логическом смысле, которые только вводят терминологию и не добавляют никаких знаний о мире. Чтобы определить концептуализацию, необходимо сформулировать аксиомы, которые ограничивают возможные интерпретации определенных терминов.

Как уточнение определения Грубера, Фейлмайр и Вёсс (2016) заявили: «Онтология - это формальная, явная спецификация общей концептуализации, которая характеризуется высокой семантической выразительностью, необходимой для повышенной сложности».

Компоненты

Современные онтологии имеют много структурных сходств, независимо от языка, на котором они выражены. Большинство онтологий описывают индивидов (экземпляры), классы (концепции), атрибуты и отношения. В этом разделе по очереди обсуждается каждый из этих компонентов.

Общие компоненты онтологий включают:

Физическим лицам
Экземпляры или объекты (базовые или «наземные» объекты)
Классы
Наборы, коллекции, концепции, классы в программировании , типы объектов или виды вещей
Атрибуты
Аспекты, свойства, особенности, характеристики или параметры, которые могут иметь объекты (и классы).
связи
Способы, которыми классы и отдельные лица могут быть связаны друг с другом
Функциональные термины
Сложные структуры, сформированные из определенных отношений, которые можно использовать вместо отдельного термина в утверждении.
Ограничения
Формально сформулированные описания того, что должно быть правдой, чтобы какое-то утверждение было принято в качестве входных данных.
Правила
Утверждения в форме предложения если-то (антецедент-консеквент), которые описывают логические выводы, которые могут быть сделаны из утверждения в определенной форме
Аксиомы
Утверждения (включая правила) в логической форме, которые вместе составляют общую теорию, которую онтология описывает в своей области применения. Это определение отличается от определения «аксиом» в порождающей грамматике и формальной логике . В этих дисциплинах аксиомы включают только утверждения, утвержденные как априорное знание. Используемые здесь «аксиомы» также включают теорию, выведенную из аксиоматических утверждений.
События
Изменение атрибутов или отношений

Онтологии обычно кодируются с использованием языков онтологий .

Типы

Онтология предметной области

Онтология предметной области (или онтология предметной области) представляет концепции, которые принадлежат области мира, такой как биология или политика. Каждая онтология предметной области обычно моделирует определения терминов, специфичных для предметной области. Например, слово « карта» имеет много разных значений. Онтология области покера смоделирует значение слова " игральная карта ", а онтология области компьютерного оборудования смоделирует значения " перфокарта " и " видеокарта ".

Поскольку онтологии предметной области написаны разными людьми, они представляют концепции очень специфическими и уникальными способами и часто несовместимы в рамках одного проекта. По мере расширения систем, основанных на онтологиях предметной области, им часто требуется объединить онтологии предметной области путем ручной настройки каждого объекта или использования комбинации слияния программного обеспечения и ручной настройки. Это представляет собой проблему для разработчика онтологий. Различные онтологии в одной и той же области возникают из-за разных языков, разного предполагаемого использования онтологий и различного восприятия области (на основе культурного фона, образования, идеологии и т. Д.).

В настоящее время объединение онтологий, которые не разработаны на основе общей онтологии верхнего уровня, является в значительной степени ручным процессом и, следовательно, трудоемким и дорогостоящим. Онтологии предметной области, которые используют одну и ту же верхнюю онтологию для предоставления набора базовых элементов, с помощью которых задаются значения сущностей онтологии предметной области, могут быть объединены с меньшими усилиями. Существуют исследования по обобщенным методам слияния онтологий, но эта область исследований все еще продолжается, и недавно мы увидели, как проблему удалось обойти за счет наличия нескольких онтологий предметной области, использующих ту же верхнюю онтологию, как OBO Foundry .

Верхняя онтология

Верхняя онтология (или основа онтология) представляет собой модель из общепризнанных отношений и объектов, которые обычно применяется в широком диапазоне онтологий предметных областей. Обычно он использует основной глоссарий, который охватывает термины и связанные описания объектов, поскольку они используются в различных соответствующих онтологиях предметной области.

Доступные для использования стандартизированные верхние онтологии включают BFO , метод BORO , Dublin Core , GFO , Cyc , SUMO , UMBEL , Unified Foundational Ontology (UFO) и DOLCE . WordNet считался некоторыми онтологией верхнего уровня и использовался в качестве лингвистического инструмента для изучения онтологий предметной области.

Гибридная онтология

Gellish онтология является примером сочетания верхнего и онтологии предметной области.

Визуализация

Обзор методов визуализации онтологий представлен Katifori et al. Обновленный обзор методов и инструментов визуализации онтологий был опубликован Dudás et al. Наиболее распространенные методы визуализации онтологий, а именно визуализация дерева с отступом и графа, оцениваются Fu et al. Визуальный язык для онтологий, представленных в OWL , определяется Визуальной нотацией для онтологий OWL (VOWL) .

Инженерное дело

Инжиниринг онтологий (также называемый построением онтологий) - это набор задач, связанных с разработкой онтологий для определенной области. Это подполе инженерии знаний, которая изучает процесс разработки онтологий, жизненный цикл онтологии, методы и методологии для построения онтологий, а также инструменты и языки, которые их поддерживают.

Инженерия онтологий стремится сделать явными знания, содержащиеся в программных приложениях, и организационные процедуры для конкретной области. Разработка онтологий предлагает направление для преодоления семантических препятствий, например, связанных с определениями бизнес-терминов и классов программного обеспечения. Известные проблемы, связанные с инженерией онтологий, включают:

  1. Обеспечение актуальности онтологии со знанием предметной области и использованием терминов
  2. Обеспечение достаточной специфичности и охвата концепции для интересующей области, что сводит к минимуму проблему полноты содержания.
  3. Обеспечение того, чтобы онтология могла поддерживать свои варианты использования.

Редакторы

Редакторы онтологий - это приложения, предназначенные для помощи в создании онтологий или манипулировании ими. Редакторы онтологий обычно используют один или несколько языков онтологий .

Аспекты редакторов онтологий включают: возможности визуальной навигации в модели знаний , механизмы вывода и извлечение информации ; поддержка модулей; импорт и экспорт иностранных языков представления знаний для сопоставления онтологий ; и поддержка таких мета-онтологий, как OWL-S , Dublin Core и т. д.

Обучение

Изучение онтологий - это автоматическое или полуавтоматическое создание онтологий, включая извлечение терминов предметной области из текста на естественном языке. Поскольку создание онтологий вручную чрезвычайно трудоемко и требует много времени, есть большая мотивация для автоматизации процесса. Извлечение информации и интеллектуальный анализ текста были исследованы для автоматической связи онтологий с документами, например, в контексте задач BioCreative.

Языки

Язык онтологий является формальным языком , используемым для кодирования онтологий. Существует ряд таких языков для онтологий, как проприетарных, так и основанных на стандартах:

  • Common Algebraic Specification Language - это общий язык спецификаций на основе логики, разработанный в рамках рабочей группы 1.3 IFIP «Основы системных спецификаций», и фактически является стандартным языком для спецификаций программного обеспечения. В настоящее время он применяется к спецификациям онтологий, чтобы обеспечить механизмы модульности и структурирования.
  • Общая логика - это стандарт ISO 24707, спецификация семейства языков онтологий, которые могут быть точно переведены друг в друга.
  • У проекта Cyc есть собственный язык онтологий CycL , основанный на исчислении предикатов первого порядка с некоторыми расширениями более высокого порядка.
  • DOGMA (Разработка методов и приложений, основанных на онтологии) использует подход моделирования, ориентированного на факты, для обеспечения более высокого уровня семантической стабильности.
  • Gellish язык включает в себя правила для своего расширения и , таким образом , интегрирует онтологию с языком онтологий.
  • IDEF5 - это метод программной инженерии для разработки и поддержки удобных, точных онтологий предметной области.
  • KIF - это синтаксис логики первого порядка , основанный на S-выражениях . SUO-KIF - это производная версия, поддерживающая предложенную верхнюю объединенную онтологию .
  • MOF и UML являются стандартами OMG
  • Olog - это теоретико-категориальный подход к онтологиям, делающий упор на переводы между онтологиями с использованием функторов .
  • OBO , язык, используемый для биологических и биомедицинских онтологий.
  • OntoUML - это онтологически обоснованный профиль UML для концептуального моделирования онтологий предметной области.
  • OWL - это язык для создания онтологических утверждений, разработанный как продолжение RDF и RDFS , а также более ранних языковых проектов онтологий, включая OIL , DAML и DAML + OIL . OWL предназначен для использования во всемирной паутине , и все его элементы (классы, свойства и отдельные лица) определены как ресурсы RDF и идентифицируются с помощью URI .
  • Формат обмена правилами (RIF) и F-Logic объединяют онтологии и правила.
  • Семантический язык разработки приложений (SADL) отражает подмножество выразительности OWL с использованием англоязычного языка, вводимого через подключаемый модуль Eclipse .
  • SBVR (Семантика бизнес-словарей и правил) - это стандарт OMG, принятый в промышленности для построения онтологий.
  • Проект TOVE, проект TOronto Virtual Enterprise

Опубликованные примеры

  • Арабская онтология , лингвистическая онтология для арабского языка, которая может использоваться как арабский Wordnet, но с онтологически чистым содержанием.
  • AURUM - Онтология информационной безопасности, онтология для обмена знаниями в области информационной безопасности, позволяющая пользователям совместно понимать и расширять совокупность знаний предметной области. Он может служить основой для автоматизированного управления рисками информационной безопасности и соблюдения нормативных требований.
  • BabelNet , очень большая многоязычная семантическая сеть и онтология, лексикализованная на многих языках.
  • Базовая формальная онтология, формальная верхняя онтология, предназначенная для поддержки научных исследований.
  • BioPAX, онтология для обмена данными о биологических путях (клеточных процессах) и их взаимодействия
  • BMO, онтология модели электронного бизнеса, основанная на обзоре онтологий предприятия и литературы по бизнес-моделям
  • SSBMO, онтология сильно устойчивой бизнес-модели, основанная на обзоре системной литературы по естественным и социальным наукам (включая бизнес). Включает критику и существенные расширения онтологии бизнес-модели (BMO).
  • CCO и GexKB, онтологии приложений (APO), которые объединяют различные типы знаний с онтологией клеточного цикла (CCO) и базой знаний по экспрессии генов (GexKB)
  • CContology (онтология жалоб клиентов), онтология электронного бизнеса для поддержки управления жалобами клиентов в режиме онлайн
  • Концептуальная эталонная модель CIDOC , онтология культурного наследия
  • COSMO, базовая онтология (текущая версия в OWL), которая разработана, чтобы содержать представления всех примитивных концепций, необходимых для логического определения значений любого объекта предметной области. Он предназначен для использования в качестве базовой онтологии, которую можно использовать для перевода между представлениями в других онтологиях или базах данных. Он начался как слияние основных элементов онтологий OpenCyc и SUMO и был дополнен другими элементами онтологии (типами, отношениями), чтобы включить представления всех слов в словаре Longman, определяющем словарь .
  • Онтология компьютерных наук , автоматически генерируемая онтология исследовательских тем в области компьютерных наук.
  • Cyc , большая основа онтологии для формального представления вселенной дискурса
  • Онтология болезней , предназначенная для облегчения сопоставления болезней и связанных состояний с конкретными медицинскими кодами.
  • DOLCE , описательная онтология для лингвистической и когнитивной инженерии
  • Драмматика, онтология драмы
  • Dublin Core , простая онтология для документов и публикации
  • Бизнес-онтология финансовой индустрии (FIBO), концептуальная бизнес-онтология для финансовой индустрии.
  • Фундаментальные, базовые и лингвистические онтологии
  • Базовая модель анатомии , онтология анатомии человека
  • Друг друга , онтология для описания людей, их действий и их отношений с другими людьми и объектами.
  • Генная онтология для геномики
  • Словарь английского языка Gellish , онтология, которая включает словарь и таксономию, которая включает верхнюю онтологию и нижнюю онтологию, которая фокусируется на промышленных и бизнес-приложениях в области проектирования, технологии и снабжения.
  • Геополитическая онтология , онтология, описывающая геополитическую информацию, созданная Продовольственной и сельскохозяйственной организацией Объединенных Наций (ФАО). Геополитическая онтология включает имена на нескольких языках (английском, французском, испанском, арабском, китайском, русском и итальянском); карты стандартных систем кодирования (UN, ISO, FAOSTAT, AGROVOC и др.); обеспечивает отношения между территориями (сухопутные границы, членство в группах и т. д.); и отслеживает исторические изменения. Кроме того, ФАО предоставляет веб-сервисы геополитической онтологии и производителя модулей для загрузки модулей геополитической онтологии в различные форматы (RDF, XML и EXCEL). Дополнительную информацию см. В профилях ФАО по странам .
  • GAO (General Automotive Ontology) - онтология для автомобильной промышленности, которая включает в себя расширения для автомобилей.
  • ЗОЛОТО, Общая онтология лингвистического описания
  • GUM (Generalized Upper Model), лингвистически мотивированная онтология для посредничества между клиентскими системами и технологией естественного языка.
  • IDEAS Group , формальная онтология архитектуры предприятия, разрабатываемая министерствами обороны Австралии, Канады, Великобритании и США.
  • Linkbase, формальное представление биомедицинской области, основанное на базовой формальной онтологии.
  • LPL, язык шаблонов ориентиров
  • NCBO Bioportal, биологические и биомедицинские онтологии и связанные с ними инструменты для поиска, просмотра и визуализации
  • Онтологии NIFSTD из Neuroscience Information Framework : модульный набор онтологий для области нейробиологии.
  • OBO-Edit, браузер онтологий для большинства открытых биологических и биомедицинских онтологий
  • OBO Foundry , набор совместимых справочных онтологий в биологии и биомедицине
  • OMNIBUS Ontology, онтология обучения, инструктирования и учебного дизайна
  • Онтология для биомедицинских исследований , интегрированная онтология с открытым доступом для биологических и клинических исследований.
  • ONSTR, Онтология для последующего скрининга новорожденных и трансляционных исследований, Сотрудничество по интеграции данных последующего скрининга новорожденных, Университет Эмори, Атланта.
  • Онтология растений для структур растений, стадий роста / развития и т. Д.
  • POPE, Онтология Пердью для фармацевтической инженерии
  • PRO, белковая онтология информационного ресурса о белках, Джорджтаунский университет
  • ProbOnto , база знаний и онтология вероятностных распределений .
  • Таксономия абстракции программ
  • Белковая онтология для протеомики
  • RXNO Ontology , для именных реакций в химии
  • SCDO, онтология серповидно-клеточных заболеваний, облегчает обмен данными и сотрудничество в рамках сообщества SDC, среди других приложений (см. Список на веб-сайте SCDO ).
  • Онтология последовательностей для представления типов геномных признаков, обнаруженных в биологических последовательностях.
  • SNOMED CT (Систематизированная номенклатура медицины - клинические термины)
  • Предлагаемая верхняя объединенная онтология , формальная верхняя онтология
  • Онтология системной биологии (SBO), для вычислительных моделей в биологии
  • SWEET, Семантическая сеть для терминологии Земли и окружающей среды
  • Онтология ThoughtTreasure
  • TIME-ITEM , Темы для индексации медицинского образования
  • Уберон , представляющий анатомические структуры животных
  • UMBEL , легкая справочная структура из 20 000 классов предметных понятий и их взаимосвязей, полученных из OpenCyc.
  • WordNet , лексическая справочная система
  • YAMATO, еще одна более продвинутая онтология верхнего уровня

Проект сообщества W3C Linking Open Data координирует попытки объединить различные онтологии в всемирную семантическую сеть .

Библиотеки

Развитие онтологий привело к появлению сервисов, предоставляющих списки или каталоги онтологий, называемых библиотеками онтологий.

Ниже приведены библиотеки онтологий, выбранных человеком.

  • COLORE - это открытый репозиторий онтологий первого порядка в Common Logic с формальными связями между онтологиями в репозитории.
  • Библиотека онтологий DAML поддерживает наследие онтологий DAML.
  • Портал Ontology Design Patterns - это вики-репозиторий многократно используемых компонентов и практик для проектирования онтологий, а также список типовых онтологий .
  • Библиотека онтологий Protégé содержит набор онтологий OWL, Frame-based и других форматов.
  • SchemaWeb - это каталог схем RDF, выраженных в RDFS, OWL и DAML + OIL.

Ниже приведены как каталоги, так и поисковые системы.

  • OBO Foundry - это набор совместимых справочных онтологий в области биологии и биомедицины.
  • Биопортал (репозиторий онтологий NCBO)
  • Библиотека онтологий OntoSelect предлагает аналогичные услуги для онтологий RDF / S, DAML и OWL.
  • Ontaria - это «каталог семантических веб-данных с возможностью поиска и просмотра», ориентированный на словари RDF с онтологиями OWL. (NB Проект "приостановлен" с 2004 г.).
  • Swoogle - это каталог и поисковая машина для всех ресурсов RDF, доступных в Интернете, включая онтологии.
  • Инициатива Open Ontology Repository
  • ROMULUS - это базовый репозиторий онтологий, направленный на улучшение семантической совместимости. В настоящее время в репозитории есть три базовых онтологии: DOLCE , BFO и GFO .

Примеры приложений

В общем, онтологии можно выгодно использовать в нескольких областях.

  • Корпоративные приложения. Более конкретным примером является SAPPHIRE (Здравоохранение) или Ситуационная осведомленность и готовность к инцидентам в общественном здравоохранении и механизмам рассуждений, которая представляет собой основанную на семантике информационную систему здравоохранения, способную отслеживать и оценивать ситуации и события, которые могут повлиять на здоровье населения .
  • Географические информационные системы объединяют данные из разных источников и, следовательно, получают выгоду от онтологических метаданных, которые помогают связать семантику данных.
  • Онтологии предметной области чрезвычайно важны в биомедицинских исследованиях, которые требуют устранения неоднозначности именованных сущностей для различных биомедицинских терминов и сокращений, которые имеют одну и ту же строку символов, но представляют разные биомедицинские концепции. Например, CSF может представлять колониестимулирующий фактор или спинномозговую жидкость, которые в биомедицинской литературе представлены одним и тем же термином CSF. Вот почему большое количество общедоступных онтологий связано с науками о жизни. Инструменты науки о жизни, которые не могут реализовать эти типы биомедицинских онтологий, не смогут точно определить причинно-следственные связи между концепциями.

Смотрите также

Родственные философские концепции

использованная литература

дальнейшее чтение

внешние ссылки