Цикл - Cyc

Цикл
Cyc Projects Logos.png
По часовой стрелке: логотипы для базы знаний Cyc, механизмы вывода, действенный вывод, интеллектуальный выбор данных
Оригинальный автор (ы) Дуглас Ленат
Разработчики) Cycorp, Inc.
Первый выпуск 1984 ; 37 лет назад ( 1984 )
Стабильный выпуск
6.1 / 27 ноября 2017 г . ; 3 года назад ( 2017-11-27 )
Написано в Лисп , CYCL , SubL
Тип Онтология и база знаний и представление знаний языка и логический вывод
Веб-сайт www .cyc .com

Сус (выраженный / s к / SYKE ) представляет собой долгосрочный искусственный интеллект проект , который направлен на сборку всеобъемлющей онтологии и базы знаний , которая охватывает основные понятия и правила о том, как устроен мир. Надеясь уловить здравый смысл , Cyc фокусируется на неявных знаниях, которые другие платформы искусственного интеллекта могут принять как должное. Это контрастирует с фактами, которые можно найти где-нибудь в Интернете или получить через поисковую систему или Википедию. Cyc позволяет семантическим рассуждениям вести рассуждения, подобные человеческим, и быть менее «хрупкими» при столкновении с новыми ситуациями.

Дуглас Ленат начал проект в июле 1984 года в MCC , где он был главным научным сотрудником в 1984–1994 годах, а затем, с января 1995 года, он активно развивался в компании Cycorp , где он является генеральным директором .

Обзор

Потребность в масштабном проекте подобного рода символического искусственного интеллекта возникла в начале 1980-х годов. Первые исследователи ИИ за предыдущие 25 лет имели богатый опыт работы с программами ИИ, которые давали обнадеживающие первые результаты, но затем не могли «масштабироваться» - выходить за рамки «обучающего набора» для решения более широкого круга случаев. Дуглас Ленат и Алан Кей объявили об этой необходимости и в 1983 году организовали встречу в Стэнфорде для решения этой проблемы. Предварительные расчеты Лената, Кея и их коллег (включая Марвина Мински , Аллена Ньюэлла , Эдварда Фейгенбаума и Джона Маккарти ) показали, что эти усилия потребуют от 1000 до 3000 человеко-лет усилий, что намного превышает стандартная модель академического проекта. Однако события, произошедшие в течение года после этой встречи, позволили начать работу такого масштаба.

Проект начался в июле 1984 года как флагманский проект корпорации Microelectronics and Computer Technology Corporation (MCC) с 400 сотрудниками, исследовательского консорциума, созданного двумя дюжинами крупных корпораций США, «чтобы противостоять зловещим усилиям Японии в области искусственного интеллекта. называется « проект пятого поколения ». Правительство США отреагировало на угрозу пятого поколения, приняв Закон о национальных совместных исследованиях 1984 года, который впервые позволил американским компаниям «вступать в сговор» в долгосрочных исследованиях, связанных с высоким риском и высокой отдачей, а MCC и Sematech приступили к воспользуйтесь этой десятилетней возможностью. Первым президентом и главным исполнительным директором MCC был Бобби Рэй Инман , бывший директор АНБ и заместитель директора Центрального разведывательного управления.

Целью проекта Cyc было систематизировать в пригодной для машинного использования форме миллионы единиц знаний, составляющих человеческий здравый смысл. Это повлекло за собой (1) разработку адекватно выразительного языка представления CycL , (2) разработку онтологии, охватывающей все человеческие концепции до некоторого соответствующего уровня детализации, (3) разработку базы знаний на этой онтологической структуре, включающей все человеческие знания об этих концепциях вплоть до некоторого подходящего уровня детализации и (4) разработка механизма вывода экспоненциально быстрее, чем те, которые использовались в тогдашних традиционных экспертных системах, чтобы иметь возможность делать выводы того же типа и глубины, что и люди. из, учитывая их знание мира.

Чуть подробнее:

  • Язык представления CycL начался как расширение RLL (так называемый язык языка представления, разработанный в 1979–1980 годах Ленатом и его аспирантом Расселом Грейнером в Стэнфордском университете), но через несколько лет после запуска проекта Cyc Стало ясно, что даже представление типичного новостного сюжета, романа или рекламы потребует большего, чем выразительная сила полной логики первого порядка , а именно исчисления предикатов второго порядка («Какая связь между дождем и водой?»), а затем даже. логические порядки более высокого уровня, включая модальную логику , рефлексию (позволяющую системе рассуждать о своем прогрессе на данный момент, по проблеме, над которой она работает) и контекстную логику (позволяющую системе явно рассуждать о контекстах, в которых ее различные предпосылки и выводы могут иметь место), немонотонная логика и ограниченность . К 1989 году CycL расширился в выразительной силе до логики более высокого порядка (HOL).
    • Представления Triplestore (которые сродни языкам представления кадров и слотов 1970-х годов, из которых произошли RLL) широко распространены сегодня в ИИ. Возможно, будет полезно привести несколько примеров, подчеркивающих или нарушающих этот тип представления, типичных для примеров, которые заставили проект Cyc перейти от представления тройного хранилища к гораздо более выразительному в период 1984–1989 гг .: предложения на английском языке, включая отрицания. («У Фреда нет собаки»), вложенные квантификаторы («У каждого американца есть мать» означает, что все x существует-существует y ... но «у каждого американца есть президент» означает, что существует y такое, что для- все x ...), вложенные модальные окна, такие как «Соединенные Штаты считают, что Германия хочет, чтобы НАТО не преследовала ...», и даже неудобно представлять в Triplestore отношения с арностью выше 2, такие как «Лос-Анджелес» находится между Сан-Диего и Сан-Франциско по US101 ".
  • Онтология Cyc выросла примерно до 100 000 терминов в течение первого десятилетия проекта, до 1994 г., и по состоянию на 2017 г. содержала около 1 500 000 терминов. Эта онтология включала:
    • 416 000 коллекций (типы, сорта, природные виды , включая как типы вещей, такие как Рыба, так и типы действий, такие как Рыбалка)
    • чуть более миллиона человек, представляющих
      • 42 500 предикатов (отношения, атрибуты, поля, свойства, функции),
      • около миллиона общеизвестных организаций, таких как TheUnitedStatesOfAmerica, BarackObama, TheSigningOfTheUSDeclarationOfIndependence и т. д.
      • Произвольно большое количество дополнительных терминов также неявно присутствует в онтологии Cyc в том смысле, что существуют функции, обозначающие термины, такие как CalendarYearFn (если задан аргумент 2016, он обозначает 2016 календарный год), GovernmentFn (если задан аргумент France (он обозначает правительство Франции), Meter (когда приводится аргумент 2016, он обозначает расстояние в 2,016 километра), а также вложения и составы таких обозначающих функции терминов.
  • База знаний Cyc, основанная на общих правилах здравого смысла и утверждениях, включающих эти онтологические термины, была в значительной степени создана путем ручного написания аксиом; он вырос примерно до 1 миллиона в 1994 году, а по состоянию на 2017 год составляет около 24,5 миллиона, а на строительство потребовалось более 1000 человеко-лет.
    • Важно понимать , что в Сусе онтологических инженеры стремятся сохранить эти цифры , как маленькие , насколько это возможно, не раздувать их до тех пор, как дедуктивное замыкание базы знаний не уменьшаются. Предположим, что Cyc рассказывают об одном миллионе отдельных людей, животных и т. Д. Тогда можно сказать 10 18 фактов в форме «Микки Маус - не то же лицо, что и <Лось Буллвинкль / Авраам Линкольн / Дженнифер Лопес>». Но вместо этого можно было бы сказать Cyc 10 000 правил таксономии Линнея, за которыми следуют всего 10 8 правил формы «Нет мыши - это лось». И, что еще более компактно, Cyc можно было бы вместо этого просто дать те 10 000 правил таксономии Линнея, за которыми следовало бы только одно правило формы: «Для любых двух таксонов Линнея, если ни один из них явно не известен как супертаксон другого, то они не пересекаются». Эти 10 001 утверждение имеют такое же дедуктивное завершение, как и ранее упомянутые 10 18 фактов.
  • Дизайн механизма вывода Cyc отделяет эпистемологическую проблему (какой контент должен быть в Cyc KB) от эвристической проблемы (как Cyc может эффективно вывести аргументы на сотни шагов в море из десятков миллионов аксиом). Чтобы сделать первое, может быть достаточно языка CycL и хорошо понятного логического вывода. Для последнего Cyc использовал архитектуру сообщества агентов, где специализированные модули рассуждений, каждый со своей собственной структурой данных и алгоритмом, «подняли руку», если они могли эффективно добиться прогресса в любой из открытых в настоящее время подзадач. К 1994 году было 20 таких модулей эвристического уровня (HL); по состоянию на 2017 год насчитывается более 1050 модулей HL.
    • Некоторые из этих HL-модулей очень общие, например, модуль, который кэширует звезду Клини ( транзитивное замыкание ) всех обычно используемых транзитивных отношений в онтологии Cyc.
    • Некоторые из них зависят от домена, например, балансировщик химических уравнений. Они могут быть и часто являются «побегом» (указателем на) некоторой внешней доступной программы, веб-сервиса или онлайн-базы данных, например, модуля для быстрого «вычисления» текущего населения города, зная, где и как это искать.

CycL имеет публично выпущенную спецификацию, и десятки модулей HL описаны в учебниках Лената и Гуха, но фактический код механизма вывода Cyc и полный список модулей 1000+ HL являются собственностью Cycorp.

Название «Cyc» (от «энциклопедия», произносится [saɪk] , как « syke ») является зарегистрированным товарным знаком, принадлежащим Cycorp. Доступ к Cyc осуществляется через платные лицензии, но добросовестным исследовательским группам в области ИИ предоставляются бесплатные лицензии только на исследования (см. ResearchCyc ); по состоянию на 2017 год более 600 таких групп по всему миру имеют эти лицензии.

Типичными элементами знаний, представленными в базе знаний Cyc, являются «Каждое дерево - это растение» и «Растения рано или поздно умирают». Когда его спрашивают, умирают ли деревья, машина вывода может сделать очевидный вывод и правильно ответить на вопрос.

Большая часть знаний Cyc, помимо математики, верна только по умолчанию. Например, Cyc знает, что по умолчанию родители любят своих детей, когда вы счастливы, вы улыбаетесь, ваш первый шаг - большое достижение, когда у кого-то, кого вы любите, есть большое достижение, которое делает вас счастливыми, и только у взрослых есть дети. . Когда его спросили, есть ли на изображении с надписью «Кто-то наблюдает, как его дочь делает первый шаг» улыбающийся взрослый человек, Cyc может логически сделать вывод, что ответ - Да , и «показать свою работу», представив пошаговый логический аргумент с использованием этих пяти частей. знаний из своей базы знаний. Они сформулированы на языке CycL , который основан на исчислении предикатов и имеет синтаксис, аналогичный синтаксису языка программирования Lisp .

В 2008 году ресурсы Cyc были сопоставлены со многими статьями Википедии . Cyc в настоящее время подключен к Викиданным . В планах на будущее Cyc может быть подключен как к DBpedia, так и к Freebase .

Большая часть текущей работы Cyc по-прежнему является инженерией знаний , представляя факты о мире вручную и внедряя эффективные механизмы вывода на основе этих знаний. Однако работа в Cycorp все чаще включает в себя предоставление системе Cyc возможности общаться с конечными пользователями на естественном языке и помогать в текущем процессе формирования знаний с помощью машинного обучения и понимания естественного языка . Еще одна крупная работа Cycorp - это создание набора онтологических инженерных инструментов на базе Cyc, позволяющих снизить планку входа для людей, которые могут вносить свой вклад, редактировать, просматривать и запрашивать Cyc.

Как и многие компании, Cycorp стремится использовать обработку естественного языка Cyc для анализа всего Интернета для извлечения структурированных данных; в отличие от всех других, он может призывать саму систему Cyc действовать как индуктивное предубеждение и как средство оценки двусмысленности , метафоры и многоточия . Систематических сравнительных исследований производительности Cyc мало, если таковые вообще имеются.

База знаний

Имена концептов в Cyc - это термины или константы CycL . Константы начинаются с необязательного символа «# $» и чувствительны к регистру. Есть константы для:

  • Отдельные элементы, называемые личностями , например # $ BillClinton или # $ France.
  • Коллекции , такие как # $ Tree-ThePlant (содержащие все деревья) или # $ EquivalenceRelation (содержащие все отношения эквивалентности ). Член коллекции называется экземпляром этой коллекции.
  • Функции , производящие новые термины из заданных. Например, # $ FruitFn при наличии аргумента, описывающего тип (или коллекцию) растений, вернет коллекцию своих плодов. По соглашению, функциональные константы начинаются с заглавной буквы и заканчиваются строкой «Fn».
  • Функции истины , которые могут применяться к одному или нескольким другим концепциям и возвращать либо истину, либо ложь. Например, # $ siblings - это родственные отношения, истина, если два аргумента являются братьями и сестрами. По соглашению, константы функции истинности начинаются с строчной буквы. Функции истины могут быть разбиты на логические связки (например, # $ and, # $ or, # $ not, # $ подразумевает), квантификаторы (# $ forAll, # $ thereExists и т. Д.) И предикаты .

Два важных бинарных предиката - это # ​​$ isa и # $ genls. Первый описывает, что один элемент является экземпляром некоторой коллекции, второй - что одна коллекция является вложенной коллекцией другой. Факты о концепциях утверждаются с помощью определенных предложений CycL . Предикаты записываются перед аргументами в скобках:

(#$isa #$BillClinton #$UnitedStatesPresident)

«Билл Клинтон принадлежит к собранию президентов США».

(#$genls #$Tree-ThePlant #$Plant)

«Все деревья - растения».

(#$capitalCity #$France #$Paris)

"Париж - столица Франции."

Предложения также могут содержать переменные, строки, начинающиеся с "?". Эти предложения называются «правилами». Одно важное правило, установленное для предиката # $ isa, гласит:

(#$implies
   (#$and
     (#$isa ?OBJ ?SUBSET)
     (#$genls ?SUBSET ?SUPERSET))
   (#$isa ?OBJ ?SUPERSET))

«Если OBJ является экземпляром коллекции SUBSET, а SUBSET является вложенной коллекцией SUPERSET , тогда OBJ является экземпляром коллекции SUPERSET». Другой типичный пример:

(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)

это означает, что для каждого экземпляра коллекции # $ ChordataPhylum (т.е. для каждой хордовой ) существует животное женского пола (экземпляр # $ FemaleAnimal), которое является его матерью (описывается предикатом # $ financialMother).

База знаний разделена на микротеории (Mt), наборы концепций и фактов, обычно относящиеся к одной конкретной области знаний. В отличие от базы знаний в целом, каждая микротеория должна быть свободна от монотонных противоречий. Каждая микротеория - это первоклассный объект в онтологии Cyc; у него есть имя, которое является обычной константой; Константы микротеории по соглашению содержат строку «Mt». Примером может служить # $ MathMt, микротеория, содержащая математические знания. Микротеории могут наследовать друг от друга и организованы в иерархию: одна из специализаций # $ MathMt - это # ​​$ GeometryGMt, микротеория о геометрии.

Механизм логического вывода

Механизм вывода - это компьютерная программа, которая пытается получить ответы из базы знаний. Механизм вывода Cyc выполняет общие логические выводы (включая modus ponens , modus tollens , универсальную количественную оценку и экзистенциальную количественную оценку ). Он также выполняет индуктивные рассуждения , статистическое машинное обучение и символическое машинное обучение, а также абдуктивные рассуждения (но, конечно, экономно и с использованием существующей базы знаний в качестве фильтра и руководства).

Релизы

OpenCyc

Первая версия OpenCyc была выпущена весной 2002 г. и содержала всего 6 000 концепций и 60 000 фактов. База знаний выпущена под лицензией Apache License . Cycorp заявила о своем намерении выпустить OpenCyc под параллельными неограниченными лицензиями для удовлетворения потребностей своих пользователей. CY переводчик и SubL (программа , которая позволяет пользователям просматривать и редактировать базу данных, а также сделать выводы) была выпущена бесплатно, но только как двоичная, без исходного кода. Он был доступен для Linux и Microsoft Windows . В рамках проекта Texai с открытым исходным кодом был выпущен RDF- совместимый контент, извлеченный из OpenCyc. Версия OpenCyc 4.0 была выпущена в июне 2012 года. OpenCyc 4.0 включал большую часть онтологии Cyc того времени, содержащей сотни тысяч терминов, а также миллионы утверждений, связывающих эти термины друг с другом; однако это в основном таксономические утверждения, а не сложные правила, доступные в Cyc. База знаний OpenCyc 4.0 содержала 239 000 концепций и 2 093 000 фактов.

Основная цель выпуска OpenCyc заключалась в том, чтобы помочь исследователям ИИ понять, чего не хватает в том, что они теперь называют онтологиями и графами знаний . Полезно и важно иметь должным образом систематизированные концепции, такие как человек, ночь, сон, лежание, бодрствование, счастье и т. Д., Но что отсутствует в содержании OpenCyc об этих терминах, но присутствует в содержании Cyc KB, так это различные правила большой палец, который большинство из нас разделяет об этих терминах: что (по умолчанию в ModernWesternHumanCultureMt) каждый человек спит ночью, спит лежа, может быть разбужен, недоволен тем, что его разбудили, и так далее. Этот момент не требует постоянно обновляемых выпусков OpenCyc, поэтому с 2017 года OpenCyc больше не доступен.

ResearchCyc

В июле 2006 года Cycorp бесплатно выпустила исполняемый файл ResearchCyc 1.0, версию Cyc, предназначенную для исследовательского сообщества. (ResearchCyc находился в стадии бета-разработки в течение всего 2004 г .; бета-версия была выпущена в феврале 2005 г.) В дополнение к таксономической информации, содержащейся в OpenCyc, ResearchCyc включает значительно больше семантических знаний (т. Е. Дополнительных фактов и практических правил), включая концепции в своей базе знаний; он также включает в себя большой словарный запас, инструменты синтаксического анализа и генерации на английском языке и интерфейсы на основе Java для редактирования и запросов знаний. Кроме того, он содержит систему для интеграции данных на основе онтологий . По состоянию на 2017 год продолжали появляться регулярные выпуски ResearchCyc, при этом 600 исследовательских групп использовали лицензии по всему миру бесплатно для некоммерческих исследовательских целей. По состоянию на декабрь 2019 года ResearchCyc больше не поддерживается. Cycorp планирует улучшить и пересмотреть инструменты для внешних разработчиков в ближайшие годы.

Приложения

Было более сотни успешных применений Cyc; Здесь перечислены несколько непохожих друг на друга случаев:

Тезаурус фармацевтических терминов Менеджер / интегратор

Более десяти лет Glaxo использует Cyc для полуавтоматической интеграции всех больших (сотни тысяч терминов) тезаурусов терминов фармацевтической отрасли, которые отражают различное использование в разных компаниях, странах, годах и подотраслях. Эта задача интеграции онтологии требует знания предметной области, поверхностных семантических знаний, а также произвольно глубоких знаний здравого смысла и рассуждений. Фармацевтический словарь варьируется в зависимости от страны, (под) отраслей, компаний, отделов и десятилетий. Например, что такое гелевый пакет ? Как называется «улица» у ранитидина гидрохлорида ? Каждый из этих n контролируемых словарей представляет собой онтологию примерно с 300 тыс. Терминов. Исследователи Glaxo должны выполнить запрос в своем текущем словаре , перевести его в нейтральное «истинное значение», а затем преобразовать его в противоположном направлении, чтобы найти потенциальные совпадения с документами, каждый из которых был написан в соответствии с определенным известным словарём. . Они использовали большой посох, чтобы делать это вручную. Cyc используется в качестве универсального интерлингва, способного представлять объединение «истинных значений» всех терминов и способного представлять 300 тыс. Преобразований между каждым из этих контролируемых словарей и Cyc, тем самым преобразовывая задачу в линейную без введения обычная разновидность «телефонной игры» приглушения смысла. Кроме того, создание каждого из этих 300 000 отображений для каждого тезауруса выполняется Cyc в значительной степени автоматически.

База знаний о терроризме

Комплексная база знаний о терроризме представляла собой разрабатываемое приложение Cyc, которое в конечном итоге попыталось вместить все соответствующие знания о «террористических» группах, их членах, лидерах, идеологии, основателях, спонсорах, аффилированности, объектах, местах, финансах, возможностях, намерениях, поведении. , тактика и полное описание конкретных террористических событий. Знания хранятся в виде утверждений математической логики, пригодных для компьютерного понимания и рассуждений.

Фонд кливлендской клиники

Клиника Cleveland использовала Cyc для разработки запросов на естественном языке интерфейса биомедицинской информации, охватывающее десятилетие информации о кардио - хирургических операциях. Запрос анализируется на набор фрагментов CycL (логика высшего порядка) с открытыми переменными (например, «этот вопрос касается человека, у которого развилась инфекция эндокардита», »этот вопрос касается подгруппы пациентов клиники Кливленда, которые оперировали там в 2009 году »и др.); затем применяются различные ограничения (знания в области медицины, здравый смысл, прагматика дискурса, синтаксис), чтобы увидеть, как эти фрагменты могут сочетаться в одном семантически значимом формальном запросе; Важно отметить, что в большинстве случаев существует только один и только один способ включения и интеграции этих фрагментов. Интеграция фрагментов включает в себя (i) решение, какие открытые переменные, в каких фрагментах фактически представляют одну и ту же переменную, и (ii) для всех конечных переменных решить, какой порядок и объем количественной оценки должна иметь эта переменная и какой тип (универсальный или экзистенциальный) . Этот логический (CycL) запрос затем преобразуется в запрос SPARQL, который передается в CCF SemanticDB, которая является его озером данных .

MathCraft

Приложение One Cyc призвано помочь учащимся заниматься математикой на уровне 6-го класса, помогая им глубже понять этот предмет. Он основан на опыте, когда мы часто думали, что что-то поняли, но по- настоящему поняли это только после того, как нам пришлось объяснить или научить этому кого-то еще. В отличие от почти всех других образовательных программ, где компьютер играет роль учителя, в этом приложении Cyc, называемом MathCraft, Cyc играет роль однокурсника, который всегда немного больше сбит с толку, чем вы, пользователь, в отношении предмета. . Роль пользователя - наблюдать за аватаром Cyc и давать ему советы, исправлять его ошибки, наставлять его, заставлять видеть, что он делает не так, и т. Д. Поскольку пользователь дает хороший совет, Cyc позволяет аватару делать меньше ошибок такого типа. следовательно, с точки зрения пользователя кажется, что пользователь только что успешно его чему-то научил. Это разновидность обучения путем обучения .

Критика

Проект Cyc был описан как «одно из самых противоречивых начинаний в истории искусственного интеллекта». Кэтрин Хаваси , генеральный директор Luminoso, говорит, что Cyc является предшественником проекта IBM Watson . Ученый в области машинного обучения Педро Домингос называет проект «катастрофическим провалом» по нескольким причинам, включая бесконечный объем данных, необходимых для получения каких-либо жизнеспособных результатов, и неспособность Cyc развиваться самостоятельно.

Робин Хэнсон , профессор экономики Университета Джорджа Мейсона, дает более взвешенный анализ:

Конечно, проект CYC открыт для критики по поводу многих конкретных вариантов. Люди жаловались на его логические и языковые представления, на выбор прототипов для построения (например, статьи энциклопедии), на то, что он сосредоточен на ответах на действия, на то, как часто он перестраивает или поддерживает унаследованные системы и о том, чтобы быть частным против публикации всего. Но любой крупный проект, подобный этому, вызовет такие споры, и не очевидно, что какой-либо из его вариантов был серьезно неправильным. Им нужно было с чего-то начать, и, на мой взгляд, они собрали базу знаний действительно впечатляющих размеров, масштабов и интеграции. Другие архитектуры вполне могут работать лучше, но если знание участков так же важно, как думает Ленат, я бы ожидал серьезных попыток ИИ импортировать знания CYC, переводя их в новое представление. Ни один другой источник не может сравниться с размером, масштабом и интеграцией CYC.

Аналогичное мнение выразил Марвин Мински : «К сожалению, стратегии, наиболее популярные среди исследователей ИИ в 1980-х годах, зашли в тупик», - сказал Мински. Так называемые « экспертные системы », которые имитировали человеческий опыт в строго определенных предметных областях, таких как право и медицина, могли сопоставлять запросы пользователей с соответствующими диагнозами, статьями и рефератами, но они не могли усвоить концепции, которые большинство детей знает к тому времени, когда они 3 года. «Для каждого типа задач, - сказал Мински, - создание экспертных систем приходилось начинать заново, потому что они не накапливали здравого смысла». По словам Мински, только один исследователь взял на себя колоссальную задачу по созданию всеобъемлющей системы логических рассуждений. Дуглас Ленат в рамках своего проекта Cyc руководил построчным вводом более 1 миллиона правил в базу знаний здравого смысла ".

Гэри Маркус , профессор психологии и нейробиологии Нью-Йоркского университета и соучредитель компании по искусственному интеллекту под названием Geometric Intelligence, говорит, что «это представляет собой подход, который сильно отличается от всего того, что было в новостях о глубоком обучении». Это согласуется с позицией Дуга Лената о том, что «Иногда внешнего вида интеллекта недостаточно».

Стивен Вольфрам пишет:

На заре развития искусственного интеллекта было много дискуссий о «представлении знаний» с подходами, основанными на грамматике естественного языка, структуре логики предикатов или формализме баз данных. Было предпринято очень мало крупномасштабных проектов (заметным контрпримером является Cyc Дуга Лената).

Маркус пишет:

Поле могло бы выиграть, если бы CYC систематически описывалась и оценивалась. Если CYC решил некоторую значительную часть здравого смысла, то очень важно знать это как полезный инструмент и как отправную точку для дальнейших исследований. Если CYC столкнулся с трудностями, было бы полезно учиться на допущенных ошибках. Если CYC совершенно бесполезен, исследователи могут, по крайней мере, перестать беспокоиться о том, изобретают ли они велосипед заново.


Каждые несколько лет с момента его публикации (1993 г.) в журнале Wired Magazine появляется новая статья о Cyc, как положительная, так и отрицательная (в том числе один выпуск, содержащий по одному каждой статьи).

Известные сотрудники

Это список некоторых известных людей, которые работали или работали над Cyc, когда это был проект в MCC (где Cyc был впервые запущен) или Cycorp.

Смотрите также

использованная литература

дальнейшее чтение

внешние ссылки