logo
1984
0
Проект CYC
  • Описание прогноза события
  • Описание реализации события
Cyc (написано латиницей, произносится Сайк) — проект по созданию объёмной онтологической базы знаний, позволяющей программам решать сложные задачи из области искусственного интеллекта на основе логического вывода и привлечения здравого смысла.

Проект начал Дуглас Ленат в 1984 году в Microelectronics and Computer Technology Corporation. Название «Cyc» (образованное от англ. encyclopedia: «сайк») является зарегистрированной торговой маркой компании Cycorp, Inc в Остине, которой управляет Ленат и созданной для разработки Cyc. База знаний является собственностью компании, однако небольшая часть базы, предназначенная для установления общего словаря для программ автоматического рассуждения, была выпущена как OpenCyc под открытой лицензией. Позднее Cyc стала доступной для исследователей ИИ под специальной исследовательской лицензией ResearchCyc.

Типичным примером знаний в базе являются «Всякое дерево является растением» и «Растения смертны». Если спросить «умирают ли деревья?», машина логического вывода может сделать очевидный вывод и дать правильный ответ. База знаний (англ. Knowledge Base или KB) содержит более миллиона занесённых туда людьми утверждений, правил и общеупотребительных идей. Они формулируются на языке CycL, который основан на исчислении предикатов и имеет схожий с лиспом синтаксис. Англоязычные пользователи шутят, что они «велосипедисты» (от англ. cyclist — велосипедист).

Большая часть сегодняшней работы в проекте Cyc всё ещё связана с инженерией знаний — описание фактов об окружающем мире вручную и реализация эффективных механизмов логического вывода на основе этих знаний. Однако ведётся работа над тем, чтобы дать системе Cyc возможность самостоятельно общаться с пользователями на естественном языке, и над ускорением процесса пополнения базы с помощью машинного обучения.

Об этой новости на другом языке: english

 

Источники: Wikipedia

Последняя версия OpenCyc, 1.0 была выпущена в июле 2006 года. OpenCyc 1.0 включает в себя полную онтологию Cyc, содержащую сотни тысяч выражений, миллионы утверждений, связывающих термы между собой. База знаний содержит 47 000 концепций и 306 000 фактов, и её можно просмотреть на сайте OpenCyc. Первая версия OpenCyc была выпущена в мае 2001 года и содержала только 6000 концепций и 60 000 фактов. База знаний выпущена под лицензией Apache. Cycorp намерена выпускать OpenCyc под параллельными, менее жёсткими лицензиями, чтобы удовлетворить потребности своих пользователей. Интерпретатор CycL и SubL (программа, которая позволяет просматривать и изменять базу данных и делать выводы) выпущена бесплатно, но только в двоичном виде, без исходных текстов. Она работает как под GNU/Linux, так и под Microsoft Windows.

В июле 2006 года Cycorp выпустила ResearchCyc 1.0, бесплатную (но с закрытыми исходниками) версию Cyc, предназначенную для исследовательского сообщества. (ResearchCyc находился в стадии бета-версии в течение всего 2004 года, а выпущена в бета-тестирование он был в феврале 2005.) В дополнение к таксономической информации из OpenCyc, ResearchCyc включает значительно больше семантических знаний (то есть дополнительные факты) о концепциях в своей базе знаний, и включает большой лексикон, инструменты для грамматического разбора и генерации английского языка, написанные на языке Java интерфейсы для редактирования знаний и создания запросов к базе.

Cycorp публично выразила своё намерение выпустить все термы и таксономические взаимосвязи, содержащиеся в ResearchCyc, как часть OpenCyc, и это было сделано в версии 1.0. Одна из указанных целей — создать полностью свободный и неограниченный семантический словарь для использования в семантической паутине. Таксономия OpenCyc доступна в формате Owl на сайте проекта OpenCyc.

Cyc получал десятки тысяч фактов, включая то, чего не найти в энциклопедиях, потому что это слишком очевидно. Например, он знает, что Исаак Ньютон — это знаменитый физик, которого уже нет в живых. Но важнее то, что он понимает — если уронить яблоко, оно упадет на землю.

И теперь система Ленэта будет приносить доход компании Lucid. «Одна из причин заключается в том, что Cyc готов, — объясняет Ленэт, оставивший место профессора Стэнфорда в 1984 году, чтобы начать свой проект. — Не то, чтобы было больше нечего делать. Но всё, что осталось — это добавить специализированные знания, вроде экономики или онкологии».

«Cyc являет собой подход, сильно отличающийся от глубокого обучения, которое у всех на слуху», — заявил профессор психологии и нейробиологии Гэри Маркус.
Среди прочего, Lucid разрабатывает на основе общих знаний Cyc персонального помощника. Это должно быть похоже на Siri, но без досадных недопониманий. Также компания ведет переговоры о других вариантах использования базы знаний. К примеру, Lucid сотрудничает с Кливлендской больницей над автоматизацией процесса подбора добровольцев для клинических испытаний. С помощью базы Cyc врачи смогут вводить запросы естественным языком, при этом Lucid должна не только найти ответ, но и выдать всю логическую цепочку своих рассуждений.

Коммерциализация Cyc вызывает у некоторых недоумение. Во-первых, проект слишком долго был в фазе созревания. Во-вторых, программирование и логика внутри ИИ несколько устарела. Однако, даже глубокое обучение не способно пока вложить в машины здравый смысл. «Легко говорить, что у нас есть программы, побеждающие в шашки, шахматы и го, — говорит он. — Но совсем не то же самое, если эти программы могут вести долгие беседы, в результате которых люди принимают жизненные решения».

Источники: Wikipedia Хайтек

Рейтинг события
50
Cycorp, Inc.

autor logo

Cycorp is a leading provider of semantic technologies that bring a new level of intelligence and common sense reasoning to a wide variety of software applications. The Cyc software combines an unparalleled common sense ontology and knowledge base with a powerful reasoning engine and natural language interfaces to enable the development of novel knowledge-intensive applications. As a premier knowledge-based technologies research and development company, Cycorp leverages its cutting edge innovations in knowledge representation, machine reasoning, natural language processing, semantic data integration, and information management and search to offer an array of semantic middleware, knowledge-based application development capabilities, and turn-key solutions. The Cyc project, a long-term quest to develop a true artificial intelligence, was founded in 1984 by Dr. Douglas Lenat as a lead project in the Microelectronics and Computer Technology Corporation (MCC). In 1994, Cycorp was founded to further develop, commercialize, and apply the Cyc technology. To foster the growth of semantic reasoning by the research community, Cycorp offers a no-cost license to its semantic technologies development toolkit to the research community. Additionally, it has placed the core Cyc ontology into the public domain. Cycorp has headquarters in Austin, Texas.