Cyc 프로젝트(Cyc project)는 인간의 상식(common sense)을 기계적으로 표현하고 추론할 수 있도록 설계된 장기 인공지능(symbolic AI) 프로젝트이다. 1984년 더글러스 레나트(Douglas Lenat)에 의해 시작되었으며, 세계에 대한 포괄적인 온톨로지(ontology)와 지식 기반(knowledge base)을 구성하는 것을 목표로 한다.
개요
Cyc는 인간이 당연하게 여기는 암묵적 지식을 체계적인 형태로 정의하고, 이를 바탕으로 인공지능이 유사한 방식으로 사고하도록 하는 것을 목표로 한다. 이 프로젝트는 기호 기반 AI의 대표적 사례이다. [1]
역사
- Cyc 프로젝트는 1984년 미국 MCC(Microelectronics and Computer Technology Corporation)에서 시작되었으며, 이후 Cycorp에서 지속적으로 개발되었다.
- 프로젝트 이름 'Cyc'는 'encyclopedia'에서 유래하며, 이미 Cycorp의 등록 상표이다.
지식 기반
- Cyc의 지식 기반은 수십만 개의 온톨로지 용어와 수백만 개의 사실(assertions)으로 구성된다. 1994년에는 약 100,000개의 용어와 1백만 개의 사실이 있었으며, 2017년에는 약 1.5백만 용어와 2,450만 개의 사실로 확장되었다.
- 지식은 서로 모순이 없는 단위인 마이크로이론(microtheories) 단위로 조직되어 있다.
추론 엔진
- Cyc의 추론 엔진은 일반적인 논리적 연역뿐 아니라 귀납, 통계적 머신러닝, 가설 추론(abductive reasoning) 등을 지원한다.
OpenCyc 및 ResearchCyc
- OpenCyc는 Cyc의 하위 집합을 오픈 소스로 공개한 버전으로, 2002년 첫 공개되었으며 Apache 라이선스로 배포되었다. 2017년 이후에는 오픈 버전이 더 이상 공개되지 않았다.
- 2006년 이후에는 학술 연구를 위해 ResearchCyc가 공개되어, 더 많은 내용과 도구가 포함되었다.
활용 사례
- 시맨틱 웹, 의료 정보 검색(예: Cleveland Clinic), 테러 지식 기반, 네트워크 보안(CycSecure), 교육용 시스템(MathCraft) 등 다양한 실제 적용사례가 있다.
비판과 한계
- Cyc는 AI 역사상 가장 야심찬 프로젝트 중 하나로, 그 복잡성과 손수 지식을 코딩해야 하는 방식 때문에 확장성, 유연성 면에서 한계가 있다는 비판을 받는다.
- 딥러닝 중심 연구에 밀리면서 대중의 관심에서 멀어진 점도 언급된다. [2]
같이 보기
참고 문헌
- “One Genius' Lonely Crusade to Teach a Computer Common Sense”, Wired, 2016.