OKBQA Platform은 질의응답 시스템의 세계적인 협업을 도모하기 위해서 함께 만들어가고 있는 개발환경입니다. 질의 응답 시스템의 개발에 관심이 있는 전세계의 누구라도 자유롭게 참여해서, 필요한 모듈들을 개발하고, 서로 공유하며, 모듈들을 자유롭게 조합해서 성능을 평가할 수 있게 함으로써 질의응답 시스템 기술의 발전을 함께 이루어 나가는 것을 그 목적으로 하고 있습니다. 관련 정보와 데모 시스템, 그리고 모듈의 리포지토리를 OKBQA 허브사이트(http://www.okbqa.org/) 확인하실 수 있습니다. 이번 해커톤에서는 모듈 개발의 현황을 공유하고 모듈들을 조합한 워크플로우를 평가(evaluation)하는 것을 주제로 합니다.
현재 많은 대화형 에이전트들이 개발되고 있고, Amazon Echo, Apple Siri, Google Assistant 등 상품화 또한 활발하게 전개되고 있습니다. 본 타스크에서는 대화에 참여하는 쌍방간 정보획득의 비대칭성을 개선하는 것을 목표로, 학습과 평가에 사용할 수 있는 벤치마크 데이터로서의 코퍼스를 개발하는 것을 주제로 합니다.
본 타스크에서 목표로하는 에이전트는 다음과 같은 특성을 갖습니다.
주어진 지식을 기반으로 지속적인 대화의 진행이 가능.
주어진 지식을 기반으로 대화 상대로부터 주어지는 질의에 응답이 가능.
에이전트 자신의 지식 기반에 부족한 부분을 획득할 수 있는 대화의 유도가 가능.
이러한 관점에서 해커톤 기간에는 학습 및 평가 코퍼스 개발을 주제로 다음과 같은 협업을 하고자 합니다.
대화 코퍼스의 공유
대화 코퍼스 개발 방향에 대한 토론
평가항목 개발
기초 (baseline) 대화 모델의 개발
영상(Video) 분석을 통해 영상속의 인물과 대사의 화자를 연결시키는 것을 목표로 합니다. 이 타스크를 위해서 미국 NBC에서 제작, 방송된 인기 시트콤인 Friends의 대본과 영상을 사용할 것입니다. 본 타스크는 대화의 텍스트 뿐만이 아니라 영상의 분석에서 얻어지는 정보를 함께 사용함으로써 대화 인식의 정확도를 높일 수 있을 것이라는 것을 가정으로 하며, 최신의 대화 인식 평가 타스크인 SemEval 2018 - Task 4를 확장한 개념입니다.

Task 4. KB Population
(http://7.okbqa.org/hackathon/task/task4)
지식 기반 (Knowledge Base)은 지식을 필요로 하는 인공지능 에이전트의 성능에 절대적인 영향을 미치는 중요한 요소입니다. 현재, DBPedia, Wikidata, YAGO 등 많은 지식기반들이 개발되고 있습니다. 하지만, 웹을 통해서 매일매일 새로운 지식과 정보가 쏟아지는 현대에 지식 기반을 정확하고 빠르게 자동으로 확장하기 위한 기술의 중요성은 더욱 높아지고 있습니다. 이번 해커톤에서는 텍스트 자료로부터 지식을 자동으로 획득하기 위해 중요시되는 두가지 작업을 수행하고자 합니다.