맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

엔씨소프트-고려대, AI 대화 '포커스 데이터셋' 글로벌 공개

작성자 이미지
토큰포스트 기자

2022.04.14 (목) 18:07

대화 이미지 3
하트 이미지 0

세계 최초 사용자 페르소나(Persona)와 외부 지식 활용하는 데이터셋 구축

사진 = 포커스 데이터셋 대화 시스템 구성도 / 엔씨소프트

엔씨소프트가 고려대학교 임흐석 교수 연구팀과 공동 연구를 통해 구축한 인공지능(AI) 대화 데이터 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여개의 광범위한 주제를 다룬 1만 5천개 이상의 대화로 구성돼 있다.

포커스 데이터셋을 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다. 현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용이 소요됨에도 불구하고, 실시간 지식과 개인의 경험을 반영하는데 한계를 나타내고 있다.

공동연구팀은 지난 2월 세계 최고 권위의 인공지능 학회 'AAAI 2022'에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회(Shared Tasks)를 비롯한 연구 성과를 공유하는 워크샵(The 1st Workshop on Customized Chat Grounding Persona and Knowledge)을 고려대와 공동 개최한다.

이연수 엔씨소프트 Language AI Lab 실장은 "최근 NLP 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정하였으며, 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이루어지기를 기대한다."고 말했다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

출석 체크

0 / 0

기사 스탬프

0 / 0

댓글

3

추천

0

스크랩

스크랩

데일리 스탬프

0

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 5

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

꺼벙남

2022.10.14 09:37:35

사용자에 의해 삭제된 댓글입니다.

답글달기

0

0
0

이전 답글 더보기

꺼벙남

2022.09.19 08:57:27

사용자에 의해 삭제된 댓글입니다.

답글달기

0

0
0

이전 답글 더보기

꺼벙남

2022.09.19 08:57:16

답글달기

0

0
0

이전 답글 더보기

크라운

2022.08.03 19:22:38

감사요

답글달기

0

0
0

이전 답글 더보기

크라운

2022.07.19 17:49:54

좋은소식 감사요

답글달기

0

0
0

이전 답글 더보기

1