스마일게이트 AI 센터(이하 AI센터)는 인공지능(이하 AI) 언어 모델 평가 플랫폼 ‘휴릭’(HuLiC)을 공개한다고 29일 밝혔다.
AI 센터에서 첫 공개하는 휴릭은 인공지능에 기반한 다양한 언어 모델을 평가, 연구하며 그 결과를 공유하는 평가 플랫폼이다. 휴릭은 ‘인간다움’에 대한 탐구를 목적으로 실제 인간처럼 상호작용 할 수 있는 인공지능 언어 모델을 만들기 위해 데이터를 구축하고 평가한다.
이를 위해 AI센터는 인간처럼 쌍방향으로 대화를 주고 받으며 생성된 대화의 양상을 검토하기 위한 적합한 평가 항목과 기준을 정의하고, 다수의 참여자가 인공지능 모델을 통해 도출한 대화 데이터에 대해 평가를 진행했다.
휴릭은 기존 자동화 방식의 AI 언어 모델 평가와 달리 실제 전문가가 참여해 사람만이 평가 가능한 지표를 토대로 평가 했다. 이렇게 수집, 평가 된 데이터는 기존 인공지능 대화모델의 기계적인 응답에서 벗어나 실제 사람들의 대화처럼 상호작용할 수 있는 인간다운 AI 모델 연구의 초석이 될 것으로 기대를 모으고 있다.
특히 휴릭은 오픈 도메인을 지향하며 외부에서 공유, 참고할 수 있도록 고안 돼 언어 모델 연구자들에게 유용한 정보를 제공할 수 있을 것으로 기대된다. 향후 AI센터는 이번 휴릭 공개를 기점으로 일상 대화 외에도 윤리, 혐오 등 특정 주제에 대한 언어 모델 평가를 이어갈 계획이다.
한우진 AI센터 센터장은 “기존 AI 평가 플랫폼은 대부분 한정적으로 정의되어 있는 정량적 평가에 집중해 왔다”며 “기술 발전에 따라 AI의 종합 능력을 평가해야 하는 시기가 도래했으며, 이는 곧 인간다운 AI를 실현하기 위한 필수 과정이다. 이번에 첫 선을 보이는 휴릭 뿐만 아니라 대화 및 윤리 평가 데이터가 AI 기술 발전의 토대가 될 수 있을 것으로 기대된다” 라고 말했다.