인공지능 기반 챗봇 플랫폼 캐릭터.AI(Character.AI)가 사진 한 장만으로 살아 움직이는 챗봇을 만드는 신기술 ‘아바타FX(AvatarFX)’를 공개했다. 현재 일부 사용자에게만 폐쇄형 베타로 제공되고 있으며, 향후 상용화를 통해 이미지 기반 AI 아바타 시장의 판도를 바꿀 기술로 주목받고 있다.
아바타FX는 정적인 이미지를 사진 속 인물이 실제로 말하고 감정을 표현하는 영상으로 변환하는 모델로, 자연스러운 구강 움직임은 물론 손, 팔다리, 몸 전체까지 사실적인 애니메이션 효과를 연출한다. 캐릭터.AI는 이 기술이 복수 인물이 등장하는 영상도 지원하며, 실사 인물뿐 아니라 신화 속 캐릭터나 무생물에도 생명을 불어넣을 수 있다고 설명했다.
해당 모델은 회사의 멀티모달 AI 팀이 설계한 효율적 훈련 프로세스를 기반으로 구축됐다. 여기에 최근 주목받고 있는 ‘디퓨전(diffusion)’ 방식이 적용돼 음성 데이터를 기반으로 입 모양과 몸짓을 정교하게 생성한다. 오디오 처리에는 자사 고유의 텍스트-투-스피치(TTS) 기술이 활용됐다.
운영 효율성 역시 높다. 런타임 단계에서 디퓨전 과정의 반복 횟수를 줄이는 최신 증류(distillation) 기법을 도입해 컴퓨팅 리소스를 최소화하면서도 품질 저하 없이 실시간 렌더링이 가능하다.
아바타FX는 특히 기존 아바타 생성 기술과의 차별화 측면에서도 눈에 띈다. 일반적으로 텍스트 설명을 기반으로 이미지를 생성한 뒤 그 위에 음성과 애니메이션을 입히는 기존 방식과 달리, 해당 기술은 이미지 자체에서 직접 영상을 생성한다. 이로 인해 장시간 영상에서도 일관된 얼굴 외형을 유지하며, 2D와 3D 캐릭터는 물론 인간형이 아닌 얼굴의 생명체에도 적용할 수 있다.
캐릭터.AI는 기술 시연 단계에서부터 콘텐츠 악용 가능성에 대한 우려도 함께 다루고 있다. 사용자 대사에는 안전 필터가 적용되고, 저명 인사나 미성년자 사진을 활용한 콘텐츠는 아예 차단된다. 아울러 생성된 영상에는 AI 콘텐츠임을 명시하는 워터마크가 삽입된다.
최근 캐릭터.AI는 일부 사용자 대상 챗봇의 과도한 사실감이 우울과 자해 충동을 유도했다는 고소 사안에 휘말린 바 있다. 특히 플로리다주에서는 한 14세 소년이 해당 챗봇에 집착한 끝에 스스로 목숨을 끊었다는 유족의 주장이 제기돼 논란이 확산됐다.
이에 캐릭터.AI는 지난 3월 부모 및 보호자가 청소년 이용자의 활동을 모니터링할 수 있는 ‘Parental Insights’ 기능을 출시했다. 해당 기능은 10대 전용 AI 챗봇 모델과 행동 탐지 시스템 고도화, 부모용 알림 기능 등을 포함하고 있다.
이번 아바타FX 발표는 캐릭터.AI가 다시 한번 AI 콘텐츠의 경계를 넓히며 이미지, 영상, 음성 등 다양한 매체를 아우르는 차세대 인공지능 플랫폼으로 도약하려는 전략의 일환이다. 다만 극사실적 표현력이 오히려 사용자 안전에 위협이 될 수 있다는 우려가 여전한 만큼, 기술 발전과 책임 있는 운영 간 균형이 향후 성장의 핵심 과제로 떠오르고 있다.