Krisp가 실시간 화상 회의에서 영어 악센트를 조정하는 AI 기반 기술을 선보인다.
Krisp Technologies는 소음 제거, 실시간 회의 녹취 및 요약 기능을 지원하는 소프트웨어를 개발하는 기업이다. 이 회사는 새로운 AI 기반 ‘악센트 변환(AI Accent Conversion)’ 기술을 발표하며, 강한 억양을 가진 화자의 발화를 네이티브 영어 발음에 가깝게 변환해 이해도를 높이는 기능을 추가했다.
Krisp의 기술은 대부분의 인기 있는 화상 회의 플랫폼과 호환되며, 매월 50억 건 이상의 통화를 처리할 만큼 강력한 성능을 보유하고 있다. 이 기술은 데스크톱 애플리케이션 형태로 제공되며, 가상 마이크처럼 작동해 음성을 실시간으로 변환하는 방식이다. 음성 처리 속도는 200밀리초에 불과해 사용자가 인식하지 못할 정도의 낮은 지연 시간을 갖춘 것이 특징이다.
AI Accent Conversion은 발화자의 원래 음성을 유지하면서도 음소(phoneme)만 변환해 미국식 영어 발음에 맞게 조정한다. 이를 통해 감정 표현, 어조, 말하는 리듬은 그대로 유지하면서도 발음은 보다 명료해진다는 설명이다. Krisp는 이 기술과 관련해 두 개의 특허를 보유하고 있다.
기업 고객을 대상으로 한 초기 테스트에서는 이 기능을 활용할 경우 네트 프로모터 점수(Net Promoter Score, NPS)가 7.23에서 8.29로 상승하는 것으로 나타났다. 또한 판매 전환율이 26% 증가했고, 예약당 매출이 약 15% 높아지는 효과도 확인됐다.
회사의 공동 창업자이자 사장인 아르토 미나시안(Arto Minasyan)은 자신 역시 강한 억양으로 인해 의사소통에 어려움을 겪은 경험이 있다고 밝혔다. 그는 "악센트를 교정하는 것은 가능하지만, 바쁜 비즈니스 환경에서 수년간 연습해야 하는 것은 현실적으로 어렵다"고 설명했다.
AI Accent Conversion은 우선 인도식 영어 발음을 지원하며, 이후 필리핀, 남미 지역의 스페인어 발음 등으로 확대될 예정이다. 이 기능은 노이즈 제거, 회의 녹취 및 요약 기능을 포함하는 Krisp의 AI 미팅 어시스턴트에 통합된다. 또한 별도의 클라우드 서버를 거치지 않고 로컬 PC에서 직접 실행되기 때문에 개인정보 보호 측면에서도 강점이 있다.
이 기능은 하루 90분까지 무료로 제공되며, 무제한 사용이 가능한 비즈니스 요금제는 월 15달러(약 2만 1,600원)로 책정됐다.