딥페이크 생성 도구의 접근성이 높아지면서 딥페이크 위협이 증가하고 있다. 검증 제공업체 썸섭(Sumsub)에 따르면 2023년에서 2024년 사이 딥페이크가 245% 증가했으며, 이는 선거철을 앞두고 부분적으로 촉발되었다. 최근 Business.com 조사에 따르면, 10%의 기업이 클론 음성 등 딥페이크를 이용한 사기를 경험한 것으로 나타났다.
18일(현지시간) 테크크런치에 따르면, 이 트렌드는 딥페이크 방어 도구와 관련 기술을 마케팅하는 기업들에게 큰 기회를 제공하고 있다. 이러한 기업 중 하나인 핀드롭(Pindrop)은 수요일에 허큘리스 캐피탈(Hercules Capital)로부터 5년간 1억 달러의 대출을 확보했다고 발표했으며, CEO 비제이 발라수브라마니안(Vijay Balasubramaniyan)은 이 자금이 제품 개발과 고용에 사용될 것이라고 밝혔다.
"생성형 AI의 발전으로 특히 음성 클로닝이 강력한 도구가 되었습니다,"라고 발라수브라마니안은 TechCrunch와의 인터뷰에서 말했다. "AI 탐지 기술을 활용한 딥페이크 탐지는 이제 모든 콜센터에서 사기꾼을 한 발 앞서기 위해 필요합니다."
핀드롭은 은행, 금융 및 관련 산업의 기업을 대상으로 딥페이크 방지 및 다중 인증 제품을 개발하고 있다. 회사는 예를 들어, 컨택 센터의 전화를 식별할 수 있으며, 경쟁사 솔루션보다 더 높은 정확도를 자랑한다고 주장한다.
"핀드롭은 합성 및 실제 음성 모두를 포함한 2천만 개 이상의 발화 데이터셋을 활용하여 AI 모델을 훈련시켜 진짜 인간의 목소리와 합성된 목소리를 구분합니다,"라고 발라수브라마니안은 말했다. "우리는 딥페이크를 만드는 데 사용되는 텍스트-음성 변환(TTS) 모델을 식별하기 위해 330개 이상의 TTS 모델을 훈련했습니다."
딥페이크 탐지 모델에서 편향은 일반적인 문제이다. 많은 오디오 모델이 미국 서부의 목소리를 인식하는 경향이 있으며, 다른 억양과 방언에는 성능이 떨어져 합법적인 목소리를 딥페이크로 분류할 수 있다.
합성 훈련 데이터가 편향을 완화하는지 악화시키는지는 논란의 여지가 있지만, 발라수브라마니안은 전자가 맞다고 생각하며, 핀드롭의 음성 인증 제품이 발음이나 언어보다 목소리의 "음향 및 스펙트럼-시간적 특성"에 중점을 두고 있다고 주장한다.
"AI 기반 음성 인식 시스템은 톤, 억양, 방언 및 사투리 차이로 인해 편향된 결과를 보여주는 경향이 있으며, 이는 인종적 함의를 가질 수 있습니다,"라고 발라수브라마니안은 말했다. "이러한 편향은 다양한 민족, 인종, 성별 또는 기타 차이에 대한 대표성이 부족한 데이터의 동질성에서 비롯되며, 이는 AI 시스템이 훈련된 데이터의 다양성을 제한합니다."
핀드롭은 2011년 구글 출신 비제이 발라수브라마니안과 전 바라쿠다 네트웍스(Barracuda Networks) 최고 연구 책임자 폴 저지(Paul Judge), 무스타크 아하마드(Mustaque Ahamad)가 회사를 설립한 이후 상당한 성장을 이루었다. 현재 애틀랜타에 본사를 두고 있으며 약 250명의 직원을 고용하고 있는 이 회사는 비트루비안 파트너스(Vitruvian Partners), 캐피털G(CapitalG), IVP 및 안드레센 호로위츠(Andreessen Horowitz) 등의 투자자로부터 2억 3천477만 달러의 벤처 자본을 모금했다.
이번에는 왜 지분이 아닌 부채를 선택했는지 묻자, 발라수브라마니안은 "효율적으로 성장 자금을 조달"할 수 있는 "매력적인 옵션"이었다고 말했다. (이는 흔한 전략이다.)
대출 자금은 핀드롭이 기술을 헬스케어, 소매, 미디어 및 여행과 같은 새로운 부문에 도입하는 데 사용할 것이라고 발라수브라마니안은 덧붙였다.
"생성형 AI의 등장으로 우리는 전 세계적으로 솔루션에 대한 엄청난 수요를 보고 있으며, 딥페이크로 인한 위협이 큰 국가로의 확장을 고려하고 있습니다,"라고 발라수브라마니안은 말했다. "핀드롭은 사기 방지, 인증 및 생체 인식 솔루션을 통해 기업이 자신과 소비자를 보호할 수 있도록 돕기 위해 준비되어 있습니다."
뉴스 속보를 실시간으로...토큰포스트 텔레그램 가기