인공지능 스타트업 오픈AI(OpenAI)는 음성 어시스턴트 출시를 한 달 연기한다고 발표했다.
26일(현지시간) 블룸버그에 따르면 OpenAI는 지난 5월 제품 출시 행사에서 텍스트, 오디오, 이미지를 실시간으로 더 잘 처리할 수 있는 GPT-4 모델의 업데이트 버전인 GPT-4o의 음성 옵션을 공개했다. OpenAI는 원래 6월 말에 소수의 유료 ChatGPT 플러스(Plus) 가입자에게 음성 기능을 출시할 계획이었지만 "출시 기준에 도달하려면 한 달이 더 필요하다고 판단했다"고 밝혔다.
OpenAI는 "특정 콘텐츠를 감지하고 거부하는 모델의 기능을 개선하고 있다"고 발표했다. "또한 사용자 경험을 개선하고 실시간 응답을 유지하면서 수백만 명으로 확장할 수 있는 인프라를 준비 중이다"라고 밝혔다.
이러한 지연은 점점 더 복잡해지는 AI 경쟁자보다 앞서 나가기 위해 노력하는 OpenAI에게 잠재적인 차질을 가져올 수 있다. 이 회사는 작년에 ChatGPT가 사용자와 대화할 수 있는 보다 제한된 옵션을 도입했지만, 새로운 기능은 더 빠르고 강력한 이미지 인식 기능과 결합하여 챗봇을 훨씬 더 유용하고 역동적인 대화 파트너로 만들 것이라고 약속했다.
출시 행사 무대에서 OpenAI 직원들은 연구원의 스마트폰 카메라 앞에 놓인 종이에 수학 문제를 푸는 등의 요청에 거의 즉각적으로 응답하는 ChatGPT를 선보였다. 일부 시청자들은 이 도구를 스칼렛 요한슨이 목소리로 연기한 2013년 영화 '허(Her)'의 AI 가상 비서에 비유하기도 했다. 이 여배우는 나중에 자신과 너무 비슷하다는 이유로 ChatGPT의 음성 중 하나를 삭제해달라고 요구했다.
화요일, OpenAI는 가을에 모든 유료 가입자에게 음성 기능을 출시할 계획이라고 밝혔다. OpenAI는 5월 이벤트에서 시연했던 비디오 및 화면 공유 기능도 출시하기 위해 "작업 중"이라고 밝혔다. 이 회사는 향후 이러한 기능의 출시 시기에 대해 사용자에게 더 자세히 알려줄 것이라고 밝혔다.
따라서 다음 달에 일부 유료 사용자에게 음성 옵션이 제공되더라도 그 기능은 이벤트에서 시연된 것보다 더 제한적일 가능성이 높다. 예를 들어, 챗봇은 스마트폰의 카메라를 사용하여 사용자의 춤 동작에 대한 음성 피드백을 제공하는 컴퓨터 비전 기능에 액세스할 수 없다.
뉴스 속보를 실시간으로...토큰포스트 텔레그램 가기