아마존(AMZN)이 인간처럼 웹브라우저를 조작할 수 있는 인공지능 에이전트를 새롭게 공개하며 차세대 AI 주도권 경쟁에 본격적으로 뛰어들었다.
아마존은 3월 31일(현지시간) ‘노바 액트(Nova Act)’라는 AI 에이전트를 선보이고, 사용자가 지시한 복합적인 작업을 웹브라우저를 통해 자율적으로 수행할 수 있도록 설계했다고 밝혔다. 이번 시스템은 샌프란시스코에 새롭게 개설된 아마존 AGI 연구소에서 개발됐으며, 지난해 공개된 노바(Nova) 기반 멀티모달 AI 모델을 토대로 하고 있다.
노바 액트는 단순 텍스트 입력이나 버튼 클릭부터 시작해 일정 계획이나 지도 검색처럼 인간의 직관과 유사한 웹 조작이 가능하다. 예컨대 “집에서 세 개의 가게를 들른 뒤 오후 6시쯤 영화를 볼 수 있는 가장 쉬운 경로를 찾아줘” 같은 복잡한 요청도 웹 내 여러 요소를 분석하고 순차적으로 처리할 수 있다. 아마존은 이를 통해 사용자 명령을 자동으로 분해하고 일련의 구체적인 행동으로 재구성하는 것이 가능하다고 설명했다.
이번 발표와 함께 아마존은 개발자들이 노바 액트를 직접 실험하고 새로운 에이전트를 제작할 수 있도록 SDK(소프트웨어 개발 키트)도 함께 공개했다. 아마존 인공지능 부문 수석 부사장 로힛 프라사드(Rohit Prasad)는 “개발자와 기술 애호가라면 누구나 아마존의 프론티어 AI 기술을 쉽게 활용할 수 있다”며 “노바 모델로 아이디어를 테스트하고 이를 AWS 베드록(Bedrock)을 통해 바로 확장할 수 있도록 했다”고 강조했다. AWS 베드록은 다양한 AI 모델을 클라우드 기반에서 통합 제공하는 완전관리형 서비스다.
이번 AI 브라우저 제어 기술은 구글(GOOGL), 오픈AI, 앤스로픽(Anthropic) 등 주요 기술 기업들이 앞다퉈 연구 중인 분야다. 특히 앤스로픽은 지난해 브라우저 조작이 가능한 실험용 클로드(Claude) 모델을 공개했고, 구글도 젬니(Gemini)에 브라우저 제어 기능을 탑재 중인 것으로 알려졌다. 아마존의 이번 발표는 이 같은 ‘AI 사용행태 모델(agentic AI)’ 분야에서 존재감을 부각하려는 시도로 해석된다.
노바 액트와 함께 오픈된 nova.amazon.com에서는 텍스트 요약, 이미지·영상 생성 등 다양한 노바 모델 기능을 체험할 수 있다. AI 에이전트의 잠재력과 활용성이 금융, 전자상거래, 고객지원 등 실생활 전반에 점차 확장되는 가운데, 아마존의 움직임은 향후 시장 변화를 주도할 또 한 번의 분수령이 될 수 있다는 평가가 나온다.