아마존이 자사의 차세대 AI 에이전트 개발 도구 ‘노바 액트(Nova Act)’를 전격 공개하며, 마이크로소프트(MSFT), 세일즈포스(CRM), 오픈AI 등과 본격적인 주도권 경쟁에 뛰어들었다. 이 소프트웨어 개발 키트(SDK)는 웹 기반 작업을 자동화할 수 있는 AI 에이전트를 쉽게 구현할 수 있도록 설계됐으며, 아마존의 독자적인 대형 언어 모델 ‘노바(Nova)’에 최적화되어 있다.
이번 발표는 지난해 출시된 ‘노바’ 모델과 알렉사 음성 비서의 AI 기능 업그레이드에 이어 나온 야심작으로, 아마존은 이를 통해 그간 뒤처진 것으로 평가받던 AI 개발 경쟁에서 반전을 노리고 있다. 특히 노바 액트는 웹 브라우저 안에서 실제 업무를 수행할 수 있는 ‘행동형 에이전트’를 구현하는 데 초점을 맞추며 기존의 질문-응답 형 AI와 차별점을 확보했다.
노바 액트의 가장 큰 특징은 복잡한 작업을 세분화해 신뢰도 높은 자동화를 구현할 수 있다는 점이다. 단일 프롬프트에 의존하지 않고 각 단계별로 작업을 수행하는 구조를 갖추고 있어, 기존 모델 대비 훨씬 높은 정확도와 안정성을 자랑한다. 실제로 아마존이 내부 테스트한 결과에서는 텍스트 기반 명령 이해도와 UI 조작 부분에서 경쟁사보다 높은 성능을 기록했다. 예컨대, 웹 텍스트 처리 평가에서는 노바 액트가 0.939의 점수를 얻어 오픈AI의 CUA(0.883)나 앤스로픽의 클로드 3.7 소넷(0.900)보다 우수한 성적을 거뒀다.
또한 SDK는 마이크로소프트가 개발한 오픈소스 브라우저 자동화 프레임워크 ‘플레이라이트(Playwright)’와 연동되며, 이를 기반으로 터치, 클릭, 비밀번호 입력 등 사용자의 직접 입력 없이도 정밀한 웹 조작이 가능하다는 점에서 강력한 보안성과 유연성을 함께 추구한다. 민감 정보를 모델에 직접 전달하지 않고 자동 입력할 수 있어 프라이버시 보호에도 유리하다.
아마존 측은 노바 액트를 단순 개발 도구가 아닌 웹 사용 방식의 근본적인 전환점으로 보고 있다. 아마존 AGI의 데이비드 루안 부사장은 “우리는 웹으로 행동할 줄 아는 AI 에이전트를 차세대 컴퓨팅의 핵심 요소로 보고 있다”며 “장기적으로는 인간 사용자보다 더 많은 에이전트가 웹을 탐색하게 될 것”이라고 전망했다. 루안은 앞서 AI 스타트업 어댑트(Adept)의 공동 창업자로, 2024년 아마존에 인수합병 방식으로 합류한 인물이다.
현재 출시된 노바 액트 SDK는 전 세계 개발자를 대상으로 오픈소스 형태로 제공되되, 아마존의 노바 모델에서만 작동하도록 설계된 점이 특징이다. 즉, 오픈AI의 GPT-4o나 클로드 3 등 외부 모델과 연동이 불가능하다는 제약은 있지만, 해당 모델과의 통합 훈련을 통해 안정성과 정확성을 극대화했다는 것이 아마존 측의 설명이다.
사용 환경도 유연하다. AWS 외부 클라우드나 로컬 환경에서도 설치 및 실행이 가능해 특정 인프라에 종속되지 않는다. 다만 SDK는 오픈소스지만, 모델 자체는 비공개로 운영되며, 현재는 무료 연구 프리뷰 형식으로 제공되고 있다. 본격적인 상용화는 향후 단계적 가격 정책 발표와 함께 시작될 예정이다.
이번 출시를 계기로 아마존은 ‘추론형 챗봇’ 중심의 경쟁 구도를 ‘작동형 에이전트’ 시장으로 이동시키려는 구체적인 전략을 드러낸 셈이다. 루안 부사장은 “우리는 아직 가장 유용한 AI 에이전트 제품이 세상에 나오지 않았다고 믿는다”며 “노바 액트는 그런 제품을 개발할 수 있는 기반 API”라고 강조했다.
AI의 행동 중심 진화가 본격화되는 지금, 노바 액트는 기업 내 반복 업무 자동화, 사용자 맞춤형 서비스 구현 등 다양한 분야에서 활용될 수 있는 강력한 도구로 떠오를 가능성이 크다. 오픈소스 생태계와 연계된 확장성보다 자체 최적화를 내세운 아마존의 이 전략이 성공할 수 있을지, AI 에이전트 시장의 방향을 가늠할 중요한 시험대가 될 전망이다.