팔로알토에 본사를 둔 스타트업 젠스파크(Genspark)가 범용 AI 에이전트 시장에서 본격적인 경쟁의 신호탄을 쏘아 올렸다. 이 회사는 최근 '슈퍼 에이전트(Super Agent)'라 불리는 자율형 AI 시스템을 공개하며, 복잡한 실세계 과업을 빠르고 정교하게 처리할 수 있는 능력을 강조했다. 일상적인 음성 통화 예약부터 영상 콘텐츠 제작, 일정 계획까지 소화하며 기존 챗봇의 한계를 넘는 다기능성을 내세웠다.
슈퍼 에이전트는 단순한 대화형 인터페이스를 넘어서는 기술이다. 공동 창업자 에릭 징(Eric Jing)은 이 시스템이 9개의 대규모 언어모델(LLM), 80개 이상의 툴, 10개 이상의 독자적 데이터세트를 유기적으로 연계해 설계됐다고 밝혔다. 실시간으로 복합적인 작업 흐름을 통제하고, 최종 결과물까지 생성하는 점에서 기존 AI 에이전트들과 차별된다.
공개된 데모 영상에서는 샌디에이고 5일 여행 일정을 짜고, 관광지 간 도보 거리 계산은 물론 대중교통 경로를 파악한 뒤, 음성 통화를 통해 음식 알레르기와 좌석 배치를 포함한 레스토랑 예약까지 완료하는 전 과정을 시연했다. 또 다른 사례로는 요리 영상을 자동 제작하거나, 최근 정치 스캔들을 풍자한 '사우스파크' 스타일 애니메이션까지 제작해 눈길을 끌었다.
전문가들은 슈퍼 에이전트의 핵심 경쟁력으로 '추론 과정의 시각화' 기능을 꼽는다. 각 단계에서 어떤 도구를 선택했는지, 왜 그 경로를 택했는지를 투명하게 보여주는 체계는 이해도를 높이고 신뢰 형성에도 유리하다. 이는 기업용 AI 솔루션의 투명성과 설명 가능성을 강화할 수 있는 실질적인 모델로 평가받는다.
사용 편의성도 빼놓을 수 없다. 브라우저 기반 인터페이스는 별도 설치 없이 작동하며, 개인정보 입력 없이 곧바로 사용이 가능하다. 반면 경쟁사 마너스(Manus)는 여전히 대기자 명단 등록과 SNS 계정 등 개인정보 제공이 필요해 진입 장벽이 존재한다.
기술적으로는 광범위한 외부 API나 툴을 연계해야 하는 '도구 오케스트레이션' 문제를 효과적으로 해결했다는 평가다. 젠스파크는 과제별로 적합한 모델과 툴을 동적으로 연결하는 라우팅 기술과 MCP(Model Context Protocol) 같은 최신 표준을 활용해 이 문제에 접근했다. 이와 관련해 중국 쑤저우대학교에서 연구 개발 중인 CoTools 프레임워크와 유사한 전략이라는 분석도 나온다.
AI 에이전트 시장에서 두각을 나타낸 또 다른 스타트업인 마너스는 코드 에디터, 웹 브라우저, 스프레드시트 도구를 활용한 다중 에이전트 구조로 주목받았다. 오픈소스 기반에 앤트로픽(Anthropic)의 '클로드' LLM을 얹은 이 시스템은 최근 GAIA 벤치마크에서 오픈AI 시스템을 상회하는 성과를 거두기도 했다. 하지만 젠스파크는 GAIA 기준 87.8%라는 더 높은 성능을 기록하며 앞서 나가는 모습이다.
이러한 상황에서 빅테크 기업들은 상대적으로 보수적인 움직임을 보이고 있다. 마이크로소프트(MSFT)는 코파일럿 스튜디오를 통해 엑셀이나 아웃룩 등 업무툴에 한정된 맞춤형 에이전트를 선보이고 있으며, 오픈AI와 아마존(AMZN) 역시 범용 에이전트보다는 제한적인 SDK나 툴킷 중심으로 접근하고 있다. 실수가 허용되지 않는 기업 브랜드 리스크와 자사 모델 생태계에 대한 의존이 움직임을 제약하고 있다는 분석이 지배적이다.
결국 기업 입장에서는 이 같은 기술 진보가 실질적인 변화를 불러올 수 있는지에 대한 전략적 판단이 관건이다. 여행 예약이나 애니메이션 제작처럼 소비자 중심 기능보다는, 규제 보고서 생성, 고객 온보딩, 마케팅 콘텐츠 자동화 등 업무 특화 자동화가 더욱 실질적인 이점으로 작용할 수 있다.
젠스파크는 이에 대해 에이전트가 교사, 디자이너, 채용 담당자 등 다양한 분야에서 최소한의 설정만으로도 활용 가능하다는 점을 부각하고 있다. 기존 RPA(로보틱 프로세스 자동화) 플랫폼이나 SaaS 솔루션과 경쟁할 수 있는 가능성을 시사하는 대목이다.
범용 AI 에이전트의 시대는 더 이상 미래가 아니다. 이미 현실이며, 매우 빠른 속도로 전개되고 있다.