캐나다 AI 스타트업 코히어(Cohere)가 획기적인 다국어 지원 AI 모델 '커맨드 A(Command A)'를 공개했다. 이번 신제품은 기업용 AI 애플리케이션을 겨냥한 것으로, 단 두 개의 GPU만으로도 구동이 가능하다는 점에서 주목을 받고 있다.
커맨드 A는 지난해 출시된 '커맨드 R(Command R)' 및 '커맨드 R+(Command R+)'의 후속작으로, 검색 기반 생성(retrieval-augmented generation, RAG), 외부 도구 연계, 그리고 기업 환경 최적화를 중점적으로 개선했다. 특히 AI 모델의 연산 효율성을 높이고 응답 속도를 향상시키는 데 집중했으며, 금융, 의료, 과학, 법률 등 즉각적인 응답이 요구되는 산업 분야에서 강력한 경쟁력을 갖출 것으로 전망된다.
이 모델은 오픈AI의 GPT-4o 및 딥식(DeepSeek)-V3 등과 경쟁하는 수준의 성능을 보이면서도, 하드웨어 요구 사항을 대폭 낮춘 것이 특징이다. 기존 모델이 128,000개 토큰의 컨텍스트 길이를 지원했던 것과 달리, 커맨드 A는 이를 256,000개 토큰으로 늘려 한 번에 처리할 수 있는 정보량을 두 배로 확대했다. 이는 약 600페이지 분량의 텍스트를 한 번에 처리할 수 있는 수준이다.
코히어 측은 커맨드 A가 AI 응용 분야에서 속도와 비용 절감 측면에서 탁월한 강점을 제공한다고 강조했다. 실제로 GPT-4o 대비 1.75배, 딥식-V3 대비 2.4배 빠른 토큰 생성 속도를 기록했으며, 첫 응답 시간도 대폭 단축했다. 또한 A100 및 H100 GPU 두 개만으로도 원활한 구동이 가능해, 기존 32개 이상의 GPU가 필요했던 모델들과 비교해 하드웨어 비용을 크게 줄였다.
다국어 지원 역시 커맨드 A의 주요 특징 중 하나다. 23개 주요 언어를 지원하며, 특히 아랍어 방언 처리 능력이 크게 개선됐다. 벤치마크 테스트에서 커맨드 A는 영어-아랍어 번역 정확도 98.2%를 기록하며 GPT-4o(92.2%) 및 딥식-V3(94.9%)를 능가했다.
현재 커맨드 A는 코히어 플랫폼에서 이용 가능하며, 연구 목적으로 한정된 오픈 웨이트 버전이 허깅페이스(Hugging Face)를 통해 제공되고 있다. 가격은 입력 토큰 100만 개당 2.50달러, 출력 토큰 100만 개당 10달러로 책정됐다. 기업 맞춤형 온프레미스 배포도 별도 요청을 통해 제공된다.
코히어 개발 책임자인 드와라크나스 가네산(Dwaraknath Ganesan)은 "커맨드 A는 단 두 개의 H100 GPU로 구동 가능하며, 256K 컨텍스트 길이, 다국어 지원, 외부 도구 연계 기능 등을 갖춘 강력한 AI 모델"이라며 "기업들이 생산성을 극대화하는 데 기여할 것"이라고 밝혔다.
이번 커맨드 A는 빠른 속도, 강화된 다국어 처리, 낮은 하드웨어 요구 사항 등에서 차별화된 경쟁력을 보이며, 기업 환경에서 강력한 대안으로 떠오를 전망이다.