맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

캐나다 AI 스타트업 코히어, 초고효율 '커맨드 A' 공개… GPT-4o와 경쟁

작성자 이미지
정민석 기자

2025.03.14 (금) 00:40

대화 이미지 0
하트 이미지 1

코히어가 기업용 AI 모델 '커맨드 A'를 발표했다. 낮은 GPU 요구량과 256K 컨텍스트 지원으로 GPT-4o와 경쟁한다.

캐나다 AI 스타트업 코히어, 초고효율 '커맨드 A' 공개… GPT-4o와 경쟁 / Tokenpost

캐나다 AI 스타트업 코히어(Cohere)가 획기적인 다국어 지원 AI 모델 '커맨드 A(Command A)'를 공개했다. 이번 신제품은 기업용 AI 애플리케이션을 겨냥한 것으로, 단 두 개의 GPU만으로도 구동이 가능하다는 점에서 주목을 받고 있다.

커맨드 A는 지난해 출시된 '커맨드 R(Command R)' 및 '커맨드 R+(Command R+)'의 후속작으로, 검색 기반 생성(retrieval-augmented generation, RAG), 외부 도구 연계, 그리고 기업 환경 최적화를 중점적으로 개선했다. 특히 AI 모델의 연산 효율성을 높이고 응답 속도를 향상시키는 데 집중했으며, 금융, 의료, 과학, 법률 등 즉각적인 응답이 요구되는 산업 분야에서 강력한 경쟁력을 갖출 것으로 전망된다.

이 모델은 오픈AI의 GPT-4o 및 딥식(DeepSeek)-V3 등과 경쟁하는 수준의 성능을 보이면서도, 하드웨어 요구 사항을 대폭 낮춘 것이 특징이다. 기존 모델이 128,000개 토큰의 컨텍스트 길이를 지원했던 것과 달리, 커맨드 A는 이를 256,000개 토큰으로 늘려 한 번에 처리할 수 있는 정보량을 두 배로 확대했다. 이는 약 600페이지 분량의 텍스트를 한 번에 처리할 수 있는 수준이다.

코히어 측은 커맨드 A가 AI 응용 분야에서 속도와 비용 절감 측면에서 탁월한 강점을 제공한다고 강조했다. 실제로 GPT-4o 대비 1.75배, 딥식-V3 대비 2.4배 빠른 토큰 생성 속도를 기록했으며, 첫 응답 시간도 대폭 단축했다. 또한 A100 및 H100 GPU 두 개만으로도 원활한 구동이 가능해, 기존 32개 이상의 GPU가 필요했던 모델들과 비교해 하드웨어 비용을 크게 줄였다.

다국어 지원 역시 커맨드 A의 주요 특징 중 하나다. 23개 주요 언어를 지원하며, 특히 아랍어 방언 처리 능력이 크게 개선됐다. 벤치마크 테스트에서 커맨드 A는 영어-아랍어 번역 정확도 98.2%를 기록하며 GPT-4o(92.2%) 및 딥식-V3(94.9%)를 능가했다.

현재 커맨드 A는 코히어 플랫폼에서 이용 가능하며, 연구 목적으로 한정된 오픈 웨이트 버전이 허깅페이스(Hugging Face)를 통해 제공되고 있다. 가격은 입력 토큰 100만 개당 2.50달러, 출력 토큰 100만 개당 10달러로 책정됐다. 기업 맞춤형 온프레미스 배포도 별도 요청을 통해 제공된다.

코히어 개발 책임자인 드와라크나스 가네산(Dwaraknath Ganesan)은 "커맨드 A는 단 두 개의 H100 GPU로 구동 가능하며, 256K 컨텍스트 길이, 다국어 지원, 외부 도구 연계 기능 등을 갖춘 강력한 AI 모델"이라며 "기업들이 생산성을 극대화하는 데 기여할 것"이라고 밝혔다.

이번 커맨드 A는 빠른 속도, 강화된 다국어 처리, 낮은 하드웨어 요구 사항 등에서 차별화된 경쟁력을 보이며, 기업 환경에서 강력한 대안으로 떠오를 전망이다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

0

추천

1

스크랩

스크랩

데일리 스탬프

1

매일 스탬프를 찍을 수 있어요!

등급 아이콘

SSdc

12:31

댓글 0

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요
1