인공지능 스타트업 코히어(Cohere)가 신형 임베딩 모델인 ‘임베드 4(Embed 4)’를 공개했다. 기업 환경에서 정보 검색과 AI 에이전트 운영을 위한 핵심 기술이자, 비정형 데이터로 가득한 현실 속에서 더욱 정밀한 검색을 가능케 하는 이 모델은 복잡한 멀티모달 데이터를 단일 벡터로 변환해 처리하는 강점을 갖고 있다.
코히어가 밝힌 바에 따르면 임베드 4는 최대 12만 8,000토큰에 달하는 긴 컨텍스트 범위를 지원한다. 이는 약 200페이지에 해당하는 문서를 한 번에 처리할 수 있다는 의미로, 연간 재무보고서나 제품 매뉴얼, 법률 계약서 등 방대한 비정형 문서도 문제없이 처리 가능하다는 점에서 엔터프라이즈 수요에 최적화된 모델로 평가된다. 또한 100개 이상의 언어를 지원하며, 아랍어, 일본어, 한국어, 프랑스어 등 주요 비즈니스 언어에 대한 정교한 활용까지 가능해 글로벌 기업의 멀티지역 정보 통합에 유리하다.
임베드 4의 강점은 다양한 형식의 입력 데이터를 하나의 통합된 벡터로 구조화할 수 있다는 점이다. 텍스트 문서는 물론 이미지, 표, 코드, 도식 등 다양한 정보 유형을 일관되게 표현함으로써, 검색 정확도를 높이고 추론 기반의 AI 모델이 더욱 정밀한 답변을 생성할 수 있도록 돕는다. 특히 금융, 의료, 제조처럼 규제가 까다로운 산업군에서도 문맥 이해력이 뛰어난 것이 특징이다.
코히어는 이번 모델이 스캔 이미지, 손글씨, 왜곡된 문서 등 ‘실제 환경에서 발생하는 소음 데이터’를 견딜 수 있게 학습됐다고 밝혔다. 현실 기업 환경에서는 데이터 전처리 단계에서 이미지를 텍스트로 변환하거나, 여러 형식의 자료를 정제하는 작업이 복잡하게 이루어지는데, 임베드 4는 이러한 과정을 간소화하면서도 높은 정확도를 유지하는 데 중점을 뒀다.
AI 검색 스타트업 아고라(Agora)는 해당 모델 도입 사례를 공개하며 멀티모달 임베딩 기술이 자사 e커머스 검색의 정확도와 속도를 크게 향상시켰다고 밝혔다. 아고라의 창립자인 파람 재기(Param Jaggi)에 따르면, 이 기술 덕분에 제품 정보에 포함된 이미지 및 복합 텍스트가 단일 임베딩으로 일관되게 처리되어 검색 엔진의 성능이 눈에 띄게 개선됐다는 설명이다.
코히어 측은 앞으로 자사의 생성형 AI 모델 ‘커맨드 A(Command A)’와의 연동에 대해서도 강조했다. 커맨드 A처럼 대화형 AI나 업무용 에이전트는 사용자 질문에 대해 정확하고 빠르게 응답하기 위해 고성능 검색 엔진이 필요하고, 이를 위한 기반으로 임베드 4의 고급 임베딩 기능이 매우 중요하다는 것이다. 이는 허위 생성(hallucination) 방지와 응답 품질 개선 측면에서 핵심적인 역할을 수행한다.
임베드 4는 마이크로소프트 애저 AI 파운드리와 아마존 세이지메이커에서 이용 가능하며, 기업의 개별적 프라이빗 배포 모델로도 활용할 수 있다. 또한 코히어의 생산성 플랫폼 ‘노스(North)’에도 통합돼, 내부 제품 ‘컴퍼스(Compass)’의 시맨틱 검색 기능을 강화하는 데 사용되고 있다. 이처럼 임베드 4는 검색 정확도를 비약적으로 끌어올리는 동시에, 생성형 AI의 전반적 성능을 뒷받침하는 핵심 인프라로 자리매김하고 있다.