구글(GOOGL)이 자사 최신 대형 언어 모델(Large Language Model)인 제미니 2.5 프로(Gemini 2.5 Pro)를 공개 프리뷰 형태로 출시하며 본격적인 상용화에 들어갔다. 이 모델은 추론 및 논리적 사고에 최적화된 기능을 갖춘 버전으로, 대규모 이용자 기반을 가진 응용 서비스를 구축하려는 개발자들에게 적합하다.
그동안 제미니 2.5 프로는 하루 25건, 분당 최대 5건의 요청만 가능한 제한된 무료 API 형태로 제공됐다. 하지만 이번 공개 프리뷰를 통해 유료 요금제가 추가되면서 요청량이 분당 최대 2,000건으로 상향됐고, 일일 제한도 폐지됐다. 구글은 이 모델이 분당 최대 800만 토큰 분량의 데이터를 처리할 수 있다고 밝혔다.
요금은 입력 토큰 100만 개당 $1.25(약 1,800원), 출력 토큰은 $15(약 2만 1,600원)부터 시작되며, 단일 프롬프트 내 토큰 수가 20만 개를 넘으면 입력 단가는 $2.5(약 3,600원)로 상향 조정된다. 이 가격 구조는 경쟁 모델인 앤스로픽(Anthropic)의 클로드 3.7 소넷보다 저렴하고, 오픈소스 모델 딥시크-R1 대비로는 다소 높은 수치다.
제미니 2.5 프로는 지난달 첫선을 보인 직후 유저 기반 성능 벤치마크인 LMArena에서 타사를 큰 폭으로 앞서며 1위를 차지했고, 미 수학올림피아드 예선 시험인 AIME 2025에선 86.7%라는 높은 점수를 획득했다. 구글은 이 모델이 비용을 높이는 '추론 시 최적화 기법(test-time compute)' 없이도 여러 논리 최적화 모델을 능가하는 성능을 보였다고 강조했다.
모델 구조 측면에서도 이전 버전인 제미니 2.0 프로 대비 핵심 알고리즘과 후속 학습 절차가 크게 개선됐다. 후속 학습(post-training)은 대형 언어 모델의 초기 학습 이후, 추가 데이터를 통해 결과의 정밀도를 높이는 고도화 과정이다.
한편 오픈AI(OpenAI) 역시 시장 수성에 박차를 가하고 있다. 최근 샘 알트먼(Sam Altman) 최고경영자는 향후 2주 내 논리 최적화 모델 o3와 미공개 모델 o4-미니를 각각 출시할 계획이라고 밝혔다. 이 가운데 o3는 지난해 프리뷰만 진행했던 버전으로 별도 서비스로 제공되는 것은 이번이 처음이다.
오픈AI는 향후 이 두 모델을 통합한 차세대 인공지능 시스템 GPT-5를 준비 중이며, 이를 통해 챗GPT(ChatGPT)의 무료 버전과 유료 버전 모두를 구동할 예정이다. AI 산업의 주도권 경쟁이 한층 치열해지는 가운데, 구글과 오픈AI의 차세대 모델 전략이 향후 시장 판도를 좌우할 핵심 변수로 부상하고 있다.