구글이 최신 인공지능 모델 제미니 2.5 플래시(Gemini 2.5 Flash)를 선보이며 AI 운용 효율성과 비용 절감을 동시에 겨냥한 전략을 내놨다. 이 모델은 AI 처리 과정에서의 ‘생각 예산(thinking budget)’ 개념을 도입, 사용자가 원하는 수준의 연산 능력을 직접 조절할 수 있도록 설계됐다. 이를 통해 복잡한 문제에 대해 AI가 수행하는 추론의 깊이를 선택할 수 있게 됨으로써, 고비용 구조였던 기존 AI 생태계에 구조적 변화를 가져올 수 있다는 평가가 나온다.
제미니 2.5 플래시는 현재 구글 AI 스튜디오와 버텍스 AI 플랫폼을 통해 프리뷰 형태로 공개됐다. 구글은 이 모델이 AI 시장에서 제기되던 ‘성능 대비 가격’ 문제를 해결하면서도 개선된 사고력을 제공한다고 강조했다. 실제로 이번 모델의 가장 큰 특징은 추론 기능을 끄거나 켤 수 있는 유연성이다. 간단한 정보 검색이나 번역 등에는 낮은 비용의 기본 기능만 사용하는 반면, 수학 문제 해결 등 고도화된 작업에는 ‘생각 예산’을 조정해 더 많은 연산 자원을 투입할 수 있다.
가격 책정 방식도 대폭 개편됐다. 입력 토큰 100만 개당 비용은 0.15달러(약 220원)로 고정되며, 출력 토큰의 경우 추론을 끄면 0.60달러(약 860원), 추론을 켜면 3.50달러(약 5,040원)에 달한다. 약 6배 차이의 요금 구조는 복잡한 추론 과정이 연산적으로 얼마나 많은 자원이 소모되는지를 보여주는 대목이다. 구글 측은 최대 24,576개 토큰까지 조절 가능한 이 ‘생각 예산’이 문제의 복잡도에 따라 자동으로 최적화된다고 밝혔다.
성능 면에서는 주요 벤치마크 지표에서 괄목할 만한 결과를 보였다. '휴머니티즈 라스트 이그잼'에서는 12.1%로 앤트로픽의 클로드 3.7 소네트(8.9%)와 딥시크 R1(8.6%)을 압도했으며, 수학 및 논리 기반 시험인 GPQA 다이아몬드와 AIME에서도 각각 78.3%, 최고 88%의 정답률을 기록했다. 이 같은 성과는 모델 크기는 유지하면서도 연산 최적화를 이룬 이번 업그레이드의 기술력을 입증한다는 분석이다.
이번 출시와 함께 구글은 AI 전략 전반에 걸친 전방위적인 움직임을 보이고 있다. 2.5 플래시 공개 직전에는 제미니 어드밴스드 구독자에게 비디오 생성 기능 ‘Veo 2’를 추가했으며, 미국 내 모든 대학생을 대상으로 오는 2026년 봄까지 제미니 어드밴스드를 무료로 제공한다고 발표했다. 이는 차세대 지식 노동자층을 미리 선점하겠다는 의도를 담은 조치다.
구글 측은 “2.5 플래시를 사용하면 비용과 속도 측면에서 최적의 선택을 할 수 있다”며 기업 고객들이 작업 목적에 맞춰 AI 추론 강도를 선택해 예산을 절감할 수 있도록 구성했다고 강조했다. 일례로, “캐나다에 몇 개의 주가 있나?” 같은 단순 질문에는 최소한의 추론만 사용되고, “철근 보강 구조물의 장력 계산 공식은?” 같은 질문에는 고급 추론 회로가 자동 활성화된다.
2.5 플래시는 현재 제미니 앱에서도 ‘2.5 플래시(실험적)’이라는 이름으로 소비자들이 직접 사용해볼 수 있다. 지난 모델인 ‘2.0 씽킹(실험적)’을 대체하는 형태로 제공되며, 구글은 이를 통해 다양한 사용자 피드백을 수렴하겠다는 방침이다.
AI의 상용화가 본격화되면서 성능 이외에도 가격 및 자원 관리의 중요성이 부각되는 가운데, 구글의 이 같은 행보는 생성형 AI 시장의 성숙 단계를 예고하는 신호탄이 될 것으로 전망된다. 특히 기업 입장에서는 고도화된 작업에만 AI 추론을 할당함으로써 전체 운영 비용을 제어할 수 있다는 점에서 매력적인 선택지가 될 것으로 보인다.