구글, '생각하는 AI' 제미니 2.5 플래시 공개…성능·경제성 '두 토끼' 잡았다

| 김민준 기자

구글(GOOGL)이 자사의 차세대 인공지능 모델인 ‘제미니(Gemini) 2.5 플래시(Flash)’를 개발자 미리보기(preview) 버전으로 공개했다. 이번 모델은 복잡한 문제 해결 능력을 한층 강화한 하이브리드 추론 AI로, 구글 AI 스튜디오와 자사의 클라우드 플랫폼 ‘버텍스 AI(Vertex AI)’를 통해 개발자에게 제공된다.

‘제미니 2.5 플래시’는 기존 ‘2.0 플래시’ 모델의 빠른 반응성과 저지연 특성을 계승하면서, 복잡한 명령어를 단계별로 나눠 이해하고 처리하는 능력을 갖춘 것이 특징이다. 구글 측은 이를 ‘생각하는(thinking) AI’라 칭하며, 개발자에게 추론 기능을 켜고 끌 수 있는 선택권과 함께 ‘생각 예산(thinking budget)’을 설정하는 기능도 제공한다고 설명했다. 이 예산 설정 기능을 통해 품질, 속도, 비용 사이의 균형을 맞출 수 있다는 것이다.

고급 추론 기능은 많은 정보 단위 토큰(token)을 소모하게 되지만, 구글은 복잡도에 따라 사용할 토큰량을 자동 조정하거나 사용자가 직접 상한선을 설정하도록 해 유연성을 확보했다. 토큰 단가는 거의 15센트(약 220원)부터 시작되며, 추론 기능을 활성화할 경우 백만 개당 최대 $3.50(약 5,000원)까지 상승한다.

일상적인 질문에는 빠르게 반응하고, 중급 수준의 명령에는 캘린더 연동 일정 정리 같은 작업을 수행하는 것이 가능하다. 고급 추론에서는 수학 함수 코딩이나 웹 게임 제작까지 지원하지만, 여전히 사용자의 입력에 따라 성능 편차가 나타날 수 있다는 게 구글 측의 설명이다.

성능 면에서도 뚜렷한 진전을 보였다. ‘제미니 2.5 플래시’는 AI 모델의 이해 및 응답 능력을 측정하는 시험인 ‘휴머니티스 라스트 이그잼(Humanity’s Last Exam)’에서 12.1%의 점수를 획득하며, 이전 모델인 2.0 플래시의 5.1%를 크게 웃돌았다. 이 시험은 수학, 인문학, 자연과학 등에서 인간의 고난도 질문을 기반으로 설계된 테스트로 알려져 있다.

또한 제미니 2.5 플래시는 챗봇 성능 비교 플랫폼인 ‘LMArena’의 고난도 프롬프트 평가에서도 강력한 성능을 입증했으며, 동일한 세대의 프리미엄 모델인 ‘제미니 2.5 프로’에 이어 두 번째로 높은 점수를 기록했다.

구글은 이번 모델이 가격 대비 성능 면에서 경쟁사를 압도하는 주력 AI 모델로 자리매김할 것이라고 자신했다. 특히 AI 솔루션을 구축하는 기업과 개발자들이 정확도와 비용 문제 사이에서 중요한 선택을 할 수 있는 유의미한 옵션이 될 것이라며 기대감을 나타냈다.