알리바바(BABA)의 주가가 8% 이상 급등했다. 이는 자사가 새롭게 공개한 오픈소스 추론 모델 ‘QwQ-32B’에 대한 시장의 기대감이 반영된 결과다.
알리바바가 공개한 QwQ-32B는 기존 딥시크-R1(DeepSeek-R1) 모델과 유사한 성능을 제공하는 인공지능(AI) 모델로, 32.5억 개의 매개변수를 보유하고 있다. 이는 딥시크-R1의 6710억 개 매개변수 대비 대폭 축소된 규모다. 하지만 R1이 전체 매개변수 중 370억 개만 활성화해 결과를 도출하는 방식으로 운영되는 점을 고려하면, QwQ-32B의 성능이 충분한 경쟁력을 갖췄다는 평가가 나온다.
이 모델은 AI의 핵심 기술로 꼽히는 ‘트랜스포머(Transformer)’ 아키텍처를 기반으로 개발됐다. 특히, 회전 위치 인코딩(rotary positional encoding)을 적용해 문장 내 의미적 관계를 보다 정교하게 해석할 수 있도록 설계됐다. 또한 최대 13만 1,072개의 토큰을 처리할 수 있으며, 코드 작성, 수학 문제 해결, 외부 애플리케이션과의 상호작용 등 다양한 추론 작업에서 강점을 보인다.
알리바바는 QwQ-32B를 강화학습(Reinforcement Learning) 기법을 활용해 두 차례의 훈련 과정을 거쳐 개발했다. 1차 훈련에서는 수학 및 프로그래밍 능력을 향상시키는 데 초점을 맞췄으며, 2차 훈련을 통해 전반적인 문제 해결 능력을 강화했다. 테스트 결과 QwQ-32B는 다섯 개의 평가 항목 중 세 가지에서 딥시크-R1을 능가하는 성능을 기록했다. 특히 외부 시스템과의 상호작용 부문에서 6% 높은 점수를 획득하며 강력한 확장성을 입증했다.
이번 모델 공개는 알리바바가 오는 3년간 약 3800억 위안(약 53조 원)을 AI 인프라 구축에 투자하겠다는 계획을 발표한 직후 이뤄졌다. 이는 지난 10년간 AI 및 클라우드 부문에 투자한 금액보다 많은 수준으로, 회사가 AI 산업을 미래 성장 동력으로 삼겠다는 의지를 분명히 한 것으로 해석된다.
한편, 중국의 다른 IT 대기업들도 대형 언어 모델(LLM) 개발 경쟁에 박차를 가하고 있다. 텐센트(Tencent)는 최근 ‘훈위안 터보 S(Hunyuan Turbo S)’라는 추론 모델을 공개했으며, 이 모델은 1초 내 응답을 제공하는 특징을 갖췄다. AI 분야에서 글로벌 기술 기업들이 보다 정밀하고 효율적인 모델 개발에 집중하는 가운데, 알리바바의 QwQ-32B가 시장에서 어떤 성과를 거둘지 주목된다.