맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

알리바바(BABA), AI 모델 공개에 8% 급등… QwQ-32B 기대감 반영

작성자 이미지
정민석 기자

2025.03.07 (금) 05:57

대화 이미지 1
하트 이미지 1

알리바바가 오픈소스 AI 모델 'QwQ-32B'를 공개하며 주가가 8% 이상 상승했다. 시장은 모델의 경쟁력과 AI 투자 확대 계획에 주목하고 있다.

알리바바(BABA), AI 모델 공개에 8% 급등… QwQ-32B 기대감 반영 / Tokenpost

알리바바(BABA)의 주가가 8% 이상 급등했다. 이는 자사가 새롭게 공개한 오픈소스 추론 모델 ‘QwQ-32B’에 대한 시장의 기대감이 반영된 결과다.

알리바바가 공개한 QwQ-32B는 기존 딥시크-R1(DeepSeek-R1) 모델과 유사한 성능을 제공하는 인공지능(AI) 모델로, 32.5억 개의 매개변수를 보유하고 있다. 이는 딥시크-R1의 6710억 개 매개변수 대비 대폭 축소된 규모다. 하지만 R1이 전체 매개변수 중 370억 개만 활성화해 결과를 도출하는 방식으로 운영되는 점을 고려하면, QwQ-32B의 성능이 충분한 경쟁력을 갖췄다는 평가가 나온다.

이 모델은 AI의 핵심 기술로 꼽히는 ‘트랜스포머(Transformer)’ 아키텍처를 기반으로 개발됐다. 특히, 회전 위치 인코딩(rotary positional encoding)을 적용해 문장 내 의미적 관계를 보다 정교하게 해석할 수 있도록 설계됐다. 또한 최대 13만 1,072개의 토큰을 처리할 수 있으며, 코드 작성, 수학 문제 해결, 외부 애플리케이션과의 상호작용 등 다양한 추론 작업에서 강점을 보인다.

알리바바는 QwQ-32B를 강화학습(Reinforcement Learning) 기법을 활용해 두 차례의 훈련 과정을 거쳐 개발했다. 1차 훈련에서는 수학 및 프로그래밍 능력을 향상시키는 데 초점을 맞췄으며, 2차 훈련을 통해 전반적인 문제 해결 능력을 강화했다. 테스트 결과 QwQ-32B는 다섯 개의 평가 항목 중 세 가지에서 딥시크-R1을 능가하는 성능을 기록했다. 특히 외부 시스템과의 상호작용 부문에서 6% 높은 점수를 획득하며 강력한 확장성을 입증했다.

이번 모델 공개는 알리바바가 오는 3년간 약 3800억 위안(약 53조 원)을 AI 인프라 구축에 투자하겠다는 계획을 발표한 직후 이뤄졌다. 이는 지난 10년간 AI 및 클라우드 부문에 투자한 금액보다 많은 수준으로, 회사가 AI 산업을 미래 성장 동력으로 삼겠다는 의지를 분명히 한 것으로 해석된다.

한편, 중국의 다른 IT 대기업들도 대형 언어 모델(LLM) 개발 경쟁에 박차를 가하고 있다. 텐센트(Tencent)는 최근 ‘훈위안 터보 S(Hunyuan Turbo S)’라는 추론 모델을 공개했으며, 이 모델은 1초 내 응답을 제공하는 특징을 갖췄다. AI 분야에서 글로벌 기술 기업들이 보다 정밀하고 효율적인 모델 개발에 집중하는 가운데, 알리바바의 QwQ-32B가 시장에서 어떤 성과를 거둘지 주목된다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

1

추천

1

스크랩

스크랩

데일리 스탬프

1

매일 스탬프를 찍을 수 있어요!

등급 아이콘

릴라당

07:33

댓글 1

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

릴라당

2025.03.07 07:33:41

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1