알리바바, 오픈AI 능가한 오픈소스 AI 'Qwen3' 전격 공개

| 김민준 기자

중국 최대 전자상거래 기업 알리바바(BABA)가 자사의 오픈소스 인공지능 모델 'Qwen3' 시리즈를 전격 공개하며 글로벌 AI 경쟁에 다시 불을 지폈다. Qwen3은 공개된 모델 가운데 성능 면에서 최고 수준을 자랑하며, 오픈AI(OpenAI)의 'o1'이나 딥시크(DeepSeek)의 'R1' 같은 독점 상용 모델과도 유사한 수준에 이르는 것으로 평가된다.

Qwen3의 핵심은 총 여덟 개에 달하는 멀티모달 모델 구성으로, 이 가운데 두 개는 '혼합 전문가(Mixture-of-Experts; MoE)' 구조를 채택해 작업에 따라 필요한 하위 모델만 활성화하는 방식으로 효율성과 전문성을 동시에 강화했다. 이 기술은 이미 프랑스 AI 스타트업 미스트랄(Mistral)이 선보인 바 있는 접근법으로, Qwen3에서는 이를 한층 확장했다.

기술적으로 가장 주목받는 모델은 매개변수 2,350억 개 규모의 ‘Qwen3-235B-A22B’다. 이 모델은 500개의 질문을 포함한 벤치마크 테스트 ArenaHard에서 딥시크 R1과 오픈AI o1을 웃도는 성능을 기록했으며, 구글(GOOGL)의 '제미니 2.5-Pro'와 견줄 만한 수준에 도달했다는 점에서 시장의 관심이 집중되고 있다.

알리바바는 이번 모델에 "하이브리드 추론(hybrid reasoning)" 기능을 도입했다. 이는 사용자가 빠르고 간결한 응답을 원할 경우와 복잡하고 전문적인 문제 해결을 위해 심화된 사고 단계가 필요한 경우를 구분해 대응할 수 있도록 설계된 시스템이다. 이러한 기능은 오픈AI가 일부 시리즈에 반영했던 컴퓨팅 집약형 접근과 유사하며, Qwen은 해당 기능을 Qwen Chat 환경에서 /think 등의 프롬프트를 통한 수동 조작 방식으로 제공하고 있다.

이번 공개는 단순한 모델 배포를 넘어, 오픈소스 생태계에 실질적인 기여를 가능케 한다. Hugging Face, GitHub, Kaggle 등 주요 플랫폼에서 이미 배포됐으며, 알리바바는 구체적인 코드도 아파치 2.0 라이선스 하에 공개해 자유로운 재사용과 상업 활용이 가능하도록 했다. 이는 메타(META)나 구글과 같은 일부 기업들이 제약 있는 라이선스를 고수하고 있는 점과 명확히 대비된다.

앞서 버전인 Qwen2.5 대비 Qwen3은 학습 데이터를 두 배로 늘려 36조 토큰에 달하는 대규모 데이터를 활용했고, 웹 크롤링, 문서 추출, 수학 및 코딩 중심의 합성 데이터까지 포함해 어린 모델임에도 불구하고 성능 향상이 두드러졌다. 퍼포먼스를 극대화하기 위한 3단계 사전 훈련과 4단계 후속 강화 학습도 이뤄졌다.

엔지니어링 측면에서도 확장성이 뛰어나다. OpenAI API 호환 모델로 쉽게 전환할 수 있고, 미세 조정(Fine-tuning)을 위해 LoRA와 QLoRA를 통한 사내 튜닝도 지원한다. 또한 사용자는 일반 노트북부터 다중 GPU 서버에 이르기까지 다양한 컴퓨팅 환경에 맞춰 0.6B에서 32B까지 다양한 모델을 활용할 수 있다.

보안과 기업 운용 측면에서도 눈에 띄는 이점이 있다. MoE 구조를 통해 실제 작동하는 파라미터 수를 대폭 줄여 메모리 사용을 절감하는 동시에, 모델 사용 시 공격 표면도 좁힌다. 또한 사내 서버에서 직접 가중치를 운용할 수 있어 민감 데이터의 로깅 및 검토가 가능하다.

알리바바 측은 이번 발표가 단순 모델 공개를 넘어, 향후 AGI(인공지능 일반화)와 ASI(초지능 인공지능)로 이어지는 로드맵의 중요한 이정표가 될 것이라고 밝혔다. 실제로 Qwen3의 다음단계 개발 계획에는 컨텍스트 길이 확장, 멀티모달 처리 기능 강화, 환경 기반 강화 학습 등이 포함돼 있다.

AI 산업이 글로벌 경쟁의 핵심 전선으로 떠오르면서 알리바바와 같은 중국 기업들의 행보는 더욱 주목받고 있다. Qwen3은 단순한 기술 진보를 넘어, 오픈소스 AI 생태계 내에서 메타, 구글, 오픈AI, 아마존(AMZN), 마이크로소프트(MSFT), 안트로픽(Anthropic) 등과 어깨를 나란히 할 수 있는 *실질적인 대안*으로 떠오르고 있다. 이는 AI를 도입하려는 전 세계 기업들, 특히 비용 효율과 유연성을 중시하는 조직들에게 매력적인 선택지를 제공한다.