PANews에 따르면 Qwen 팀이 'Qwen2.5-VL-32B-Instruct' 모델을 오픈소스로 출시했다. 이 모델은 이미지 이해, 수학적 추론, 텍스트 생성 등 다양한 작업에서 향상된 성능을 갖췄으며, 총 320억 개의 매개변수를 포함하고 있다. 특히 강화 학습을 적용해 응답 스타일을 개선함으로써 인간 선호도에 더욱 부합하는 답변을 제공한다. 이는 이전에 공개된 720억 매개변수 모델(Qwen2.5-VL-72B)보다 멀티모달 평가(MMMU, MathVista)에서 우수한 성능을 기록했다.
이번 32B 모델은 이전 Qwen2.5-VL 시리즈 대비 여러 부분에서 개선됐다. 응답 스타일을 조정해 보다 상세하고 가독성이 높은 답변을 생성하며, 수학적 추론 능력이 향상돼 복잡한 수학 문제를 해결하는 정확도가 높아졌다. 또한 이미지 이해 및 분석에서도 강점을 보여, 이미지 해석, 콘텐츠 인식, 시각적 논리 추론 등에서 더욱 정밀한 성과를 보였다.