AI 모델 개발자들이 새로운 오픈소스 수학 모델인 'Light-R1-32B'를 공개했다. 해당 모델은 복잡한 수학 문제 해결에 특화된 AI로, 대형 오픈소스 모델과 비교해 뛰어난 성능을 보이면서도 단 1,000달러(약 144만 원)라는 저렴한 비용으로 훈련을 마쳤다. 특히 모델의 전체 코드, 데이터셋, 학습 과정이 오픈소스로 공개돼 기업과 연구자들이 자유롭게 활용할 수 있다.
Light-R1-32B는 320억 개의 매개변수를 갖춘 모델로, 미국 수학경시대회(AIME) 벤치마크에서 DeepSeek-R1-Distill-Qwen-32B 등 기존 모델을 뛰어넘는 점수를 기록했다. 이를 개발한 연구진은 커리큘럼 기반 지도학습(SFT)과 직접 선호 최적화(DPO) 기법을 적용해 모델의 수학적 추론 능력을 극대화했다고 설명했다.
특히 Nvidia H800 GPU 12개를 이용해 6시간 만에 훈련을 완료한 점이 주목할 만하다. 이는 Alibaba의 오픈소스 'Qwen 2.5-32B-Instruct' 모델을 기반으로 최적화한 결과다. 연구팀은 모델의 학습 데이터를 철저히 검증해 기존 벤치마크들과의 데이터 중복을 방지했으며, 난이도 기반 응답 필터링 기술을 적용해 성능을 향상시켰다.
Light-R1-32B는 Apache 2.0 라이선스에 따라 공개되어, 기업과 개발자가 자유롭게 수정·상업적 활용이 가능하다. 이에 따라 AI 스타트업과 연구 기관들은 비용 부담 없이 고성능 수학 AI 모델을 활용할 수 있는 기회를 얻게 됐다. 연구진은 향후 강화학습을 도입해 더욱 정교한 수학적 추론이 가능한 시스템으로 발전시킬 계획이다.