맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

오픈소스 수학 AI 'Light-R1-32B' 공개… 144만 원으로 훈련 완료

작성자 이미지
정민석 기자

2025.03.06 (목) 04:49

대화 이미지 1
하트 이미지 1

Light-R1-32B가 공개됐다. 320억 개 매개변수를 가진 이 AI 모델은 144만 원의 저비용으로 훈련을 마쳤으며, 기존 대형 모델을 뛰어넘는 성능을 보였다.

오픈소스 수학 AI 'Light-R1-32B' 공개… 144만 원으로 훈련 완료 / Tokenpost

AI 모델 개발자들이 새로운 오픈소스 수학 모델인 'Light-R1-32B'를 공개했다. 해당 모델은 복잡한 수학 문제 해결에 특화된 AI로, 대형 오픈소스 모델과 비교해 뛰어난 성능을 보이면서도 단 1,000달러(약 144만 원)라는 저렴한 비용으로 훈련을 마쳤다. 특히 모델의 전체 코드, 데이터셋, 학습 과정이 오픈소스로 공개돼 기업과 연구자들이 자유롭게 활용할 수 있다.

Light-R1-32B는 320억 개의 매개변수를 갖춘 모델로, 미국 수학경시대회(AIME) 벤치마크에서 DeepSeek-R1-Distill-Qwen-32B 등 기존 모델을 뛰어넘는 점수를 기록했다. 이를 개발한 연구진은 커리큘럼 기반 지도학습(SFT)과 직접 선호 최적화(DPO) 기법을 적용해 모델의 수학적 추론 능력을 극대화했다고 설명했다.

특히 Nvidia H800 GPU 12개를 이용해 6시간 만에 훈련을 완료한 점이 주목할 만하다. 이는 Alibaba의 오픈소스 'Qwen 2.5-32B-Instruct' 모델을 기반으로 최적화한 결과다. 연구팀은 모델의 학습 데이터를 철저히 검증해 기존 벤치마크들과의 데이터 중복을 방지했으며, 난이도 기반 응답 필터링 기술을 적용해 성능을 향상시켰다.

Light-R1-32B는 Apache 2.0 라이선스에 따라 공개되어, 기업과 개발자가 자유롭게 수정·상업적 활용이 가능하다. 이에 따라 AI 스타트업과 연구 기관들은 비용 부담 없이 고성능 수학 AI 모델을 활용할 수 있는 기회를 얻게 됐다. 연구진은 향후 강화학습을 도입해 더욱 정교한 수학적 추론이 가능한 시스템으로 발전시킬 계획이다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

1

추천

1

스크랩

스크랩

데일리 스탬프

1

매일 스탬프를 찍을 수 있어요!

등급 아이콘

릴라당

06:40

댓글 1

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

릴라당

2025.03.06 06:40:19

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1