스탠퍼드 대학과 워싱턴 대학의 연구진이 단 50달러(약 7만 2,500원) 미만의 클라우드 컴퓨팅 비용으로 OpenAI의 'O1'과 경쟁할 수 있는 AI 추론 모델을 개발했다. 해당 연구는 최근 공개된 논문을 통해 발표됐으며, 연구진은 이 모델을 'S1'이라 명명했다. S1은 수학 및 코딩 능력을 평가하는 테스트에서 OpenAI의 'O1' 및 DeepSeek의 'R1'과 유사한 성능을 보였다.
연구진은 기존에 공개된 AI 모델을 기반으로 S1을 구축했다. 이 과정에서 '디스틸레이션(distillation)' 기법을 사용해 다른 AI 모델의 추론 능력을 학습할 수 있도록 조정했다. 특정 AI 모델의 답변을 바탕으로 학습하는 이 기법을 활용해 S1은 구글의 최신 AI 모델인 '제미니 2.0 플래시 싱킹 실험(Gemini 2.0 Flash Thinking Experimental)'을 기반으로 개발됐다.
현재 S1과 관련된 데이터 및 코드베이스는 깃허브(GitHub)를 통해 공개돼 있으며, 누구나 다운로드하여 사용할 수 있도록 설계됐다. 연구진은 S1을 학습시키는 데 1,000개의 질문 데이터셋을 활용했으며, 훈련 과정에는 16개의 엔비디아(Nvidia) H100 GPU를 사용해 30분 이내에 완료했다. 스탠퍼드 연구원 니클라스 뮤니호프(Niklas Muennighoff)는 해당 컴퓨팅 리소스를 현재 시세로 환산하면 약 20달러(약 2만 9,000원)에 불과하다고 밝혔다.
이 같은 연구 결과는 AI 기술이 거대 테크 기업의 전유물이 아닐 수 있음을 시사한다. 기존의 고비용 AI 모델을 저렴하게 복제할 수 있는 환경이 조성되면서, AI 모델의 범용화와 더불어 시장 내 경쟁이 더욱 격화될 것으로 예상된다. 그러나 이러한 기술 발전에 대한 법적·윤리적 논란도 불거지고 있다. OpenAI는 앞서 DeepSeek이 자사 API에서 데이터를 불법적으로 수집해 모델 학습에 활용했다고 주장한 바 있으며, 유사 사례가 반복될 경우 AI 산업 전반에 미칠 영향이 더욱 커질 전망이다.
한편, 메타(Meta), 구글(Google), 마이크로소프트(MSFT) 등 주요 빅테크 기업들은 올해 AI 인프라에 천문학적인 규모의 투자를 계획 중이다. 하지만 연구진은 이러한 막대한 예산 없이도 혁신적인 AI 모델을 개발할 수 있는 가능성을 이번 연구를 통해 시사했다. 연구진은 S1이 단순한 비용 절감의 사례를 넘어 AI 모델의 접근성을 높이는 계기가 될 수 있기를 기대하고 있다.