엔비디아(NVDA)가 오픈소스 AI 모델 시장에 본격적으로 뛰어들었다. 18일(현지시간) GTC 행사에서 엔비디아는 새로운 ‘Llama Nemotron’ 리즈닝 모델을 공개하며, 에이전트형 AI(AI agents) 워크로드의 혁신을 예고했다. 이번 모델은 지난 1월 CES에서 발표된 ‘Nemotron’ 모델의 확장판으로, 보다 고도화된 추론 능력을 제공하는 것이 특징이다.
올해 AI 시장에서는 논리적 추론을 수행하는 모델들이 급부상하고 있다. 특히, 딥시크(DeepSeek)의 ‘DeepSeek R1’이 오픈소스 기반의 강력한 추론 능력을 선보이며 업계를 뒤흔들었다. 이에 엔비디아는 Llama 기반의 Nemotron 모델을 통해 경쟁력을 확보하고, 비즈니스 환경에서 활용 가능한 고차원 AI 솔루션을 제공하려는 전략을 내세웠다.
엔비디아 측은 “에이전트형 AI는 자율적으로 사고하고, 계획을 수립하며, 실행 및 결과 검토까지 수행하는 시스템”이라며, “에이전트가 문맥을 이해하고, 복잡한 요청을 처리하며, 사용자 의도를 파악해 실시간으로 적응하는 것이 중요하다”고 설명했다. 이를 위해 Llama Nemotron 모델은 알고리즘을 최적화하고, 고도화된 사후 훈련 기법을 적용했다.
엔비디아는 이번 모델을 운영 환경에 따라 세 가지 버전으로 출시했다. ‘Nemotron Nano’는 엣지 및 소규모 배포에 적합한 경량 모델이며, ‘Nemotron Super’는 단일 데이터센터 GPU에서 최적의 성능을 발휘하는 균형 잡힌 모델이다. ‘Nemotron Ultra’는 다중 GPU 환경에서 최고의 추론 정확도를 제공하도록 설계되었다. 현재 Nano와 Super는 AI.NVIDIA.com을 통해 다운로드 가능하며, Ultra 모델은 곧 출시될 예정이다.
하이브리드 방식의 추론 기능도 이번 발표의 핵심 요소다. 엔비디아는 사용자가 필요에 따라 AI의 논리적 추론 기능을 활성화하거나 비활성화할 수 있도록 했다. 이는 단순한 정보 검색 시 연산량을 줄이고, 복잡한 문제를 해결할 때만 고성능 추론을 적용하는 방식이다. 이를 통해 기업은 AI 워크로드를 유연하게 최적화할 수 있다.
추론 모델뿐만 아니라 엔비디아는 기업 환경에서의 활용도를 높이기 위해 ‘Agent AI-Q’ 프레임워크도 발표했다. 이는 AI 에이전트가 여러 데이터 유형과 외부 도구를 효과적으로 연계할 수 있도록 돕는 개방형 프레임워크로, 4월 정식 출시될 예정이다.
이번 발표는 기업들이 AI 에이전트를 보다 쉽게 도입하고 운영할 수 있도록 하는 데 초점을 맞추고 있다. 데이터 주권 및 보안 우려로 클라우드 AI 도입을 망설이던 기업들에게 오픈소스 기반의 AI 솔루션이 강력한 대안이 될 전망이다. 또한, 하이브리드 추론 기술을 통해 연산 비용을 절감하면서도 고차원적인 AI 활용이 가능해질 것으로 보인다.
AI 기술이 단순한 챗봇 수준을 넘어 논리적 추론이 가능한 단계로 진화하면서, 엔비디아의 새로운 모형이 기업 AI 시장에 어떤 변화를 가져올지 주목된다.