엔비디아, 차세대 AI 에이전트 모델 'Llama Nemotron' 공개… 성능 5배↑

정민석 기자

2025.03.19 (수) 05:42

엔비디아가 GTC 2025에서 AI 에이전트 모델 'Llama Nemotron'을 발표했다. 해당 모델은 추론 속도를 최대 5배 향상시켰으며, 마이크로소프트와 SAP 등 글로벌 기업들과 협업을 이어간다.

엔비디아, 차세대 AI 에이전트 모델 'Llama Nemotron' 공개… 성능 5배↑ / TokenPost Ai

엔비디아(NVDA)가 차세대 AI 에이전트 기술 발전을 위한 핵심 모델과 인프라를 공개했다.

미국 캘리포니아에서 열린 연례 GTC 2025 컨퍼런스에서 엔비디아는 새로운 'Llama Nemotron' AI 모델군을 발표했다. 이 모델들은 현재 업계 표준이 된 메타(Meta)의 오픈소스 Llama 모델을 기반으로 한 것으로, 엔비디아의 정교한 후처리 및 성능 향상 기법이 적용돼 정확도가 20% 향상됐으며 추론 속도는 최대 5배 빨라졌다고 회사 측은 밝혔다.

엔비디아는 Llama Nemotron 모델을 'NIM 마이크로서비스' 플랫폼을 통해 제공하며, 이를 세 가지 버전(Nano, Super, Ultra)으로 최적화했다. Nano 모델은 개인용 컴퓨터와 엣지 디바이스를 겨냥했으며, Super 모델은 단일 GPU에서 실행되도록 설계됐다. Ultra 모델은 다중 GPU 환경에서 최대의 성능을 발휘하도록 만들어졌다.

이러한 고성능 AI 모델은 이미 여러 글로벌 기술 기업들과 협업을 통해 실제 서비스에 적용되고 있다. 마이크로소프트(MSFT)는 자체 클라우드 플랫폼 '애저(Azure) AI Foundry'에서 Llama Nemotron 모델을 지원할 예정이며, SAP는 이를 활용해 AI 어시스턴트 'Joule'의 성능을 발전시키고 있다. 또한 액센츄어, 아틀라시안, 박스(Box), 서비스나우(ServiceNow) 등 주요 기업들도 엔비디아의 최신 모델과 협력 중이다.

AI 에이전트 구축을 위한 기술적 기반도 강화됐다. 엔비디아는 'AI-Q Blueprint'라는 새로운 프레임워크를 선보이며, AI 모델이 보다 정교한 데이터 셋과 연계되도록 지원하겠다는 계획을 발표했다. 또한, 엔비디아의 AI 데이터 플랫폼을 통해 기업들이 AI 워크로드를 보다 효율적으로 운영할 수 있도록 환경을 구축할 예정이다.

이번 발표에서 엔비디아는 마이크로소프트, SAP에 이어 오라클(ORCL)과도 협력 관계를 더욱 확장하겠다고 밝혔다. 오라클의 클라우드 인프라에서 엔비디아의 GPU 및 AI 인퍼런스 소프트웨어를 활용해 AI 에이전트 개발을 가속화하겠다는 목표다.

젠슨 황(Jensen Huang) 엔비디아 CEO는 “AI 기술이 산업 전반에 걸쳐 거대한 변화를 만들고 있다”며 “이번에 공개된 모델과 인프라가 차세대 AI 혁신을 가속화하는 중요한 이정표가 될 것”이라고 말했다.

뉴스를 실시간으로...토큰포스트 텔레그램 가기

광고문의 기사제보 보도자료

#엔비디아 #AI #LlamaNemotron #GTC2025 #마이크로소프트 #SAP #오라클