맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

엔비디아, 차세대 AI 에이전트 모델 'Llama Nemotron' 공개… 성능 5배↑

작성자 이미지
정민석 기자

2025.03.19 (수) 05:42

대화 이미지 2
하트 이미지 1

엔비디아가 GTC 2025에서 AI 에이전트 모델 'Llama Nemotron'을 발표했다. 해당 모델은 추론 속도를 최대 5배 향상시켰으며, 마이크로소프트와 SAP 등 글로벌 기업들과 협업을 이어간다.

엔비디아, 차세대 AI 에이전트 모델 'Llama Nemotron' 공개… 성능 5배↑ / TokenPost Ai

엔비디아(NVDA)가 차세대 AI 에이전트 기술 발전을 위한 핵심 모델과 인프라를 공개했다.

미국 캘리포니아에서 열린 연례 GTC 2025 컨퍼런스에서 엔비디아는 새로운 'Llama Nemotron' AI 모델군을 발표했다. 이 모델들은 현재 업계 표준이 된 메타(Meta)의 오픈소스 Llama 모델을 기반으로 한 것으로, 엔비디아의 정교한 후처리 및 성능 향상 기법이 적용돼 정확도가 20% 향상됐으며 추론 속도는 최대 5배 빨라졌다고 회사 측은 밝혔다.

엔비디아는 Llama Nemotron 모델을 'NIM 마이크로서비스' 플랫폼을 통해 제공하며, 이를 세 가지 버전(Nano, Super, Ultra)으로 최적화했다. Nano 모델은 개인용 컴퓨터와 엣지 디바이스를 겨냥했으며, Super 모델은 단일 GPU에서 실행되도록 설계됐다. Ultra 모델은 다중 GPU 환경에서 최대의 성능을 발휘하도록 만들어졌다.

이러한 고성능 AI 모델은 이미 여러 글로벌 기술 기업들과 협업을 통해 실제 서비스에 적용되고 있다. 마이크로소프트(MSFT)는 자체 클라우드 플랫폼 '애저(Azure) AI Foundry'에서 Llama Nemotron 모델을 지원할 예정이며, SAP는 이를 활용해 AI 어시스턴트 'Joule'의 성능을 발전시키고 있다. 또한 액센츄어, 아틀라시안, 박스(Box), 서비스나우(ServiceNow) 등 주요 기업들도 엔비디아의 최신 모델과 협력 중이다.

AI 에이전트 구축을 위한 기술적 기반도 강화됐다. 엔비디아는 'AI-Q Blueprint'라는 새로운 프레임워크를 선보이며, AI 모델이 보다 정교한 데이터 셋과 연계되도록 지원하겠다는 계획을 발표했다. 또한, 엔비디아의 AI 데이터 플랫폼을 통해 기업들이 AI 워크로드를 보다 효율적으로 운영할 수 있도록 환경을 구축할 예정이다.

이번 발표에서 엔비디아는 마이크로소프트, SAP에 이어 오라클(ORCL)과도 협력 관계를 더욱 확장하겠다고 밝혔다. 오라클의 클라우드 인프라에서 엔비디아의 GPU 및 AI 인퍼런스 소프트웨어를 활용해 AI 에이전트 개발을 가속화하겠다는 목표다.

젠슨 황(Jensen Huang) 엔비디아 CEO는 “AI 기술이 산업 전반에 걸쳐 거대한 변화를 만들고 있다”며 “이번에 공개된 모델과 인프라가 차세대 AI 혁신을 가속화하는 중요한 이정표가 될 것”이라고 말했다.

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

광고문의 기사제보 보도자료

많이 본 기사

관련된 다른 기사

댓글

2

추천

1

스크랩

스크랩

데일리 스탬프

2

매일 스탬프를 찍을 수 있어요!

등급 아이콘

SSdc

11:01

등급 아이콘

릴라당

08:38

댓글 2

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

0/1000

댓글 문구 추천

좋은기사 감사해요 후속기사 원해요 탁월한 분석이에요

SSdc

2025.03.19 11:01:15

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

릴라당

2025.03.19 08:38:25

좋은기사 감사해요

답글달기

0

0
0

이전 답글 더보기

1