엔비디아(NVDA)가 최근 GTC 컨퍼런스에서 공개한 새로운 서버 시스템은 AI 연산 성능을 완전히 새로운 차원으로 끌어올렸다. 단일 랙 서버로 엑사플롭스(Exaflops) 수준의 연산을 수행할 수 있는 이 시스템은, 블랙웰(Blackwell) GPU 기반의 'GB200 NVL72'를 통해 최첨단 대규모 AI 모델 훈련과 추론을 위한 성능 기준을 새로 정의했다. 불과 몇 년 전만 해도 수십 개의 서버 랙이 필요했던 연산 능력이 이제 단 하나의 랙에 응축된 셈이다.
2022년 미국 오크리지 국립연구소에 설치된 HPE와 AMD 기반 프론티어(Frontier) 슈퍼컴퓨터는 세계 최초의 엑사플롭스 시스템으로 주목받았지만, 엔비디아의 이번 시스템은 불과 3년 만에 이보다 70배 이상 높은 성능 밀도를 기록했다. 특히 블랙웰 GPU는 4비트 및 8비트 부동소수점 연산에 최적화돼 있어, 정확성보다는 처리 속도가 중요한 AI 연산에 더욱 적합한 구조를 지닌다. 반면 프론티어는 과학연산에 요구되는 64비트 정밀 연산을 제공했던 만큼 용도 측면에서 상이하다.
이처럼 계산 성능이 비약적으로 성장한 배경에는 반도체 집적도 개선, 에너지 효율 최적화, 그리고 AI 특화 아키텍처 설계의 혁신이 있다. 지난 수십 년간의 발전을 감안하면 놀랍지만, 더욱 중요한 질문은 '앞으로 5년은 어떻게 바뀔 것인가'에 있다. 엔비디아는 이번 컨퍼런스에서 향후 출시 예정인 '베라 루빈(Vera Rubin)' 아키텍처 기반 시스템의 청사진도 공유했다. 해당 시스템은 연간 최대 15엑사플롭스의 AI 최적화 연산력을 제공할 것으로 보이며, 이는 블랙웰의 14배에 달하는 수치다.
하지만 기술적 진보와 함께 따라오는 문제도 있다. 대규모 AI 연산을 위한 연산 능력 구축 경쟁이 전 세계적으로 과열되는 가운데, 일부 전문가들은 과잉 투자에 대한 우려를 제기하고 있다. 중국의 딥시크(DeepSeek)가 공개한 경량 추론 모델 R1은 기존 대비 현격히 낮은 연산 자원으로도 유사한 성능을 구현해, AI 산업 전반에 ‘연산 축소 가능성’이라는 새로운 시사점을 던졌다. 이에 따라 마이크로소프트(MSFT)는 여러 데이터센터 임대 계약을 취소했고, 미디어들은 이 움직임이 AI 인프라에 대한 수요 재평가 신호일 수 있다고 해석했다.
다만 일부 전문가는 이러한 조정의 핵심은 연산 수요 문제가 아니라, 냉각 및 전력 공급 등 차세대 AI 시스템을 감당할 물리적 인프라의 부족이라고 분석했다. 즉, 단순한 축소가 아니라, 보다 고도화된 인프라로의 전환이 필요하다는 의미다. 실제로 매사츄세츠 공과대학교(MIT) 기술 리뷰는 다수의 중국 데이터센터가 과거 설계 기준으로는 차세대 AI 수요에 대응할 수 없어 가동률이 떨어지고 있다는 점을 지적한 바 있다.
AI 추론은 모델 훈련 이상으로 막대한 연산 능력을 요구한다. 딥리서치 어시스턴트나 자율 실행이 가능한 에이전트형 AI 시스템 등, 실시간 처리가 핵심인 신형 AI는 단위 시간당 수행해야 하는 연산량이 기하급수적으로 증가하고 있다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 최근 CNBC와의 인터뷰에서 추론 AI는 기존 AI 대비 100배 이상의 계산력을 필요로 한다고 강조하며, '경량 AI 시대'라는 일부 주장을 정면 반박한 바 있다.
오픈AI는 최근 400억 달러(약 57조 6,000억 원) 규모의 투자 유치를 통해, 향후 더욱 고도화된 AI 모델 및 관련 인프라 확장을 예고했다. 주간 5억 명이 사용하는 챗GPT의 유지 및 확장에는 방대한 계산 자원이 필요하고, 이는 곧 데이터센터, 서버, 전력, 냉각 등 물리 인프라 전반의 혁신을 지속적으로 필요로 한다. 이 같은 행보는 단지 기술 경쟁 이상의 의미를 갖는다. 맥킨지에 따르면 AI는 연간 4조 4,000억 달러 이상의 기업 이익 창출 잠재력을 지니고 있으며, 이는 전 세계 국가들이 AI 주도권을 전략 산업으로 간주하는 이유이기도 하다.
당장 무엇이 뒤따를지 단언할 수는 없지만, 최근 몇 주 사이에도 AI 분야에서는 상당한 발전이 있었다. GPT-4o의 텍스트 기반 이미지 생성은 사실상 완성 단계에 접어들었고, 구글(GOOGL)의 제미니 2.5 프로는 업계 최고 수준의 추론 능력을 구현했다. 또한 런웨이의 최신 비디오 모델은 장면과 인물의 일관성을 유지하는 데 성공해 AI 영상 기술의 실용화를 가속시키고 있다.
이처럼 플롭스(FLOPS)가 늘어나는 것만큼, 책임과 규제에 대한 논의도 병행돼야 한다. 지나친 기술 낙관은 위험할 수 있으며, 인류가 새로운 도구를 가졌을 때 이를 어떻게 사용할지에 대한 철학적 고민은 더욱 절실한 시점이다. 하지만 분명한 것은 지금 우리가 목도하는 컴퓨팅 성능의 도약이 AI의 미래를 다시 쓰고 있다는 점이다.