인공지능(AI) 기술이 빠르게 확산되면서 이를 지원하는 고성능 인프라의 중요성이 더욱 부각되고 있다. 특히 기업들이 수천 개의 GPU를 활용하는 시대에 안정적인 AI 환경을 유지하는 것은 큰 도전 과제가 되고 있다.
이러한 문제를 해결하기 위해 펭귄 솔루션(Penguin Solutions)은 ‘ICE 클러스터웨어(ICE ClusterWare)’를 선보였다. 이 소프트웨어는 AI 인프라의 자동화된 구축과 최적화를 목표로 하며, 성능과 보안성을 극대화하는 데 초점을 맞추고 있다. 트레이 레이튼(Trey Layton) 펭귄 솔루션 소프트웨어 및 제품 관리 부사장은 “AI 인프라는 항상 최고 성능을 유지해야 하며, 기존 IT 인프라와는 완전히 다른 관리 방식이 필요하다”고 강조했다.
펭귄 솔루션은 최근 ‘마스터링 AI: 새로운 인프라 규칙’ 이벤트를 통해 ICE 클러스터웨어의 핵심 기능을 공개했다. 이 소프트웨어는 온프레미스와 클라우드 환경을 결합하여 데이터 중력 문제와 지연 시간 이슈를 해결하는 데 도움을 준다. 초보자도 쉽게 AI 환경을 구축할 수 있도록 자동화 기능을 제공하며, GPU 클러스터의 세밀한 조정을 지원해 AI 워크로드를 최적화한다.
특히 ICE 클러스터웨어는 ‘AIM(AI Infrastructure Management)’ 서비스를 통해 예측 분석 기능을 추가했다. 이는 하드웨어 장애를 사전에 감지하고 대응할 수 있도록 지원해 AI 시스템의 안정성을 한층 높인다. 레이튼 부사장은 “AI 인프라는 24시간 가동되며 작은 장애가 전체 시스템에 큰 영향을 줄 수 있다”며 “AIM은 이러한 위협을 미리 감지하는 역할을 한다”고 설명했다.
AI 기술이 산업 전반에서 빠르게 확산됨에 따라 AI 인프라의 중요성은 더욱 강조될 전망이다. 펭귄 솔루션의 ICE 클러스터웨어는 이러한 변화 속에서 기업들이 AI 역량을 손쉽게 확장하고 강화할 수 있는 해법으로 주목받고 있다.