|
시장보고서
상품코드
2029307
NVIDIA GTC 2026 : 토큰 최적화 및 추론 기반 AI 인프라를 위한 NVIDIA의 풀스택 접근 방식NVIDIA GTC 2026: NVIDIAs Full-Stack Approach for Token-Optimized, Inference-Driven AI Infrastructure |
||||||
이 IDC Market Perspective에서는 NVIDIA가 칩 공급업체에서 풀스택 AI 인프라의 리더로 변모하고 있는 점에 대해 논의합니다. 또한, GTC 2026은 현대의 데이터센터를 AI의 생산성을 평가하는 새로운 업계 표준으로 떠오르고 있는 토큰 기반 성과 지표에 최적화된 'AI 팩토리'로 정의함으로써 이러한 변화를 더욱 공고히 했습니다. 행사를 통해 엔비디아는 Vera Rubin, Vera CPU, DSX AI Factory의 블루프린트, 옴니버스(Omniverse)와 연계된 디지털 트윈과 같은 플랫폼을 강조했습니다. 이는 종합적으로 토큰 당 비용을 절감하고, 실리콘에서 그리드까지 시스템 수준의 효율성을 향상시킵니다. 이번 발표는 고도로 통합된 하드웨어, 소프트웨어, 네트워크 및 에너지 효율적인 인프라에 의존하는 추론 중심의 AI 운영으로 전환하는 업계 전반의 움직임을 뒷받침합니다. 이러한 모멘텀을 유지하려면 통합과 생태계 개방성의 균형을 맞추고, 에너지와 비용의 증가로 인한 제약에 대응해야 합니다. "NVIDIA는 컴퓨팅, 네트워크, 스토리지, 소프트웨어, 전력 오케스트레이션을 베라 루빈(Vera Rubin) 및 DSX와 같은 검증된 AI 팩토리 플랫폼에 통합함으로써 데이터센터를 지속적인 추론 기반 AI 운영을 위한 생산 환경으로 재정의하고 있습니다. 이러한 접근 방식은 대규모 배포와 효율성을 가속화하고, 인프라 아키텍처, 데이터센터 운영 및 파트너 에코시스템 간의 긴밀한 통합의 필요성을 강화합니다."라고 Madhumitha Sathish(IDC 고성능 컴퓨팅 부문 리서치 매니저)는 말했습니다.
This IDC Market Perspective discusses how NVIDIA is moving from a chip supplier to a full-stack AI infrastructure leader, and GTC 2026 reinforced this shift by framing modern datacenters as AI factories optimized for token-based performance metrics emerging as new industry standards for evaluating AI productivity. Across the event, NVIDIA highlighted platforms such as Vera Rubin, Vera CPU, DSX AI Factory blueprints, and Omniverse-aligned digital twins that collectively reduce the cost per token and improve system-level efficiency from silicon to grid. These announcements underscore a broader industry transition toward inference-driven AI operations that depend on highly integrated hardware, software, networking, and energy-aware infrastructure. Sustaining momentum will require balancing integration with ecosystem openness and addressing rising energy and cost constraints. "By integrating compute, networking, storage, software, and power orchestration into validated AI factory platforms such as Vera Rubin and DSX, NVIDIA is reframing datacenters as production environments for continuous, inference-driven AI operations. This approach accelerates deployment and efficiency at scale, reinforcing the need for tighter integration between infrastructure architecture, datacenter operations, and partner ecosystems." - Madhumitha Sathish, research manager, High-Performance Computing, IDC