본문 바로가기
종목 이야기

엔비디아 베라 루빈 NVL72 공개, GPU 이후 AI 시스템·데이터센터 경쟁의 시작

by 위즈올마이티 2026. 1. 8.
728x90
728x90



□ GPU를 넘어 플랫폼으로, 엔비디아의 방향 전환


엔비디아가 CES 2026 기조연설에서 공개한 ‘베라 루빈(Vera Rubin)’은 차세대 AI 칩 발표라는 표현만으로는 부족함


이번 발표는 AI 경쟁의 무대를 GPU 단위에서 시스템 단위로 옮기겠다는 전략적 선언에 가깝기 때문임


NVIDIA 최고경영자 Jensen Huang은 베라 루빈을 루빈(Rubin) 아키텍처 기반의 차세대 AI 플랫폼이라고 정의함


이 표현이 중요한 이유는 베라 루빈이 단일 GPU 성능 경쟁의 연장선이 아니라,


AI 학습과 추론, 데이터센터와 슈퍼컴퓨팅 환경 전체를 하나의 구조로 다시 묶는 시도이기 때문임


AI 모델의 크기와 복잡도가 기하급수적으로 증가하면서, 개별 가속기의 성능 향상만으로는 전체 효율을 보장하기 어려운 국면에 진입함


엔비디아가 이 시점에 ‘플랫폼’을 강조한 것은 AI 연산이 연구와 실험의 단계를 넘어,


산업 인프라 단계로 이동하고 있음을 전제로 한 선택으로 읽힘


블랙웰 세대까지 엔비디아의 경쟁력이 GPU 성능과 메모리 대역폭의 극대화에 있었다면,


베라 루빈은 그 성능을 전제로 “AI를 어떻게 운영할 것인가”라는 질문에 답하려는 단계임


이는 엔비디아가 GPU 기업에서 AI 가속기 기업을 거쳐, AI 컴퓨팅 플랫폼 기업으로 정체성을 확장하고 있음을 보여줌


□ 루빈 GPU와 베라 CPU, AI 시스템을 다시 설계하다


베라 루빈 플랫폼의 핵심은 루빈 GPU와 베라 CPU의 결합 구조에 있음


여기서 CPU를 다시 전면에 배치했다는 점은 단순한 제품 구성 변화가 아님


초거대 AI 모델 환경에서 병목은 더 이상 연산 성능 자체가 아니라


데이터 이동, 메모리 접근, 작업 스케줄링, 네트워크 제어, 전력 관리 같은 시스템 레벨에서 발생함


엔비디아는 이러한 영역을 범용 x86 CPU에 맡기는 대신, AI 워크로드에 최적화된 자체 CPU로 흡수하려는 전략을 택함


이는 단기적인 성능 보완을 넘어, 향후 AI 시스템의 표준 아키텍처를 엔비디아 주도로 설계하겠다는 의지를 보여줌


CPU까지 포함한 통합 설계는 향후 소프트웨어 스택, 스케줄러, 네트워크 구조까지 하나의 생태계로 묶을 수 있는 기반이 됨


베라 루빈은 연산 장치의 집합이 아니라, AI 시스템 전체를 하나의 설계 철학으로 통합하려는 시도라고 볼 수 있음


□ NVL72와 랙 스케일 AI, ‘돌릴 수 있는 AI’의 조건


엔비디아는 베라 루빈과 함께 이를 기반으로 한 AI 슈퍼컴퓨터 시스템 ‘베라 루빈 NVL72’를 공개함


NVL72는 베라 CPU 36개와 루빈 GPU 72개를 NVLink로 연결한 랙 스케일 시스템으로,


개별 서버를 묶는 방식이 아니라 랙 전체를 하나의 거대한 AI 컴퓨터처럼 설계한 구조임


기존 서버 단위 확장은 서버 간 통신 비용 증가, 네트워크 병목, 전력 분산 문제, 운영 복잡도라는 구조적 한계를 가짐


AI 모델이 커질수록 이 문제는 기하급수적으로 확대되고, 결국 “이론적으로는 가능하지만 현실적으로는 운영이 어려운 AI”가 됨


하이퍼스케일 데이터센터 입장에서는 성능보다도 예측 가능한 확장성과 운영 안정성이 더 중요한 요소로 작용함


NVL72와 같은 랙 스케일 설계는 AI 인프라를 실험 장비가 아니라, 상시 가동되는 생산 설비로 전환시키는 조건에 해당함


즉 NVL72는 빠른 AI가 아니라, 실제로 굴릴 수 있는 AI를 목표로 한 시스템임


□ 성능 5배, 비용 10배 절감이 의미하는 것


젠슨 황 CEO는 베라 루빈 NVL72가 기존 블랙웰 기반 시스템 대비 추론 성능 기준 최대 5배 수준의 향상을 제공할 수 있다고 설명함


여기서 말하는 성능은 특정 워크로드, 특히 대형 모델 추론 환경을 전제로 한 수치임
또 하나 중요한 표현은 ‘비용’임


엔비디아가 언급한 비용 절감은 총비용(TCO) 전반을 단정적으로 의미하기보다는,


토큰당 추론 비용(cost per token)이 블랙웰 대비 최대 10배 낮아질 수 있다는 주장에 가까움


이는 칩 가격 하나의 문제가 아니라 연산 밀도, 전력 효율, 네트워크 구조, 랙 단위 통합


이 복합적으로 작용한 결과로 해석하는 것이 자연스러움


비용 구조의 변화는 단순한 효율 개선을 넘어, AI 도입 주체의 범위를 확장시키는 역할을 함


대형 빅테크뿐 아니라, 중견 클라우드 사업자와 국가 연구기관까지 AI 인프라 구축이 현실적인 선택지가 되는 계기가 될 수 있음


베라 루빈은 비싸지만 빠른 AI가 아니라, 대규모로 지속적으로 굴릴 수 있는 AI를 목표로 설계된 플랫폼임


□ 마무리하며


AI 경쟁은 이제 칩이 아니라 구조의 싸움임


베라 루빈의 등장은 AI 산업이 성능 경쟁의 초기 국면을 지나, 구조와 운영을 고민하는 성숙 단계로 접어들었음을 보여줌


이제 경쟁의 핵심은 누가 더 빠른 칩을 만드느냐가 아니라, 누가 AI 시스템 전체를 더 효율적으로 설계하고 운영할 수 있느냐로 이동함


하이퍼스케일 데이터센터, 국가 단위 슈퍼컴퓨터, 초대형 AI 모델을 운용하는 연구기관 입장에서 베라 루빈은 차세대 인프라 설계의 기준점이 될 가능성이 큼


엔비디아가 밝힌 2026년 하반기 출시는 AI 인프라 경쟁의 규칙이 바뀌는 분기점으로 기록될 가능성이 큼


블랙웰이 AI 가속기의 정점이었다면, 베라 루빈은 AI 컴퓨팅이 ‘공장’의 형태로 진입하는 출발점에 해당함


이번 발표는 차세대 AI 시대의 승부처가 성능 숫자가 아니라 구조와 경제성에 있음을 분명히 보여줌

728x90
728x90

댓글