728x90
728x90

엔비디아, CUDA 해자 최종 완성 ㅡ CuTeDSL 통합이 만든 역대급 실적
□ 3줄 요약 1. 엔비디아는 CUDA 위에 Python CuTeDSL 생태계를 얹으며 소프트웨어 해자를 결정...
blog.naver.com
□ 3줄 요약
1. 엔비디아는 CUDA 위에 Python CuTeDSL 생태계를 얹으며 소프트웨어 해자를 결정적으로 강화했고, PyTorch Inductor가 CuTeDSL을 공식 지원하며 성능·생태계 우위가 더 커지고 있음
2. FY2026 Q3 실적은 매출·데이터센터·마진 모두 사상 최대치를 기록했으며 Blackwell·Rubin 기반 AI 인프라 수요가 과열 수준으로 폭발하는 중임
3. CPU→GPU 가속 전환, 생성형→에이전틱·물리적 AI 전환이 동시에 진행되면서 엔비디아는 단일 아키텍처로 모든 전환을 커버하는 유일한 인프라 기업으로 자리 잡는 중임
□ Python DSL 전쟁과 엔비디아의 소프트웨어 해자 확대
PyTorch Compile/Inductor가 이제 NVIDIA Python CuTeDSL을 직접 타겟팅하게 되면서
엔비디아 소프트웨어 해자는 새로운 단계로 확장되는 중임
CuTeDSL·cuTile·TileIR은 모두 엔비디아가 통제하는 폐쇄형 DSL로
커널 생성부터 최적화 패스까지 전부 내부에서 다루는 구조임
이 때문에 FlexAttention 같은 핵심 연산에서 Triton 대비 2배 이상의 성능 향상을 실현하며
엔비디아가 하드웨어뿐 아니라 소프트웨어 스택에서도 구조적 우위를 확보함
반면 Triton은 아직 Blackwell의 주요 기능을 활용하지 못하고 있어
경쟁사가 의존하는 오픈 DSL은 최신 아키텍처 대응에서 뒤처지는 상황임
엔비디아가 DSL·IR·컴파일러까지 수직 통합한 이유는 결국
“속도와 효율 최적화의 결정적 지점”을 모두 자사 손 안에 두기 위함임
이 구조는 Blackwell·Rubin 세대에서 성능 차이를 더 크게 벌릴 가능성이 높아 소프트웨어 레이어가 곧 해자가 되는 구간에 진입했음
□ FY2026 Q3 실적: 사상 최고치와 공급 초과 환경
이번 분기 실적은 역대급 성장세를 그대로 보여줌
매출 570억 달러
전년 대비 +62%, 전분기 대비 +22%
데이터센터 512억 달러
전년 대비 +66%
총마진 73%대 유지
Q4 가이던스 650억 달러 제시
매출총이익률·데이터센터 매출 비중 모두 구조적으로 높은 수준을 유지하며
블랙웰 출하 증가와 함께 실적의 기울기가 더 가팔라지는 모습임
주요 하이퍼스케일러와 프런티어 AI 기업의 주문량이 2026년 말까지 이미 채워져 있고
중국향 컴퓨트 매출을 0으로 가정한 상태에서도 전제가 흔들리지 않을 정도로 글로벌 수요가 압도적인 상황임
□ Blackwell·Rubin이 여는 고성능 추론 시대
AI 모델이 reasoning·chain-of-thought을 수행하는 구조로 전환되면서 추론 연산량은 과거 대비 10~20배 가까이 폭증하고 있음
이런 환경에서 Blackwell은 메가와트당 처리량이 기존 세대 대비 10배 개선됨
전력 제약이 심화되는 시대에 “전력 1MW당 처리량”은 가장 핵심적인 지표이며 엔비디아가 경쟁자를 따돌리는 결정적 변수임
Rubin은 이미 실리콘 리턴을 완료했고 2026년 말~2027년 초 또 한 번의 성능 점프를 목표로 bring-up이 진행 중임
Blackwell 이후 Rubin까지 연결되는 로드맵은
훈련·추론 모든 영역에서 엔비디아가 기본값이 되는 흐름을 더욱 강화함
전력·쿨링·데이터센터 제약이 커질수록 효율을 극대화하는 아키텍처가 시장을 독점하게 되는 구조임
□ 경쟁사와의 격차: GPU가 ASIC을 압도하는 구조적 이유
아마존·구글·메타 모두 자체 AI ASIC을 개발하고 있지만
자체 칩의 목적은 내부 효율 확보에 가깝고 외부 고객에게 “임대”해 매출을 만들기는 구조적으로 어려움
반면 엔비디아 GPU는
CUDA
TensorRT·Inductor
NVLink·InfiniBand
Python CuTeDSL
Omniverse·NIM까지 하나의 통합 플랫폼으로 제공됨
클라우드 사업자는 엔비디아 칩을 확보하면 전 세계 개발자에게 즉시 임대해 수익을 만들 수 있음
즉, 엔비디아 GPU는 내부 효율 + 외부 매출이라는 두 축을 모두 제공하는 반면 ASIC은 대부분 내부 최적화에 머무르는 구조임
이 차이는 단기간에 따라잡기 어려운 생태계 격차로 이어지며
DSL–컴파일러–네트워크–추론 플랫폼까지 이어진 풀스택이 엔비디아 해자를 더 넓히는 핵심 요인임
□ 투자자가 봐야 할 핵심 체크포인트
고성장 흐름 속에서도 확인해야 할 구조적 리스크는 분명 존재함
첫째, CapEx 사이클
AI 인프라 3~4조 달러 시대를 선반영한 상태라 하이퍼스케일러 투자 속도 조절이 단기 변동성을 만들 수 있음
둘째, 공급망·전력 제약
HBM·CoWoS 패키징·파운드리 모두 병목이며 이 병목이 현재는 호재지만 변곡점 이후 공급 과잉으로 바뀔 가능성도 있음
셋째, 규제·지정학
대중 규제는 돌발적으로 특정 지역 데이터를 꺼버릴 수 있고
장기적으로 AI 인프라 단일 벤더 의존을 규제 대상으로 삼는 논의가 커질 여지도 있음
넷째, 오픈소스 생태계의 반격
엔비디아의 폐쇄형 구조(CUDA·CuTeDSL)는 락인 논쟁을 만들고
구글·메타·AMD 중심의 개방형 IR/DSL 생태계가 장기 경쟁 압력을 만들 수 있음
이 네 가지는 실적 자체보다
“멀티플 변동성”을 좌우하는 요소이므로
분기마다 점검이 필요함
□ 마무리하며 ㅡ AI 국가 인프라 기업으로의 진화
엔비디아는 국가 단위 AI 팩토리·슈퍼컴퓨터·전력·네트워크·소프트웨어를 통합 제공하는 AI 국가 인프라 기업으로 변모하고 있음
2030년까지 글로벌 AI CapEx가 연간 3~4조 달러로 확대될 것이라는 엔비디아 경영진의 전망은
더 이상 과장이 아니라 인프라 패러다임의 변화로 해석되는 구간임
CPU 중심 시대가 끝나고 생성형을 넘어 에이전틱·물리적 AI가 확장될수록
효율·연산량·전력 제약까지 통합적으로 해석하는 아키텍처가 시장을 장악하게 됨
그 중심에 엔비디아가 자리하고 있음
728x90
728x90
'종목 이야기' 카테고리의 다른 글
| 머크 키트루다 SC 유럽 첫 승인 ㅡ 알테오젠 기술로 바뀌는 면역항암제 패러다임 (0) | 2025.11.20 |
|---|---|
| 팔란티어·PwC UK 대형 파트너십 확장 ㅡ 영국 AI 전환의 게임체인저 (0) | 2025.11.20 |
| HBM 올인한 메모리 시장, 엔비디아의 LPDDR 전환 결정에 균형 무너졌다 (1) | 2025.11.20 |
| 삼성디스플레이, BOE에 1조 로열티 받나 ㅡ OLED 특허전 ‘3년 전쟁’ 완승 (0) | 2025.11.19 |
| 올리브영 미국 상륙, LA 1·2호점 동시 오픈 ㅡ 세포라·얼타 없는 틈을 파고든다 (0) | 2025.11.19 |
댓글