본문 바로가기
생각 정리

엔비디아 GPU vs 구글 TPU, AI 패권은 ‘모델’이 아니라 ‘비용 구조’에서 갈린다 ㅡ Gavin Baker

by 위즈올마이티 2025. 12. 15.
728x90
728x90



□ AI 경쟁의 본질은 ‘모델’이 아니라 ‘비용 구조’


AI 경쟁은 흔히 누가 더 똑똑한 모델을 만들었느냐의 문제로 보이지만, 실제로는 전혀 다른 싸움임


AI 모델은 한 번 학습하고 끝나는 제품이 아니라, 서비스가 커질수록 매 순간 토큰을 계속 생산해야 하는 구조임


사용자가 늘어날수록 매출도 증가하지만, 동시에 토큰 처리 비용 역시 함께 증가함


문제는 이 비용이 생각보다 빠르게 누적된다는 점임


그래서 AI 산업은 성공할수록 오히려 수익성이 나빠질 수 있는 특이한 구조를 가지고 있음


결국 장기적으로 살아남는 기업은 가장 똑똑한 모델을 가진 회사가 아니라,


AI를 가장 효율적인 비용 구조로 굴릴 수 있는 회사가 될 가능성이 큼


□ 구글 TPU 전략, 왜 통했고 왜 흔들리는가


구글은 오래전부터 자체 AI 칩인 TPU를 개발해 사용해왔음


다른 기업들이 엔비디아 GPU를 비싼 가격에 구매해 AI를 운영할 때, 구글은 자기 칩을 사용해 상대적으로 낮은 비용으로 AI를 돌릴 수 있었음


이 전략이 효과를 발휘했던 이유는 TPU 자체의 성능 때문만은 아님


구글은 이미 검색, 유튜브, 광고, 지도 같은 초대형 트래픽 서비스를 보유하고 있었고,


TPU는 이런 내부 서비스에서 발생하는 대규모 연산을 효율적으로 처리하도록 설계된 칩이었음


이 덕분에 구글은 AI 서비스를 공격적으로 가격 인하하거나, 수익성을 낮춘 상태로도 장기간 경쟁을 지속할 수 있었음


경쟁사들이 수익을 내지 못하면 서버를 늘릴 수 없는 동안, 구글은 상대의 자금 여력을 먼저 압박하는 전략을 구사할 수 있었음


최근 외부 환경도 구글에게 유리하게 작용했음


엔비디아의 Blackwell 계열은 성능은 뛰어났지만 전력 밀도와 냉각 요구사항이 크게 높아지면서 초기 도입 난이도가 높았음


이 기간 동안 구글은 이미 구축된 TPU 인프라 위에서 안정적으로 대규모 학습을 이어가며 모델 개발을 지속할 수 있었음


다만 이 구간은 구조적인 우위라기보다, 인프라 전환이 지연되면서 생긴 일시적인 완충 구간에 가까웠음


□ 엔비디아의 반격: 속도전과 GB300의 의미


엔비디아는 구글이 자체 칩을 만든다는 사실을 막으려 하지 않았음


대신 자체 칩이 완성될 즈음이면 이미 더 앞선 GPU가 존재하도록 만드는, 시간 기반 전략을 선택했음


이를 가능하게 만든 핵심은 출시 주기임


엔비디아는 GPU 신제품 출시 주기를 2년에서 1년 수준으로 단축했고,


고객이 ASIC을 설계·양산할 시점이면 이미 다음 세대 GPU를 시장에 내놓는 구조를 만들었음


GB300 계열은 이 전략이 구현된 결과물에 가까움


GB300의 핵심은 랙 단위 통합과 표준화가 진전되면서 데이터센터 구축 난이도를 낮추려는 방향성에 있음


완전히 기존 레거시 랙에 ‘그대로 꽂는’ 수준이라고 단정하기는 어렵지만,


신규 데이터센터를 새로 설계하지 않더라도 리트로핏이 가능한 방향으로 확산 속도를 높이려는 시도가 분명해지고 있음


AI 경쟁의 병목은 점점 성능이 아니라 배포 속도로 이동하고 있음


얼마나 빠르게 장비를 설치하고, 바로 학습과 추론에 들어갈 수 있느냐가 비용과 경쟁력에 직접적인 영향을 주기 시작함


이 흐름이 이어질 경우, 설치·운영·전력 비용을 모두 포함한 기준에서 GPU의 총소유비용이 다시 경쟁력을 갖는 구간이 형성될 가능성이 커짐


이 시점부터 구글의 저마진 전략은 과거만큼의 위력을 발휘하기 어려워짐


□ 이 싸움이 남기는 구조적 변화


이 흐름이 곧바로 구글의 위기를 의미하는 것은 아님


구글은 여전히 방대한 데이터와 트래픽, 강력한 광고 수익 기반을 보유한 기업임


다만 AI 영역에서 과거처럼 압도적인 비용 우위를 유지하기는 점점 어려워지고 있음


여기에 TPU를 둘러싼 내부 구조적 고민도 함께 커지고 있음


TPU는 구글이 직접 설계하지만, 실제 칩 구현과 파운드리 관리에는 브로드컴 같은 파트너에 대한 의존도가 높음


커스텀 실리콘은 제품 믹스와 협상 구조에 따라 수익성이 달라지며,


TPU 규모가 커질수록 파트너 마진과 비용 부담이 구글 쪽으로 전가될 가능성도 커짐


이 때문에 구글은 미디어텍과의 협력 등 공급망 다변화를 시도하고 있지만,


고속 인터커넥트와 통신 IP 같은 기술 장벽으로 인해 단기간 내 구조가 완전히 바뀌기는 쉽지 않음


한편 엔비디아는 구글을 단독으로 상대하지 않음


OpenAI, xAI, Anthropic, Meta 같은 여러 플레이어들이 동시에 경쟁하도록 판을 설계하고 있음


이들이 경쟁할수록 GPU 수요는 늘어나고, 엔비디아 생태계는 유지되는 구조임


결국 이 전쟁은 GPU와 TPU 중 어느 쪽이 이기느냐의 문제가 아니라, AI 인프라의 표준이 어디로 굳어지느냐의 싸움에 가까움


현재까지의 흐름만 놓고 보면, 그 표준은 엔비디아 중심으로 형성되고 있는 국면임


□ 마무리하며


엔비디아와 구글의 경쟁은 단순한 칩 성능 비교가 아님


AI라는 산업이 앞으로 어떤 비용 구조 위에서 성장하게 될 것인가를 둘러싼 경쟁임


구글은 오랫동안 자체 칩을 통해 비용 우위를 확보하며 경쟁을 이끌어왔지만,


AI가 대중화되고 워크로드가 빠르게 확장되는 국면에서는 범용성과 배포 속도를 갖춘 인프라의 중요성이 점점 더 커지고 있음


엔비디아는 이 변화를 읽고 속도와 생태계 중심으로 전략을 설계해 왔고, GB300 계열은 그 방향성을 보여주는 사례에 가까움


이 전쟁의 결말은 아직 정해지지 않았지만, 한 가지는 분명해지고 있음


앞으로의 AI 경쟁에서 핵심은 모델의 똑똑함보다, 그 모델을 얼마나 싸고 안정적으로 오래 굴릴 수 있느냐임


그리고 그 질문에 대한 답은 이제 칩을 넘어 전력, 냉각, 데이터센터 구조, 반도체 공급망 전체로 확장되고 있음


AI 전쟁은 아직 진행 중이지만, 인프라의 방향성만큼은 점점 분명해지고 있는 국면임

728x90
728x90

댓글