베라 루빈 시대: AI 컴퓨팅 및 공급 위기 탐색하기
엔비디아가 향후 2년 동안 생산할 수 있는 모든 칩은 이미 주인이 정해졌습니다. 2026년 3월 16일에 열린 GTC 2026에서 젠슨 황(Jensen Huang)은 TSMC의 3nm 공정으로 제작된 3,360억 개의 트랜지스터를 탑재한 AI 플랫폼 '베라 루빈(Vera Rubin)'을 공개하는 동시에 업계가 우려하던 사실을 확인해 주었습니다. 바로 HBM4 메모리가 2026년까지 완전히 매진되었으며, GPU 리드 타임이 현재 36주에서 52주까지 늘어났다는 점입니다. 190억 달러 규모의 DePIN 섹터에 있어 이러한 공급 위기는 문제가 아니라 10년에 한 번 올까 말까 한 기회입니다.
베라 루빈 아키텍처: AI 컴퓨팅의 새로운 차원
암흑 물질의 존재를 증명한 천문학자의 이름을 딴 베라 루빈은 블랙웰(Blackwell) 이후 엔비디아가 시도하는 가장 야심 찬 플랫폼 도약을 상징합니다. 그 수치는 놀라운 수준입니다:
- 3,360억 개의 트랜지스터: TSMC의 N3P 노드 적용 — 블랙웰 밀도의 거의 두 배
- 22 TB/s 메모리 대역폭: SK하이닉스와 삼성의 차세대 HBM4를 통해 구현
- NVL72 구성: 72개의 루빈 GPU와 36개의 베라 CPU가 NVLink 6 패브릭을 통해 연결되어 3.6 exaFLOPS의 NVFP4 추론 및 2.5 exaFLOPS의 학습 성능 제공
- 5배 향상된 추론 처리량: 엔비디아의 새로운 4비트 부동 소수점(NVFP4) 포맷 사용
황 CEO는 이번 기조연설에서 "5개 층의 케이크로서의 AI" — 에너지, 칩, 인프라, 모델, 애플리케이션 — 를 중심으로 발표를 진행했습니다. 특히 첫 번째 층인 에너지에 이례적으로 많은 강조점을 두었습니다. 데이터 센터는 이미 전 세계 전력의 2~3%를 소비하고 있으며, AI 워크로드가 확장됨에 따라 2030년까지 그 비중이 3배로 늘어날 수 있다는 전망이 나오고 있습니다. 황 CEO는 해양 파력 발전을 위한 디지털 트윈을 포함한 재생 에너지 파트너십을 언급하며, 컴퓨팅 공급이 더 이상 실리콘만의 문제가 아니라 에너지의 문제임을 시사했습니다.
최초의 베라 루빈 샘플은 2026년 말 티어 1 클라우드 제공업체에 인도될 예정이며, 2027년 초에 본격적인 양산에 들어갈 것으로 보입니다. '파인만(Feynman)'이라는 코드명의 다음 아키텍처는 이미 2027년 로드맵에 포함되어 있습니다.