들어가며
구독자님, 이번 주 산호세 SAP 센터에서 열린 엔비디아 GTC 2026이 어제, 3월 19일로 막을 내렸어요. 3만 명이 넘는 참가자가 몰린 이 행사에서, 젠슨 황 CEO는 2시간이 넘는 기조연설을 통해 수십 가지 제품과 전략을 쏟아냈어요. 오늘 뉴스레터에서는 이번 GTC 2026을 총 정리 해보려해요.
미디어의 헤드라인은 예상대로 베라 루빈(Vera Rubin), Groq 통합, 1조 달러 매출 가시성 같은 키워드로 도배되었어요. 그런데 저는 이번 GTC의 진짜 메시지가 개별 제품이 아니라 다른 곳에 있었다고 봐요.
젠슨 황이 2시간 동안 설명한 건 결국 하나예요. "AI는 이제 산업 생산 시스템이고, 토큰이 그 공장의 생산물이며, 엔비디아는 그 공장의 설계자"라는 선언이에요. 오늘은 GTC 2026에서 우리가 정말 집중해서 봤어야 할 세 가지 포인트를 짚어볼게요.
1조 달러의 의미: 숫자 뒤에 숨은 구조 변화
GTC에서 가장 많이 인용된 숫자는 단연 "1조 달러"에요. 젠슨 황은 블랙웰(Blackwell)과 베라 루빈(Vera Rubin) 플랫폼의 구매 주문이 2027년까지 1조 달러에 달할 것이라고 밝혔어요. 작년 GTC에서 제시했던 5,000억 달러 가시성의 정확히 두 배예요.
이 숫자가 흥미로운 이유는 규모 자체보다 구성에 있어요. 젠슨 황에 따르면 이 1조 달러에는 GPU 시스템과 네트워킹 매출만 포함되어 있어요. 새로 발표된 독립형 Vera CPU, Groq LPX 솔루션, 스토리지는 포함되지 않은 수치예요. 젠슨 황 본인의 표현을 빌리면, Groq를 추론 워크로드에 추가하면 컴퓨팅 지출이 약 25% 증가하기 때문에, 실질적인 시장 규모는 1.25조 달러 이상이 돼요.
매출 구성도 주목할 만해요. 현재 매출의 약 60%는 상위 5대 하이퍼스케일러(AWS, Google, Azure, Meta, Oracle 등)에서 나오고, 40%는 기업, 산업, 소버린(주권) AI[1] 등에서 발생해요. 젠슨 황은 '물리적 AI(Physical AI)'가 본격화되면 이 비중이 역전되어 비(非)하이퍼스케일러 비중이 70%까지 올라갈 것으로 전망했어요.
이게 왜 중요할까요? 엔비디아의 매출이 소수의 빅테크 기업에 집중되어 있다는 건 오랫동안 리스크 요인이었어요. 하지만 물리적 AI — 로보틱스, 자율주행, 제조 — 가 확산되면, 고객 기반이 구조적으로 분산돼요. 엔비디아는 이미 BYD, 현대, 닛산, 지리(Geely) 등 연간 1,800만 대를 생산하는 자동차 제조사를 자율주행 파트너로 확보했고, Uber와의 배차 네트워크 연동도 발표했어요.
참고로 엔비디아의 직전 회계연도(FY2026, 2026년 1월 종료) 매출은 2,159억 달러로 전년 대비 65% 성장했어요. 데이터센터 매출만 1,973억 달러예요. 다음 분기(FY27 Q1) 가이던스는 780억 달러로, 월가 컨센서스 726억 달러를 크게 상회했어요.
Groq 통합: 200억 달러짜리 퍼즐의 완성

이번 GTC의 기술적 하이라이트는 단연 Groq 통합이었어요. 지난해 12월 크리스마스 이브에 발표된 200억 달러 규모의 Groq 자산 인수가 불과 3개월 만에 구체적인 제품으로 등장한 거예요. 왜 엔비디아가 200억 달러 — 직전 밸류에이션의 약 3배 — 를 지불했는지, 이번 GTC에서 비로소 답이 나왔어요.
핵심은 '분리된 추론(Disaggregated Inference)'이에요. AI가 답변을 생성하는 과정(추론)은 크게 두 단계로 나뉘어요. 입력을 이해하는 프리필(Prefill) 단계와, 실제로 토큰을 하나씩 만들어내는 디코드(Decode) 단계예요.
젠슨 황의 설명에 따르면, 베라 루빈은 고처리량(High Throughput) — 대량의 데이터를 한꺼번에 처리하는 데 최적화되어 있어요. 반면 Groq의 LPU[2]는 온칩 SRAM[3]을 대규모로 탑재한 초저지연(Low Latency) 머신이에요. 엔비디아는 이 근본적으로 다른 두 프로세서를 하나의 시스템으로 통합했어요.
프리필은 베라 루빈이 담당하고, 디코드의 토큰 생성은 Groq가 맡아요. 심지어 디코드 내부에서도 어텐션 연산[4]은 베라 루빈에서, FFN(피드포워드 네트워크) 연산은 Groq에서 수행하는 식으로 극도로 세밀한 분업이 이뤄져요. 두 시스템은 이더넷 위에서 특수 모드로 연결되어 지연 시간을 절반 가까이 줄였어요.
결과는? 와트당 추론 성능 최대 35배 향상이에요. 단순한 수치 개선이 아니라, 젠슨 황의 표현대로 "세상이 한 번도 본 적 없는 새로운 추론 성능 티어"가 열린 거예요.
이걸 자동차 산업에 비유하면 이해가 쉬워요. 보통 엔진 하나로 모든 주행 조건을 감당하잖아요. 엔비디아가 한 건 고속도로 주행용 엔진과 시내 주행용 엔진을 하나의 차에 넣고, 상황에 따라 자동 전환되게 만든 것이에요. 비용은 올라가지만, 에너지 효율과 성능이 극적으로 좋아져요.
Groq LP30 칩은 삼성이 생산하고 있으며, 2026년 3분기(하반기) 출하 예정이에요. 이와 함께 베라 루빈도 같은 시기에 본격 출하될 것으로 보여요 — 마이크로소프트에는 이미 첫 번째 샘플이 전달되었어요.
'토큰 경제학': 엔비디아가 재정의하는 컴퓨팅의 가치
이번 GTC에서 제가 가장 주목한 프레임은 토큰 경제학(Tokenomics)이에요. 애널리스트 콜에서 마진 지속성에 대한 우려가 나왔을 때, 젠슨 황의 답변은 명확했어요. "고객은 비싼 컴퓨터를 사는 게 아니라, 와트당/초당 생산되는 토큰의 단가가 가장 저렴한 장비를 사는 겁니다."
이건 컴퓨터를 소모품이 아니라 제조 설비로 재정의하는 것이에요. ASML의 노광 장비[5]나 TSMC의 웨이퍼처럼, 비싸더라도 생산성이 압도적이면 고객은 기꺼이 최신형을 선택한다는 논리예요.
젠슨 황은 이 맥락에서 과거와 현재의 컴퓨팅 패러다임을 비교했어요. 과거에는 소프트웨어를 미리 작성하고, 콘텐츠를 미리 녹화하고, 영상을 미리 저장했어요. DVD를 재생하듯 사전에 만들어진 결과물을 출력하는 방식이었죠. 하지만 생성형 AI는 모든 것을 실시간으로 생성해요. 사용자, 맥락, 의도를 고려해 매번 새로운 결과물을 만들어내기 때문에, 필요한 연산량이 과거보다 수백~수천 배 더 높아요.
여기에 AI의 진화 단계가 겹쳐요. 젠슨 황은 AI를 세 단계로 정의했어요.
- 1단계: 생성형 AI — 프롬프트를 넣으면 결과물을 생성하는 단계
- 2단계: 추론(Reasoning) — 논리적으로 사고하는 단계
- 3단계: 에이전틱 시스템 — 자율적으로 목표를 설정하고, 도구를 사용하며, 다른 에이전트를 생성해서 작업을 수행하는 단계
현재 우리는 3단계에 진입하고 있어요. 에이전틱 AI에서는 하나의 질문이 수십 개의 하위 에이전트를 생성하고, 각 에이전트가 독립적으로 추론하면서 토큰을 소비해요. 토큰 수요가 포물선 형태로 급증하는 이유예요. 젠슨 황이 "엔지니어에게 노트북뿐만 아니라 토큰 예산(Token Budget)을 할당하는 시대가 왔다"고 말한 건, 단순한 비유가 아니라 실제로 기업의 IT 비용 구조가 바뀌고 있다는 의미예요.
이 프레임에서 엔비디아의 가격 전략이 이해돼요. 경쟁사가 "우리 칩이 30% 더 저렴하다"고 말할 때, 엔비디아의 반론은 "중요한 건 칩 가격이 아니라 팩토리의 생산성"이라는 거예요. 마치 iPhone을 살 때 부품 원가가 아니라 사용 경험의 총합으로 판단하는 것처럼, AI 인프라도 토큰당 비용(Cost per Token)이라는 새로운 단위로 평가되어야 한다는 주장이에요.
오스왈드의 시선
솔직히 이야기하면, 이번 GTC는 신제품 발표회가 아니라 비즈니스 모델 선언이었다고 봐요. 엔비디아가 하고 있는 건 전형적인 플랫폼 록인(Lock-in) 전략의 완성형이에요. 하드웨어(GPU + CPU + LPU + DPU + NIC + 스위치), 소프트웨어(CUDA + Dynamo + NemoClaw), 그리고 이제는 추론 파이프라인의 아키텍처 자체까지 엔비디아가 설계해요. 고객이 이 생태계 안에 들어오면 나가기가 극도로 어려워지는 구조예요.
Groq 인수가 그 핵심이에요. 원래 Groq는 엔비디아 GPU의 대안이 될 수 있었던 추론 전문 칩이었어요. Google TPU를 만든 조나단 로스(Jonathan Ross)가 창업한 회사였으니까요. 엔비디아는 200억 달러를 들여 잠재적 경쟁자를 제거하는 동시에, 자신의 약점(추론 저지연)을 보완한 거예요. Bernstein의 스테이시 라스곤(Stacy Rasgon)이 이 딜을 "경쟁의 허구를 유지하면서 사실상 인수하는 구조"라고 평가한 건 정확한 지적이에요.
한 가지 더 주목할 점이 있어요. 중국 시장 전략이에요. 최신 베라 루빈은 수출 규제로 중국 판매가 불가능하지만, 엔비디아는 두 가지 카드를 꺼냈어요. 첫째, 트럼프 행정부로부터 수출 허가를 받아 H200의 생산을 재개했어요. 둘째, Groq 기술 기반의 중국 전용 추론 칩을 5월에 출시할 계획이에요. 규제를 우회하는 게 아니라 규제 안에서 최적화된 제품을 만드는 전략인데, 이건 엔비디아가 중국 시장을 결코 포기하지 않겠다는 신호예요.
그리고 SK하이닉스의 움직임도 빼놓을 수 없어요. 용인 클러스터 1기 2~6단계에 21조 6,000억 원 규모의 인프라 투자를 공시했는데, JP모건 추정으로는 총 자본지출이 72조~86조 원에 달할 수 있어요. 최태원 회장이 GTC 현장에서 "칩 웨이퍼 부족이 2030년까지 지속될 것"이라고 말한 건, 공급 측에서도 이 수요가 구조적이라고 판단하고 있다는 의미예요.
다만, 저는 몇 가지 건강한 의문을 갖고 있어요. 1조 달러 가시성은 '구매 의향'이지 '확정 매출'이 아니에요. 하이퍼스케일러들의 CapEx 사이클이 조정되면 이 숫자는 움직일 수 있어요. 또한 엔비디아의 마진 방어 논리가 설득력 있지만, CUDA 생태계에 대한 독점적 의존은 결국 규제 리스크로 돌아올 수 있어요. 토큰 경제학이 작동하려면 토큰의 최종 소비자 — 즉 AI 서비스를 쓰는 기업과 소비자 — 가 실제로 그 비용을 감당할 수 있어야 하니까요.
마치며
이번 GTC 2026에서 기억해야 할 핵심은 세 가지예요.
첫째, 엔비디아는 더 이상 칩 회사가 아니에요. 7개의 칩으로 구성된 풀스택 'AI 팩토리'를 설계하는 회사로 전환했어요. 둘째, Groq 통합은 추론 시장의 게임 체인저가 될 수 있어요. 고처리량과 초저지연의 결합이 만들어내는 35배 성능 향상은 단순한 스펙 경쟁을 넘어선 구조적 우위예요. 셋째, '토큰 경제학'은 AI 인프라 투자의 새로운 평가 프레임이에요. 칩 가격이 아니라 토큰당 생산 비용이 기준이 되는 세상에서, 현재로서는 엔비디아의 논리가 가장 설득력 있어요.
이 주제가 더 궁금하신 분은, 젠슨 황의 기조연설 전문(약 2시간 30분)을 한번 직접 보시길 추천해요. 제품 발표 사이사이에 AI 산업의 구조를 읽는 프레임이 녹아 있거든요.
참고자료 & 더 읽기
핵심 출처
- NVIDIA, "NVIDIA Announces Financial Results for Fourth Quarter and Fiscal 2026", 2026.2.25. : FY2026 연간 매출 2,159억 달러, Q1 FY27 가이던스 780억 달러 등 재무 데이터의 1차 출처예요.
- NVIDIA, "NVIDIA Kicks Off the Next Generation of AI With Rubin — Six New Chips, One Incredible AI Supercomputer", 2026.1.5. : 베라 루빈 플랫폼의 공식 발표 자료예요. 6개 칩의 구성과 스펙이 정리되어 있어요.
- CNBC, "Nvidia buying AI chip startup Groq's assets for about $20 billion in its largest deal on record", 2025.12.24. : Groq 인수의 배경과 구조를 이해하는 데 필수적인 기사예요.
- NVIDIA Technical Blog, "Inside the NVIDIA Vera Rubin Platform", 2026.1 (Updated 2026.3.16). : Groq LPX 추가 이후 업데이트된 기술 심층 분석 자료예요. 분리된 추론 아키텍처를 이해하는 데 가장 좋은 자료예요.
배경 지식
- The Next Platform, "Nvidia Finally Admits Why It Shelled Out $20 Billion For Groq", 2026.3.17. : Groq 인수의 전략적 의미와 베라 루빈 통합 과정을 기술적으로 분석한 기사예요.
- Reuters, "South Korea's SK Group chairman expects chip wafer shortage to last until 2030", 2026.3.16. : SK그룹 최태원 회장의 GTC 현장 발언과 ADR 상장 검토 소식을 담고 있어요.
- Tom's Hardware, "Nvidia GTC 2026 keynote live blog", 2026.3.16. : 기조연설의 실시간 정리본이에요. 전체 발표 흐름을 빠르게 파악하는 데 좋아요.
관련 영상
각주
- [1] 주권 AI (Sovereign AI): 각 국가가 자국 내에 독자적인 AI 인프라를 구축하는 움직임이에요. 데이터 주권과 안보 차원에서 미국 빅테크에 의존하지 않으려는 전략이에요. 엔비디아 FY2026 기준 주권 AI 매출이 300억 달러를 넘겼어요.
- [2] LPU (Language Processing Unit): Groq가 개발한 AI 추론 전용 프로세서예요. GPU와 달리 온칩 SRAM에 데이터를 저장해 초저지연으로 토큰을 생성하는 데 특화되어 있어요. 쉽게 말하면, GPU가 만능 요리사라면 LPU는 초밥만 미친 속도로 만드는 전문 장인이에요.
- [3] SRAM (Static Random-Access Memory): 칩 내부에 탑재되는 초고속 메모리예요. HBM이나 DRAM보다 훨씬 빠르지만 용량이 작고 비싸요. Groq LP30은 이 SRAM을 500MB 수준으로 대규모 탑재해 저지연을 달성해요.
- [4] 어텐션 연산 (Attention Computation): 트랜스포머 AI 모델의 핵심 연산이에요. 입력된 텍스트에서 어떤 단어가 다른 단어와 얼마나 관련이 있는지 계산하는 과정이에요. 문맥을 이해하는 데 필수적이지만, 연산량이 매우 커요.
- [5] 노광 장비 (Lithography Equipment): 반도체를 만들 때 회로 패턴을 웨이퍼에 새기는 장비예요. 네덜란드 ASML이 최첨단 EUV 노광 장비를 사실상 독점하고 있어요. 대당 가격이 수천억 원에 달하지만, 이 장비 없이는 최신 반도체를 만들 수 없어서 고객이 기꺼이 구매해요.

의견을 남겨주세요