인사이트 리포트

[넥서스알파랩]엔비디아와 마이크로소프트가 AI 노트북에서 '그 숫자'를 지운 이유

AI 노트북 광고가 가린 진실 — 진짜 승부처는 '연산'이 아니라 '메모리'다 들어가며

2026.06.07 | 조회 14 |
0
|
from.
넥서스알파랩

들어가며

첨부 이미지

컴퓨텍스 2026에서 마이크로소프트와 엔비디아가 공동으로 서피스 랩탑 울트라를 공개했습니다. 엔비디아의 새 칩 RTX 스파크를 실리콘 단계부터 함께 설계한 첫 노트북입니다. 그런데 이 발표에서 가장 주목할 점은 화려한 사양 자체가 아니라, 두 회사가 무엇을 전면에 내세웠고 무엇을 내려놓았는가입니다. 그동안 모든 AI 노트북 광고가 가장 크게 자랑하던 숫자, 즉 연산 가속 칩의 처리 속도를 이들은 앞세우지 않았습니다. 대신 메모리를 들고 나왔습니다. 이 선택 하나에 온디바이스 AI 시대의 핵심이 압축되어 있습니다.

엔비디아가 내건 숫자

서피스 랩탑 울트라의 심장은 RTX 스파크입니다. 20개 코어로 구성된 그레이스 CPU와 6144개의 연산 코어를 가진 블랙웰 GPU가 엔비디아 독자 인터커넥트로 직결되어, 칩 내부에서 초당 600기가바이트 수준으로 데이터를 주고받습니다. 여기에 최대 128기가바이트 통합 메모리와 초당 300기가바이트의 대역폭이 결합됩니다. 일반 노트북의 그래픽 메모리가 보통 8에서 12기가바이트, 그것도 좁은 통로에 묶여 있는 것과 비교하면 같은 노트북이라 부르기 어려운 격차입니다. 이 구조 덕분에 RTX 스파크는 네트워크 연결 없이 1200억 매개변수급 대형 모델까지 로컬에서 구동할 수 있습니다.

왜 메모리인가 — 톱스 마케팅의 한계

핵심은 AI를 실제로 돌리는 방식에 있습니다. 사용자와 회의하고 코드를 작성하는 자율형 AI 비서를 노트북에서 구동하려면, 100억 개가 넘는 모델 정보가 칩 메모리 위에 통째로 상주해야 합니다. 그런데 일반 노트북은 메모리 용량이 작고 데이터가 오가는 통로마저 좁아, 단어 하나를 만들 때마다 거대한 가중치 정보를 좁은 통로로 일일이 끌어와야 합니다. 이것이 메모리 병목입니다. 이 상태에서는 연산 가속 칩이 아무리 빠른 처리 속도를 자랑해도 의미가 없습니다. 계산할 힘은 남아도는데 정작 데이터가 도착하지 않아 칩이 멈춰 서서 기다리기 때문입니다. 그동안 노트북 광고를 가득 채운 처리 속도 경쟁이 현실의 AI 구동 환경에서 얼마나 무력했는지가 바로 이 지점에서 드러납니다.

소프트웨어의 응답 — 구글 젬마 4

하드웨어가 길을 열었다면, 그 길을 채우는 것은 모델입니다. 구글이 내놓은 온디바이스 모델 젬마 4는 시각과 음성 데이터를 처리하던 무거운 인코더 계통을 통째로 걷어낸 인코더리스 구조를 택했습니다. 외부 이미지와 소리를 별도 장치 없이 단일 디코더의 동일한 임베딩 공간으로 곧장 주입해, 로컬 메모리 낭비와 지연을 줄였습니다. 더 결정적인 것은 압축 효율입니다. 원본 정밀도에서는 약 26.7기가바이트를 요구하지만, 양자화 인식 훈련을 거친 4비트 형식에서는 단 6.7기가바이트만 차지합니다. 그러면서도 256K 토큰에 달하는 긴 맥락을 유지하고, 출력값의 폭주를 억제하는 안전장치를 내장해 로컬 환경의 고질병이던 환각 현상을 수치적으로 제어합니다.

두 흐름이 만나는 지점

여기서 하드웨어와 소프트웨어가 만납니다. 6.7기가바이트짜리 젬마 4를 128기가바이트 메모리에 올리면, 가장 긴 맥락을 전부 활성화하고도 100기가바이트가 넘는 공간이 그대로 남습니다. 이는 사용자의 코드 전체와 화면 속 디자인, 회의 음성 일체를 외부 서버로 단 한 번도 보내지 않고, 인터넷 연결 없이 노트북 안에서만 강력한 AI 비서를 영구 구동할 수 있음을 의미합니다. 마이크로소프트는 이 구조를 상시 작동 AI 에이전트의 클라우드 토큰 비용 폭증에 대한 해답, 곧 '무제한 지능'으로 설명하고 있습니다.

넥서스알파랩이 본 시각

넥서스알파랩이 본 시각은 이렇습니다. AI 노트북 경쟁의 진짜 전장은 연산 속도가 아니라 메모리입니다. 얼마나 큰 모델을, 얼마나 빠른 통로로, 칩 바로 옆에 붙여 두느냐가 승부를 가릅니다. 흥미로운 역사적 맥락도 있습니다. 마이크로소프트와 엔비디아는 과거 윈도우 온 암을 시도했다가 빈약한 성능과 호환성 문제로 구억 달러, 우리 돈 약 1조 2천억 원의 손실을 보고 물러난 적이 있습니다. 한때 무너졌던 바로 그 자리에서 두 회사는 이번엔 가장 눈에 띄는 숫자가 아니라 가장 보이지 않던 병목을 정조준했습니다.

이 변화는 경쟁 구도도 바꿉니다. 애플의 최신 칩은 초당 307기가바이트라는 뛰어난 대역폭을 갖췄지만 폐쇄적인 그래픽 생태계 안에서만 작동합니다. 반면 RTX 스파크 진영은 글로벌 창작·개발 생태계의 표준 소프트웨어와 가속 자원을 그대로 활용할 수 있습니다. 어도비가 포토샵과 프리미어를 이 칩에 맞춰 재설계해 성능을 두 배로 끌어올린 것이 대표적입니다. 같은 가을, 엔비디아는 에이수스·델·HP·레노버·MSI 등을 통해 RTX 스파크 노트북을 확산시킬 예정이라, 이 흐름은 단발성 제품이 아니라 플랫폼 전환의 시작에 가깝습니다.

투자자가 주목할 신호와 꼬리 위험

서학개미 관점에서 핵심 시사점은 분명합니다. AI PC의 진짜 해자는 처리 속도 수치가 아니라 메모리 용량과 대역폭, 그리고 통합 아키텍처에 있습니다. 따라서 향후 제품과 기업을 평가할 때 마케팅용 처리 속도 숫자보다 통합 메모리 규격과 대역폭 설계를 먼저 확인하는 편이 합리적입니다. 또한 상시 작동 AI 에이전트가 늘어날수록 클라우드 추론 비용 부담이 커지므로, 로컬과 클라우드를 섞는 하이브리드 구조로의 전환은 비용 측면에서도 설득력을 갖습니다.

다만 분명히 구분해 둘 점도 있습니다. 서피스 랩탑 울트라의 정확한 가격과 실사용 성능, 발열 제어의 현실적 한계는 아직 충분히 검증되지 않았습니다. 메모리 중심 아키텍처가 시장 표준으로 자리 잡는 속도와, 이로 인해 메모리 공급망이 받을 수요 압력의 크기 역시 현 시점에서는 단정하기 어렵습니다(출처를 바탕으로 한 추론). 구조는 분명히 바뀌고 있으나, 그 속도와 폭은 앞으로의 출시와 실측 데이터로 확인해야 합니다.

본 리포트는 투자 추천이 아닙니다. 넥서스알파랩이었습니다.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

넥서스알파랩 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

다른 뉴스레터

© 2026 넥서스알파랩

구글과 ChatGPT가 주목하는 AI 비즈니스 전문 리포트, 넥서스알파랩

메일리 로고

도움말 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-8호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스