H100 렌탈 가격 40% 반등..네오 클라우드·HBM·네트워킹 기업 수혜

아메리카 / 김민영 기자 / 2026-04-08 07:36:24
(사진=연합뉴스)

 

[알파경제 = 김민영 기자] 최근 구형 H100 칩의 1년 렌탈 가격이 2025년 10월 시간당 1.70달러에서 2026년 3월 2.35달러로 약 40% 급등하는 이례적 흐름이 나타났다.

 

김세환 KB증권 연구원은 "이는 제품의 수요와 공급(온디맨드 GPU 용량 사실상 완전 매진, 블랙웰 신규 배치 리드타임 6~7개월 지연) 외에도 구조적 원인에 기인한다"며 "네오 클라우드, HBM, 네트워킹, 전력/냉각, 저장장치 기업의 수혜가 예상된다"고 판단했다.

H100칩의 '가격 역전 현상'의 세 가지 구조적 수요 변화를 살펴보면, 추론 분리 아키텍처 (Disaggregated Serving)의 확산으로 호퍼칩의 경제적 수명이 연장되고 있다는 점이다. 

 

LLM 추론은 내부적으로 연산 집약적인 사전 처리 (Prefill)와 메모리 대역폭 집약적인 생성 (Decode) 두 단계로 나뉘며, 이를 물리적으로 분리해 각각에 최적화된 GPU를 배치하는 방식이 상용화되고 있다. 

 

블랙웰은 FP4 지원과 초당 8TB 메모리 대역폭을 앞세워 전단계에서 호퍼 대비 11~15배 빠른 처리량을 보여주지만, 블랙웰의 공급이 수요를 따라잡지 못하는 상황에서 호퍼칩은 비용 효율적인 보조 추론 및 백그라운드 워크로드 처리에 여전히 경쟁력을 유지하고 있다.

 

김세환 연구원은 "블랙웰의 등장이 H100을 퇴역시킨 것이 아니라 보완적 역할을 부여하면서, 두 세대의 GPU가 동시에 소진되는 구조가 형성된 것"이라고 해석했다.

 

AI 에이전트의 확산이 토큰 소비를 폭발적으로 끌어올리고 있다는 점도 주목할 만 한다.

 

에이전트는 다단계 추론, 외부 도구 호출, 자기 검증을 반복하면서 기존 챗봇과는 비교할 수 없이 많은 토큰을 소비한다. 토큰 단가는 2년간 280배 하락했지만 멀티 에이전트 루프의 비선형적 수요 증가로 기업의 실제 AI 비용은 오히려 급등하는 역설이 발생하고 있다.

 

김세환 연구원은 "코드 생성 AI가 구조적 GPU 소비원으로 부상했다"며 "코드 생성은 수만 줄의 코드베이스를 컨텍스트로 입력해야 하므로 Prefill 부하가 극대화되고, 생성/검증/수정을 반복하면서 세션당 수십 회의 추론 호출이 발생하고 있다"고 설명했다. 

 

앤트로픽의 연간반복매출 (ARR)이 한 분기 만에 90억 달러에서 250억 달러 이상으로 약 3배 급증한 것이 이를 단적으로 보여준다.

 

김 연구원은 "이와 같은 변화의 구조적 공통분모는 하나로 추론 1건당 토큰 소비량이 과거와 비교할 수 없이 커졌다는 것"이라고 강조했다.

 

KB증권은 이와 같은 칩 가격 인상 관련 수혜 기업으로 네오 클라우드 3사 코어위브 (CRWV US), 네비우스(NBIS US), 아이렌(IREN US)과 GPU/파운드리 기업 엔비디아 (NVDA US), TSMC (TSM US)를 꼽았다.

 

또, HBM/메모리 관련 SK하이닉스 (000660 KR), 삼성전자 (005930 KR), 마이크론 (MU US), 어플라이드 머티리얼즈 (AMAT US), 네트워킹 기업 크레도 테크놀로지 (CRDO US), 코히어런트 (COHR US), 루멘텀 (LITE US), 암페놀 (APH US), 전력/냉각 기업 버티브 (VRT US), 슈나이더 일렉트릭 (SU FR/유럽 상장), 저장장치 관련 씨게이트 (STX US), 웨스턴 디지털(WDC US)을 제시했다. 

알파경제 김민영 기자(kimmy@alphabiz.co.kr)

주요기사

아카마이(AKAM.N) 분산형 AI 인프라 가치 재평가 구간
엔라이트(LASR.N) 분기 사상 최대 매출 달성..고마진 사업 비중 확대
프리포트맥모란(FCX.N) 리스크 주가에 선반영..2분기부터 광산 정상 가동
달러트리(DLTR.N) 4분기 실적 예상치 부합..매크로 변수에도 이익 방어
스페이스X 상장 절차 본견 돌입..우주산업 투자 확대
뉴스댓글 >

건강이 보이는 대표 K Medical 뉴스

SNS