AI인프라 전쟁…반도체까지 국가 경쟁력 이슈로[AI 7대 트렌드⑦]

김지현 기자 (kjh@dailian.co.kr)
입력 2026.03.27 14:34
수정 2026.03.27 14:34

구글 터보퀀트, 메모리 혁신

AI 지능 평준화…연산 규모 경쟁

탈엔비디아…기업, 자체 칩 각축전

데이터센터·AIX 진화…경쟁력 핵심

현대차·기아 로보틱스랩은 미국 라스베이거스에서 열린 CES 파운드리(Foundry) 2026에 참가해 AI 반도체 전문기업 ‘딥엑스(DEEPX)’와의 협력을 통해 온-디바이스 AI를 위한 AI 칩을 개발 완료하고 양산을 위한 준비를 마쳤다고 밝혔다.ⓒ뉴시스

인공지능(AI) 인프라 경쟁이 치열한 가운데 AI 경쟁의 중심축이 모델 개발에서 메모리 등 연산 인프라를 확보하는 것으로 이동하고 있다.

생성형 AI 확산으로 막대한 연산 자원이 필요해지면서 반도체와 데이터센터, 슈퍼컴퓨팅을 중심으로 산업 구조가 재편되고 있기 때문이다.

글로벌 빅테크 기업들은 AI 전용 칩과 대규모 데이터센터 구축에 투자를 하고 있다. 이 같은 변화는 기술 경쟁을 넘어 국가 경쟁력으로까지 확장하고 있다.

구글 ‘터보퀀트’ 등장…메모리 반도체 위협

미 캘리포니아주 마운틴뷰에 있는 구글 본사 외벽에 구글 로고가 붙어 있다.ⓒ뉴시

구글 리서치는 25일(현지시각) ‘터보퀀트’(TurboQuant) 기술을 발표했다.

터보퀀트는 AI 모델의 크기를 크게 축소하는 것으로, AI의 메모리 사용량을 6분의 1로 줄인다. 한마디로 첨단 메모리를 압축하는 모델 경량화 기술이다.

AI는 사용자와의 대화, 검색 등이 지속되면 관련 내용이나 주요 맥락 정보를 메모리에 저장하게 된다. 이 과정에서 맥락 데이터가 늘어나고, 사용량 역시 그만큼 증가한다.

구글이 내놓은 터보퀀트 기술은 데이터 크기를 줄이는 극좌표양자화(폴라퀀트), 양자화 존슨-린덴스트라우스 변환(QJL) 기술을 바탕으로 만들어졌다. 이를 통해 AI가 사용하는 데이터를 줄이고 QJL 기술이 미세한 오차를 바로잡는다.

유회준 KAIST 전기 및 전자공학부 교수는 “터보퀀트는 모델 경량화 기법 중 하나다. KV캐시가 복잡한 수치로 작업을 했는데 3비트로 맞춰 메모리 사이즈를 (6배 가량) 줄이는 것”이라며 “이 모델은 범용보다는 특정한 응용·전문 분야에서 특수하게 사용될 것으로 보인다”고 말했다. KV캐시는 대규모언어모델(LMM)의 임시 기억장치다.

모델 지능 평준화…‘규모 경제’ 각축

터보퀀터 등 메모리 사용량을 줄이는 기술이 등장하면서 AI 패권 전쟁의 문법이 바뀌고 있다. 불과 1~2년 전만 해도 얼마나 똑똑한 LLM을 만드느냐가 핵심이었다면, 이제 시장의 눈은 ‘얼마나 더 압도적인 연산 자원을 확보하느냐’로 쏠리고 있는 까닭이다.

실제로 글로벌 AI 시장은 모델 개발의 진입장벽이 낮아지는 상향평준화 단계에 진입했다는 평가가 지배적이다. 오픈AI의 GPT-4를 필두로 구글의 제미나이(Gemini), 앤트로픽의 클로드(Claude) 등 선두권 모델 간의 성능 격차는 점차 좁혀지고 있다.

이는 AI 에이전트의 도입 시기만 봐도 알 수 있다. 한국지능정보사회진흥원(NIA)의 ‘AI 에이전트 시대, AI 활용 패러다임 변화’ 보고서에 따르면 자체 LLM을 갖춘 주요 빅테크 기업을 중심으로 2024년 4분디 차례로 AI 에이전트를 출시하기 시작했다.

LG전자, 카카오, SK텔레콤 등 국내 주요 빅테크 기업도 AI 에이전트로 비즈니스 효율성을 강화하는 등 글로벌 경쟁력 확보를 위한 기술 개발에 주력하고 있다.

이제 더 높은 수준의 추론 능력과 실시간 서비스를 제공하기 위한 컴퓨팅 파워가 필요해졌다. 업계 관계자는 “소프트웨어 알고리즘의 효율성만으로는 격차를 벌리기 힘들다”며 “결국 수만 대의 그래픽 처리 장치(GPU)를 동시에 돌릴 수 있는 데이터센터 규모와 이를 뒷받침할 전력이 승패를 가르는 본질이 됐다”고 분석했다.

탈(脫)엔비디아와 커스텀 칩 부상

삼성전자가 지난 3월 16~19일(현지 시간) 미국 새너제이에서 열리는 엔비디아 GTC에 참가해 차세대 HBM4E 기술력과 Vera Rubin 플랫폼을 구현하는 메모리 토털 솔루션을 유일하게 공급할 수 있는 역량을 앞세워 글로벌 AI리더십을 한층 강화한다. 사진은 삼성전자 GTC 부스.ⓒ뉴시스

치열한 AI 연산 인프라 확보 경쟁 속 핵심은 반도체다. 최근 기업들이 GPU 시장 공급 부족 사태를 겪은 후 엔비디아에 대한 의존도를 낮추기 위해 ‘자체 칩 개발’이라는 초강수를 두는 것도 이때문이다.

AI 칩 자체 개발과 다변화가 이뤄지면서 메모리 반도체는 공급처 다변화, 고대역폭메모리(HBM) 수요 확대로 인해 영향을 받을 수밖에 없어서다.

국외에서는 마이크로소프트(MS)가 자체 AI 칩 ‘마이아 100’을 통해 엔비디아에 도전장을 내밀었고, 구글은 6세대 TPU를 공개하며 경쟁에 뛰어들었다.

국내에서는 삼성전자가 차세대 HBM인 ‘HBM4E’ 실물 칩과 웨이퍼를 최초 공개하기도 했다.

이러한 흐름은 반도체 산업의 구조적 재편을 야기한다. 과거에는 범용 칩을 사용하는 구조였다면, 이제는 각사의 AI 아키텍처에 최적화된 기술을 확보는 게 곧 경쟁력이 된 것이다.

정부 역시 이같은 경쟁에 동참하고 있다. 과학기술정보통신부는 ‘K-엔비디아 육성’ 프로젝트를 본격화하고 있다. 프로젝트는 첨단 AI 반도체 파운드리, 국가 AI 컴퓨팅 센터 등을 목표로 한다.

과기정통부와 금융위는 27일 국민성장펀드를 통해 ‘리벨리온’에 2500억원을 직접 투자하는 안건을 의결했다. 리벨리온은 2020년 6월 설립된 AI 반도체 팹리스 기업이다. 이는 AI 반도체라는 하드웨어 생산 지원을 넘어 AI 반도체가 국가 경쟁력의 핵심으로 급부상했다는 의미이기도 하다.

데이터센터가 새로운 영토

지난 17일 서울 중구 프레스센터에서 열린 국민성장펀드 K-엔비디아 프로젝트 민관 합동간담회에서 AI 반도체 기업 대표 참석자들이 발언을 경청하고 있다.ⓒ뉴시스

인프라 전쟁의 또 다른 전선은 데이터센터와 전력이다. AI 모델 학습과 추론에는 일반적인 클라우드 서비스보다 수십 배 이상의 전력이 소모된다.

최근 MS가 가동을 멈췄던 쓰리마일섬 원전 재가동 프로젝트에 참여하고 있다는 점은 시사하는 바가 크다. 빅테크 기업들이 단순한 IT 기업의 수준을 넘어 에너지 기업과의 동맹은 물론, 발전 시설을 직접 구축하려 단계까지 나아가고 있기 때문이다.

인프라 확보 경쟁은 국가 간 주권 이슈로도 번지고 있다. 연산 자원을 보유하지 못한 국가는 기술 종속국으로 전락할 수 있다는 위기감으로 인해서다. 중국의 기술 반출 규제, 미국의 투자 및 안보 규제 등이 대표적인 예다.

전문가는 추후 AI 데이터가 어떤 곳에서, 어떤 방식으로 생성·저장될지가 관건이라고 봤다. 유 교수는 “컴퓨터의 발전을 보면 이전에는 각 도시·지역별로 데이터센터가 있었고, 이후 범위를 좁혀오다 미니 컴퓨터, 퍼스널 컴퓨터가 등장했다. 현재 AI의 발전을 보면 데이터센터에 머물고 있다”며 “널리 보급되기에는 시작 단계에 불과하지만 이제 AI는 단순히 컴퓨터 안에서만 있는 게 아니라 로봇, 가전 등에 스며들어가는 AI트랜스포메이션, AIX 등으로 다양한게 퍼질 것”이라고 설명했다.

▲<AI 해킹 위험 커진다…‘AI 보안·감사’ 산업 등장[AI 7대 트렌드⑧]>에서 이어집니다.

#AI7대트렌드

#AI인프라

#K-엔비디아육성프로젝트

#SK하이닉스

#과기정통부

#구글터보퀀트

#금융위원회

#데이터센터

#반도체

#삼성전자

#슈퍼컴퓨팅