공유하기

카카오톡
블로그
페이스북
X
주소복사

AI 열기, 물로 잡는다…kt cloud "리퀴드 쿨링, 내년 4월 상용화"

조인영 기자 (ciy8100@dailian.co.kr)
입력 2025.12.11 14:03
수정 2025.12.11 14:09

클라우드·의료 연구업계가 핵심 수요…산·학·연도 소규모 HPC 요구 늘어

누액·전력 우려에 "부식 억제·필터 적용해 안정성 확보"

전력 최대 60% 절감·운영 인력 30% 목표…AI 데이터센터 효율화 가속

허영만 kt cloud DC본부장이 11일 서울시 양천구 소재 'AI 이노베이션 센터'에서 열린 미디어 행사에서 인사말을 하고 있다.ⓒkt cloud

kt cloud가 국내 최초 '리퀴드 쿨링(액체 냉각)' 적용 가산 AI 데이터센터를 내년 4월 상용화한다. AI 인프라 팽창 속 데이터센터 수요 증가에 맞춰 선행 기술을 적용하며 AI 시대를 선도하겠다는 의지다.


허영만 kt cloud DC본부장은 11일 서울시 양천구 소재 'AI 이노베이션 센터'에서 열린 미디어 행사에서 "가산 데이터센터 오픈으로 국내 최초로 리퀴드 쿨링에 대해 상업 서비스를 준비하고 있다"면서 "내년 4월 서비스 개시 예정"이라고 밝혔다.


‘리퀴드 쿨링’은 고성능 GPU(그래픽처리장치) 서버에서 발생하는 열을 효율적으로 제어하기 위해 액체를 활용하는 방식을 말한다. 공랭식이 공기로 식히는 방식이라면, 리퀴드 쿨링은 냉수를 써서 열을 빠르게 빼낸다.


허 본부장은 ‘리퀴드 쿨링’ 주 수요처로 클라우드 사업자를 꼽았다. 그는 "클라우드 사업자들이 기본적으로 데이터센터 인프라에 리퀴드 쿨링 요구를 많이 하고 있다"면서 "머신러닝에 접목해 추론 서비스까지 요구하는 파마슈티컬(Pharmaceutical) 의료 연구 업계에서도 요청한다"고 설명했다.


산·학·연에서는 소규모 GPU 기반 고성능 컴퓨팅 환경을 요구하고 있다고 덧붙였다.


이같은 '리퀴드 쿨링' 선호는 점진적으로 확대될 것으로 허 본부장은 내다봤다.


그는 "에어 쿨링(공랭식)도 랙(rack)당 40~50kW(킬로와트)를 할 수 있으나 100~200kW가 넘어가면 리퀴드 쿨링으로 구현해야 한다"면서 "두 방식은 공존하겠지만 비중 자체는 리퀴드 쿨링이 늘어날 것"이라고 진단했다.


'리퀴드 쿨링' 기술 도입으로 기업들의 비용이 늘어날 것이라는 우려도 제기됐다. 이에 대해 kt cloud는 처음 시도되는 기술인만큼 기업들이 어느 정도 감당중이며, 상용화가 본격화되면 비용 절감 효과가 나타날 것으로 기대했다.


리퀴드 쿨링의 누액(leak) 가능성을 지적하는 목소리도 나왔다.


이에 대해 kt cloud는 배관 재질이 타 배관과 다르며, 냉각수에는 부식 억제제와 미생물 번식을 막는 살생제를 넣어 안정성을 확보했다고 강조했다. 또한 25마이크로미터(㎛) 필터를 적용해 이물질에 따른 막힘이나 고장을 예방하고 있다고 설명했다.


전력 증가 지적도 있었다. 이에 대해 kt cloud는 "고가의 서버를 사용할 시 에어쿨링 시스템을 적용하면 전력량이 올라간다. 이를 낮추기 위해 활용하는 것이 리퀴드 쿨링 시스템"이라고 답했다.


서울 양천구에 위치한 kt cloud ‘AI 이노베이션 센터’ⓒkt cloud
냉각·관제·자율주행까지 아우르는 통합 실증 센터

이날 공개된 ‘AI 이노베이션 센터’에서는 kt cloud가 상용화와 기술 검증을 진행 중인 첨단 냉각 기술이 시연됐다. 센터 내 'AI 인프라 랩스'에 들어서자 '웅웅' 소리와 함께 빼곡히 들어선 서버가 보였다. 벽면 한 공간에서는 바람이 불어와 내부 온도 상승을 억제했다.


D2C(Direct to Chip, 직접 칩 냉각) 수냉식은 GPU 칩에 콜드플레이트를 부착하고 냉수를 직접 접촉시키는 방식을 기반으로 한다.


가까이서 살펴보니 오른쪽에는 D2C 시스템의 핵심 장비인 냉각수 분배 장치(CDU)가 설치돼 있다. 펌프와 열교환기로 구성된 이 장치는 냉각수를 순환시킨다. 고개를 들어 천장을 향하자 배관이 보였다. 배관은 CDU에서 매니폴드를 거쳐 서버 내부의 콜드플레이트까지 이어지는 냉각수 라인이다.


왼쪽을 돌아보면 수냉식 서버가 배치돼있다. 매니폴드를 통해 공급된 냉각수가 서버 내부를 돌며 열을 직접 식혀준다. 이 방식은 기존 공랭식보다 운영 온도를 크게 낮춰 서버의 내구성과 안정성을 높인 것이 특징으로, 실제 운영 시스템과 동일한 환경을 구현해 고객사들이 데이터센터 운영 방식을 한눈에 확인할 수 있도록 했다.


kt cloud는1kW(키로와트)급 모듈 8개(총 8kW)로 구성된 서버(Server)형 수냉식 부하기 기반의 D2C 수냉식 시스템 실제 작동 모습을 구현했다. 가산 AI 데이터센터에 해당 기술을 국내 최초로 상용화한 바 있다.


이를 위해 kt cloud는 B200 등 최신 엔비디아 GPU(그래픽처리장치) 기반 AI 서버의 고열 환경을 테스트하고, 제어하기 위한 리퀴드 쿨링 부하기를 자체 개발해 성능 검증을 완료했다.


또한 B200·NVL72 규격에 맞춰 냉각수 유량, 압력, 온도 등 조건을 지속적으로 실증하는 등 기술을 내재화했다.


kt cloud는 AI 서버를 특수 액체에 직접 담가 열을 식히는 '이머전 쿨링'(액침 냉각) 기술의 실제 모형도 선보였다.


kt cloud는 PoC(기술 검증)를 통해 실제 부하 테스트를 진행한 결과, 최대 60%의 전력 절감 효과를 확인했다고 설명했다. 다만 아직 고객 수요는 없다고 밝혔다.


'AI 이노베이션 센터' AI 인프라 랩스ⓒkt cloud

D2C 수냉식 시스템 내부 순환 냉각수 'PG-25'도 마련했다.회사측은 "TCS(Technology Cooling System) 계통에 사용되는 각기 다른 재질과 PG-25 용액의 가능성 테스트를 진행하고 있다"고 말했다.


옆의 관제시스템에서는 온도, 습도, 조도, 소음 등을 실시간으로 모니터링하며 화재나 일산화탄소, 메탄가스 등 각종 유해 가스 누출을 예방한다.


자율주행 로봇을 활용해 서버룸을 순찰하는 시연도 이어졌다. 각종 카메라를 장착한 자율주행 로봇이 서버 랙을 사이를 오가며 상태를 점검했다. 카메라를 개별 서버로 가져가 이상이 있는지 탐지한 후 다음 랙으로 이동했다.


AI 데이터센터, 향후 인력 3분의 1로 줄이는 운영 모델 목표

허 본부장은 "데이터센터와 AI 산업 발전을 위해 기술을 선도적으로 이끌고, 실제 환경에 검증함으로써 고객에게 더 많은 가치를 제공하고자 한다"고 강조했다.


이어 "업계 많은 플레이어들이 선도적인 데이터에 많은 갈증을 느끼고 있는 상황에서 kt cloud가 기술 요소 등을 연구하고 실증해 공개하는 부분도 검토하고 있다"고 덧붙였다.


kt cloud는 2030년까지 데이터센터 용량을 320MW 이상으로 확대하며, 경북(10MW), 가산(40MW), 부천(80MW) 등 신규 센터를 순차 개소할 계획이다.


이같은 AI 데이터센터 운영이 확산할 경우 인건비도 절감될 수 있을 것으로 예상했다.


허 본부장은 "현재 60~70명 정도가 4조 3교대를 하고 있다. 목표 인력은 현 인력의 3분의 1 이하"라고 설명했다. 완전 무인화에 대해서는 "시간이 더 필요하다. 우선 적용 업무를 분류하고, 단계적으로 무인화할 시스템을 구축하고 운영하는 것이 목표"라고 말했다.

조인영 기자 (ciy8100@dailian.co.kr)
기사 모아 보기 >
0
0

댓글 0

로그인 후 댓글을 작성하실 수 있습니다.
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기