이세돌 ‘마지막 대국’ 상대 NHN 토종 바둑 AI ‘한돌’ 정체는?
입력 2019.12.18 09:47
수정 2019.12.18 10:04
1999년부터 ‘한게임 바둑’서 쌓은 방대한 데이터 활용
국내 바둑 랭킹 1위 신진서 9단 이겨…승률 ‘90%’ 이상
1999년부터 ‘한게임 바둑’서 쌓은 방대한 데이터 활용
국내 바둑 랭킹 1위 신진서 9단 이겨…승률 ‘90%’ 이상
이세돌 바둑 9단의 은퇴 경기가 18일 열린다. 알파고와의 대결 이후 약 3년 만이다. 경기 상대는 NHN이 개발한 토종 바둑 인공지능(AI) ‘한돌(HanDol)’이다.
한돌은 NHN이 1999년부터 ‘한게임 바둑’을 통해 쌓아온 방대한 바둑 데이터를 기반으로 자체 개발, 서비스하는 AI 바둑 프로그램이다. 국내 게임업계 중 자체 개발해 일반인이 상시 대국 가능한 바둑 AI로는 최초일 뿐 아니라 유일하다.
NHN은 2017년 초부터 10개월간의 개발 기간을 거쳐 2017년 12월 한돌 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치면서 한돌 2.0은 1.0에 비해 90%이상의 승률, 한돌 3.0은 2.0에 비해 90% 이상의 승률을 보인다.
한돌은 지난해 12월 출시 1주년을 기념해 한 달 간 다섯 명의 최상위 랭킹 바둑 프로기사들과 릴레이 대국을 펼치는 ‘프로기사 TOP5 vs 한돌 빅매치’ 이벤트를 진행해 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단을 대상으로 연이어 승리를 거뒀다.
올해 8월 20일부터 25일까지 중국 산둥성에서 열린 ‘2019 중신증권배 세계 AI 바둑대회’에 참여해 처음으로 참가한 세계 AI 바둑대회에서 3위를 달성하기도 했다.
바둑 AI의 주요 기능은 대국 시 이길 수 있는 다음 수를 예측하는 것이다. 개발 초기 한돌은 한게임 바둑 데이터 등 사람이 둔 기보를 학습해서 다음 수를 예측하는 정책망을 사용했다.
출시 시점에는 ▲사람이 둔 기보로 학습한 정책망으로 후보 수를 선택한 후 ▲자가 대국을 한 기보로 학습한 가치망과 ▲패턴으로 끝까지 빠르게 둔 롤아웃으로 다음 수에 대한 승리 확률을 얻었다. 이렇게 선택하고 얻은 수에 대한 승리 확률에 MCTS라는 수읽기 알고리듬을 사용해 다음 수를 예측했다.
최신 버전의 한돌은 무작위·자가대국으로 만든 기보로부터 학습한 정책망과 더 정확한 가치망을 사용해 롤아웃 없이 MCTS 수읽기 알고리듬을 통해 다음 수를 예측한다. 여기에 자가 대국에서 생성한 기보를 이용해 학습하는 과정을 반복, 지속적으로 성능을 개선시키고 있다.
현재 한돌은 2016년 이세돌 9단과 대국한 알파고 리, 2017년 커제와 대국한 알파고 마스터의 수준을 넘어서는 기력을 선보이고 있다고 평가받는다.
NHN의 한돌 개발·서비스 목표는 바둑의 기력을 높이는 것 뿐 아니라, 바둑을 배우고 즐기는 모든 이용자에게 도움을 줄 수 있는 서비스로 만들어나가는 것이다.
NHN 관계자는 “바둑 프로기사뿐 아니라 일반 유저나 바둑을 전혀 모르는 유저도 쉽게 접근할 수 있도록 덤 조절이나 접바둑, 페어바둑 등의 다양한 대국 서비스, 신규 콘텐츠를 갖춘 성능 좋은 AI로 개발하기 위해 노력 중”이라며 “한돌에서 사용한 기술을 활용해 장기, 퍼즐 등으로의 확장도 계획하고 있다”고 강조했다.
한편 NHN과 K바둑, SBS가 주최, 주관하는 이세돌vs한돌 대국은 총 3국에 걸쳐 진행된다. 이날과 19일 오후 12시에 서울 양재 도곡타워 바디프랜드 본사에서 두 차례 대국이 열리며, 마지막 3국은 이세돌 9단의 고향인 전남 신안군에 위치한 엘도라도 리조트에서 21일 오후 12시에 펼쳐진다.