넷마블, 딥러닝 기반 음성 인식 기술 ‘NeurIPS 2020’서 공개
입력 2020.11.04 10:53
수정 2020.11.04 10:54
높은 정확도와 빠른 응답 속도
넷마블은 오는 12월 6일부터 캐나다 밴쿠버에서 개최되는 ‘NeurIPS 2020(신경정보처리시스템학회)’에서 딥러닝 기반 모바일 음성 인식 기술을 선보일 예정이라고 4일 밝혔다.
NeurIPS는 세계 최고 권위의 인공지능 컨퍼런스로, 머신러닝과 빅데이터, 시청각 정보처리 등 다양한 인공지능(AI) 분야의 연구를 다룬다.
넷마블은 이번 컨퍼런스 데모 세션에서 ‘딥러닝 기반 음성 인식기를 세계 최초로 모바일 게임에 탑재 가능한 수준까지 경량화한 기술(MONICA/모니카)’을 공개할 예정이다. 모니카는 논문 심사관 전원에게 ‘Strong Accept’라는 리뷰 결과를 받아 만점으로 심사를 통과했다.
논문 발표를 맡은 넷마블 AI센터 안수남 팀장은 “모바일 게임에 필요한 음성 사용자경험(UX)은 인식률과 응답 속도가 매우 중요하기 때문에 이를 지속 개선해 나가는 것에 초점을 맞추고 있다”며 “모바일 내에서 높은 정확도와 빠른 응답 속도로 반응하는 음성 인식기를 세계 최초로 개발하여 게임 이용자들의 몰입도 향상에 주력하고 있다”고 설명했다.
또한 “모니카는 가장 우수한 성능을 갖춘 딥러닝 기반 음성 인식기인 스피치 트랜스포머보다 6배 적은 메모리 사용량과 3배 빠른 연산 시간을 확보하여 모바일에서도 구동시킬 수 있는 수준으로 경량화한 모델”이라며 “딥러닝 기반 음성 인식은 특정 언어에 국한되지 않기 때문에 다국어 지원 게임 개발 시에도 활용도가 높다”고 말했다.
넷마블 AI센터 오인수 실장은 “모바일에서 구동하는 음성 인식 기술 개발을 통해 게임 이용자들에게 더 좋은 편의 기능을 제공할 수 있을 것으로 기대한다”며 “향후 넷마블에서 출시하게 될 글로벌 타이틀에도 순차적으로 기술을 적용해나갈 계획이다”라고 덧붙였다.
한편 넷마블에서는 지난 3월 출시한 ‘A3: 스틸얼라이브’에 시동어 인식 기술(시동어: 모니카)을 적용하여 서비스 중이다. 음성 AI 분야 세계 최고 학회인 ‘INTERSPEECH 2019’에서 <Robust Keyword Spotting via Recycle-Pooling for Mobile Game> 논문으로, ‘IEEE ICASSP 2020’에서는 <Robust End-to-end Keyword Spotting and Voice Command Recognition for Mobile Game> 논문으로 기술 발표를 진행해 넷마블의 인공지능 분야 기술력을 입증한 바 있다.