공유하기

카카오톡
블로그
페이스북
X
주소복사

'옥냥이'의 피아노맨, AI 음성 기술과 선거 [기자수첩-정치]

정도원 기자 (united97@dailian.co.kr)
입력 2024.06.03 07:00
수정 2024.06.03 07:00

정치인, 차분한 목소리부터 격정적인

연설까지 'AI 딥러닝' 대상으로 최적

미세한 발음 습관까지 캐치하는 기술

발달, 선거판 악용 가능성에 대비해야

지난 4·10 총선 당시 대중 유세에서 마이크를 잡고 연설하고 있는 정치인들의 모습. 사진은 본문 기사 내용과 직접적인 관련은 없다. ⓒ뉴시스

한 번도 안 본 사람은 있어도 한 번만 본 사람은 없다는 네이버 치지직 스트리머 '옥냥이'의 '피아노맨' 영상이 있다. 빌리 조엘의 명곡 '피아노맨'을 커버한 것인데, 스트리머 옥냥이 본인이 직접 부른 게 아니라 AI에 목소리를 학습시켜 만든 이른바 'AI 커버 곡'이다.


완급·강약 조절이 완벽하고 절절한 호소력까지 담겨 'AI가 부른 노래'라 가볍게 생각하고 처음 들은 사람에게 큰 충격을 준다고 한다. 조회수가 130만 회를 향해 가는 가운데, 이 곡을 듣고 나오는 다양한 반응 중에서는 눈물을 철철 흘리는 반응까지 나왔다.


무서운 점은 AI가 인간의 미세한 발음 습관까지도 잡아내 학습한다는 점이다. 자신이 부르지는 않았으나 자신의 목소리로 나오는 노래를 감상하던 해당 스트리머는 '시옷(ㅅ)' 발음에서 다소 혀가 짧게 나오는 본인의 발음 특징이 AI 커버에도 반영된 것을 알고 놀라워 하기도 했다.


과거 목소리를 합성하던 이른바 '보컬로이드' 시절과 AI가 처음부터 딥러닝을 해서 목소리를 생성하는 요즘 시절의 차이는 '하늘과 땅 차이'라는 비교로도 부족할 정도다. 발음의 미묘한 습관까지 반영되니 이제 오히려 의식해서 습관 없이 발음할 수 있으면 진짜 인간, 그 사람만의 습관이 반영돼 있으면 AI로 역으로 판단해야 하는 것 아니냐는 말까지 나온다.


원곡 아티스트의 저작권을 비롯한 법적인 여러 문제가 명확하게 정리된 것은 아니지만, 일반적인 이용자 입장에서 이러한 기술의 발달은 축복일 수 있다. 다만 이러한 '기술의 축복'이 정치에 악용되는 사례는 미리 경계하고 우려하지 않을 수 없다. 세상의 모든 기술 발달은 다 정치판에 들어와 악용되는 게 지금까지의 흐름이기 때문이다.


여러 인터넷방송 스트리머 중 유독 스트리머 '옥냥이'의 AI 커버곡 완성도가 높고 유명한 이유는 방송 경력이 오래된데다, 다양한 상황에서 나온 깨끗한 방송 자료가 많아 AI 딥러닝이 용이하기 때문이라고 한다.


말 많이 하고 발언 자료가 음성·영상으로 많이 남아있기로는 정치인만한 사람들이 없다. 토론회부터 대중연설까지, 차분한 목소리부터 격정적인 고음까지 상황에 따른 자료도 다양하다. 대권주자라면 특히 발언하는 자리도 많고 뉴스가 많이 되기 때문에 자료도 풍부하다. 어떻게 보면 AI 딥러닝에 최적인 셈이다.


이미 이웃나라 일본에서는 기시다 후미오(岸田文雄) 총리의 목소리를 AI로 딥러닝시킨 뒤, 부적절한 발언을 하는 동영상을 제작·유포한 사례가 있었다. 일본 언론은 이를 'AI 딥페이크'가 정치의 새로운 위협으로 부상한 사례로 규정했다.


올해와 내년은 큰 선거가 없는 정치 휴지기(政治 休止期)지만 그 이후부터는 2026년 6월 지방선거, 2027년 3월 대선, 2028년 4월 총선 등 잇달아 전국단위 선거가 돌아오는 '정치의 계절'이다. 기술의 발전 속도를 고려하면 투표 직전의 결정적인 상황에 하지도 않은 발언을 만들어내서 터뜨리거나, 실제 했던 발언인데도 'AI 딥페이크'라고 잡아떼는 등 온갖 혼란이 예상된다.


1992년작 영화 '배트맨 리턴즈'에서는 고담시장 선거에 나섰던 악당 펭귄맨이 승세를 굳혀가다가 "이 썩어빠진 도시를 지옥으로 만들어버리겠다"는 발언이 배트맨에 의해 전격 유포된다. 펭귄맨은 "내가 말한 것 아니다"라고 일단 잡아떼봤지만, 누가 들어도 그의 목소리였기 때문에 선거 캠페인을 단념할 수밖에 없었다.


지금이라면 펭귄맨은 "내가 말한 것 아니다. AI 딥페이크인 것 같다"고 끝까지 잡아뗐을 것이다. 또 만약 배트맨이 어떻게든 펭귄맨의 당선을 저지하는 게 정의라고 생각해서 'AI 딥러닝'으로 해당 발언을 만들어냈다면 이를 어떻게 바라봐야 할까. 우리 사회의 정치 양극화가 심화되고 있어, '폭탄 발언' 하나 만들어내 어떻게든 상대 후보를 떨구고 나 하나는 그 과정에서 산화해도 족하다고 생각하는 사람들이 있을 수 있다.


우리 현행 법령에는 선거일 90일 전부터 선거일까지 딥페이크 영상을 제작·유포할 수 없다는 규정이 있는 게 전부다. 큰 선거가 없는 기간 동안 총체적으로 선거 현장에서 발생 가능한 여러 상황을 점검해보고, 국회에서 관련 법령을 재정비할 필요성이 있어 보인다.

'기자수첩-정치'를 네이버에서 지금 바로 구독해보세요!
정도원 기자 (united97@dailian.co.kr)
기사 모아 보기 >
0
0

댓글 0

로그인 후 댓글을 작성하실 수 있습니다.
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기