'AI 이루다' 논란, 개인정보유출 '비상'..."편법쓰다 걸렸다"
입력 2021.01.14 09:36
수정 2021.01.14 09:37
스캐터랩, 개발자 플랫폼 '깃허브'에 고객 정보 공유
"중소기업 데이터 관리 책임 강화해야"
개보위-KISA, 개인정보유출 현장 조사 중
소수자 혐오 발언으로 논란을 빚은 인공지능(AI) 챗봇 서비스 ‘이루다’가 개인정보유출 파장으로 결국 서비스를 중단하자, IT업계도 촉각을 곤두세우고 있다.
일각에서는 관행처럼 이뤄졌던 개인정보 활용 문제가 수면위로 떠올랐다는 반응이다. 주요 업체들은 고객정보 수집 동의방식부터 활용 및 보관까지 자체 점검에 나섰다.
14일 업계에 따르면 이루다 개발사인 스캐터랩은 개인정보유출 논란이 아직 수그러들지 않은 가운데, 이루다 개발 기록을 오픈소스 공유 플랫폼 ‘깃허브’에 공유했다는 사실을 지난 인정했다.
회사는 사과문을 통해 깃허브에 오픈소스로 공유한 데이터에 내부 테스트 샘플이 포함된 사실을 확인했다. 문제를 발견한 즉시 해당 깃허브 레파지토리를 비공개 처리했다며 서비스 이용자분께 사과드린다고 말했다.
스캐터랩은 연애 분석 앱 ‘연애의 과학’으로 이용자들의 카카오톡 데이터를 수집해 이루다 개발에 쓰는 과정에서 개인정보보호법을 어겼다는 의혹을 받고 있다. 스캐터랩이
이용자들에게 개인정보 이용 및 활용 동의를 제대로 받지 않는 등 개인정보보호법을 어겼다는 의혹을 받고 있다. 스캐터랩의 개인정보 취급·처리 방침이 문제가 되는 부분은 다음과 같다. 우선 ‘연애의 과학’ 앱을 회원가입과 동시에 개인정보취급방침에 동의하는 방식이다. 통상적으로는 필수와 선택 항목을 구분해야 하는데, 해당 앱은 전부 동의하도록 포괄적으로 취하는 형식이라는 지적이다. 이는 개인정보보호법 제22조 위반의 소지가 있다.
수집한 고객들의 정보를 이루다 등 신규 서비스 개발에 활용하겠다고 안내했는지 여부도 관건이다. 만약 이같은 목적을 정확히 알리지 않았다면 이 또한 법을 위반한 것이 된다. 여기에 고객들의 개인정보를 제대로 비식별화 처리를 했는지도 조사 대상이다. 개인정보보호법에 따르면 개인정보를 취급할 때 특정한 개인을 알아볼수 없도록 안전조치(비식별 처리)를 해야 한다.
그러나 스캐터랩이 2019년부터 깃허브에 이루다 훈련에 쓰인 카톡 대화 100여건을 데이터로 공유하는 과정에서 20여건의 실명과 직장명, 지역명, 지하철역 등이 들어간 것이 확인돼 파장이 더욱 커지고 있다.
업체 관계자는 “최근의 추세가 개인정보 보호보다 활용에 초점이 맞춰진 가운데, 주요 서비스들 대부분은 고객 개인정보 수집에 동의를 해야만 이용할 수 있는 구조로 돼있다”며 “이같은 상황에서 이루다 사태는 기존 관행의 문제점이 수면위로 드러난 것. 이미 예견됐던 상황”이라고 꼬집었다.
또 다른 플랫폼 업체 관계자는 “이번 사태는 비싼 데이터를 끌어 모을 자금 여력이 없는 스타트업이 데이터를 수집하는 과정에서 편법을 쓰면서 발생한 것”이라며 “대기업에서는 원천적으로 리스크 발생 가능성을 차단하고 철저히 보호하기 때문에 개인정보 유출 등의 이슈가 발생하기 어렵다”고 말했다.
이어 “해당 기업의 유출 문제 역시 아직 개인정보위 조사 발표 전으로, 결과가 나와 봐야 알겠지만 향후 중소기업들의 데이터 관리 책임을 강화할 필요는 있다”며 “또 정부가 하나의 큰 공공 데이터 풀을 조성해서 스타트업들의 데이터 빈곤을 해소하는 것이 제2의 이루다 사태를 막는 데 도움이 될 것으로 보인다”고 덧붙였다.
한편 개인정보보호위원회와 한국인터넷진흥원(KISA)은 지난13일 서울 성동구에 위치한 스캐터랩 사무실을 방문해 개인정보유출 관련 조사에 착수했다. 별개로 연애의 과학 이용자들은 집단소송을 준비중이다.