[이미영 기자]문재인 대통령 대선후보 때 패러디로 화제가 된 바 있는 배우 김민교씨<사진>에 이어 최근 한 웹사이트에 문 대통령과 똑 같은 목소리가 올라와 화제가 됐다.

“와타시와 프레지던트데스.”(문재인 대통령 목소리)
“손석희는 대한민국의 언론인으로 JTBC 보도담당 사장이다.”(손석희 JTBC 사장 목소리)

이 화제의 목소리는 문재인 대통령과 손석희 사장이 말한 것이 아니라 한 엔지니어가 음성 합성 기술을 이용해 만들어 낸 것으로 실제와 매우 비슷하다는 반응이다. 20일 중앙일보는 게임제작사에서 엔지니어로 일하고 있는 김태훈(25)씨가 웹사이트에 약 일주일 동안 공개했던 이 목소리 샘플들은 19일 오전에 비공개로 바뀌었다고 전했다.

매체에 따르면 게임제작사인 데브시스터즈가 샘플 공개 이후 제기된 악용 우려와 기술제휴 요청 때문에 공개하지 않는 것으로 방침을 바꾸었기 때문이다. 이 음성 합성 기술은 16일 네이버가 주최한 개발자 콘퍼런스에서 소개됐다.
  
합성 원리는 유명인의 목소리를 분석한 뒤 새로운 문장에 합성하는 것이다. 목소리와 그 소리가 무슨 의미인지를 동시에 컴퓨터에 학습시킨 뒤 이를 바탕으로 새로운 문장을 읽게 하는 방식이다. 목소리 데이터가 많고 음질이 좋을수록 합성 결과물도 좋아진다.
  
개발자인 김씨는 유튜브의 영상과 뉴스 등의 목소리 데이터를 활용했다. 문재인 대통령의 연설 목소리, 손석희 앵커의 뉴스 진행 목소리를 ‘원료’로 사용했다. 김씨가 웹사이트에 공개한 샘플에서 2시간짜리 음성을 분석해 만든 문 대통령의 합성 목소리는 다소 어색하다. 5시간짜리 음성을 분석해 만든 박근혜 전 대통령의 목소리는 상당히 흡사하고, 15시간짜리 음성으로 만든 손 사장 합성 목소리는 매우 똑같이 들린다는 게 이용자들의 반응이다.
  
애플과 삼성전자는 ‘시리’나 ‘빅스비’ 등 인공지능(AI)이 사람과 비슷한 목소리를 내도록 하는 데 이와 유사한 기술을 활용 중이다.
  
네이버는 배우 유인나씨의 목소리로 오디오북 서비스를 만들었다. 알파고를 만든 구글의 자회사 딥마인드는 신경망 기술을 활용해 사람의 목소리와 비슷한 소리를 내도록 스스로 훈련하는 AI를 개발 중이다.
  
개발자 김씨는 지난 16일 자신이 개발한 음성 합성 기술의 소스 코드(알고리즘)를 웹사이트에 공개했다. 그는 “그리 어려운 기술이 아니다. 앞으로는 기업뿐 아니라 일반인도 많이 사용하게 될 것”이라고 말했다. 김씨는 “누구나 음성 합성 기술을 이용할 수 있도록 하겠다”며 소스 코드를 공개했다가 관심과 논란의 주인공이 되자 19일 이를 삭제했다.
  
이 같은 음성 합성 기술은 보이스피싱 등의 범죄에 악용될 수 있다는 걱정을 낳는다. 웹사이트에서 문 대통령의 합성 목소리를 들은 이모(30)씨는 “신기하긴 한데 문재인 대통령이나 손석희 사장이 한 말인 것처럼 이상한 말을 만드는 사람도 있을 것 같아 무섭다”고 말했다.
 

저작권자 © 시사플러스 무단전재 및 재배포 금지