英 연구진, 키보드 타이핑 소리 분석해 내용 맞히는 딥러닝 모델 개발
최대 95% 정확도…"음향 부채널 공격 위험성 알리고자 연구"

【서울=뉴시스】삽화 사건사고 컴퓨터 업무 웹서핑
【서울=뉴시스】삽화 사건사고 컴퓨터 업무 웹서핑

[정재원 기자] #지난주 토요일 오후, 오랜만에 휴가를 떠나기 위해 카페에서 체코 프라하행 비행기 표를 알아보던 직장인 A씨. 최저가 요금을 확인한 A씨는 비행기 표를 놓칠 수 없다는 생각에 곧바로 신용카드를 꺼냈다. 그리고 결제까지 진행했다. 얼마 뒤 그는 그 카페에서 그의 계정과 비밀번호 등이 해킹된 사실을 뒤늦게 알았다. 대체 어찌된 일일까. 범인은 바로 그의 뒷 테이블에 등을 마주대고 앉았던 손님으로 밝혀졌다. 해커는 A씨의 노트북 키보드 소리를 녹음한 뒤 인공지능(AI) 프로그램을 이용해 그가 어떤 내용을 입력했는 지 알아낼 수 있었다.

AI 기술이 고도화되면서 사용자가 개인 메시지, 계정 정보, 공인인증서 비밀번호, 계좌번호 등을 키보드로 입력할 때 타자 소리만으로도 어떤 텍스트를 입력했는지 분석할 수 있다는 연구 결과가 나왔기 때문이다. 특히 해당 딥러닝 모델의 데이터 정확도가 최대 95%에 달하는 것으로 알려져 충격을 주고 있다.

아마존 소프트웨어 개발자 조슈아 해리슨 등 영국 연구진은 AI가 타자 소리를 분석해 입력 내용을 맞히는 딥러닝 모델을 개발, 최근 논문 사전공개 사이트 '아카이브'에 논문 원고를 게재했다.

원고에 따르면 이들이 개발한 딥 러닝 모델은 키보드에서 17㎝ 떨어진 곳의 아이폰13 미니 내장 마이크, 맥북 프로에서 실행한 줌(Zoom)·스카이프(Skype) 등 화상 회의 프로그램 마이크에 입력된 타자 소리만으로 사용자가 어떤 내용을 입력한 건지 AI가 유추한다.

36개의 자판(숫자 10개, 알파벳 26개)으로 '에너지' 등 단어를 25번 무작위로 입력해 실험한 결과 아이폰13 미니 마이크에서의 데이터 일치도는 95%, 줌·스카이프에서의 일치도는 각각 93%, 91.7%로 나타났다.

"음향 부채널 공격 다양화했지만 사람들 심각성 못 느껴 연구"

연구진은 "사람들은 비밀번호 입력 시 정기적으로 화면을 숨기지만 타자 소리를 헷갈리게 하는 데 신경 쓰지 않는다"며 연구 이유를 설명했다. 스마트워치 등 마이크로 기기에 따른 녹음 기술과 함께 AI 딥러닝 기술도 발전하는데 사람들이 음향 부채널 공격(비밀번호 입력 소리를 들어 암호키를 훔치는 것) 위험성을 깨닫지 않는다는 의미다.

이들은 기계식 키보드에 방음 장치를 추가하거나 소음이 적은 키보드를 이용하더라도 음향 부채널 공격을 막는데 완벽한 해결책이 되진 못할 것이라고 지적했다.

대신 생체(지문, 안면 등) 인식 인증과 같은 이중 인증 기능이나 가짜 키 입력 소리, 시프트(Shift)키 입력을 활용하는 것을 추천했다. 시프트키 입력 사실을 AI는 인식할 수 있으나 아직까지는 다른 키 소리 안에 시프트키 해제 소리를 인식하지 못하기 때문이다.

국내 보안 전문가들은 이번 연구가 사용 기기, 환경 등 제한된 실험 조건에서 이뤄진 것처럼 이러한 해킹 수법이 상용화되기까지는 아직 거리가 멀다고 말한다. 다만 향후 이러한 해킹이 일어날 가능성은 충분히 있다고 말했다.

원유철 한국정보보호학회장(충남대 교수)은 "해당 해킹 수법이 통하려면 제조사별 여러 기기와 타이핑하는 사용자별 특성을 딥러닝 모델이 모두 반영해야 하는데 아직은 쉬운 작업이 아니다"라면서도 "최근 음향 부채널 공격 수법이 많이 발전하고 있고, 그걸 막으려는 노력은 분명 필요하다"고 밝혔다.

염흥열 순천향대 교수도 "암호를 입력하는 시점과 일반적으로 타이핑하는 시점 등 여러 내용이 복합적으로 녹음될 텐데 불필요한 부분을 없애고 정보를 파악하는 게 난해하겠지만, 완전 불가능한 수법은 아니다"라고 말했다.

저작권자 © 시사플러스 무단전재 및 재배포 금지