한국CISO협의회

자료실

HOME
자료실
보안 제품정보

보안 제품정보

목소리에 작별을 고한다	2018.11.29
구글 듀플렉스에서 받은 충격...챗봇이 범람할 시대의 입구에서 음성 인식 기술 도입, 큰 물살 타고 있어...그렇다면 인간의 목소리는? [보안뉴스 문가용 기자] 올 여름 난 수천만 명의 세계인들과 마찬가지로 필자는 구글 듀플렉스(Google Duplex)의 시연을 지켜봤다. 소름끼치도록 사람과 똑같았던 그 ‘통화하는 인공지능’ 말이다. 그걸 보면서 필자는 세 단어를 떠올렸다. “목소리는 이제 죽었구나.” [이미지 = iclickart] 그 시연은 필자에게는 너무나 명확한 메시지였다. 목소리는 정말로 죽어버린 것이었다. 이제부터 우리는 인간과 똑같은 목소리를 가진 영업용 봇들을 고용하고, 주요 매체와의 전화 인터뷰를 하는 정치인 대리 봇에 대한 소문을 듣게 될 것이며 주요 거래처와 협상을 주고받는 네고시에이터 봇을 영입할 것이다. “이렇게 전화를 직접 주셔서 얼마나 반가운지 몰라요”라거나 “목소리를 직접 들으니 좋네요”와 같은 인사말은 더 이상 허례허식 수준에도 못 낄, 폐어가 될 전망이다. 아니, 그 인사말을 시치미 뚝 떼고 하는 알고리즘들과 더 많은 통화를 하게 될지도 모르겠다. 사람인지 아닌지 확인할 수 있는 수수께끼나 질문들이 발견될 것이고, 전화 자주하는 착한 자식이라는 타이틀을 노력도 없이 얻게 되는 유행이 번질 것이다. 진짜로, 목소리는, 죽었다! 애플이 시리라는 물건을 세상에 내놓은 순간부터 스마트 음성 기술은 폭발적인 발전을 거듭했다. 사용자들도 그 어떤 신기술보다 빠르게 스마트 음성 기술을 받아들였다. 몇 년 지나지도 않았는데, 목소리로 기계에 명령을 내리는 게 그리 신기한 일이 아니게 되어버렸다. 마치 기계에 음성을 주입할 날을 고대하기라도 했던 것처럼 순식간에 이 변화가 자리를 굳건히 잡았다. 미국인 다섯 명 중 한 명은 알렉사나 헤이 구글을 외치고 있다니 말이다. 이렇게 된 데에는 이유가 있다. 음성 인식 기술과 자연어 처리 기술, 그리고 그 동안 축적되어 온 풍부한 사용자 데이터가 합쳐지니 일반 사용자가 다루기 크게 어렵지 않고, 실용적이기까지 한 기술이 탄생한 것이다. 갑자기 어디서 짜잔하고 등장한 획기적인 기술이 아니라는 것이다. 또한 매뉴얼을 수 페이지 읽고, 소프트웨어 사용법을 숙달한 후 원하는 것을 하거나 얻는 것보다 음성 한 마디로 답을 받는 건 얼마나 간편한 일인가. 결국 음성 기술은 우리가 원하는 것을 우리가 원하는 방식으로 준다는 점에서 이리도 빠르게 주류로 변해가고 있는 것이다. 음성이 이렇게나 편리한 것이기 때문에, 그래서 소비자들의 반응이 그렇게도 좋기 때문에, 구글 듀플렉스처럼 인간과 거의 똑같은 채팅 봇이 등장한 것이다. 하지만, 모든 기술이 그렇듯, 이 기술에도 분명 위험이 존재한다. 물론 구글은 듀플렉스를 시연하면서 해당 봇이 식당 예약과 같은 특수한 상황에서만 기능을 발휘한다거나, 아직 이 기술을 클라이언트들과 실험하는 단계에도 이르지 못했다고 언급했다. 또한 앞으로 듀플렉스는 스스로가 인공지능임을 분명히 밝히고 통화를 할 거라고 구글은 약속하기도 했다. 그럼에도 이러한 기술이 미칠 수 있는 영향에 대해 염려스러운 마음을 금할 수가 없다. 이미 많은 기업의 사업 활동에 음성 봇들이 들어서고 있지만, 그래서 앞으로 음성 봇은 더 많이 활용될 것이 분명하지만, 걱정이 쉽게 사라지지 않는다. 마이크로소프트가 개발한 소셜 챗봇인 샤오이스(Xiaoice)는 이미 중국 사용자들과 1백만 번 이상 통화했다. 이미 사람들이 다음에 어떤 말을 할지도 예측 가능한 상태다. 심지어 인간이 하듯 상대방이 말하는 중간에 끼어들 수도 있다. 아마존은 기업이 운영하는 콜센터 전용 알렉사인 렉스(Lex)를 발표하기도 했다. 모두가 이렇게 한 마음으로 챗봇 영입에 열을 올리는 건 왜일까? 이게 맞는 방향인 걸까? 물론 ‘실용성’ 자체만 본다면 기업으로서는 당연한 결정이라고 볼 수 있다. 우리가 각자 집에서 여러 음성 기술에 적응했듯이, 기업도 처음의 시행착오와 적응 기간을 충분히 거칠 수 있을 것이다. 어느 정도 효율성만 보인다면, 그리고 유용한 답을 높은 확률로 주기만 한다면 말이다. 게다가 은행이나 보험사에 전화 걸어 수십 분씩 대기하느니 인공지능과 대화하는 게 더 나을 수도 있다. 역시, 결국 편리의 문제다. 그런데 누가 편리해지는 걸까? 소비자와 기업 모두? 그래야 한다. 기업만큼 소비자도 편하고, 소비자만큼 기업도 편해야 한다. 하지만 그 균형을 유지하기 위해서는 산더미처럼 쌓인 사회적, 윤리적, 법적 과제들을 해결해야 할 것이다. 채팅봇이 윤리적인 태도를 항상 유지하게 하려면 어떻게 해야 할까? 기업이 채팅봇을 통해 소비자 몰래 심리 분석 같은 걸 몰래 진행하는 걸 어떻게 알고 막을 수 있을까? 기능 수행을 위해 주입된 정보를 인공지능 알고리즘이나 봇들은 어떻게 처리하는가? 인공지능이 중요한 전화번호를 쓸데없이 기억하는 걸 어떻게 막을 것인가? 어떤 고객의 취향이나 성향을 인공지능이라면 기억해도 되는 것일까? 인공지능이 그런 정보를 기억하고 가지고 있다면, 그 소유 기업도 가지고 있다고 볼 수 있는 걸까? 그렇다면 누가 그 정보에 접근할 수 있을까? 음성 인식 인공지능이 그렇게까지 소름끼치게 사람과 같아지려면 수많은 데이터를 섭취해야만 한다. 그리고 그 데이터들은 아무렇게나 버리고 처리해도 되는 게 아니라, 정해진 방법대로 관리해야 하는 귀중한 것들이다. 이를 음성 챗봇을 만들거나 사용하는 기업들 모두 인지하고 있어야 한다. 챗봇의 사용에는 거대한 책임이 뒤따른다는 걸 강조하고 또 강조해도 모자라다. 그런 귀중한 정보에 대한 책임을 진다는 건 다음과 같은 질문에 답할 수 있어야 한다는 뜻이다. 주입하는 데이터의 출처를 정확히 알고 있는가? 어떤 방식으로 추출되는지도? 이 정보에 서드파티 데이터가 섞여 있는가? 인공지능 모델에 주입하는 데에 써도 된다는 허락을 받았는가? 그 허락을 어디에서 어떤 절차로 받아야 하는가? 하지만 이 질문에 명확하고 투명하게 대답할 수 있는 기업은 아직 하나도 없다. 뿐만 아니라 소비자의 기대치라는 요소도 고려해야 한다. 사람은 상대방의 목소리나 제스처 등을 통해 ‘저 사람에게선 이 정도 수준의 대응을 기대할 수 있다’라는 걸 본능적으로 계산한다. 알렉사가 알렉사처럼 말하면, 기계가 할 수 있는 답변만을 기대한다. 그러나 기계가 사람처럼 말하면, 그 기대치는 크게 올라간다. 그 기대치가 꺾인다면 사업 운영에 있어 좋을 게 없다. 챗봇을 콜센터 직원 대신 고용해 비용이 절감된다고 해도, 생각지도 못한 다른 ‘마이너스 요인’이 있을 수 있다는 것이다. 분명 사람의 목소리를 가진 로봇들은 세상 곳곳에 자리하게 될 것이다. 우린 점점 더 봇들과 이야기하는 시간이 늘어나는 걸 받아들여야만 할 것이다. 하지만 그것이 우리가 금세 봇들의 대화 방식에 익숙해진다는 뜻은 아니다. 즉문즉답이 가능한 간단하고 짧은 질문들에야 큰 효율을 발휘할 수 있겠지만, 사람의 대화가 어디 그런 단답형 질문과 답으로만 구성되어 있는가. 가끔은 전혀 다른 내용의 이야기를 주고받다가 문제가 풀릴 때도 있는 게 인간의 대화다. 전화기 고장 났다고 콜센터에 연락한 고객이, 갑자기 인생사를 넋두리처럼 늘어놓았을 때, 챗봇은 대응할 수 있을까? 아직은 사람이 필요한 자리가 있다. 사람이 내는 진짜 음성 말이다. 분명 사람과 똑같은 목소리를 가진 봇의 존재는 신기하다. 하지만 실제 현장에서 널리 쓰일 만큼 충분히 성숙한 기술은 아니다. 기술 그 자체의 문제도 그렇지만, 그 기술이 도입되는 사회적 환경과 소비자의 반응이라는 면에서도 가야 할 길이 더 남아있다. 또한 완벽한 봇이 나오더라도, 그래서 챗봇이 콜센터나 각종 통화를 장악한다고 하더라도, 그렇기 때문에 더 사람이 필요한 자리가 생길 것이다. 가끔 그냥 이유 없이 엄마 목소리가 듣고 싶어 전화할 때가 있잖은가? 아무리 봇이 감쪽같아도 엄마를 대신할 순 없다. 목소리는 죽었다. 하지만 다는 아니다. 글 : 크리스토퍼 코놀리(Christopher Connolly), Genesys [국제부 문가용 기자(globoan@boannews.com)] Copyrighted 2015. UBM-Tech. 117153:0515BC <저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>