상세글 보기

[Refresh] Open Class - 대화형 인공지능, 챗봇의 진화

2017.04.10



‘알로’, ‘아미카’, ‘에코’. 무엇을 말하는 걸까요? 바로 여러 기업에서 선보인 대화형 인공지능 로봇 일명 챗봇의 이름인데요. 챗봇이란 채팅과 로봇의 합성어로 인공지능을 기반으로 한 커뮤니케이션 소프트웨어를 말합니다. 최근엔 음성 인식 로봇의 한계를 보완하고 인력 대체 기술로 떠오르면서 커머스, 상담, 고객응대 서비스 등 여러 분야에서 주목 받고 있는데요. 그렇다면 대화형 인공지능의 현재와 미래는 어떤 모습일까요? 이번 오픈클래스에서 딥러닝 기술 기반의 스타트업, 플런티(Fluenty)의 김강학 대표로부터 그 답을 들어볼 수 있었습니다.




오픈클래스 강의 중인 플런티 김강학 대표






챗봇의 발전 배경


프로그래밍 패러다임의 변화, 머신러닝과 딥러닝



지난해 큰 이슈였던 알파고와 이세돌의 대국, 기억하시나요? 인간의 영역이라 생각했던 바둑에서 컴퓨터가 압도적인 승리를 거두며 일명 ‘Alphago Shock’라고도 불렸는데요. 그렇다면 알파고는 몇 줄의 소스코드로 형성되어 있을까요? 802줄입니다.” 


일반적으로 포털 사이트 검색엔진의 코드는 수만 줄로 이루어져 있습니다. 그에 비해 알파고의 소스코드가 겨우 802줄이라는 점은 실로 놀라운 수치인데요. 인간의 뇌를 뛰어넘는 소프트웨어가 이렇게 간단한 구조를 가질 수 있었던 것은 바로 프로그래밍 패러다임의 변화 덕분입니다. 과거에는 컴퓨터에게 하나의 업무를 지시하기 위해 일일이 소스코드를 입력해야만 했지만 최근에는 컴퓨터에게 데이터를 제공하면 컴퓨터가 그것을 학습하고 능동적으로 활용할 수 있게 되었죠. 이것을 기계학습(Machine Learning, 머신러닝)이라고 합니다




오픈클래스 집중하고 있는 현대카드 직원들




최근에는 딥러닝이라는 개념이 주목 받고 있는데요. 기존 머신러닝의 한계를 해결하며 등장한 것이 바로 딥러닝입니다. 간단히 예를 들어볼게요. 음식의 비주얼을 통해 맛을 판단하는 인공지능 로봇을 만들고자 합니다. 노란색, 붉은색 같은 웜톤 색깔의 음식들은 맛있는 경우가 많았습니다. 반면 초록색, 파란색 등 쿨톤 색깔의 음식들은 맛이 없는 경우가 많았는데요. 이러한 데이터들을 하나씩 입력하면 평균값, 즉 컬러와 맛의 상관관계에 대한 하나의 기준이 생깁니다. 축적된 데이터를 기반으로 기준을 마련하고 원하는 답을 도출해내는 것이 머신러닝(machine learning)이죠


딥러닝(Deep Learning)은 컴퓨터가 축적된 데이터를 분석하는 데서 더 나아가 학습을 통해 답을 찾는 능동적인 시스템입니다. 대표적인 예로 자율주행 자동차를 들 수 있는데요. 자율주행 자동차의 경우, 자동차 위에 카메라 레이더를 설치하고 몇만 시간을 주행하죠. 이 과정에서 컴퓨터는 각종 데이터를 수집하고 도로 모양에 따른 핸들의 각도를 학습하게 됩니다. , 사람의 조종 없이도 도로 모양에 따라 핸들의 방향을 바꿀 수 있는 자율주행 자동차가 탄생하게 되죠


인공지능 기술이 발달하면서 많은 분들이 컴퓨터의 학습 능력에 집중하는데요. 그 전에 사람의 역할에 더 주목해야 합니다.” 김강학 대표는 인공지능 기술에 있어 사람의 중요성을 강조했습니다. 컴퓨터는 사람이 가르친 범위 내에서 학습하는데, 이 때 정확한 설계가 선행되어야 원하는 데이터를 얻을 수 있기 때문이죠






챗봇의 도약


언어이해 기술의 발달로 똑똑해진 대화형 인공지능



단순 대화형 로봇에서 벗어나 쇼핑, 예약, 결제, 상담 등 다양한 분야에서 대화형 인공지능 로봇이 떠오른 이유는 언어이해 기술의 눈부신 발전 덕분입니다. 이것을 자연어 처리라고 하는데요. 기존 인공지능은 키워드가 달라지면 의미를 인지하지 못했죠. 예를 들어 전화해대신 연락해라고 하면 알아듣지 못하는 건데요. 이제는 주변 맥락을 통해 새로운 단어를 이해하는 기술이 발전하면서 더욱 자연스러운 대화가 가능해졌습니다


그러나 언어가 가진 장벽 중 하나는 바로 시간적 제약이 있단 점입니다. 제가 오늘 할 말을 한 번에 다 던져버리고 싶지만 시간적 제약으로 그럴 수 없는 것처럼 말이죠.” 예를 들어 팀장님, 다음 주에 일이 있어서 금주 중에 진행 중인 일을 마무리하고 휴가서 제출하겠습니다.”라는 문장에서 중요한 것은 다음 주’, ‘휴가’, ‘물음표가 되겠죠. 이처럼 대화한다는 것은 시간 순으로 이어지는 상대방의 말에서 중점을 파악하고 다음 행동이나 말을 준비할 수 있다는 의미이기도 합니다




오픈클래스 강의 중인 플런티 김강학 대표_1




이러한 기능을 가진 알고리즘이 바로 RNN(순환신경망, Recurrent Neural Network)입니다. RNN은 시간의 흐름에 따른 네트워크로, 단어와 단어 사이 연관성을 통해 언어를 처리합니다. 과거의 정보를 기억해 현재 작업으로 연결하거나 다음 행동을 예측하죠. 하지만 모든 걸 기억하려다 보니 오래된 데이터는 잊어버리는 단점이 있었습니다.


이 문제점을 보완한 것이 LSTM(장단기기억기술, Long Short-Term Memory)을 적용한 네트워크입니다. 메시지가 오면 상황에 따라 알맞은 답변을 제시하는 스마트 리플라이또한 LSTM을 활용한 대화형 인공지능인데요. LSTM은 현재 주어진 단어와 과거 메모리를 기반으로 무엇이 중요한 정보인지 구분하고 이어질 말들을 예측합니다. 과거 데이터 중 버려야 할 것을 구분 짓기도 하죠.






챗봇의 발전방향


대화형 인공지능, 하나의 플랫폼으로 거듭나다 



대화형 인공지능 로봇은 결코 새로운 게 아닙니다. 우리가 아는 아이폰 시리(Siri)도 대화형 인공지능 로봇 중 하나니까요.”


하지만 출시된 지 몇 년이 지난 지금, 시리를 사용하는 사람은 거의 없습니다. 그 이유는 무엇일까요? 시리에겐 사용자의 니즈를 실현시킬 DB가 없었기 때문입니다. 예를 들어 시리에게 스타벅스에서 커피 주문하고 싶어라는 말을 하면 메뉴 주문에 대한 언어를 이해할 수는 있지만 정작 그 말을 실행에 옮길 DB가 없는 거죠.




김강학 대표 이야기에 경청하는 현대카드 직원분의 모습




이렇듯 단순했던 대화형 인공지능이 최근 플랫폼화과정을 거치면서 한 단계 진화하고 있습니다. 다양한 앱을 실행하는 하나의 플랫폼으로써 그 구성과 역할이 바뀌고 있는 건데요. 이사부터 음식배달, 영화예매, 꽃 배달 등 사용자가 요구하는 관련 기능을 전용 플랫폼 내 채팅을 통해 실행할 수 있게 됐죠.

 

지하철 같은 공공장소에서 음성으로 명령하기 쉽지 않다는 점, 스마트폰 시장의 포화로 사용자들이 더 이상 앱을 다운로드하지 않는다는 점을 미루어 볼 때 대화형 인공지능 기술의 플랫폼화는 더욱 가속화될 전망입니다.






챗봇의 한계와 전망,


할 수 있는 것과 할 수 없는 것



데이터가 많으니 대화형 인공지능 프로그램을 만들어 달라는 요청이 자주 들어옵니다. 그럴 때마다 저희는 어렵다고 답하죠.”

 

데이터가 많으면 대화형 인공지능 로봇을 만들 수 있을까요? 먼저 확실히 알아둬야 하는 것은 로봇과 나누는 대화의 종류입니다. 가볍게 잡담을 나누는 비목적성 대화의 경우 축적된 데이터가 많을수록 다양한 답변으로 무리 없이 대화를 이어갈 수 있습니다. 그 예로 심심이, 스마트 리플라이가 있죠.






반면 액션을 필요로 하는 목적성 대화는 어떨까요? 딥러닝의 대가인 앤드류 응(Andrew Ng) 교수는 이렇게 말했습니다. “오늘날의 딥러닝이 해내지 못하는 것이 하나 있는데, 의미 있는 대화를 하는 것이다. 딥러닝은 그저 많은 데이터를 모을 수 있는 좁은 도메인(영역)에 한정되어 있다.” 여기서 의미 있는 대화란 직접적인 행동으로 연결되는 대화를 의미합니다. 하지만 현재로서는 서로 다른 도메인을 넘나들며 지식을 응용하진 못하는 수준이죠. 이것이 바로 데이터가 많다고 해도 대화형 인공지능 프로그램을 만들기는 어려운 이유입니다.


항공 예약 상담을 예로 들어 보겠습니다. 대화형 인공지능 로봇이 예약까지 실행할 수 있을까요? 물론 불가능합니다. 예약을 위해 최종적으로 취해야 할 행동에 대한 데이터는 전혀 없기 때문이죠. 이런 부분은 자동화되어 있지 않기 때문에 사람이 직접 적용해야 합니다.


그렇다면 목적성 대화를 위한 대화형 인공지능은 어느 수준에 도달해 있을까요? 사람의 말 속에 담긴 의도(intent)나 문장 안에 들어있는 정보를 파악하는 데는 이미 높은 수준을 자랑합니다. 또한 출발지, 도착지, 탑승 인원 등 원하는 정보를 충족할 때까지 계속 대화를 이어가는 슬롯채우기 프로세스도 상당한 수준에 도달한 상태죠. 따라서 목적성 대화를 뒷받침할 수 있는 기술이 충족된다면 대화형 인공지능은 앞으로 더 다양한 분야에 활용될 것입니다.









강의가 끝난 후에도 대화형 인공지능에 대한 직원들의 궁금증은 계속해서 이어졌습니다.

 


Q. 대화형 인공지능은 커머스나 상담에 이용하는 경우가 많은데요. 지금까지는 주로 커머스 부분에 집중돼 있는데 본격적으로 상담에 적용되려면 얼마나 걸릴까요?


A. Q&A라면 이미 잘 적용되어 있어요. 문제는 지금 수준으론 대화를 길게 이어가기 힘들다는 겁니다. 때문에 One text Q&A여야 하는 거죠. 아무래도 우리나라 콜센터 산업에서 가장 많은 인건비를 지출하는 금융권에서 대화형 인공지능 서비스를 많이 원하는데요. 문제는 금융권 상담은 아주 민감한 부분이라 아주 높은 정확도가 요구된다는 거죠. 대출이 안 되는데 된다고 얘기해버리면 큰일이니까요. 금융권은 대화형 인공지능에 있어 아주 큰 시장이지만 제 생각에는 일단 커머스 부분에서 정확도를 높인 후에 조금 더 시간이 지나야 활용 가능한 부분이 아닐까 합니다.

 



Q. 한때 음성 인식이 가능한 대화형 인공지능이 인기였습니다. 그러나 다시 채팅으로 돌아왔는데요. 그렇다면 음성 인식보다 채팅을 통한 대화형 인공지능이 더 낫다고 말할 수 있는 점은 무엇일까요?


A. 앞서 말씀드린 것처럼 텍스트의 경우 음성보다 때와 장소에 영향을 덜 받기 때문에 고객 입장에선 더 편할 수 있어요. 앞으로 나올 대화형 인공지능 플랫폼들은 고객들에게 더 높은 활용도를 선보일 것입니다.

 



Q. 만약 이미 설치된 메신저에 대화형 인공지능을 적용한다면 특정 메신저에 너무 편향되지는 않을까요?


A. 많은 분들이 그 이유 때문에 브랜드 앱에 채팅을 넣고 싶어 합니다. 그런데 고객이 앱에 직접 들어오면 굳이 대화형 인공지능 기능이 필요 없겠죠. 그래서 앱보다는 플랫폼에 들어가는 게 더 효율적이지 않나 싶어요. 현재로서는 특정 메신저에 국한될 수밖에 없는 상황이죠






대화형 인공지능 기술을 두고 글로벌 기업들의 경쟁이 더욱 치열해지고 있습니다. 미국의 시장조사기관인 마켓앤마켓(marketandmarkets)은 대화형 인공지능의 주요 기술시장이 연평균 55% 성장률을 보이며 2020년 기준 약 5500억 원의 규모로 성장할 것으로 예측했는데요. AI 기술의 고도화와 함께 어느새 일상 속 편리함으로 자리 잡은 대화형 인공지능 기술. 과연 어디까지 발전할 수 있을까요? 심심풀이용 채팅앱에서 사람의 말을 이해하고 분석하는 모바일 메시징 플랫폼에 이르기까지, 지금 이 순간에도 대화형 인공지능은 계속해서 진화하고 있습니다



저작자 표시 비영리 변경 금지
신고