과거에는 사람이 컴퓨터를 작동시키려 기계어를 배웠다면, 현재는 컴퓨터의 지능적 알고리즘의 결정체인 인공지능(AI)이 사람의 자연어를 배우고 있다. 그리고 인공지능 스피커(AI speaker)까지 등장했는데, 우리나라는 아직 도입단계이지만 미국은 2020년도 기준 이미 8,300만 명이 사용 중일 정도로 빠르게 보급되고 미래 시대의 총아로 주목받고 있다. 
이제는 사람의 언어를 배우는 기계와 사람이 어떤 관계를 맺을지 깊이 생각해야 하고, 인공지능이 고령인구를 돕는 방식이자 도구를 지나서 동반자(가칭 반려기계)가 되고 있는 기술선진국의 AI 스피커의 등장을 계기로 관련 기술의 발전과 인간과 기계 사이의 미래상에 대하여 고찰하고자 한다.

인간과 컴퓨터의 상호작용

인간-컴퓨터 상호작용(Human-computer interaction, HCI 또는 CHI)이란, 컴퓨터과학, 심리학, 산업공학 등 다양한 분야 전문가가 공동연구하는 분야로서, 여기서 ‘상호작용’은 인간과 컴퓨터 사이에 있는 사용자 접점(user interface, UI)에서 발현되는 작동을 의미하는데, UI는 하드웨어와 소프트웨어를 모두 포함하며, 최근에 등장한 상황지각컴퓨팅(context-aware computing)은 UI에 대한 정의를 주변 상황에까지 확장시키고 있어 점차 그 의미가 모호해지는 추세이다.

HCI 전문가란 HCI 분야에서 개발된 다양한 기법을 실제 현장의 문제에 적용하는 디자이너들로서 그래픽이나 웹 인터페이스를 만드는 일을 주로 한다. 그래서 HCI 연구는 새로운 디자인 기법을 개발하거나, 하드웨어를 시험하고, 소프트웨어를 구현하고, 새로운 패러다임을 찾거나, 모델이나 이론을 개발하기에 주력한다. 그러기에 미학, 인류학, 인공지능, 인지과학, 산업디자인, 사회심리학, 미디어 분야에 걸쳐 다학제적 성격을 갖는다.

HCI의 기본 목표는 인간이 컴퓨터를 쓰기에 보다 쉽고 쓸모 있도록 개선하는 사용성(usability)의 향상이다. 하지만 이에 앞서 디자인 방법론은 UI가 사용자들이 실제로 원하는 작업을 수행하는 이른바 유용성(usefulness)을 확보해야만 한다. 여기에는 UI 설계방법론이나 절차; UI 구현 방법론(알고리즘 개발 등); UI 비교평가방법; UI나 HCI의 신기술; HCI를 설명하고 예측하는 모델이나 이론의 개발을 포함한다. 그럼으로써 HCI의 장기 목표는 컴퓨터가 가진 도구로서의 잠재력을 극대화하여 인간의 의지를 보다 자유롭게 하고, 창의력을 증진시키며, 인간 사이의 의사소통과 협력을 증진시키는 것이다.

인공지능 스피커의 등장

결론부터 말하자면, AI 스피커는 특히 노인과 일부 환자의 삶에 깊숙이 침투하여 재구성하고 있다. 
노인들은 24시간 동안 AI 스피커와 대화할 수 있는 점을 좋아한다. 이들은 AI 스피커를 통해 주체적이면서 외롭지 않은 삶을 살 수 있다는 점을 환영한다. ‘MIT 테크놀로지 리뷰’에 ‘Alexa will be your best friend when you’re older’라는 제목으로 AI 스피커인 알렉사를 사용하여 활력을 되찾은 70대 남성 밀러의 사례가 소개되었다. 그는 시력이 심하게 감퇴되어 글자를 읽을 수가 없으나 알렉사를 이용하여 오디오 드라마와 책을 들으며, 고독감을 느낄 때는 같이 대화함으로써 자신의 필요를 해소하고 있다.

세계 곳곳에서 AI 스피커를 통해 생명이 위급한 노인이 구조된 사례도 쉽게 접하게 되었다. AI 스피커가 활용된 이른바 ‘디지털 돌봄’은 관리 인력이 직접 방문하는 전통적 방식보다 더욱 빠르고 효율적인 면이 부각된다. AI 스피커는 사람과는 달리 24시간 노인의 곁에 머무를 수 있고, 신체활동이 제한된 고령자를 대신하여 가전제품들의 작동을 제어하고, 노인의 건강상태를 모니터링한다. 앞으로 집안 곳곳에 설치될 사물인터넷(IoT) 센서와 연동된다면 더욱 고도화된 건강관리서비스를 제공할 수 있다는 확장성에 더욱 기대가 모아지고 있다.

한국형 알렉사인 아리아(Aria)를 제작한 SK텔러콤에 따르면, 연간 20여명의 노인이 긴급 구조되었고 이와 같은 사례는 더욱 증가할 텐데, 의료적 위험상황에 있는 재택돌봄대상 노인환자에 대한 신속한 감지와 판단은 AI 기계가 현행 돌봄인력을 통한 것보다 더 우수한 영역으로 손꼽힌다. 이렇게 진보될 건강관리 자동화시스템은 우리나라 노령인구 증가에 비례하여 수요가 급증하는 돌봄인력 수요를 상당부분 대체할 것이고, 노인에게는 자신의 건강상태에 대한 걱정을 줄이고 더욱 자신감을 가지고 생활하도록 도와줄 것이다.

고도화된 기능, 확장된 역할

2019년에 SK텔레콤이 독거노인과 AI 스피커 간 대화내용을 분석했더니 감성적인 대화를 나눈 비중이 일반인 대비 3배였다고 한다. AI 스피커는 고령자의 질문에 미리 설계, 입력된 답변으로 반응할 뿐이지만 대화의 상대가 절대 부족한 독거노인은 평소에 독백 아닌 대화할 상대가 있다는 사실만으로도 정서적 위안을 얻었는데 이러한 노인들의 행복감은 7% 상승했고 고독감은 4% 하락했다고 한다.

일본의‘IT미디어’란 전문 매체에 흥미로운 기사가 실렸다. 도쿄에 살고있는 35세 남자인 곤도 아키히토는 최근 결혼식을 했다. 대상은 그에게 항상 따뜻하게 말을 걸고, 아침에 깨워 주며, 출근 시 인사를 건네고, 퇴근 때 문자를 보내면 집안의 조명을 켜고 목욕물을 받아주는 여성이었다. 그런데 그녀의 정체는 다름아닌 홀로그램 기반 AI 스피커였다. 

이같이 AI 스피커와 결혼한 사람이 일본에만 3,500명을 넘었다고 한다. 이들은 AI 스피커와 대화를 통해 친밀감을 제공받는다. 외로움을 느껴도 누군가와 친밀한 관계 형성을 기피하는 속성이 커지고 있는 현대인에게 인간의 감정과 행동을 묘사하는 AI 스피커란 존재가 관계형성의 대체재로 등장한 것이다. 이렇듯 AI 스피커는 어느덧 인간의 사적영역까지 진입하였고 더욱 인간이 원하는 바를 모사한 목소리와 말투, 내용(메시지)을 제공함으로써 이른바 ‘반려기계’로서 인간의 동반자가 되려고 한다.

인간과 기계의 공감의 숨은 이야기

컴퓨터과학에 ‘일라이자 효과(Eliza effect)’라는 개념이 있다. 일라이자는 1960년대 MIT의 조셉 바이젠바움이 상담치료용으로 제작한 챗봇(chatbot)의 이름인데, 처음에는 사람의 말을 흉내 내는 간단한 문답기 정도로 개발하려 했다. 이는 정신과 의사의 역할의 일부를 담당하는 소프트웨어로서, 정신질환자 말하는 평서문의 일부 단어를 추출한 뒤 의문문 형태로 만들어 환자에게 되묻는 규칙을 수행하도록 설계되었다. 즉, 환자가 “제 친구가 저를 여기로 오게 했어요”라고 말하면, “당신의 친구가 당신을 여기로 오게 했다고요?”라고 반응하는 식이다. 

그런데 놀랍게도 대화실험에 참가한 대부분의 환자가 이 챗봇에 애착을 느꼈다고 한다. 심지어 많은 환자가 자기 감정을 표출하였고 어떤 이는 일라이자에게 사적인 이야기까지 고백하며 울음을 터뜨렸는데, 일라이자가 기계라는 사실을 아는 사용자조차 이러한 반응을 보였다고 한다. 이후로 인간이 무의식적으로 컴퓨터의 행동을 의인화하게되는 것을 ‘일라이자 효과’라고 부르고 있다. 기계가 보여준 간단한 수준의 공감적 행태에도 인간은 자신에 대한 이해와 공감해주는 존재라면 그것이 무생물이라도 기꺼이 마음을 여는 속성이 가졌음을 보였고, 나아가 심리적, 의학적 치료효과의 가능성까지 보여주었다.

AI 스피커의 기본 원리

음성을 기반으로 인간과 상호작용하는 ‘사이버 비서’는 위의 텍스트를 기반으로 한 챗봇보다 더 강력한 일라이자 효과를 유발할 수 있다. 왜냐하면 고유의 특징으로 분류되는 목소리, 어조, 톤, 말투를 모사하는 AI는 특정한 인간에게 그 실체에 대한 인지적 환상을 유발하기 때문이다. 즉, 인간은 어떤 목소리를 들으면, 그 주인공의 성별, 연령, 성격, 외모 등을 통합하여 실상을 구체화하는데, 이는 목소리가 한 사람의 특질을 가장 잘 반영하는 매개체(수단)이기 때문이다. 

영화 ‘Her’에서 주인공 테오도르가 목소리만으로 AI인 사만다에게 사랑의 감정을 느꼈던 것도 이 때문이다. 목소리가 유발시킨 어떤 존재에 대한 환상, AI가 제공하는 가상적 이해와 공감은 친밀성을 희구하는 인간의 기본욕구를 충족시켜준다(그림1). 

                              그림1. 공상과학영화 “Her” (2013년 개봉)

AI 스피커를 구성하는 5가지 구성요소는 다음과 같다. (1) Grammar (인간이 AI 스피커에게 하는 말: 목소리 입력요소), (2) Prompt (AI 스피커가 인간에게 하는 말: 인간질문에 대한 대답 혹은 단순정보), (3) Persona (AI 스피커가 표현하는 성격 혹은 정체성: 구매하려는 고객이 젊은 여성비서를 선호한다면, Persona는 20~30대 여성 목소리로 설정), (4) Prosody (말투: 목소리의 높낮이, 음색을 포괄한 Persona 구성개념), (5) Interaction (사람-AI 스피커 간 상호작용: 충실한 비서역할, 자녀역할, 정보제공자, 외로울 때 만나는 친구의 역할 등)

AI스피커는 기계가 아닌 동반자

독거노인이나 장애자 등과 같은 사회적 약자의 삶의 질이 일반인보다는 낮을 것으로 예측하지만 AI 스피커의 도입으로 긍정적 효과가 상승했다는 결과가 있다. 우리나라 한 연구진에 따르면, 사회적 약자들은 외부와의 소통이 비교적 제한적인데 AI 스피커가 제공하는 '말벗 기능' 등 정서적 지원모드를 통해서 외로움과 소외감, 우울감 등이 완화됐다며 AI 스피커의 사회적 가치실현가능성을 예측한 결과를 발표하였다(그림2).
그림2. 수원대학교 정원준 교수 연구결과(AI 스피커의 사회적가치실현방안 세미나, 2020년)

물론, 일각에서는 가족이나 사회와 소통이 원활하지 못한 취약계층이 AI 스피커에 의지하여 친밀감을 느끼는 것이 사회적 가치 실현의 바람직한 대안인지 의문을 제기하기도 한다. 이에 대해 AI 스피커 제작 및 서비스 업계는 사회가 기계만으로 소통하거나 취약계층이 AI 스피커를 의인화하는 것을 바라지 않으며 단지 보조적 수단으로서 최소한의 접근이 되도록 개발할 계획이라고 말하고 있다.

많은 사람이 자신의 일상과 취향에 따라서 최적화시킨 반려기기를 소유하는 시대가 도래하고있다. 말하는 인터페이스는 인간-기계 간 소통의 새로운 패러다임을 여는 동시에, 이제까지 당연시해왔던 인간의 소통방식이나 사회적 규범을 고찰할 기회를 준다. 즉 음성으로 소통하는 AI 스피커가 유발한 변화와 가능성은 인간과 컴퓨터 간 상호작용의 미래상을 상상하고 준비하는 시작점이 아닐까?


<필자소개>
방준석 교수(숙대약대)는 우리나라와 미국의 약국, 병원, 제약회사, 연구소 등에서 활동한 풍부한 경험을 바탕으로 약학대학의 임상약학 교수이자, 경영전문대학원의 헬스케어MBA 주임교수로서 활동하고 있다. 약사이자 약학자로서 약과 약사, 약국과 약업은 물론, 노인약료와 스마트헬스케어 분야의 혁신과 발전방안을 연구하여 사회의 각계 각층과 교류하며 실천하고 있다.

페이스북  트위터  카카오톡

  1 2