▲ 아마존의 음성인식 스피커 ‘에코(echo)’ [사진=아마존]
[헬로티]
인공지능(AI) 기반 음성 인식 기술이 올해를 기점으로 거물급 IT회사들 간 격전지로 급부상했다.
기술적으로도 음성 인식은 단순 기술을 넘어 이제 폭발력인 잠재력을 갖춘 플랫폼으로까지 진화하고 있다. 플랫폼 기반 생태계를 틀어쥐기 위한 업체 간 경쟁도 그만큼 거세지고 있다.
돌아가는 판세를 보면 2017년 음성 플랫폼을 둘러싼 '별들의 전쟁'은 역대 최고조에 이를 것으로 전망된다. 이름만으로 반은 먹고 들어가는 회사들이 구글, 아마존, 마이크로소프트(MS), 삼성전자 등이 모두 음성 기반 서비스 시장에서 대권도전을 선언했다.
◇ 음성 중심 서비스 생태계 확산 예고
가트너(Gartner)는 오는 2017년 스마트 기기와 사용자 간 상호 작용 중 30%가 대화를 통해 이뤄질 것이라고 전망했다.
가트너는 미국, 영국, 중국의 스마트기기 소비자 3021명을 대상으로 모바일 앱 설문 조사를 실시한 결과, 미국 응답자 42%와 영국 응답자 32%가 최근 3개월간 스마트폰이나 스마트 기기 등으로 음성인식 서비스를 사용한 적이 있다고 답했다.
아네트 짐머만(Annette Zimmermann) 가트너 리서치 담당 부사장은 “앞으로 VPA(Virtual Personal Assistants, 가상개인비서)가 보편화되고 스마트 기기와 대화가 가능해지면서 상호작용의 역할이 더욱 중요해질 것”이라고 말했다.
음성을 향한 글로벌 회사들의 행보 역시 이런 흐름과 무관치 않다. 아마존이 AI 기반 음성 비서 기술인 알렉사를 탑재한 스마트 스피커 '에코'로 수백만 대의 판매고를 올리면서 사업적으로도 음성의 잠재력은 어느 정도 검증됐다는 평가도 나오고 있다.
포레스터 리서치의 제임스 맥퀴비 수석 기술분석가는 “미국가정 5%는 음성인식 스피커를 사용하고 있고 아마존 에코는 미국 소비자 만족도 최고를 기록했다”고 전했다.
에코를 사려는 소비자들의 열기는 연말 쇼핑 시즌에도 여전하다. 올해 크리스마스 시즌의 경우 에코 판매량은 지난해 대비 9배에 달했다. 내년 1월 21일까지는 재고가 없다는 얘기도 나오고 있다.
아마존을 견제하려는 경쟁사들의 추격전도 본격화됐다. 구글은 올해 알렉사와 비슷한 음성 비서 기술인 구글 어시스턴트를 공개했고 MS는 코타나를 앞세워 아마존의 아성을 위협하고 있다.
구글은 지난 5월 18일 열린 구글개발자회의에서 음성인식 AI 비서 시스템 구글 어시스턴트를 공개한 데 이어 11월 4일 구글 어시스턴트 기능이 적용된 구글홈을 출시했다. ‘OK 구글’이라고 말하면 구글 검색서비스를 기반으로 사용자의 질문에 대답하거나 추천하며 사용자의 검색 성향에 따라 사용자가 원하는 것을 예측하여 전달한다.
MS는 2014년 음성 인식 비서인 ‘코타나(Cortana)’을 공개했고 윈도10에선 AI 기술을 활용해 사용자 행동방식을 학습하고 PC 안에 저장된 다양한 정보와 빙(Bing)을 결합해 사용자 맞춤형 서비스를 제공한다.
2011년 ‘시리(Siri)’를 내놓고 일찌감치 음성의 시대를 준비했지만, 초반 주도권 확보에는 실패한 애플도 전열을 가다듬기 시작했다. 애플은 지난 6월 iOS 10을 내놓으며 시리의 실용성을 높였다. 아이폰7의 경우 외부 동작 감지 센서를 2번 두드리면 시리가 자동 실행되는 기능도 추가됐다.
AI 기반 음성 인식 시장을 향한 삼성전자의 행보도 주목된다. 삼성전자는 10월 실리콘 밸리 소재 AI 플랫폼 개발 기업 비브랩스(VIV Labs)를 인수하면서 음성 플랫폼 대권 레이스에 가세했다. ‘비브(VIV)’는 스마트폰을 중심으로 스마트기기 플랫폼에 인공지능을 활용하는 ‘삼성 폰플러스 전략’에서 핵심적인 역할을 할 것으로 전망되며, 내년 출시예정인 갤럭시S8에 탑재될 예정이다.
중국 회사들의 행보도 빨라졌다.
바이두는 9월 1일 인공지능기반 음성인식 시스템 ‘딥스피치 2’를 소개했다. 바이두는 “딥스피치 2는 개인마다 다른 말투, 사투리, 시끄러운 환경에서도 높은 인식률을 보여주며 음성 인식 정확도는 97%에 이른다”고 설명했다.
◇ 아마존 ‘에코’ 바람 계속될까?
음성을 둘러싼 업체 간 경쟁에서 관전 포인트 중 하나는 아마존이 지금처럼 계속 분위기를 주도할지 아니면 경쟁사들의 추격에 성공해 다자간 경쟁 구도로 시장이 재편될지 여부다.
아마존은 2014년 11월 처음으로 에코 기기를 선보였다. 에코는 높은 음성 인식률이 장점으로 꼽힌다. 에코에는 원거리 음장(far field) 음성 인식 기술이 적용돼 주위 소음을 뚫고 6~7m 거리에서 명령도 인식할 수 있다.
아마존의 에코 플랫폼 개방전략도 들고 나왔다. 이를 통해 타사 개발자들이 에코의 기반 기술인 알렉사를 지원하는 앱 개발에 참여할 수 있도록 유도해 나간다는 방침이다. 에코에는 이미 신용카드 청구서 지불, BBC 뉴스 브리핑 등 다양한 기능이 탑재됐다. 생태계 규모 측면에선 아마존이 경쟁사들에 앞서 있는 셈이다.
포레스터 리서치 맥퀴니 분석가는 아마존이 음성인식 스피커로 특화된 기기를 사용하려는 소비자심리를 파고든 것도 주효했다는 입장이다.
구글이 안드로이드를 공개한 이후 넥서스 기기를 발표한 것과 같이 아마존은 음성인식 스피커를 넘어 스마트홈 서비스 구축을 목표로 하고 있다. 이를 위해 아마존은 최근 인텔과도 손을 잡았다.
아마존이 음성 인식에 기반한 스마트홈 환경에서 경쟁력을 갖기 위해서는 풀어야 할 숙제도 있다. 와이어드가 운영하는 온라인 미디어 백채널에 따르면 맥퀴니 분석가는 프라이버시, 제한된 기능, 좀 더 진화된 AI 역량 등을 키워드로 꼽았다.
김지환 기자 (ueghqwe@hellot.net)