Siri, 파란의 시작점

By | 2011-11-25

솔직히 말하자면 난 iOS에 음성인식 기술이 쓰일것 이라는 루머를 처음 들었을 때 기대치가 높지 않았다. 그저 현재 구글이 하고 있는 정도와 같이 음성을 텍스트로, 텍스트를 음성으로 변환하고 조금 더 나아간다면 명령어 처리 인덱스따위를 통해(앞으로 이걸 명령어 처리박스로 부르겠다) 간단한 음성명령이 구현될 것으로 내다보았다. 이 과정에서 나는 Siri를 전적으로 오해했다. 그저 이것은 조금 더 진화한 명령처리박스 정도로만 치부해 버렸었다. 내가 이렇게 오해를 하게 된 것은 아이러니 하게도 오래동안  맥을 사용해 온 역사가 있었기 때뭉이었다.

놀랍게도 맥은 1984년부터 MacinTalk라는 음성관련 앱이 존재했었고 내가 맥을 처음 접했을 때 MacinTalk는 정말 신기한 소프트웨어로 시간을 보내면서 놀기에 딱 좋은 수준이었다.  아마 올드맥 사용자들이라면 아래 둥그렇게 생긴 저 물건이 무엇인지 대번에 알아볼 것이다. 그렇다, 이건 내가 1991년 Mac LC를 구입했을 때도 들어있었던 마이크로폰이다.

애플은 사실 집요하게 음성인식과 명령, Text-to-Speech 기술에 대해 집착해왔다. 거의 한시도 여기에서 눈을 뗀적이 없었던 것 같고 MacinTalk 기술은 계속 발전을 거듭하여 잡스가 없었던 시대에도 그 명맥이 계속 이어져 어느 순간엔 PlainTalk로 명칭을 바꾸기까지 하면서 야심차게 매번 새로운  OS에 탑재되어왔다. 위의 마이크로폰이 기억난다면 아래의 사진도 친숙하리라. 이건 PlainTalk  마이크로폰이라 불리던 것으로 파워맥에 딸려나왔던 물건이다. (어느 순간부터 마이크로폰은 맥의 내부에 내장되었다)

이렇듯 애플은 거의 한순간도 쉬지 않고 음성명령에 대해 관심을 가졌었지만 그 결과는 언제나 신통치 않았다. Mac OS X 10.6.8 버전까지도 말이다.  변화의 기운은 Mac OS X Lion에서 감지되었다. Lion이 공개되기전 개발자 버전에서 Nuance의 제품에 등장하던 목소리들이 발견되었던 것이다.

당연히 나는 Siri를 제쳐두고 Nuance에 관심을 가지게 되었다. 애플이 결국 자체적으로 지속해오던 음성인식 개발을 포기하기로 한걸까 ? 한가지 자명한 사실은 Nuance의 기술이 iOS 5에 탑재되리란 사실이었고 Nuance의 Dragon Dictation은 다행히 한국어 인식과 받아쓰기도 훌륭히 해내더라는 것이었다. 자…이제 상황을 좀 정리해보겠다. 나는 Mac OS에서 돌아가던 음성명령 체계에 대해 지난 20년동안 실망만 하고 살아온 사람이었다. 그리고 그것이 결국 애플 자체의 기술이 아닌 Nuance의 음성인식 엔진으로 대체된다한들 인식률은 개선될지 몰라도 명령체계 등은 지금까지의 경험에서 크게 벗어날 것이 없다고 판단했다. 따라서 난 Siri 보다는 Nuance에 더 비중을 두었고 Siri가 드디어 세상에 출시(비록 베타버전이었지만)되었을때 놀라지 않을 수 없었다.  아마 기존 맥유저들이라면 나와 비슷했을 것이다.

아마 구글과 마이크로소프트는 내가 놀란 것 이상으로 경악하지 않을 수 없었을 것이다. 그들은 직감적으로 애플이 시도하고 있는 이 기술이 앞으로 자신의 사업영역을 어떻게 침범할 수 있을지 최악의 시나리오를 머리속으로 그려봤는지도 모르겠다.  어쨋든 Siri는 경악스러운 시도였고 현재의 IT삼국지의 나머지 두 축을 담당하는 이 회사들이 느꼈을 위기감은 짐작할만 하다.

구글은 전통적으로 검색어를 가지고 결과를 리스트 형태로 보여주는데 익숙했다. 그런데 Siri는 사용자가 궁금해했던 물음에 대한 단 하나의 답변을 내놓는다. 이건 구글 검색이 가진 패러다임과는 너무나도 다른 것이기에(또한 그들이 가지지 못한 것이기에) 구글로서는 충격이 가장 클 수밖에 없었다. 물론 Siri가 이렇게 할 수 있는데에는 WolframAlpha 같은 서비스가 한몫 단단히 했다. 마이크로소프트 역시 Bing이라는 서비스를 가지고 있기에 그들이 대면하는 충격도 클 테지만 구글만큼은 아니다. 그러나 OS와 차세대 인터페이스라는 측면에서만큼은 MS 역시 크게 한방을 먹었음이 분명해진다. 그들은 최근 공개한 Windows 8에서 애플보다 먼저 모바일과 데스크탑을 통합하는 모습을 보이려 안간힘을 쓰고 있다. 그러나 그들의 OS와 앱은 아직 터치인터페이스에 친숙하지 못하다.  MS 역시 OS내에 음성인식 기능을 내장하고 있지만 그건 내가 지금껏 불만을 가져온 애플만도 못하다.

미래를 논하기 전에 현재의 비즈니스부터 좀 더 얘기해보자. 애플이 Siri를 인수한 것은 정말 잘한 일임이 판명되었다. 그런데 Nuance나 WolframAlpha는 ? 왜 그들은 인수하지 않은 것인가 ?  자존심을 무릅쓰고 이미 Lion에도 Nuance의 엔진을 라이센싱했음에도 말이다. 애플은 음성명령체계 구도에서 Siri를 정점에 두고있다. Nuance와 같은 음성인식 엔진은 Siri에 필수적이지만 언제라도 다른 엔진으로 교체가능하도록 설계되었고 Siri와 Nuance가 합쳐져서 음성명령 체계를 구성한다. 여기에 WolframAlpha와 같은 서비스엔진과 구글과 같은 검색엔진, 지도와 칼렌더, 주소록과 같은 각종 앱들이 줄줄이 붙어나가면서 거대한 체계를 만들어 나가는 구조이다. Siri + Nuance의 조합이 핵심엔진이라면 WolframAlpha와 Map Service는 필수 서비스 엔진이라 부를 수 있다.

내가 잡스였다면 Nuance, WolframAlpha를 어떻게든 사들여버렸을 것 같다. 지도 서비스에 대해서는 이미 몇 년전부터 준비해오고 있는 거싱 있지 않은가 ?  아마 이렇게된다면 구글보다는 못하겠지만 그래도 그들을 위협할만한 서비스 체계를 완성해낼 수 있지 않을까 ? 그런데 어째서 애플같이 현금이 충만한 회사가 Nuance를 그대로 두는 걸까 ?  그 단서가 얼마전 발견된것 같다. iPhoneMy.com에 따르면 (‘Apple researching its own text-to-speech…‘ 를 참조하라) 애플은 얼마전 음성인식에 대한 특허를 출원했으며 언젠가 Nuance의 음성인식 엔진을 보다 진보한 애플의 엔진으로 대체할 것 같다.  Nuance는 Siri로 인해 현재 자사의 제품인 Dragon Dictation의 인기가 상한가를 치고있지만 그것이 언제까지 지속될지는 의문이다.

WolframAlpha는 정식서비스를 게시한지 얼마되지 않았으나 초기부터 MS와 구글의 뜨거운 관심을 받아오고 있는 중이다. (내가 주인장이라면 몸값을 더 올리기 위해 기다릴것이다) 이미 인터넷상에서는 이 서비스가 이들의 인수대상으로 거론된지 오래다. 그런데 구글은 바보같이 더 중요한 미래전쟁을 앞두고 보유현금의 1/3을 덜컥 모토롤라를 인수하는데 써버렸다.  주요 서비스를 주로 구매(?)해서 통합해온 구글인지라 너무 성급한 결정이 아니었나 싶다.

구글과 MS가 관망하는 사이 또 하나의 주자가 움직였는데 바로 아마존이다.아마존은 올 11월(바로 며칠전이다) Yap이란 음성인식 기업을 인수하며 뒤쳐지지 않겠다는 의지를 확고히 했다. (그런가하면 Nuance는 엉뚱하게도 Swype를 인수했다) MS나 구글이 아닌 아마존이 움직인점은 삼성이나 HTC와 같은 OS를 가지지 않은(가졌다해도 졸렬한 수준인) 업체들로서는 눈여겨볼만한 부분이다. Siri가 의미있는 것은 OS차원에서 움직이며 향후 데스크탑에도 탑재될 가능성이 농후(사실 100%라 본다)하며 애플TV같은 곳에도 채용을 해 제품을 완전 통합해 버릴 수 있기 때문이다. 그런 측면이라면 아마존의 음성인식에의 투자는 너무 범위가 한정되어 보인다. 물론 아마존은 킨들 파이어와 같이 무늬만 안드로이드인 OS를 떡주무르듯하여 OS레벨로 이 서비스를 끼워넣을지도 모른다. 그러나 그건 아마존이니까 가능한 부분이란 생각이 든다. 삼성과 HTC 등에겐 두 가지 길이 있다. 구글이 빨리 해주길 기다리던가 스스로 아마존같이 나서던가. 그러나 이들이 아마존같이 나서게 된다면 스티브 잡스가 애초에 원했던 방향대로 전체 게임이 진행될 가능성이 크다.  안드로이드 진영의 파편화 말이다.

Siri가 나오고나서 다시한번 이 삼국시대는 파란에 휩싸이는것 같이 보인다. Siri는 내년에 출시될 iPad에도 채용될 가능성이 높다. 또한 Mac OS에도 들어갈 것이다. 그리고 누구나 예상하는대로 애플TV에도 어떤 형태로든 들어갈 것이다.  거실에서 Siri에게 음성으로 음악을 틀고 원하는 채널로 돌리는 명령을 내릴 시대가 오는 것이다. 아마 애플은 새로운 외장 마이크로폰을 심각하게 고민하게 될지도 모르겠다. 또한 한 집안에 Siri가 5~6마리가 존재하는 상황을 어떻게 애플이 제어하려들지도 관심이다. 나만해도 iOS기기 2대에 맥이 3대니 내년에 애플TV까지 들여놓는다면 집안에 Siri만 6개가 존재하는 상황이 된다. 우리집 Siri는 혹시 하나로 통합될 수 있을까 ? 내 상상이 너무 앞서갔나 ? 내년이 벌써부터 궁금해진다.

내가 내년 이맘때쯤 시리에게 하고 있을 명령이나 생각해두자.

“이봐 시리, 오늘 챔스리그 중계해주는 채널이 어디야 ?”

“아 그래? 그럼 경기시작 10분전에 나 좀 깨워주고 텔레비젼도 맞춰서 틀어놔”

 

P.S – Siri야 말로 잡스의 공들인 유작이 아닐까 싶다. 이걸 생각하면 내년에도 애플은 할일도 많고 제품출시도 러시를 이룰거라 생각된다.

 

 

 

Facebook Comments

4 thoughts on “Siri, 파란의 시작점

  1. indy

    아 그래? 그럼 경기시작 10분전에 나 좀 깨워주고 텔레비젼도 맞춰서 틀어놔”

    그리고 가장 가까운 피자집에 전화해서 라지사이즈로 주문도 해놔.

    Reply
  2. Gundalpooh

    1. 시리를 사용해보니 너무 편하고 강력해서 이것이 다양한 언어를 지원하고 API를 공개해서 다양한 앱을 구동시키게 되는 순간 안드로이드 진영이 괴멸할까봐 약간 걱정됩니다. 근데 정작 국내 분위기는 시리의 폭발적인 잠재력을 못알아보고 있는것 같아요. 화면 크기가 커지니 어쩌니하는 얘기나 나오고. Demitrio님의 이런글이 포털 메인에 떠줘야 하는데말이죠 ㅎㅎ

    2. 아이폰이 앱들을 위한 플랫폼이 되었듯 애플 티비는 집안의 다양한 가전을 위한 플랫폼이 되지 않을까하는 생각입니다. 애플은 냉장고 세탁기 오븐렌지 등등의 제조사들을 파트너로 삼아 생태계를 구축하고 와이파이 모듈 하나씩만 넣으라고 하겠죠. 그리고 애플 티비에는 그것을 구동하기 위한 앱들이 들어가면서 시리로 집안의 모든 가전과 소통이 가능하게 되는 것이죠. 애플이 이런 밑그림을 그리고 있는게 아닌가 하는 생각이 듭니다. 이런 환경을 구축하는데는 역시 시리가 필수 불가결이죠. 아무래도 리모콘을 손가락으로 꾹꾹 눌러서 제어하는건 시간도 걸리고 전자기기를 좋아하지 않는 주부들에게는 뭔가 부자연스러우니까요. 애플의 행보를 보고 있으면 정말 한수 한수가 너무 잘 맞아 떨어져서 소름이 끼쳐요. 내년에 한국어 버전 풀리고 애플티비나오고 나면 국내에서 또 난리날 것 같습니다.

    Reply
    1. demitrio Post author

      시리와 같은 서비스는 애초에 구글같은 회사의 성격에 부합하는 것이라생각했습니다. 구글은 번역과 음성인식에 대해서는 독자적으로 노하우가 쌓인만큼 이 분야로 진출하는데에는 반감이 없으리라 봅니다. 그런데 시리같은 인터페이스가 미래의 표준이 된다면 그건 구글이 생각했던 ‘웹이 곧 OS다’에서는 좀 거리감이 있어보입니다. 구글이 시리를 놓고 장고를 거듭할듯 하네요. 전략적 판단이 필요한 시점입니다

      Reply

Gundalpooh 에 응답 남기기 응답 취소