TECH

말 잘 듣는 친구들

안녕, 혼자 사는 남자 에디터B다. 서울에서 혼자 산 지 6년쯤 되다 보니 이젠 누군가 집에 있으면 불편할 정도다. 혼자 지내다 보니...
안녕, 혼자 사는 남자 에디터B다. 서울에서 혼자 산 지 6년쯤 되다 보니 이젠…

2019. 09. 17

안녕, 혼자 사는 남자 에디터B다. 서울에서 혼자 산 지 6년쯤 되다 보니 이젠 누군가 집에 있으면 불편할 정도다. 혼자 지내다 보니 대화할 일이 없어졌고, 대화할 일이 없어지니 언어 능력이 퇴화했다. 월요일에 출근하면 퇴화한 언어능력이 빛을 발한다. “먹어요…점심…오늘은 파스타…” 그래서 말동무를 겸하려 AI스피커를 샀다.

오늘은 한국 IT기업의 양대 산맥 네이버와 카카오가 만든 AI스피커를 각각 비교해보려 한다. 카카오 스피커를 1 넘게 쓰다가 고장이 난 뒤로는 네이버 클로바를 3개월 정도 사용했으니, 내겐 거의 반려 스피커다. 결론부터 말하자면 AI스피커는 추천할 만한 제품이다. AI스피커는 라이프스타일에 확실한 변화를 준다. 몇 달 쓰다보면 이 물건이 없었던 때의 삶을 상상하기 힘들 거다. 그리고 카카오와 클로바에는 각각 장단점이 있다. 자세한 차이점에 대해서는 문답 형식으로 적어놓았으니 읽어보고 끌리는 것을 입양하자.

1400_DSC09994


Q1.인식률은 어떤 게 더 좋아요?

AI스피커를 써본 사람이 가장 많이 걱정하는 게 인식률이 아닐까. 내가 체감하기로는 카카오가 인식률이 더 좋다. 조용한 환경에서는 물론이고, 잡음이 섞여 있는 환경에서도카카오야라고 부르는 소리를 귀신같이 알아챈.

카카오는 호출 민감도를 설정할 있는데, 가장 민감하게 해놓으면 부르는 소리를 놓칠 일은 거의 없다. 꼭 크게 부르지 않고 조곤조곤 말해도 잘만 알아듣는다. 대신 민감도를 많이 낮추면 TV 소리에 잘못 반응하는 경우도 있는데, 아주 가끔이다. 빈도는 극히 낮.

멀리 있는 소리도 잘 듣는다. 카카오가 거실 있고 나는 샤워실에 있을 때 모닝콜이 울리는 경우가 있다. 샤워실에서 스피커까지의 거리는 약 2m. 문을 연 채로 “카카오야”라고 말하면 목소리가 울리는데도 듣기는 듣는다. 확률은 절반 정도?

1400_DSC09993

반면 클로바의 인식률은 카카오만큼 좋지는 않았다카카오에는 음성을 인식하는 내장 마이크가 4개 들어있고, 클로바에는 2개밖에 들어있지 않다.

나는 취침 전에는 누워서 웹툰을 보다가 졸리기 시작하면 AI스피커로 아침 알람을 맞춘다. 하지만  알아듣는 경우 ‘가끔’ 있었다. ‘가끔’ 정도면  아닌 것처럼 생각할 수도 있지만, 댓츠 노노. 바로 옆에 있는 친구를 세 번이나 불렀는데 반응이 없다고 생각해보자. 그 답답함이란…나중에는 “크을로오바아아!!”하고 부르게 된다.

1600_DSC00048[뀨?]

Q2.어려운 말도 잘 이해해요?

두 기기 모두 쉬운 대화를 할 때는 큰 문제 없다. 그렇다면 어려운 질문에는 어느 정도의 인식률을 보여주는지 테스트하기 위해 몇 가지 질문을 던져보았다.

1. 형돈이와 대준이의 ‘한번도 안 틀리고 누구도 부르기 어려운 노래’ 틀어줘.
카카오와 클로바 모두 한 번에 틀어준다. 긴 문장임에도 못 알아듣거나 엉뚱한 노래를 틀어주는 일은 없다.

2. <타짜3: 원아이드잭> 무슨 내용이야?
잘 인식한다. “영화 타짜 원아이드잭의 줄거리입니다…”라고 대답을 시작하는데, 각각 네이버와 다음에 등록된 영화 줄거리를 읽어준다.

3. <그것이 알고 싶다> 이번 주 내용 뭐야?
이건 아쉬웠다. 클로바는 “말씀하신 프로그램의 방송 정보를 찾을 수 없습니다”라고 말하고, 카카오는 “업데이트를 준비 중인 기능이에요. 조금만 기다려주세요.”라고 답한다. 카카오가 좀 더 희망적이고 친절하게 대답해주지만 어쨌든 둘 다 지원하지 않는다.

4. 올해 공휴일 며칠이야?
클로바는 “2019년 휴일은 15일의 공휴일과 하루의 대체 공휴일, 50일의 일요일을 포함해서 총 66일이에요. 2018년에 비해 휴일이 사흘 줄었어요.”라고 말하고, 카카오는 “올해는 주말을 제외하고 총 12일 쉬어요”라고 말한다. 카카오가 질문의 목적을 잘 이해한다. 공휴일이 며칠인지 궁금할 때 보통은 일요일을 포함하지는 않으니까. 여기서 또 하나의 차이는 클로바는 다시 말하기 기능이 안 된다는 거다. “다시 말해줘”라고 하면 “지원하지 않는 기능이에요”라고 말한다. 하지만 카카오는 다시 말해준다.

5. 어떻게 하면 부자가 될 수 있을까?
허무맹랑한 질문도 잘 이해한다. “돈보단 꿈을 그려봐요. 그럼 자연스럽게 돈이 모일 거예요.” “돈이 많으면 좋겠지만 당신이 지치지 않았으면 좋겠어요.” “부자를 만드는 것은 통장잔고가 아니라 생각의 차이라고 해요.” 클로바의 대답이다. 답변이 마음에 들지는 않지만 열심히 대답하려는 태도는 칭찬한다. 반면에 카카오는 “댓글 많은 뉴스 알려줘처럼 다른 질문을 해보세요”라고 말을 하더라.

1400_DSC00038


Q3.호칭을 바꿀 수 있어요?

사용자가 직접 호칭을 만들지는 못한다. 만들어져 있는 것 중 골라 써야 한다. 카카오를 부를 , “헤이 카카오” 또는 “카카오야”라고 부르면 된다. 잘 만든 이름이다. 카카오라는 이름에는 받침도 없고 부르기 쉽다. 그리고 익숙하다. 2010년에 카카오톡이 나온 이후로 우린 하루에도 몇 번이나 카카오라는 단어를 썼을 테니까. 카카오택시, 카카오뱅크 그리고 카카오닙스, 카카오 파우더 같은 것도 있으니까. 그래서 헤이 카카오라고 부를 때 어색하지 않다. 입에 착 붙는다.

1400_DSC00041

하지만 클로바는 낯설다. 살면서 클로바라는 단어를 말해 본 적이 없으니까. 기본적으로 클로바라고 부르도록 설정되어있으며, 샐리야, 짱구야, 제시카, 피노키오로 바꿀 수도 있다. 하지만 다른 호칭도 다 낯설다. 스피커의 생김새가 노란 병아리인데 짱구나 피노키오라고 부르는 것도 조화롭지 않고, 샐리, 제시카는 너무 사람 이름이 아닌가. 결국 클로바라고 불렀지만, 입에 붙지 않았다.

1400_DSC00028


Q4.주고 받는 대화는 잘 되나요?

생각보다 AI스피커와 대화할 일이 별로 없다. <SBS 스페셜>에는 AI스피커와 얘기하길 좋아하는 꼬마 아이가 나오던데, 그건 아이니까 가능한 것 같다. 어른인 내 입장에서는 대화가 이어지지 않아서 스피커랑 말하기엔 답답했다.

그래도 굳이 승자를 꼽자면 카카오다. 그 이유는 카카오는 매번 들을 준비를 하기 때문이다. “카카오야”라고 부르면 ‘띵’하는 소리와 함께 노란 링을 반짝이며 활성화된다. “7시에 알람 맞춰줘”라고 하면 그 명령을 수행한 뒤 다시 자동으로 ‘띵’하며 재활성화된다. 이때는 가만히 있거나 “그만”이라고 말하며 명령이 끝났음을 알려주면 된다.

하지만 클로바는 한번 명령을 수행한 뒤에는 자체적으로 대화를 종결한다(질문에 따라 재활성화되는 경우도 있는데 그 기준을 알 수는 없다). 클로바의 대답이 만족스럽지 못한 경우에는 다시 한번 “클로바야”라고 불러야 한다. 나는 7시, 8시, 9시에 알람을 맞추는데 이런 경우에는 클로바를 세 번이나 불러야 한다. 계속 클로바를 부르고 있으면 “애야, 저녁 상 내어와라” “얘야, 마당은 쓸었니?”하며 집안일을 쉼 없이 시키는 시아버지가 된 기분이다.

1400_DSC00026


Q5.음성으로만 작동이 가능한가요?

명령은 음성으로만 가능하지만, 자주 쓰는 몇 가지 기능은 버튼으로도 작동할 수 있다. 예를 들면, 볼륨 조절이라든지 음소거 모드. 하지만 이것도 카카오와 클로바에는 차이가 있다. 카카오는 기기 상단에 네 개의 버튼이 있다. 활성화, 음소거, 볼륨+, 볼륨-.

1400_DSC00009

클로바도 마찬가지로 네 개의 버튼이 있는데 차이가 있다면 활성화 버튼 대신 블루투스 페어링 버튼이 있다는 거다. 그럼 활성화 버튼은 어디에 있을까. 바로 전면에 있는 부리가 활성화 버튼이다.

1400_DSC00010[간질간질]

부리를 짧게 누르면 노래를 재생하고, 길게 누르면 ‘띵’ 소리를 내며 명령을 기다린다. 전체적인 디자인을 해치지 않는다는 점에서는 좋다. 하지만 디자인을 위해 볼륨 버튼을 후면에 배치하니 작동하기엔 불편해졌다. 음성 스피커니까 오직 음성으로만 제어할 것 같지만 그렇지 않거든.

볼륨 조절 버튼도 자주 쓴다. 모닝콜을 위해서는 음량을 최대치로 하지만, 노래나 라디오를 들을 때는 적당한 값을 찾아야 하기 때문에 아날로그 버튼이 더 편하기 때문이다. 그런데 볼륨 조절 버튼이 뒤통수에 있으니 번거롭다.

1400_DSC00016


Q6.음악 감상용 스피커로 쓰기엔 좋아요?

지금은 멜론을 이용하지 않지만, 예전에는 꽤 많이 들었다. 집에서 일을 하거나 청소를 할 때 “재즈 틀어줘” 아니면 “내가 좋아하는 노래 틀어줘”라고 말하곤 했다. 카카오는 멜론과 연동이 되고, 클로바는 바이브와 연동이 되기 때문에 어떤 스트리밍 서비스를 쓰느냐에 따라 선택이 달라질 수도 있겠다. 좋아하는 노래를 틀어주는 게 본인의 사용 기록에 기반하고 있기 때문이다. 다만 노래를 틀어놓을 때는 내 음성이 노랫소리에 묻혀 인식이 되지 않는 경우가 생길 수 있다. 

1400_DSC000331400_DSC00004


Q7.알림음은 변경할 수 있나요?

변경할 수 있다. 클로바는 기본 알림음으로 돌체, 레가토, 마르가토 등 3개의 옵션을 제공한다. 하지만 이외에는 선택권이 없다. 클로바의 알림음은 차분한 편이다. 깊은 꿈에 빠진 나를 깨우기엔 너무 잔잔하다. 돌체, 레가토, 마르가토… 이름부터 얼마나 차분한가.

반면에 카카오는 알림음을 음악으로 바꾸는 게 가능하다. 놀랍게도 멜론 사용자가 아니어도 노래로 변경하는 게 가능하다. 단, 곡 전체는 안되고 미리듣기 정도의 길이만 제공한다. 나는 모모랜드의 ‘뿜뿜’을 모닝콜로 쓰고 있는데, 곡 초반의 뿜뿜거리는 악기 소리에 깨지 않을 수가 없다. 딱 10분만 더 자고 싶으면 “카카오야, 10분 뒤에 알람 맞춰줘”라고 말하면 간단히 설정된다. 

1400_DSC00012

클로바에서 알림음을 변경할 수는 없지만 목소리는 다양하게 바꿀 수 있다. 미니언즈, 유인나도 있는데, 유인나 목소리는 꽤 신기하다. 네이버가 자체 개발한 음성 합성 기술인 HDTS(Hybrid Dnn Text-to-Speech)라고 하는데, 하이브리드가 들어간 걸 보니 뭔가 대단한 기술인 거 같다. 아래 영상은 네이버 직원들이 유인나 목소리와 연애 상담을 하는 거다. 신기하다 이게 만들어진 목소리라니. 앞으로 어떤 목소리가 또 탑재될지 기대된다.


Q8.휴대성은 좋아요?

사실 휴대성이 중요한지 모르겠다. AI스피커의 용도는 스피커가 아니라 ‘AI’에 방점이 찍혀있다고 생각한다. AI스피커에게 음성은 인간과 커뮤니케이션하기 위한 수단일 뿐. 그렇기 때문에 음악을 듣기 위해 AI스피커를 산다는 건 그리 좋은 선택은 아닌 것 같다. 더 저렴하고 출력도 큰 스피커가 다른 브랜드에도 많이 있다. 그래도 휴대성 면에서 두 기기의 차이가 있으니 짚고 넘어가는 게 좋겠다. 우선 카카오는 별도로 판매하는 전용 배터리팩(3820mAh) 없이는 야외에서 작동할 수 없다.

1400_DSC00029

클로바는 약 여섯 시간 사용 가능한 2,000mAh의 배터리가 탑재되어있다. 없는 것보다 있는 게 더 낫다고 생각할 수도 있겠지만, 글쎄다.

AI스피커를 야외로 가지고 갈 경우가 얼마나 있을까. 야외에서 스피커를 트는 상황이라면 공원이나 캠핑장일 텐데, 사람이 많은 공원에서 스피커를 트는 건 주변 사람에게 피해를 줄 수 있고, 어느 정도 공간이 확보된 캠핑장에서 듣는 거라면 출력이 더 좋은 스피커가 낫지 않을까. 어떤 경우를 생각해도 휴대성은 크게 중요한 요소가 아닌 듯하다.

1400_DSC00023[마지막으로 귀여운 사진1]
1400_DSC00051[귀여운 사진2]

물론 오늘 언급한 것 말고 다른 기능도 정말 많다. 카카오톡으로 메시지를 보낸다거나 홈트레이닝을 도와준다거나 빗소리를 틀어준다거나. 하지만 모든 기능이 다 필요하진 않을 거다. 자주 쓰는 기능은 본인의 라이프 스타일에 따라 달라질 테니까. 나는 한번도 쓰지 않았지만, 아이가 있는 집이라면 동화를 읽어주기나 오디오북 같은 걸 많이 쓰겠지.

처음 AI스피커가 나왔을 때만 해도 스피커와 대화하고 수다 떠는 장면들을 상상했는데, 막상 써보니 달랐다. 자연스러운 대화를 하기엔 여전히 AI스피커의 답변은 기계적이라 대화할 맛이 나지 않았으니까.

하지만 스피커는 스마트폰의 어떤 몇 가지 기능을 대체할 만큼 만족스러웠다. 폰을 켜서 앱을 실행시켜 작동하는 프로세스를 음성 하나로 대체할 수 있으니까. 리고 두 제품 중 승자를 꼽자면 단연 카카오 스피커다. 하지만 디자인이 귀여우니 클로바를 사겠다고 말해도 말리지는 않겠다. 귀여움처럼 치명적인 것이 없으니.

About Author
김석준

에디터B. 기계식 키보드와 전통주를 사랑하며, 쓸데없는 물건을 좋아한다는 오해를 자주 받는다.