세계일보
메뉴 보기 검색

[소프트웨어가 국력] (17) ‘Q보이스’로 SW시장 도전장 LG전자

친구와 대화하듯… 지능형 음성인식 기술로 ‘스마트 경쟁력’ UP
“종각역에서 강남까지 가는 가장 빠른 방법을 알려줘”라고 묻자 스마트폰은 버스와 지하철로 강남에 가는 방법을 정확하게 알려준다. 또 “요즘 인기있는 영화가 뭐야?”라고 질문하면 똑똑하게 최신영화를 검색해서 보여준다. 이는 LG전자의 스마트폰 ‘옵티머스 뷰’에 장착된 독자개발 음성인식 기술 ‘Q보이스’ 덕분이다. LG전자가 스마트폰 업계의 화두로 떠오른 음성인식 기술로 글로벌 소프트웨어(SW) 시장에 도전장을 던졌다. 뛰어난 자연어 처리 기술력이 돋보이는 Q보이스를 음성인식 기술 분야를 평정할 ‘킬러 앱’으로 키운다는 야심이다.

◆진일보한 독자 음성인식 기술


음성인식 솔루션은 손으로 여러 단계를 조작하지 않고도 빠르고 직관적으로 기능을 사용할 수 있어 최근 각광받는 분야다. 운전, 요리, 운동 등 두 손을 쓸 수 없을 때 음성만으로 필요한 기능을 작동할 수 있어 매우 편리하다. 특히 스마트기기 사용이 익숙하지 않은 노년층도 보다 쉽고 빠르게 문자나 메일을 전송할 수 있다.

문제는 음성인식 수준이다. 인식 수준이 낮으면 차라리 손으로 작동하는 것보다 불편하기 때문이다. 그런 점에서 LG전자가 6월 말 옵티머스 뷰를 통해 선보인 지능형 음성인식 솔루션 ‘Q보이스’는 빠른 반응 속도와 뛰어난 자연어 처리 성능으로 업계의 비상한 관심을 끌고 있다.

특히 Q보이스는 기존 음성인식과 달리 앞선 질문에 연속된 질문을 이해하고 대답할 줄 아는 ‘지능’을 지녔다. 예를 들어 “지금 뉴욕은 몇 시지?”라고 물어보면 뉴욕 시각을 알려주고 “그럼 파리는?”과 같이 기존 질문에 이어서 “몇 시지?”를 축약해서 질문해도 파리 시각을 정확하게 알려준다.

사용자의 엉뚱한 질문에도 재치 있게 대답하는 ‘감성 답변’도 눈에 띈다. “점심 뭐 먹었어?”라는 질문에 “신선하고 짜릿한 220V를 먹었지요”라고 답하는 등 감성적인 대화가 가능하다. 특히 Q보이스는 스마트폰 음성인식 솔루션 가운데 유일하게 여성뿐 아니라 남성 목소리도 제공해 사용자 선택권을 넓혔다는 평가를 받고 있다.

LG전자 스마트폰의 독자 음성인식기술 개발을 전담하는 MC사업본부 ‘Q보이스’ 개발팀 팀원들이 29일 서울 가산동 사무실에서 Q보이스 기능이 적용된 스마트폰을 들어보이고 있다.
이재문 기자
◆자연어 처리의 두뇌 ‘베르니케’ 독자 개발


이처럼 똑똑한 음성인식이 가능한 것은 자연어 처리와 음성합성 기반 기술을 진일보시킨 LG전자의 오랜 연구 덕분이다. 지능형 음성인식은 사용자가 음성으로 명령하면 이를 ‘인식’해 텍스트로 변환하고, 이 텍스트를 ‘분석’해 어떤 기능을 수행할지 판단한 뒤 적합한 기능을 수행하는 두 단계 절차로 실행된다. 따라서 성공적인 지능형 음성인식 서비스는 바로 텍스트 분석과 관련된 ‘자연어 처리’와 말을 정확하게 ‘인식’하는 ‘음성인식’ 솔루션에 달려 있다.

LG전자 Q보이스는 이 자연어 처리에 독자 개발한 ‘베르니케’ 기술을 적용했다. 본래 베르니케는 사전적 의미로 뇌에서 말을 이해하는 영역을 일컫는 이름이다. 인간의 뇌는 언어를 이해하고 말을 할 때 기존 기억과 비교한다. 즉 입력된 언어 상황에 가장 근접한 기억에 비춰 알맞은 답을 찾는다.

베르니케는 이런 뇌의 음성인식을 포함한 언어 처리 체계를 본땄다. 음성인식 결과로 텍스트가 입력되면 해당 텍스트의 맥락과 일치하는 사항을 자체 구축한 데이터 베이스에서 찾는다. 일치하는 맥락이 없을 경우 베르니케는 ‘추론 확률 모델’을 통해 가장 적합한 답을 찾아낸다. 바로 이 기술 덕분에 Q보이스는 자연스러운 문장단위 언어 처리에 강점을 지녔다. 음성인식 부문은 구글의 기술을 채택했다. 현재 음성인식 솔루션을 제공하는 대표적인 업체는 구글과 ‘뉘앙스(Nuance)’ 다. 구글은 세계 최대 검색포털로 음성 검색 부문에서도 방대한 노하우를 보유하고 있으며 빠르고 정확한 음성인식을 제공한다.

◆Q보이스 대표 SW로 키운다

LG전자의 25년에 걸친 언어 처리 연구도 Q보이스 개발의 밑거름이 됐다. LG전자 연구의 역사는 1988년으로 거슬러 올라간다. 1980∼1990년대 단순 단어인식에서 2000년대 음성합성, 음향기술 등 기반 기술을 거쳐 현재의 대화 형태 자연어 처리로 발전했다.

LG전자는 1997년 화자 종속 음성인식 기술(사용자의 음성을 저장해 두면 휴대전화가 이를 인식하는 기술)을 휴대전화에 처음 적용했고, 이후 다수의 피처폰에 일반 텍스트를 음성으로 변환해주는 ‘TTS(Text To Speech)’를 적용했다. 2006년부터는 시각장애인 전용 ‘책 읽어주는 폰’에도 적용돼 올해 다섯 번째 전용 모델이 나왔다. 또 음식물을 관리해 주는 스마트 냉장고, 음성 검색이 가능한 스마트TV, 로봇청소기 ‘로보킹’에도 적용됐다.

이처럼 LG전자는 Q보이스를 모든 스마트 전자제품에 적용하는 대표 SW로 키운다는 복안이다. 우선 스마트폰에 역량을 집중할 계획인데 옵티머스 뷰에 이어 ‘옵티머스 LTE2’에서도 이달 말 ‘밸류팩’ 업그레이드와 함께 서비스될 예정이다. 또 향후 출시되는 LG전자 전략 스마트폰에도 채택될 예정이다.

LG전자는 지능형 음성인식 다음 단계로 미리 일정도 알려주고 약속 장소 예약까지 실행하는 기능을 갖춘 ‘지능형 비서’를 개발하는 프로젝트를 진행 중이다.

LG전자 미래IT융합연구소장 손진호 상무는 “차별화된 사용자 경험(UX)을 지닌 Q보이스는 세계시장에서 큰 호응을 얻을 것으로 기대한다”며 “오랫동안 축적한 언어 처리 기술을 바탕으로 세계 스마트폰 시장 공략을 더욱 강화하겠다”고 강조했다.

최현태 기자