UPDATED. 2020-06-06 22:10 (토)
[단독] "사용자 상태까지 파악하는 AI 음성인식 서비스의 진화"…삼성전자, S보이스·빅스비 등 진화시키는 특허 공개
[단독] "사용자 상태까지 파악하는 AI 음성인식 서비스의 진화"…삼성전자, S보이스·빅스비 등 진화시키는 특허 공개
이 기사를 공유합니다

삼성전자가 갤럭시의 'S보이스' 또는 '빅스비' 등에 탑재되는 음성비서 서비스를 보다 진화시킬 수 있는 '사용자의 상태 정보에 기초하여 응답 메시지를 제공하는 전자 장치 및 그 동작 방법' 특허 대표 도면. 이 특허는 2018년 8월 17일 출원(출원번호 제1020180096283호) 됐으며 올해 2월 26일 공개(공개번호 제1020200020504호)됐다. 사진=키프리스 캡처
삼성전자가 갤럭시의 'S보이스' 또는 '빅스비' 등에 탑재되는 음성비서 서비스를 보다 진화시킬 수 있는 '사용자의 상태 정보에 기초하여 응답 메시지를 제공하는 전자 장치 및 그 동작 방법' 특허 대표 도면. 이 특허는 2018년 8월 17일 출원(출원번호 제1020180096283호) 됐으며 올해 2월 26일 공개(공개번호 제1020200020504호)됐다. 사진=키프리스 캡처

[비즈월드] S보이스와 빅스비, 씨리와 어시스트, 딥씽큐와 Q보이스. 삼성전자와 구글, LG전자 등이 제조하는 스마트폰에 탑재되는 인공지능(AI) 음성비서 서비스의 이름이다.

멀티미디어 기술과 네트워크 기술이 발전함에 따라 사용자는 디바이스를 이용해 다양한 서비스를 제공받을 수 있게 됐다. 특히 음성 인식 기술이 발전함에 따라 사용자는 디바이스에 음성 입력을 입력하고 음성 입력에 따른 디바이스의 동작을 실행할 수 있게 됐다.

그러나 이전까지 사용자의 음성 입력으로부터 사용자의 의도를 정확하게 파악하기 힘든 문제가 있었으며, 사용자의 의도를 파악하더라도 사용자에게 적절한 피드백을 주기 힘든 문제가 있었다.

이에 따라 사용자의 음성 입력으로부터 사용자의 의도를 파악하고 사용자가 요청한 동작의 대체 동작을 수행할 것을 사용자에게 효과적으로 추천할 수 있는 기술이 요구되고 있다.

특히 최근에는 인공 지능, 예컨대 딥러닝(Deep learning) 등의 기술이 발전함으로써 음성, 이미지, 동영상 또는 텍스트와 같은 데이터를 자동(Automation)으로 인식해 데이터와 연관된 정보를 제공하거나 데이터와 관련된 서비스를 제공하는 지능형 서비스(Intelligent Service)가 다양한 분야에서 사용되고 있다.

인공 지능 시스템은 인간 수준의 지능을 구현하는 컴퓨터 시스템이며 기존 룰(rule) 기반 스마트 시스템과 달리 기계가 스스로 학습하고 판단하며 똑똑해지는 시스템이다.

인공 지능 시스템은 사용할수록 인식률이 향상되고 사용자 취향을 보다 정확하게 이해할 수 있게 되어, 기존 룰 기반 스마트 시스템은 점차 딥러닝 기반 인공지능 시스템으로 대체되고 있다.

인공 지능 기술은 딥러닝 등 기계학습 및 기계학습을 활용한 요소 기술들로 구성된다.

기계학습은 입력 데이터들의 특징을 스스로 분류·학습하는 알고리즘 기술이며, 요소기술은 딥러닝 등의 기계학습 알고리즘을 활용하여 인간 두뇌의 인지, 판단 등의 기능을 모사하는 기술로서, 언어적 이해, 시각적 이해, 추론과 예측, 지식 표현, 동작 제어 등의 기술 분야로 구성된다.

인공 지능 기술이 응용되는 다양한 분야는 다음과 같다. 언어적 이해는 인간의 언어와 문자를 인식하고 응용·처리하는 기술로 자연어 처리, 기계 번역, 대화시스템, 질의 응답, 음성 인식·합성 등을 포함한다.

시각적 이해는 사물을 인간의 시각처럼 인식해 처리하는 기술로 객체 인식, 객체 추적, 영상 검색, 사람 인식, 장면이해, 공간 이해, 영상 개선 등을 포함한다.

추론 예측은 정보를 판단해 논리적으로 추론하고 예측하는 기술로 지식·확률 기반 추론, 최적화 예측, 선호 기반 계획, 추천 등을 포함한다. 지식 표현은 인간의 경험정보를 지식데이터로 자동화 처리하는 기술로 지식 구축(데이터 생성·분류), 지식 관리(데이터 활용) 등을 포함한다. 동작 제어는 차량의 자율 주행, 로봇의 움직임을 제어하는 기술로 움직임 제어(항법, 충돌, 주행), 조작 제어(행동 제어) 등을 포함한다.

최근에는 인공 지능 기술을 활용해 사용자의 음성 입력에 따라 특정 동작을 수행하거나, 답변을 제공하는 대화형 인공 비서가 포함된 전자 장치가 활용되고 있다. 대화형 인공 비서는 사용자의 질문 또는 지시에 따라 이미 저장된 답변 또는 동작을 수행할 수 있다.

그러나 대화형 인공 비서는 단순히 메모리 또는 서버 등에 저장된 문구 중 임의의 문구를 반복해 사용하고 있어 사용자가 자신을 인식하고 있다는 느낌을 제공할 수 없는 문제점이 있었다.

이런 가운데 삼성전자가 갤럭시의 'S보이스' 또는 '빅스비' 등에 탑재되는 음성비서 서비스를 보다 진화시킬 수 있는 기술을 개발한 것으로 나타났다.

해당 기술은 2018년 8월 17일 출원(출원번호 제1020180096283호) 됐으며 올해 2월 26일 공개(공개번호 제1020200020504호)된 '사용자의 상태 정보에 기초하여 응답 메시지를 제공하는 전자 장치 및 그 동작 방법'이라는 명칭의 특허입니다.

이 특허에 대해 삼성전자는 "사용자의 상태 정보에 기초해 응답 메시지를 제공하는 전자 장치 및 그 동작 방법을 제공한다. 사용자로부터 입력된 발화에 기초해 사용자의 상태 정보를 인식하고 사용자의 건강상태 정보를 분석하며 분석된 사용자의 건강상태 정보에 기초해 응답 메시지를 생성하고 생성된 응답 메시지를 출력하는 전자 장치 및 그 동작 방법을 제공한다"라고 설명했다.

이어 "사용자로부터 입력된 발화로부터 사용자의 이벤트 정보를 인식하고, 인식된 이벤트의 타입 및 빈도에 관한 정보에 기초해 응답 메시지를 생성하고 생성된 응답 메시지를 출력하는 전자 장치 및 그 동작 방법을 제공한다"라고 덧붙였다.

해당 기술이 적용되면 사용자의 건강 정보를 바탕으로 적절한 응답과 해결 방법까지 제시하게 된다.

기존의 음성비서 서비스의 경우 사용자가 앱을 작동하고 질문이나 지시 문구를 하게 되면 이에 대한 단답식 답변과 동작이 가능하도록 제어하는 방식이었던 것이 보다 진보된 것이다.

예를 들어 S보이스나 빅스비를 실행하고 "나 피곤해"라고 말을 하게 되면 S보이스나 빅스비는 단말기로부터 저장된 사용자의 걸음 수 수면시간, 심박수, 운동량 등의 정보를 관련 기본 정보와 비교한 정보를 기반으로 "어제 너무 많이 걸으셨어요!"라고 답변하고 이어 "힘내세요"라는 위로의 답변을 송출하게 된다. 마지막으로 "오늘은 조금 쉬어 볼까요"라는 후속 행위를 제안하게 되는 방식이다.

이는 다방면에 활용될 수 있다. 사용자가 여행을 위해 "하와이 여행 등록해줘"라고 지시하게 되면 진화된 S보이스는 "올해의 첫 번째 여행을 등록하였네요. 두근두근~"이라는 답변 이후 후속 질문과 세부 일정에 대한 제안까지 하게된다.

삼성전자가 해당 특허를 출원하면서 제안한 답변에는 엉뚱한 호주의 시드니에 대한 답변을 하는 도면이 그려져 있지만 이는 출원자의 잘못된 예를 검증 없이 제시한 것으로 보인다.

이제 과학 기술의 발달로 사용자의 마음까지 헤아리는 음성비서 서비스가 나올 날도 멀지 않을 것으로 보인다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.