카카오가 음성엔진 관련 기능을 추가로 도입해 자사 AI(인공지능) 스피커 ‘카카오미니’의 활용도를 높인다.
카카오는 25일 오전 서울 종로구 마이크임팩트스퀘어에서 열린 ‘2018 카카오 AI 미디어 스터디’에서 “올해 상반기 중 카카오미니에 보이스 프로필을 업데이트할 예정”이라며 “카카오톡 읽어주기 기능도 도입된다”고 밝혔다.
보이스 프로필은 이용자가 화자 인식 기반의 맞춤형 서비스를 이용할 수 있게 하는 기능이다. 보이스 프로필을 등록한 이용자가 카카오톡을 활성화하면 이용자 본인이 아닌 사람의 요청에는 카카오톡 메시지를 읽어주지 않는다. 이용자는 카카오미니 설정 애플리케이션에서 간단한 과정으로 자신의 목소리를 등록해 만들 수 있다.
이용자의 목소리를 인식할 정도가 되기 위해서는 이용자가 5~7번 정도 ‘Wake Up(웨이크업)’ 키워드를 말하면 된다. 웨이크업은 기계가 사용자의 명령어를 수행하게 만드는 키워드다. AI는 웨이크업 키워드가 나온 다음부터 서버 전송해서 명령어를 이해하게 된다.
웨이크업 성능은 두 가지로 나뉜다. 이용자가 키워드를 말했을 때 제대로 동작을 수행하는 기능과 사용자가 키워드가 아닌 말을 할 때는 반응하지 않는 기능이다. 사용자가 불렀을 때의 반응도만 높이면 되레 원치 않을 때도 작동할 수 있어 균형잡힌 성능 개발이 필수적이다.
아울러 카카오는 음성 엔진 적용 언어도 한국어에서 영어, 일어, 중국어 등으로 확장한다. 영어 인식은 개발이 완료된 상태로, 연내 번역 엔진과 결합해 카카오미니에 영어를 말하면 한국어로 번역해주는 개념의 음성 번역 기능을 업데이트할 예정이다. 중국어와 일어는 현재 개발 중이다.
뿐만 아니라 카카오미니 목소리도 올해 상반기부터 유명인 목소리로 만나볼 수 있다. 현재 성우 목소리를 완전히 대체하는 수준은 아니지만 특정한 상황이나 특정 대화에서 연예인 목소리를 들을 수 있게 된다.
카카오는 2014년부터 음성 인식과 음성 합성 기술을 오픈 API로 공개해 다양한 곳에서 음성 기술을 활용하고 있다. 지난해에는 현대자동차와 제휴해 제네시스G70, 산타페, 그랜저 등 많은 차량에 카카오의 음성 엔진이 사용되는 중이다.
향후 카카오는 다양한 파트너의 다양한 서비스와 제품에 음성엔진을 제공, 이용자들이 생활 속에서 카카오의 음성 기술을 만날 수 있도록 확장할 계획이다.
이승희 기자 aga4458@kukinews.com