한국어 음성인식을 제일 잘합니다 ‘액션파워’

“우리가 가장 잘할 수 있는 걸 하자” 사업 아이템을 찾기 위해 시작한 회의. 아무리 좋은 내용이라도 입 밖으로 뱉는 순간 휘발돼 버렸다. 회의가 끝나면 자동으로 정리되는 서비스는 없을까. 음성인식 기술이 식상한 단어가 되어 버린지 오래였지만 막상 쓸 수 있는 서비스가 없었다.

조홍식 액션파워 공동대표도 충분히 공감하는 내용이었다. 애널리스트로 일하던 당시 필기는 일상이었다. 전화통화를 하거나 미팅을 할 때도 정보를 기록하는 건 필수였다. 녹음을 할 때도 있었지만 공중에 떠다니는 ‘말’들을 잡기엔 역부족이었다. 조 대표는 “듣고 싶은 만큼 소중하니까 녹음을 하는건데 막상 활용하지 못했다”며 “휘발되는 음성 데이터에 대한 갈증이 있었다”고 기억했다.

때마침 음성인식 기술 패러다임이 바뀌고 있었다. 통계모델을 이용하던 기존방식에서 딥러닝이나 머신러닝으로 옮겨갔다. 음성인식과 인공지능 분야는 팀원 모두에게 강점이 있는 분야였다. 이지화 액션파워 공동대표의 경우 서울대에서 컴퓨터 공학 전공 후 음향 엔지니어로도 활동하며 음향 일을 꾸준히 이어왔다. 최환석, 백상윤 개발자 또한 같은 학교 컴공과 출신으로 자동차 네비게이션에 활용되는 음성 인식을 연구하고 있었다. 전통 기반 위에 있으면서도 최신 기술을 활용할 수 있는 더할 나위 없이 좋은 팀 구성이었다. 가장 잘 할 수 있는 분야이자 스스로가 공감하고 문제도 찾았다. 액션파워는 ‘실행이 가장 큰 힘’이라는 모토로 인공지능 기반 음성인식 기술 개발에 돌입했다.

음성 파일을 올려놓기만 하면 문자로..‘리뷰와이저’=개발에 걸린 시간만 꼬박 1년, 액션파워는 올 1월 그들의 첫 번째 서비스를 선보였다. 긴 녹음파일을 텍스트로 변환해주는 인공지능 받아쓰기 서비스 리뷰와이저다. 조 대표는 “리뷰를 가능하게 하다라는 뜻으로 음성파일을 문자로 리뷰할 수 있다는 뜻을 담았다”고 소개했다. review와 wise의 합성어로 음성 정보를 똑똑하게 활용하자는 뜻이기도 하다.

리뷰와이저에서 음성데이터가 문자로 변환되는 시간은 음성 재생시간의 3분의 1정도. 한 시간짜리 음성파일은 20-30분 내외로 문자화가 완료된다. 가격은 1초에 2원대다. 리뷰와이저 서비스내에서 편집은 물론 검색 또한 가능하다. 문자를 누르면 해당 영역부터 음성이 재생되기 때문에 적어도 녹취 파일을 풀다가 겪는 어려움은 한 번 흘러간 음성 위치를 찾는 번거로움은 없다. 정확성은 아나운서 발음 기준 99% 정도다. 현재까지 누적 등록자 수 7천 명을 돌파했다.

 

스타트업 최초, 한국어 음성인식 엔진 개발=리뷰와이저가 정확성과 속도 모두를 확보할 수 있었던 이유는 자체 개발한 한국어 음성인식 엔진 덕분. 이  대표는 “기존 서비스에서 음성인식 정확도가 낮은 이유는 분야별로 쓰이는 전문용어를 인식하지 못하기 때문”이라며 “액션파워는 자체 엔진에서 도메인별 학습을 통해 정확도를 높이고 있다”고 설명했다. 자체 엔진으로 서비스 확장가능성은 무궁무진하다. 예컨대 전문분야별 특화된 음성엔진 모듈을 통해 실제 전문 산업분야 활용이 가능해진다. 방송국에서는 자막을 일일이 타이핑 할  필요가 없어진다. 말과 글을 사용하는 분야에서는 어디든지 사용할 수 있다.

말을 글로 옮기는 측면에서 보면 일정 부분 속기사의 업무와 겹치기도 한다. 속기사 업계와의 충돌은 없었을까. 조 대표는 “현재 속기법인과 파트너쉽을 맺고 함께 할 방향을 찾고 있다”고 밝혔다. 속기사 측에서 먼저 손을 내밀었다. 조 대표는 “속기사분들은 단순히 말을 받아치는 것을 핵심 능력이라고 생각하지 않는다. 각 분야의 전문지식, 주제, 말하는 이에 따라 사용하는 언어가 달라진다”며 “속기사의 핵심 역량은 전문분야의 말을 텍스트로 만드는 것”이라고 설명했다.

그런 시각에서 봤을 때 액션파워의 기술은 사람을 대체하는 것보다 상생하는 것에 가깝다. 속기사 입장에서는 음성 파일을 있는 그대로 받아치는 일종의 초벌 작업 없이 본연의 업무에 충실할 수 있기 때문이다. 조 대표는 “인공지능이 발달해도 기술이 발전하는 속도가 100을 향해서 수렴하기까지는 오랜 시간이 걸릴 것”이라며 “우리의 업은 사람이 하기 어려운 일정 부분의 일은 인공지능을 통해서 가능하게 하고 사람은 100을 채우는 섬세하고 고도화된 일에 집중하도록 하는 것”이라고 밝혔다.

리뷰와이저 정확도 개선에 주력하는 것도 이러한 이유다. 사람이 하는 일에 완성도를 높여주는 일에 한 발자국 더 나아가기 위함이다. 사용자 성별과 연령 등 개인 특화 음성 인식 등 서비스 고도화도 이뤄질 예정이다. 서비스 고도화에 따라 전문 분야별로 활용할 수 있는 여지는 더 커진다. 이 대표는 전문분야별 특화된 음성엔진 모듈로 확장할 계획“이라며 ”실제 전문분야 사무 환경에서 활용할 수 있는 완성도를 선보일 것“이라고 말했다.

“말로 휘발되어버리는 수많은 말 데이터를 모으고 비정형 데이터에서 의미 있는 데이터를 뽑아낼 수 있도록 도울 것. 공중에 날아다니는 음성데이터를 모아 사람들에게 의미 있는 데이터로 전하는 액션파워가 되면 좋겠다” 서비스 출시와 투자 유치로 상반기 목적을 달성한 액션파워는 하반기에 리뷰와이저를 알리는데 집중할 계획이다. 함께했을 때 더욱 시너지를 내는 B2B 파트너도 찾는다. 조 대표는 “인공지능이 자체로 사업이 될 수 있지만 기존 산업과 결합해 돌아갈 때 더 큰 힘을 발휘한다”며 “파트너를 잘 찾아서 첫 코를 잘 꿰는 것이 올해 남은 목표“라고 덧붙였다.