기업·IT

클로바노트에 초거대AI 접목…2배속 음성 인식도 문제 없죠

입력 2022/07/05 04:01
한익상 네이버 책임리더

글자 잘못 받아적을 확률 5%
입소문 타고 230만 다운로드
영어·일본어·중국어도 가능
내용 요약 등 기능 더 늘릴 것
586529 기사의 0번째 이미지 이미지 크게 보기
"불과 몇 년 전만 해도 음성인식이 잘 안된다고 얘기하는 사람이 많았죠. 초거대 인공지능(AI) 기술을 접목한 클로바노트는 완전히 다릅니다."

지난달 네이버 제2사옥에서 만난 한익상 책임리더는 "클로바노트는 불분명한 발음뿐 아니라 유튜브 영상을 1.5~2배속으로 틀어도 음성을 정확하게 인식하고 기록한다"며 이같이 말했다. 네이버의 AI 기반 음성기록 앱 클로바노트 개발을 이끌고 있는 한 책임리더는 20년 넘게 음성인식 AI 분야를 연구해온 베테랑 개발자다.

클로바노트는 2020년 11월 출시됐을 땐 크게 주목받지 못했다. 음성인식 성능이 기대치에 못 미쳤기 때문이다.


그러나 작년 여름 네이버가 자체 개발한 초거대 AI인 하이퍼클로바 핵심 기술을 클로바노트의 AI 엔진(NEST)에 접목하면서 음성인식 정확도가 대폭 향상됐다. 그 결과 입소문을 타고 지난 5월 기준 누적 다운로드 수가 230만건을 돌파했다.

지금까지 음성인식 AI를 개발하려면 음성과 음성 속 텍스트를 함께 학습해야 했다. 음성 속 텍스트를 확인하는 전사(transcription) 작업에 많은 시간과 비용이 투입됐다. 이러다보니 똑똑한 AI를 위한 방대한 양의 학습데이터를 구축하는 것이 쉽지 않았다.

반면 하이퍼클로바 기술을 적용한 클로바노트의 NEST 엔진은 많은 양의 음성 데이터로 사전학습을 한 뒤 전사 작업을 거친 적은 양의 데이터로 미세조정하는 방식으로 개발됐다. 기존과 다른 새로운 AI 학습 기법이다. 방송 뉴스나 유튜브 동영상의 경우 클로바노트가 글자를 잘못 인식하는 비율은 5% 미만이다.

한 책임리더는 "클로바노트에 NEST 엔진이 탑재되면서 음성인식 성능이 범용적 수준까지 올라왔다"며 "특정 분야의 전문 용어를 디테일하게 인식하도록 고도화하는 게 앞으로 과제 중 하나"라고 말했다.


클로바노트는 일본어 버전을 출시하며 글로벌 공략에도 시동을 걸었다. 올 하반기에 북미와 다른 아시아 시장에도 클로바노트를 공개할 계획이다.

클로바노트는 현재 한국어와 일본어 외에 영어와 중국어도 인식이 가능하다. 한 책임리더는 "영어의 경우 아마존과 구글의 음성인식 성능이 앞서 있지만 범용적인 어휘에선 클로바노트도 크게 밀리지 않는다"며 "올해 일본에서도 인기 앱으로 자리매김하고 미국 시장에 성공적으로 진출하는 것이 목표"라고 말했다.

클로바노트의 인기는 다양한 기능도 한몫하고 있다. 클로바노트엔 북마크, 메모, 단어 검색, 키워드 추출 등의 기능이 탑재돼 있다.

한 책임리더는 사용자에게 추천하고 싶은 클로바노트의 기능으로 스마트폰 위젯을 꼽았다. 클로바노트 앱에서 음성 녹음을 시작하려면 스마트폰 화면을 세 번 눌러야 하지만, 위젯에선 한 번만 터치하면 된다. 또 자주 쓰는 단어를 클로바노트에 등록하면 AI가 음성 녹음을 할 때 놓치지 않는다. 그는 "향후 내용 요약과 공동 편집 등 새로운 기능을 계속 추가할 예정"이라고 말했다.

한 책임리더는 클로바노트를 업무 환경에 특화된 서비스로 발전시킬 계획이다. 그는 "클로바노트가 궁극적으론 회의 내용을 기록·정리하면서 데이터를 분석하거나 아이디어를 제안하는 등 참모 같은 역할을 할 수 있을 수준까지 발전시키고 싶다"는 포부를 밝혔다.

[임영신 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]