본문 바로가기
메뉴 보이스
사회

"맥락 따라 뉘앙스 발달한 한국어…구글 AI비서도 학습 쉽지않았죠"

신현규 기자
입력 2020.10.05 17:41   수정 2020.10.06 09:33
  • 공유
  • 글자크기
구글 시니어 전산언어학자 최현정 박사

세계 언어번역·검색 SW 개발
한국어가 가장 까다로워
한자는 AI가 익히기 쉬운편

파란만장한 20대에 덜컥 결혼
둘째 낳고 언어학 석박사 취득
이미지 크게보기
"영어에서는 '네 옷 예뻐(That's beautiful)'라고 하면 그 뒤에 '고마워(Thank you)' 같은 말이 바로 따라오게 돼 있어요. 그런데 한국어는 그렇지 않아요. '이 옷 예뻐' 그러면 '응, 이거 싼 거야' 이런 희한한 말들이 튀어나오잖아요. 사회문화적으로 발달돼 있고 복잡해요. 그래서 기계가 인간 언어를 이해하는 데 많은 기여를 하고 있는 언어예요."

구글에서 시니어 전산언어학자로 일하고 있는 최현정 박사(41)는 오는 9일 한글날을 맞아 매일경제와 인터뷰하면서 이렇게 말했다. 그는 구글에서 약 70명의 언어학자와 엔지니어를 이끌면서 기계에 인간 언어를 가르치는 일을 한다. 예를 들면 사람이 말로 던진 언어를 번역하거나 검색해주는 구글 소프트웨어 개발에 기여했고, 구글 인공지능(AI) 비서 '어시스턴트'를 위해 언어들의 의미를 파악해주는 일을 했다. 최근에는 흥미로운 작업을 하고 있다. 예를 들면 사람이 AI 비서 구글 어시스턴트에 '오 부장에게 5분 늦는다고 문자 보내'라고 명령을 내리면 기계가 "오 부장님~ 저 죄송한데 5분 늦을 것 같아요"라고 문자를 보낼 수 있는 기능을 개발하고 있다.

그런데 여기에 다른 언어도 아니고 한국어가 걸림돌 중 하나다. 오 부장이 나와 무슨 관계인지에 따라 문자 내용이 달라져야만 하기 때문이다.


예를 들어 오 부장이 직속 상사라면 위와 같이 공손하게 문자를 보내도 좋지만 나에게 을 관계에 있는 사람이라면 어리둥절할 것이다. 영어로는 "미안해, 나 5분 늦어(Sorry, I will be late for 5 minutes)" 하면 끝나는 문장을 한국어는 다양한 사회 맥락을 고려해 이야기해야만 한다. 최씨는 "한국어는 일본어, 힌디어 등과 비슷하게 사회문화적 맥락이 많이 고려돼 있다"고 했다.

그뿐만이 아니다. 한국어는 억양이 매우 중요하고(예를 들어 끝을 올리는 '좋아'와 끝을 내리는 '좋아'는 의미가 완전히 다르다), 문어체와 구어체가 완전히 다르며, 주어가 쉽게 생략되고, 겸양 표현도 많다. '언택트' '인싸' '아싸'처럼 외국어와 섞인 신조어도 마구 탄생한다. 그는 "과학이 도달하지 못하는 부분이 한국어에는 너무 많다"며 "매우 독창적인 언어"라고 했다. 그래서 외국인이 배우기 어렵고 기계도 배우기 어려운 언어다.


최씨는 "중국어는 사람이 배우기는 어렵지만 기계는 천자문을 몽땅 외우는 것이 일도 아니기 때문에 기계에 학습시키기가 용이하다"며 "기계가 배우기 쉬운 언어가 있고, 배우기 어려운 언어가 있는데 한국어는 후자"라고 했다. 그래서 '이 기능이 한국어에서 된다면 다른 언어에서는 다 될 거야' 하는 순간이 많다고 한다.

구글에 2011년 입사한 최씨는 개인사가 흥미롭다. 서울 평창동에 있는 고등학교 재학 시절 노래를 부르러 가고 반항심을 못 이겨 수업시간에 엎드려 자는 등 막강한 질풍노도 시기를 겪었다고 한다. 성적은 엉망이었다. 본인 말에 따르면 고3 때 벼락치기로 간신히 대학에 간 케이스다. 이후 스토리도 파란만장하다. 대학 4학년에 결혼해 부부가 프랑스 유학을 갔다가 7개월 만에 '실컷 유럽 여행하고' 빈털터리로 돌아왔다. 서울행 비행기 안에서 이런 질문이 떠올랐다고 한다. '나 실패한 건가?' 게다가 오자마자 임신했다는 사실도 알게 된다. 25세에 첫아이를 낳았지만 에너지를 주체하지 못해 프랑스 사람을 위한 한국어 교사 양성 과정을 밟다가 언어학 석·박사까지 하게 된다.


"첫째를 어린이집에 보내고 둘째에게 모유 수유를 하는데 공부가 너무 어려워서 저도 울고 아이들도 울었던 기억이 나요."

그러던 중 우연히 구글과 협업 프로젝트를 진행하다 덜컥 채용됐다. 언어학이 컴퓨터와 접목되면서 구글에서 인재를 대거 모집했던 것이다. 최씨는 구글에서 1호로 채용된 전산언어학자다. 그는 "운이 좋았다"며 "여기 와보니 똑똑한 사람이 너무 많더라"고 했다. 그러나 2011년부터 약 8년간 구글에서 일하며 시니어 자리까지 가게 된 것은 결국 문제해결 능력이었다. 그는 "평범하지 않은 20대를 보냈고 늘 주눅 들어 있었지만, 크건 작건 나의 길을 개척하면서 문제를 풀어나가려 했던 아줌마 근성이 큰 도움이 된 것 같다"고 했다.

[실리콘밸리 = 신현규 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
맨위로