• 대기업들이 뛰어드는 ‘초거대 AI’는 무엇

    2021년 07월 제 130호

  • 영화 <아이언맨>의 인공지능(AI) 만능 집사 ‘자비스’나 영화 <허(Her)>에 등장하는 OS(운영체제) ‘사만다’는 인간처럼 생각하며 주인공과 자연스럽게 대화를 나눈다. 인간보다 말을 더 잘하고 전문 지식까지 갖춘 자비스와 사만다의 능력은 초거대 AI에서 나온다.

    더 똑똑한 AI를 개발하기 위한 기업들의 테크 경쟁이 초거대 AI로 확대되고 있다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라스트럭처를 기반으로 대규모 데이터를 스스로 학습하는 기술이다. AI의 성능을 가늠할 수 있는 파라미터(변수)가 기존 AI보다 최소 수백 배 이상 많다. 파라미터는 뇌에서 뉴런 간 정보 전달 통로 역할을 하는 시냅스와 비슷한 역할을 한다. 파라미터의 규모가 커서 AI 지능이 높은 초거대 AI는 기존 AI와 달리 특정 역할에 국한되지 않고 스스로 생각하고 학습하며 판단한다.

    정석근 네이버 클로바 CIC 대표는 “AI는 이제 규모와 속도의 경쟁에 돌입했다”고 진단했다. 정 대표는 “초거대 AI라는 하나의 커다란 모델을 만들어 다양한 문제에 적용할 수 있다”며 “더 짧은 시간에 더 적은 리소스로 이전에 우리가 상상하지 못했던 일까지 가능하게 만들어 줄 것”이라고 말했다.

     기사의 0번째 이미지
    ▶초거대 AI 개발 경쟁 불붙인 GPT-3

    초거대 AI는 일론 머스크 테슬라 최고경영자(CEO) 등이 주도해 설립한 AI 연구기관 미국 오픈AI가 작년 초거대 AI 언어모델인 ‘GPT-3’를 공개하면서 주목받고 있다. GPT-3는 1750억 개의 파라미터를 갖췄다. 이전 버전(GPT-2·15억 개)보다 117배나 많다.

    GPT-3는 모델의 크기가 비약적으로 커진 만큼 과거에 못했던 고난도 일을 해내고 있다. 기존 AI는 특정 주제나 키워드에 대해 정해진 답을 주로 했다면 GPT-3는 여러 분야에 걸쳐 어떤 말이든 잘 알아듣고 문장을 직접 생성해 질문에 맞는 답변을 내놓는다. 소설·에세이를 쓰거나 장문의 글을 요약하는 능력도 탁월하다. 일상 언어를 컴퓨터 프로그래밍 언어로 번역해서 애플리케이션(앱) 개발에 필요한 코딩까지 해준다.

    월스트리트저널(WSJ) 등 주요 외신들은 “GPT-3가 인간과 거의 동등한 수준의 언어능력을 갖췄다”며 “GPT-3기반의 AI는 서류 요약, 외국어 번역, 보고서 작성, 이메일 작성 등 사람 수준의 작업이 가능하기 때문에 업무 생산성이 크게 향상될 것”이라고 평가했다.

    문제는 GPT-3는 언어별 학습 데이터 비중에서 영어가 92.7%로 압도적으로 높고 한국어는 0.1% 미만이어서 영어 전용 모델에 가깝다는 것이다. 한국어 성능은 제한적일 수 있다는 지적이 나온다.

    네이버는 지난 5월 한국어 초거대 AI 언어 모델인 ‘하이퍼클로바’를 공개했다. 하이퍼클로바는 2040억 개의 파라미터를 갖췄다. GPT-3를 능가하는 수준이다. GPT-3보다 한국어 데이터를 6500배 이상 학습했다. 전체 학습 데이터 중 한국어 비중이 97%에 달한다. 세계 최초 초거대 한국어 언어 모델인 셈이다. 정석근 클로바 CIC 대표는 “글로벌 기업의 플랫폼에 종속되지 않으려면 공개된 기술을 활용하고 따라잡는 수준에 그쳐선 안 된다”며 “한국어 AI 서비스를 제대로 하려면 한국어에 맞는 초거대 언어 모델을 확보하는 것이 중요하다”고 강조했다.

     기사의 1번째 이미지

    네이버 하이퍼클로바를 활용한 AI 캐릭터 대화 예시
    ▶하이퍼클로바로 뭘 할 수 있나

    초거대 AI는 자연어 처리 분야에서 주로 활용되고 있다. 자연어 이해는 컴퓨터가 사람의 언어를 이해하도록 만드는 연구 영역이다. 기계가 사람의 언어를 사용하게 하는 작업은 AI의 핵심 기술로 꼽힌다. ‘컴퓨터 과학의 아버지’라고 불리며 AI의 개념을 처음 제시한 영국 수학자 앨런 튜링이 ‘인간의 대화를 완벽하게 흉내 내는 것이 AI의 완성’이라고 말했을 정도다. 네이버는 향후 하이퍼클로바를 이미지·영상도 이해할 수 있도록 발전시켜나갈 계획이지만 현재는 ‘자연어 처리’에 집중하고 있다.

    네이버에 따르면 하이퍼클로바의 활용 분야는 무궁무진하다. 하이퍼클로바 기반의 AI는 수천, 수만 건의 쇼핑 리뷰(후기)를 한 문장으로 요약할 수 있다. AI가 상품에 대한 수많은 리뷰들을 주제별로 묶고(Clustering·클러스터링), 각 리뷰 묶음에서 대표 문장들을 추출한 뒤 하나의 문장으로 완성하는 방식이다.

    예를 들어 ‘생각보다 작은 디자인이 맘에 들어요’ ‘색감이 좋고 다 좋아요’ ‘화질이 좋아 더 만족합니다’ 등 수천 건의 리뷰를 몇 초 만에 ‘‘디자인이 깔끔하고 화질도 선명해서 매우 만족스럽다’라는 한 문장으로 요약할 수 있다. 네이버 관계자는 “하이퍼클로바를 적용한 리뷰 요약 문장은 기존 AI보다 문법이 잘 맞고 매끄럽다”고 설명했다.

    하이퍼클로바는 지식백과를 활용해 다양한 유형의 질문에 정확하게 답하는 서비스에도 쓰일 수 있다. ‘미국 대통령 중 그래미상을 받은 사람은 누구야?’처럼 여러 단계를 거쳐 답을 찾아 내는 질문이나 ‘귀리가 다이어트에 왜 도움이 돼?’처럼 이유(Why)를 설명해야 하는 경우, ‘머신러닝과 딥러닝은 어떻게 달라?’처럼 기존에 AI가 답하기 어려웠던 전문 영역의 질문까지도 척척 답할 수 있다.

    네이버는 하이퍼클로바를 활용해 사용자가 네이버 검색창에 입력한 단어나 문장에 오타가 있거나 띄어쓰기가 잘 안 된 경우, 잘못된 정보를 사용해도 정확한 검색어로 바꿔주는 기능을 도입했다. 가령 ‘잘못한 부분을 단호학’이라고 잘못 입력해도 AI가 사용자의 과거 검색 이력 등을 참고해 ‘잘못된 부분을 단호하게 훈육’이라고 정확한 검색어를 추천해 준다.

     기사의 2번째 이미지


    하이퍼클로바는 ‘캐릭터 대화’에도 활용될 수 있다. AI가 기계처럼 말하는 것이 아니라 사람처럼 캐릭터의 정체성을 갖고 사람과 ‘티키타카’를 할 수 있다. AI에 펭수의 캐릭터를 입혔다고 치자. “펭수야, 요즘 어떻게 지내”라고 물으면 AI가 “난 매일 유튜브로 팬들과 소통하고 있어요”가 아니라 “난 매일 너튜브로 팬들과 소통하고 있지롱(하트 이모티콘). 그레이트 펭 TV라고 들어봤어?”라며 펭수가 연상되는 말투로 대답한다.

    캐릭터 개성을 나타내는 이모티콘도 쓸 줄 안다. 하이퍼클로바 기반의 AI는 펭수의 독특한 세계관도 주입시킬 수 있다. 사용자가 “내일 월요일이네, 출근해야 하는군”이라고 말하면 AI가 “힘내세요, 직장인 여러분! 전 남극에서 와서 괜찮아요”라고 답하는 식이다. 네이버 관계자는 “기존 AI는 비서로만 간주해 만들었기 때문에 이용자는 AI에 대해 특징정인 말투나 개성을 떠올릴 수 없었다”며 “하이퍼클로바를 활용하면 하루 종일 대화하고 싶은 AI를 만들 수 있다”고 말했다.

    조너선 셰퍼 캐나다 앨버타대 석좌교수는 “초거대 AI를 적용한 어시스턴트, 챗봇, 고객센터(콜센터) 서비스가 본격적으로 등장하면 사람들은 AI의 능력에 대해 또 한 번 충격을 받을 것”이라며 “AI가 인간과 의미 있는 대화를 나누는 시대가 열린다고 보면 된다”고 설명했다.

     기사의 3번째 이미지

    네이버가 한국어에 특화한 국내 최초의 초(超)대규모 인공지능(AI) ‘하이퍼클로바’를 선보였다. 사진은 ‘네이버 AI 나우’ 온라인 콘퍼런스에서 설명하는 정석근 클로바 CIC 대표.
    ▶LG·SKT·카카오 등 초거대 AI 개발 착수

    국내 기업들도 초거대 AI 개발에 공격적으로 뛰어들고 있다. LG그룹은 약 1200억원을 들여 초거대 AI를 개발해 올 하반기 공개할 예정이다. 내년 상반기엔 조 단위 파라미터를 갖춘 ‘슈퍼 초거대 AI’를 개발하기로 했다.

    고객 상담, 제품 개발, 신소재 발굴, 항암 백신 개발, 제품 디자인 등 LG전자·LG화학·LG디스플레이 등 주요 계열사의 핵심 사업에 초거대 AI를 활용할 계획이다. LG유플러스와 LG CNS는 AI 콜센터(AICC) 사업을 벌이기로 했는데 초거대 AI 연구 결과물을 활용해 ‘베테랑 AI 상담사’를 개발할 계획이다. 지금 AI는 고객의 요청사항을 접수하고 비교적 단순한 상담만 맡고 있다.

    SK텔레콤도 카카오와 AI 언어 모델의 공동개발을 추진하고 있다. SK텔레콤과 카카오는 2019년 3000억원 규모의 지분 맞교환을 통해 테크 동맹 관계를 구축하고 있다. 두 회사가 보유한 데이터를 활용해 언어 모델을 만들 계획인 것으로 알려졌다. KT는 카이스트(KAIST)와 연내 초거대 AI 연구를 위한 ‘AI·소프트웨어 기술 연구소’를 마련한다.

    IT업계 관계자는 “기업이 초거대 AI에 주목하는 가장 큰 이유는 개발 과정에서 다양한 신기술과 혁신 서비스가 탄생할 수 있기 때문”이라며 “반대로 초거대 AI를 포기하면 이런 혁신 기회를 놓치고 글로벌 AI 경쟁에서 뒤처질 수밖에 없다”고 말했다.

    국내에선 최근 들어 초거대 AI가 핵심 키워드로 떠올랐지만 글로벌 빅테크 기업들은 이미 GPT-3 등을 활용한 AI 서비스 상용화에 나섰다. GPT-3 기반의 AI 애플리케이션만 300여 개에 달하는 것으로 알려졌다.

     기사의 4번째 이미지
    ▶ 여기를 누르시면 크게 보실 수 있습니다


    미국과 중국을 중심으로 GPT-3를 능가하는 초거대 AI 개발 경쟁도 치열하다. 구글은 지난 2월 파라미터 수가 최대 1조6000억 개에 달하는 초거대 AI ‘스위치 트랜스포머(Switch Transformer)’를 공개했다. 이에 맞서 지난 6월 중국 정부의 지원을 받고 있는 베이징 지위안 인공지능 연구원(The Beijing Academy of Artificial Intelli gence·BAAI)은 파라미터 수가 1조7500억 개에 달하는 ‘우다오(WuDao) 2.0’을 내놨다.

    우다오 2.0은 중국 전통 문체로 시를 창작할 수 있고, 이미지 생성과 인식 능력이 빼어난 것으로 알려졌다. 홍콩 사우스차이나모닝포스트(SCMP)는 “우다오 2.0은 미국 오픈AI와 구글을 뛰어넘는 수준”이라며 “미중 기술 패권 전쟁이 초거대 AI 분야로 확전되고 있는 양상”이라고 진단했다. 미국 오픈AI는 지난 1월 GPT-3를 활용해 일상 언어를 입력하면 이미지를 생성하는 AI 기술을 내놨다. 2030년쯤에는 파라미터가 100조 개에 달하는 GPT-4를 공개할 예정이다. ▶초거대 AI에 필요한 슈퍼컴 각축전 치열

    초거대 AI개발에 필요한 슈퍼컴퓨터 확보 경쟁도 뜨겁다. 슈퍼컴퓨터는 초대용량 연산이 가능한 대규모 컴퓨팅 인프라스트럭처다. IT업계에 따르면 슈퍼컴을 구축하고 운용하려면 최소 1000억원 이상의 투자가 필요하다. 연구기관인 오픈 AI가 GPT-3를 개발할 수 있었던 배경엔 마이크로소프트의 지원이 컸다. 오픈AI는 마이크로소프트와 함께 작년 슈퍼컴을 도입했다.

     기사의 5번째 이미지

    KT와 카이스트는 지난 5월 인공지능(AI) 및 소프트웨어(SW) 공동연구소 설립을 위한 업무협약을 맺었다고 밝혔다.


    미국과 중국, 유럽, 일본 등 주요 선진국은 정부와 기업·연구소가 뭉쳐 슈퍼컴 개발에 돈을 쏟아붓고 있다. 중국은 상위 500대 슈퍼컴 중 226개를 보유할 정도로 슈퍼컴 강국이다. 일본은 후지쯔가 개발한 ‘후가쿠’가 작년 11월 국제슈퍼컴퓨터학회(ISC)가 발표한 ‘세계 상위 500대 슈퍼컴’에서 1위를 차지했다.

    반면 한국은 슈퍼컴을 해외에서 사와야 하는 실정이어서 IT업계에서 아쉽다는 목소리가 적지 않다. 네이버는 국내 기업 중 처음으로 초거대 AI 개발을 위해 슈퍼컴을 도입했는데, 작년 10월 미국 엔비디아에서 개발한 슈퍼컴 ‘슈퍼팟(Superpod)’을 사왔다. 작년 이해진 GIO(글로벌투자책임자) 등 네이버 임원들은 초거대 AI 개발을 서두르기 위해 ‘일사천리’로 슈퍼컴 투자 결정을 내린 것으로 전해졌다. 네이버의 슈퍼컴은 700페타플롭(Petaflop·1초당 1000조 번의 연산 처리를 뜻함) 이상의 연산 처리가 가능한 것으로 알려졌다. 이런 슈퍼컴을 활용해 5600억 개 토큰의 한국어 대용량 데이터를 구축했다.

    SK텔레콤·카카오는 슈퍼컴 투자를 포함해 고성능 인프라 구축을 위해 다양한 방안을 검토하고 있다. 일각에선 SK텔레콤이 기업 분할 등 이슈로 투자를 위한 의사결정이 미뤄졌다는 분석도 나온다. LG그룹은 클라우드를 활용하기로 했다. KT는 자사가 보유한 대덕2연구센터 내 200평 공간에 전용 GPU(그래픽 반도체) 서버팜을 구축할 계획이다. IT업계 관계자는 “세계적인 반도체 쇼티지(공급 부족) 여파로 슈퍼컴을 쓰고 싶어도 국내에 들여오는 데 상당한 시간이 걸릴 것”이라고 말했다.

    [임영신 매일경제 디지털테크부 기자]

    [본 기사는 매경LUXMEN 제130호 (2021년 7월) 기사입니다]
    [ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
매일경제
맨위로