구글이 지난 10일 생성형(대화형) AI 챗봇인 ‘바드’를 출시하면서 영어에 이어 한국어와 일본어 서비스를 지원하기로 했다. 영어 다음이란 '극진한 대접'에 한국인으로선 뿌듯함이 와닿는다.
구글은 왜 사용자가 훨씬 많은 중국어나 스페인어, 프랑스어가 아닌 한국어를 택했을까. 언어 정보 제공 사이트인 스페인 에스놀로그(ethnologue)의 지난해 자료에 따르면 영어가 15억 명이고, 중국어 11억 명, 힌디어(인도이란어) 6억 2200만 명, 스페인어 5억 4830명, 프랑스어 2억 7410만 명으로 1~5위를 차지한다.
한국어 사용 인구는 23위로 8000여만 명에 불과하다. 대략 남북한 인구를 합친 것이지만 1억 2540만명(세계 13위)인 일본어에도 훨씬 못 미친다. 그럼에도 불구하고 구글이 한국어를 먼저 지원하는 데엔 이유가 있다.
결론을 먼저 말하면 한국어는 사용자가 대단히 많지도 적지도 않고, 상대적으로 언어 구조가 보다 복잡하다. 따라서 기계인 AI가 한국어를 제대로 번역하는 수준에 이르면 구글로서는 '학습 과제(장애물)’을 해결할 수 있다. 학습용인 셈이다.
▶ 언어구조가 다르다
한국어는 언어 구조가 다른 언어보다 조합이 다양해 특정 상황을 딱 잡아 번역하는데 어려움을 겪는다고 한다. 또 같은 뜻의 말도 때와 상황에 따라 달리 쓰이는 경우가 너무 많다. 때문에 구글은 사람이 아닌 AI가 자신의 경험(자료를 수집한 뒤 분석하고 해석)을 축적해 내놓는 AI 번역에서 한국어가 ‘시험대 역할’을 톡톡히 할 수 있다고 보았다.
최근 한국을 찾은 독일 AI 번역 기업인 '딥엘'의 야렉 쿠틸로브스키 최고경영인(CEO)은 “한국어의 독특한 특징 때문에 한국어의 번역 과정이 복잡하다. 그래서 번역 서비스 업계의 수요가 많다”고 말했다.
한국어의 어순이 영어나 독일어와 다르고, 같은 뜻인데도 미묘한 표현이 많아 사람이나 AI나 번역을 매끄럽게 하기 어렵다고 했다. AI 번역기의 알고리즘 트레이닝으로는 한국어가 제격이라는 말이다.
최근 독일의 AI 번역기 ‘딥엘’는 올해 한국어 번역 서비스를 추가하고 오는 8월 기업 고객을 대상으로 유료 번역 서비스인 ‘딥엘 프로’를 한국 시장에 출시한다고 발표했다.
대상과 상황, 문맥에 따라 달리 사용하는 한국어가 어떤 특징을 지녔는지 살펴보자.
한국어는 영어와 달리 어순이 바뀌어도 의미가 통한다. 영어 문장 'I Love you'는 한국어로 '나는 당신을 사랑한다'라거나 '나는 사랑해, 당신을'로 어순을 달리해 표현할 수 있다.
한 단어의 뜻도 다양하게 사용된다.
영어 'I'(나) 는 '나' 외에 '저' '본인' '소인' '쇤네' 등 다양하다. 'YOU'(너)도 '너' 말고도 '당신' '댁' 등으로 달리 적용해 사용한다.
또 영어는 모두 평어인데 한국어는 경우에 따라 평어를 쓰거나 경어를 쓴다. 경칭(존칭)은 달리 표현된다는 말이다.
예컨대 '그 일을 해'는 '그 일을 해요' '~해주세요' '~해주시어요' '그 일을 해줍쇼' 등 다양한 동사 활용형으로 구사할 수 있다.
영어 등 서구권 언어에는 이런 격식에 따른 활용도가 없거나 매우 적다. 한국어만의 독특한 특징이 번역을 매우 어렵게 한다. 따라서 한국어는 기계인 AI가 연습용, 학습용으로 활용하기엔 최상의 글인 셈이다.
순다르 피차이 구글 CEO는 “한국어와 일본어 두 언어는 영어와 매우 달라서 우리가 고려해야 하는 기술적 능력의 범위를 넓혀줄 수 있다”고 밝혔다. 한국어가 각국 언어로 출시하기 전에 영어와 다른 언어 체계에 대한 실험을 하는 테스트베드가 된다는 것이다.
▶K팝 붐도 한몫
다음으론 세계 시장에서 한국어의 번역 수요가 늘어난 것을 들 수 있다.
BTS(방탄소년단) 등 아이돌들의 활약으로 '한국(K) 콘텐츠'가 해외에서 엄청난 인기를 끌면서 세계 시장에서 한국어의 수요가 늘고 사용 빈도가 증가하고 있다.
콘텐츠 업계 관계자는 “K팝이나 K드라마의 영향으로 유튜브나 온라인 동영상 서비스(OTT) 등에서 한국어의 번역 수요가 엄청나게 늘어났다”며 “이미 사람과 AI의 협업으로 번역을 하고 있지만 더 정교하고 다양한 언어 번역이 가능한 AI가 필요한 상황”이라고 말했다.
▶토종 검색엔진 '네이버' 의식
구글의 한국어 AI 지원은 네이버를 의식한 행보라는 분석도 설득력이 있다.
구글은 세계 검색 시장에서 90%대의 점유율 가지지만 유독 한국에서는 36.99%(5월 14일 기준)로 네이버에 밀리고 있다.
구글의 검색 엔진 알고리즘 성능은 네이버보다 훨씬 뛰어나다. 특정 단어를 검색하면 네이버는 못 찾아내지만 구글은 다양하게 찾아준다.
그런데도 구글이 네이버에게서 미리는 것은 한국만의 독특한 검색 문화 때문이다. 첫 화면에서 다양한 콘텐츠를 노출하지 않고 대문을 닫아 놓은 듯한 구글의 검색창이 한국인에겐 맞지 않는 것이다. 최소한 지금까지는 그랬다.
구글로서는 생성형 AI 검색기인 '바드'에 한국어를 먼저 지원하면서 더 차이 나는 검색 능력으로 한국 시장을 장악하겠다는 전략이다.
검색 업계 관계자는 “검색이나 브라우저 서비스는 지속 사용해온 사람들의 충성도가 높기 때문에 기존 서비스를 잘 안 바꾸는 경향이 있다”면서 “하지만 해외 업체들이 최근 출시된 AI 번역과 AI 챗봇이란 서비스를 무기로 한국의 검색 시장을 노리고 있다”고 말했다. 네이버 등 토종 검색 업체로서는 크게 걱정을 해야 할 일이다.
이 말고도 글로벌 AI 빅테크(대형 기술 기업)들은 한국인들의 새로운 기술에 대한 관심도를 상당히 높이 평가하고 있다.
구글 피차이 CEO는 바드의 한국어 지원을 발표하면서 “1999년 서울에서 택시를 탄 적이 있었는데, 기사가 휴대전화 3대를 쓰고 있던 모습이 인상적이었다”고 소개했다.
이는 한국인들의 새로운 전자 제품이나 인터넷 서비스에 대한 경험 개방성이 상대적으로 다른 국가보다 커 이를 고려했다는 말이다.
실제 오래 전부터 글로벌 휴대전화 제조 업계에서는 이 같은 한국인들의 IT 열정에 제품 출시 초기엔 한국을 최적의 테스트베드로 삼았다. 모토로라 등이 한국에 대리점 등을 보다 일찍 내 '사용자 경험'을 차기 제품 개발에 반영한 것은 잘 알려져 있다.