[쿠키 IT] 심심치않게 엉뚱한 오역 사례가 발견돼 화제를 모은 바 있는 구글 번역기가 이번엔 국내 네티즌들의 인상을 찌푸리게 했다.
26일 트위터 등 온라인에는 구글의 ‘대한민국’에 대한 오역 사례가 큰 이슈가 됐다. 바로 구글 번역기에서 ‘출발어’를 한국어, ‘도착어’를 일본어로 설정해놓고 ‘대한민국’을 번역하면 ‘日本(일본)’이라고 나오는 것이다. ‘소리나는 대로 읽기’를 선택해보면 ‘Nippon’이라고 제시된다. 단순한 오류로 바로잡기만 하면 끝날 해프닝일지 몰라도 목격한 국내 네티즌들에게는 상당히 ‘불편한 오역’이 아닐 수 없다.
더구나 도착어를 영어, 중국어, 독일어 등 주요 주변국의 언어로 설정하면 모두 정상 번역되면서 일본어만 이런 오역이 나오고 있다.
이미 온라인에는 구글을 성토하는 목소리가 줄을 잇고 있다. 이 내용을 전달한 트위터 글은 오후 5시 40분 기준으로 RT(Retweet·리트윗·타인의 트위터 글을 자기 트위터로 가져와 전파하는 행위) 횟수 150회(followkr.com)를 넘기며 1위를 달리고 있다.
지난 20일 구글 번역기는 ‘아이폰이 안드로이드보다 우수하다’는 한글 문장을 영어로 번역하면 ‘The Android is better than the iPhone(안드로이드가 아이폰보다 낫다)’는 정반대의 의미의 문장이 나오는 것이 발견되기도 했다. 이때는 아이폰뿐만 아니라 다른 스마트폰OS(운영체제)의 이름을 대입해 번역을 시도해도 ‘안드로이드가 낫다’는 문장이 도출돼 자사 OS 홍보를 위해 일부러 조작해 놓은 것 아니냐는 의심을 사기도 했다. 더구나 ‘내가 너보다 낫다(I’m better than you)’와 같은 OS와 상관없는 문장으로 번역을 시도하면 제대로 번역돼 사용자들의 고개를 갸우뚱하게 만들었다.
또 지난 2008년 베타버전(시험판) 시절에는 한국어 ‘독도’를 영어로는 ‘Dokdo’로 나왔지만, 일본어로 ‘獨島’가 아닌 ‘竹島(다케시마)’라고 번역하기도 했다.
구글은 나름의 이유를 내놓긴 했지만 특정 국가명이 오역되는, 그것도 역사적으로 특별한 관계에 있는 국가명으로 오역되는 이유로선 그다지 명쾌하진 못하다. ‘안드로이드가 낫다’의 사례처럼 자신들에게 유리한 방식으로 오역되는 관점에서도 마찬가지다.
구글에 따르면 구글번역기는 인간 번역의 개입이 없는 기술에만 의존하는 방식이다. 구글번역기는 수많은 어휘와 문법을 정의하는 많은 작업을 필요로 하는 대부분의 상업용 기계번역 소프트웨어와 달리, 컴퓨터에 57개의 언어에 해당하는 수십 억개의 단어 및 텍스트와 더불어 사람이 번역한 텍스트 사례를 합께 입력한다. 또 이외에도 웹에는 이미 사람들이 번역해놓은 수억개의 자료가 존재한다.
이런 자료들을 통해 구글은 컴퓨터가 양쪽의 언어를 인식하도록 만든 후, ‘통계적 학습기법’을 이용해 번역 모델을 구축한다는 것이다. 즉, 사용자가 구글번역기에 특정 문구를 입력하면 구글은 그 문구의 패턴을 분석해 기존 자료 내에서 유사한 패턴을 찾아낸다. 그리고 패턴에 기반해 가장 적절한 번역문구를 제시한다는 것이다.
결국 이에 따르면 전세계 50여개가 넘는 언어의 수십억 단어·텍스트, 사람이 번역해 놓은 수억개의 자료 등을 인식해 통계적으로 패턴을 추출하면 ‘대한민국’을 일본어로 번역했을 경우 ‘大韓民國’이나 ‘韓國’ 보다는 ‘日本’이 더 적절하다는 결론이 도출되는 셈이다. 반면 ‘한국’을 일본어로 번역하면 ‘韓國’이라고 정상 번역된다.
구글 관계자는 “기계가 제공하는 번역인만큼 아직 완벽하지 않다”며 “사람이 직접 번역해놓은 고품질의 자료가 웹상에 많아질수록 구글이 분석할 수 있는 정보가 많아지고 더 정확한 번역결과를 볼 수 있다”고 말했다. 또 “대한민국의 일본어 오역은 빠른 시일 안에 수정하겠다”고 덧붙였다.
국민일보 쿠키뉴스 김현섭 기자 afero@kmib.co.kr