바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

ETRI, 실시간 방송자막 韓·中 자동번역시스템 개발

ETRI, 실시간 방송자막韓·中 자동번역시스템 개발

- 대규모 공중파 방송은 물론 소규모의 인터넷 방송에
이르기까지, 중국을 대상으로 하는 방송업체 등에게 각광 -
 

한국어 드라마와 영화의 중국어권 수출로 인해 불기 시작한 한류 열풍으로, 중국어권 시청자들이 한국 문화의 수요자로 대두되고 있는 가운데, 한국 방송물을 중국어 자막을 통해 실시간으로 시청할 수 있는 기술이 국내 연구진에 의해 개발되었다.

한국전자통신연구원(ETRI, http://www.etri.re.kr) 휴먼정보처리연구부(부장 박상규 박사)는 정보통신 선도기반기술개발사업인 동양 4국 언어에 대한 TM(Translation Memory, 번역 재활용 기술) 기반 통합 CAT(Computer Aided Translation, 전문 번역가 지원도구) 시스템 과제의 일환으로, 실시간 한중 방송자막 자동번역시스템을 개발하였다.

ETRI의 실시간 한·중 방송자막 자동번역 시스템은 한국어 방송물이 방영되고 있는 화면에, 중국어 자막이 실시간으로 나타나도록 하는 기술이다.

향후에는 한중 방송자막 자동번역 시스템의 개발 과정에서 축적된 기술과 ETRI에서 기 개발한 영한, 한영, 일한, 한일 자동번역 기술을 바탕으로, 영어권과 일본어권 시청자들도 자국어로 한국어 방송 시청을 하는 것이 가능하게 될 것이다.

● 기술적 특성 - 중국에도 없는 실시간 한·중 자막 자동번역시스템 

한·중 방송자막 자동번역 기능은, 우리 나라 방송신호에 포함되어 있는 한글 자막 신호를 실시간으로 번역해 TV화면에 나타내 주는 방식으로 구현되는데, 한국어 자막이 포함되는 지상파, 위성, 케이블 방송은 물론 생방송이나 비디오로 녹화된 영상물까지도 중국어 자막방송으로 시청할 수 있게 해준다.

실시간 자동 번역은 한국어 문장에 대한 형태소 분석 기술, 구문분석 기술 및 중국어로의 변환기술과 생성기술로 구성되며, 정확한 원시언어 번역 및 자연스러운 목적언어 생성을 위하여 동사패턴을 기반으로 하고 있다. 동사패턴은 지식의 재활용도를 높여주며, 패턴 구축에 따른 번역 품질의 향상을 일관되게 유지할 수 있다.  

● 저렴한 비용, 실시간 영상번역으로 Buy Korea 전도사 역할 

ETRI의 실시간 한중 방송자막 자동번역시스템은 저렴한 비용으로 중국어권 시청자들을 대상으로 한 동시다발적인 실시간 중국어 자동번역을 가능하게 해주므로, 중국을 상대로 하는 기업체나 방송사 등이 겪고 있는 번역 비용과 인력부족 문제를 상당부분 해결해준다.

15억 중국인들은 실시간 방송자막 자동번역시스템이 탑재된 한국산 TV로 한국의 드라마, 뉴스, 연예 프로그램을 시청하게 되므로, 정보가전 등 타산업에의 파급효과도 막대할 것으로 보인다.

● 실시간 방송자막 자동번역시스템 시장전망 및 업계 반응 

2003년경 약 730억 원 규모로 확대될 것으로 전망되어 왔던 한국어 관련 자동번역 시장은, ETRI의 실시간 방송자막 자동번역 시스템의 출현으로 더욱 빠르게 성장할 것으로 보인다.

연구책임자인 ETRI 휴먼정보처리연구부장 박상규 박사는, "이미 여러 번역 업체들과 인터넷 방송사들로부터 문의가 이어지고 있다."며, "실시간 방송자막 자동번역시스템의 핵심 기술은 모든 언어권에 적용될 수 있어, 향후 해외 기술이전도 활발해질 것"이라고 말했다.

ETRI는 11월 중에 본 기술에 대한 공개 기술이전 설명회 및 시연회를 가질 예정이다.

 

[ 용어설명 ]

□ TM(Translation Memory, 번역 재활용 기술) 

컴퓨터가 번역 작업과 동시에 번역결과를 지능적으로 축적하여, 유사하거나 같은 문장이 다시 입력되는 경우에 기존 번역결과를 재활용하는 기술을 의미한다.직역은 물론 문장의 의미를 가장 잘 살리는 표현에 의한 의역까지 가능하게 해준다.

□ CAT(Computer Aided Translation, 전문가 번역 지원도구) 

전문용어나 상용구가 많은 전문번역은 사전만으로는 큰 도움을 받을 수 없는 것이 특징이다.  이러한 전문번역을 행하는 사람에게 실질적인 도움을 줄 수 있도록, 번역된 문장이나 단어 중 가장 적절한 표현을 찾아주어 전문번역가가 번역을 하는데 도움을 주는 소프트웨어가 CAT이다. 

□ 원시 언어와 목적언어

번역 대상이 되는 문서를 표현하는 언어를 원시언어, 번역결과로 표현되는 언어를 목적언어라고 한다.한국어 문서를 중국어 문서로 번역할 경우 원시 언어는 한국어이고 목적 언어는 중국어이다.

□ 형태소 분석

문자열을 분석하여 자연언어 분석의 기본 단위인 형태소로 분해, 해당되는 문법정보로 분류하는 것을 말한다.예를 들어, 주었던이라는 어구를 컴퓨터가 주=동사, 었=과거시제선어말어미, 던=관형사형전성어미라고 인식할 수 있도록 하는 기능이다.

□ 구문 분석 

문장 내 단어가 어떤 단어와 어떤 관계로 연결되는 지를 분석하는 것을 말하는데, 예를 들어, 아빠는 비싼 선물을 사셨다라는 문장에서 주어(아빠), 수식어(비싼), 목적어(선물), 술어(사다)를 인식하는 것이다.이는 특히 한국어와 어순이 다른 외국어로 번역하는 경우에 필수적인 과정이다.

□ 변환 

사전에서 가장 적절한 표현을 골라 대치시키고(단어변환), 어순 등 문장구조를 바르게 재배치하는(구조변환) 일련의 작업을 말한다. 

□ 생성 

적절한 단어로 바꿔 순서까지 재배치하고 난 후에 수행하는 과정으로서, 시제, 상, 수의 일치 및 어순 조정 등 문법에 맞는 문장으로 작문해 내는 과정을 말한다.

□ 자동 번역 

언어에 대한 지식의 집합체인 사전, 패턴을 컴퓨터에 저장시키고 이를 이용하여 번역을 수행하는 것을 말한다.영어-한국어와 같이 구조적으로 상이한 언어들 간의 자연스러운 번역에는 패턴번역 방식이 효과적이다.

□ 명사 의미 분류 

유사한 의미를 가진 명사들을 특정 범주로 분류한 것을 말한다. 이러한 명사 분류를 통해 동사패턴의 적용성을 높일 수 있다. 예를 들어, 버스, 전철, 기차, 자전거, 오토바이, 택시 등은 탈것으로 분류되며, 이러한 분류를 통해 자전거를 타다와 버스를 타다라는 문장은 동사패턴 A=탈것!을 타다에 의해 모두 처리될 수 있다.

□ 동사 패턴

목적어, 보어 등의 의미 분류, 문장 구조 등을 고려해 가장 잘 어울리는 동사를 미리 골라 기록해 놓은 것으로, 자연스러운 번역문 생성에 필수적이다.예를 들어 중국어에서는 약의 복용은 服, 액체를 마시는 것은 喝, 어떤 결과를 이루는 것은 取得이라고 하는데, 이런 연결관계를 세트로 구성해 놓은 정보를 동사패턴이라고 한다. 

TOP