바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

ETRI, 방송뉴스 음성인식시스템 개발

ETRI, 방송뉴스 음성인식시스템 개발

- 청각 장애자를 위한 자막방송을 크게 확대 할 것으로 기대 -

방송뉴스 음성이 실시간으로 자막처리 되어 청각 장애자뿐만 아니라 일반 시청자에게도 방송 이해를 돕는데 크게 기여할 수 있는 방송뉴스 음성인식시스템이 개발되었다.

한국전자통신연구원(ETRI, http://www.etri.re.kr) 음성정보연구센터(센터장 이영직)는 정보통신부가 출연한 청각 및 시각장애인을 위한 디지털 방송기술 개발과제의 일환으로 방송뉴스 자막작업에 적용할 수 있는 "연속음성인식시스템"을 개발하였다.

현재, 우리나라의 자막방송은 전체 방영분의 20%에서 40%까지 실시하고 있으며, 전체 방영분으로 자막방송을 확대하는 것이 요구되고 있다. 그런데, 현재의 자막방송작업이 한 채널당 4인 이상의 전문 속기타자 인력이 투입되어 자막입력 및 수정작업을 수동으로 하고 있는데, 대부분 방송과 함께 실시간으로 작업을 하여야 하며, 소요되는 전문인력이 절대 부족하고, 인력양성에도 많은 시간이 소요되어, 자막방송 확대에 어려움을 겪고 있다. 이러한 어려움을 해소하기 위하여, ETRI는 현재의 수동 자막 작업방식에 음성인식기술을 적용하여 반자동화를 할 수 있는 방송뉴스 음성인식시스템을 개발한 것이다. 즉, 방송뉴스의 음성을 먼저 실시간으로 인식을 하고, 그 결과를 전문 속기타자 요원이 수정하는 방식으로 자막작업을 수행하는 것이다.

ETRI, KBS, SBS, 한국자막방송협회가 공동 개발한 방송뉴스 음성인식시스템은 실시간으로 음성 인식이 수행되도록 2개의 음성인식기를 통해 작업이 분담되게 설계하여 음성인식 지연시간이 누적되지 않도록 하였다. 이러한 방식을 지원하기 위하여 입력음성의 특성에 따라 구분하여 일정한 길이로 분할하는 음성분할기능을 구현하였다. 또한 뉴스의 특성상 새로운 어휘가 항상 출현하므로, 인터넷을 검색하여 새로운 어휘를 검출하여 이를 시스템에 반영하는 미등록어 검출 알고리즘 및 작업도구도 함께 개발하였다.

ETRI 이영직 센터장은 "이번에 개발한 음성인식시스템은 방송뉴스가 다양한 음향환경으로 구성되어 있음에도 불구하고, 현재 실시간 음성인식률이 음절기준으로 85%를 상회" 하고 있다며, "본 기술이 적용될 경우 인력부족 문제해소에 상당한 기여를 할 것으로 기대되며, 앞으로 성능향상을 통하여 이러한 효과가 극대화 될 것"으로 전망했다.

TOP