HWP문서[ETRI 보도자료] ETRI, 美 NAB서 AI시대 미디어 산업의 새로운 지평을 연다_240405_F.hwp

닫기

5

Embargo

없음

배포일자 : 2023.4.11.(목)

배포번호 : 2024-23호

초실감메타버스연구소

미디어연구본부장

이태진(042-860-5713)

E-mail : tjlee@etri.re.kr

미디어연구본부

미디어지능화연구실장

이남경(042-860-1148)

E-mail : nklee@etri.re.kr

대외협력부

홍보실장

정길호(042-860-0670)

E-mail : khchong@etri.re.kr

홍보실

선임행정원

김민규(042-860-0681)

E-mail : kakapow@etri.re.kr

매수 : 보도자료 2매(참고자료 4매, 사진자료 8매)

배포처 : ETRI 홍보실

ETRI, NABAI시대 미디어 산업의 새로운 지평을 연다

- AI 기술로 영상 메타데이터 자동 생성 및 새로운 샷 편집 기술 전시

- 시청각장애인용 ATSC 3.0 기반 재난정보 및 촉각 지원 실감 미디어 개발

국내 연구진이 인공지능(AI)을 활용한 차세대 방송미디어 핵심기술을 미국에서 개최되는 세계 최대 전시회에서 일반에 공개한다. 향후 본 기술은 미디어 및 방송 산업의 혁신을 가속화하고 글로벌 시장에서 우리의 기술 리더십을 더욱 공고히 할 것으로 기대된다.

한국전자통신연구원(ETRI)은 미국 라스베가스 컨벤션센터에서 14일부터 4일간 열리는 세계 최대 규모의 국제 방송 장비 전시회(NAB 2024)에서 연구진이 개발한 방송미디어 관련 최신기술을 선보인다.

연구진은 AI를 활용한 인공지능시대 미디어 서비스를 위한 핵심기술들을 소개한다. 전시되는 기술은 메타데이터 자동 생성 및 영상 검색 기술 샷 예측 및 가상 샷 생성 기술 시청각장애인을 위한 ATSC(북미디지털방송표준화기구) 3.0 재난정보미디어 서비스 플랫폼 ATSC 3.0 기반 촉각지원형 입체미디어 서비스 기술이다.

ETRI가 공개한 메타데이터 자동 생성 및 영상 검색 기술은 미디어사업자 등이 보유하고 있는 영상을 분석해 자동으로 메타데이터를 만든다. 이를 활용하면 멀티모달 영상 검색이 가능하다. 이 기술은 최신 AI 기술을 활용해 메타데이터를 자동 생성하고 다양한 영상 검색 기능을 제공한다. 이를 통해 대용량 아카이브 환경에서 효율적인 영상 검색 서비스를 제공할 수 있어 산업계의 주목을 받고 있다.

또한, 샷 예측 및 가상 샷 생성 기술은 다중 카메라로 동시에 촬영된 영상을 분석하여 가편집본 영상을 자동으로 생성하고 새로운 구도의 가상 샷을 만드는 기술이다. 이 기술은 다양한 구도의 영상 콘텐츠를 효율적으로 제작해 주며 관련 서비스 분야에도 활용 가능한 전문 영상 편집 소프트웨어의 플러그인 앱 형태로 개발했다.

시청각장애인을 위한 ATSC 3.0 재난정보미디어 서비스 플랫폼 기술은 재난정보 접근이 제한된 사람들도 쉽게 이해할 수 있게 다양한 미디어(청각장애인용 아바타수어 영상, 시각장애인용 해설 오디오, 외국인을 위한 맞춤형 이미지)로 제공한다. 이 기술은 클라우드 환경에서 재난정보미디어를 수신하고 재생할 수 있는 ATSC 3.0 기반 셋톱박스와 다양한 스마트 디바이스들을 연동해 서비스를 제공한다.

아울러, ATSC 3.0 기반 촉각지원형 입체미디어 서비스 기술은 미디어 스트리밍 서비스 환경에서 시청자에게 입체영상 및 촉감을 전달하는 몰입형 실감콘텐츠 서비스 기술이다. ETRI는 현재 해당 기술의 국제표준 추진 및 AI 콘텐츠 생성 원천기술을 확보하고 있다.

NAB의 회장 커티스 레게이트(Curtis LeGeyt)ETRINAB 2024에서 선보인 미디어 AI 서비스 기술은 미래 방송의 발전 방향을 제시하는 혁신적 기술이다고 밝혔다.

ETRI 이태진 미디어연구본부장도 "이번 NAB 2024를 통해 ETRI 미디어 지능화 기술의 우수성을 널리 알리고 국내 미디어 기업들의 글로벌 진출에 기여할 것이다고 말했다.

본 기술은 과학기술정보통신부 지능적 미디어 속성 추출 및 공유 기술 개발 학습 기반 연출 기법이 적용된 미디어 제작 기술 개발 재난정보인지 취약계층을 위한 맞춤형 재난미디어 서비스 플랫폼 기술 개발 사용자 선택형 UHD 입체 미디어 서비스 기술 개발 과제의 지원을 받아 개발되었다. <보도자료 본문 끝>

용어설명

1) National Association of Broadcasters

2) 북미의 지상파 디지털 방송 규격을 제정하는 표준화 기구(ATSC : Advanced Television Systems Committee)

참고1

메타데이터 자동 생성 및 영상 검색 기술

< 메타데이터 자동 생성 및 영상 검색 기술 >

메타데이터 자동 생성 및 영상 검색 기술은 미디어 콘텐츠의 속성, 맥락, 흐름을 인공지능으로 분석하여 미디

어 지식 자원을 자동 구축하고, 이를 서로 다른 서비스에 유기적으로 활용하도록 제공하는 지능적 미디어 속성 추출 및 공유하는 기술이다.

인력 및 자막과 같은 추가 정보에 대한 의존없이 국내 콘텐츠의 특성을 학습한 AI를 이용하여 콘텐츠의 컨텍스트를 분석하여 메타데이터 자동 생성한다. 국내제작 콘텐츠의 특성을 고려한 시맨틱 검색, 다국어 자동 변환, 자동 제작·편집 등 다양한 서비스에 활용 가능한 메타데이터를 자동으로 생성 및 구축한다.

참고2

샷 예측 및 가상 샷 생성 기술

< 샷 예측 및 가상 샷 생성 기술 >

샷 예측 및 가상 샷 생성 기술은 편집자를 대신하여 AI가 다수의 카메라로 촬영된 영상을 자동 편집하는 샷 예측 기능과 편집과정에서 추가로 필요한 촬영되지 않은 화각의 샷을 생성하는 가상샷 생성 기능을 영상 편집자에게 제공한다.

자동 편집을 위한 AI는 콘텐츠 장르나 편집 스타일에 따라 편집자가 영상의 호흡, 다이나믹스 등을 조정할 수 있는 기능과 함께 상용 편집도구를 위한 플러그인 기능을 제공하여 편집자의 작업 편의성을 높였다. 가상 샷 생성 기술은 특정 인물 중심 샷 생성 뿐만 아니라 이벤트 중심의 샷 생성을 지원함으로써 한두대의 카메라로 획득된 영상에서 다양한 화각의 가상 샷을 기반으로 다채로운 영상을 제작할 수 있도록 돕는다.

참고3

시청각장애인을 위한 ATSC 3.0 재난정보미디어 서비스 플랫폼

< 시청각장애인을 위한 ATSC 3.0 재난정보미디어 서비스 플랫폼 >

시청각장애인을 위한 재난정보미디어 서비스는 재난 관련 정보를 정보 접근이 제한된 사람들이 쉽게 이해할 수 있도록 텍스트, 동영상, 오디오 등의 다양한 미디어 형식으로 제공한다.

서비스 플랫폼은 ATSC 3.0 기반으로 청각장애인을 위한 아바타수어 영상, 시각장애인을 위한 오디오 합성 기반 해설음성, 고령인 및 외국어 사용자를 위한 맞춤형 이미지 등과 같은 재난정보미디어 생성 기술을 포함한다. 또한, 클라우드 기반 환경을 통해 재난정보미디어를 수신하고 재생할 수 있는 ATSC 3.0 기반 셋톱박스와 2nd 디바이스(스마트폰, 스피커 등)와의 연동을 통해 방송 애플리케이션(BA:Broadcast App) 기술을 포함한다.

참고4

ATSC 3.0 기반 촉각지원형 입체미디어 서비스 핵심기술

< ATSC 3.0 기반 촉각지원형 입체미디어 서비스 핵심기술 >

ATSC3.0 기반 촉각지원형 입체미디어 서비스 기술은 ETRI에서 국제표준화를 진행중인 차세대 실감미디어 서비스 핵심요소 기술이며, OTT 및 지상파 서비스 환경에서 시청자에게 입체미디어와 함께 촉각의 느낌도 전달하는 체험형 입체미디어 서비스이다. NABSHOW2024 전시예정인 콘텐츠는 생성형 AI 기반으로 생성/입체변환/제작 하였다.