메인콘텐츠 바로가기

ETRI Webzine

VOL.159 August 2020   

Focus On ICT

AI를 이용해 영상을 압축하다

생활 속 ICT 이야기

  • ETRI 대표기술
    ‘영상 압축기술’

  • 지난 6월, ETRI가 인공지능(AI)을 이용해 영상을 압축하는 기술력을 겨루는 국제경진대회에서 세계 1, 2위를 차지했다. 이로써 기존 MPEG, HEVC 등 국제표준 압축 기술에 이어 진화하는 미디어 콘텐츠를 효율적으로 이용할 수 있는 획기적 인프라 기술 개선에 큰 도움이 될 전망이다.

    ETRI의 대표기술을 꼽으라고 하면 으레 TDX, CDMA나 반도체 등을 우선해 말한다. 하지만 이외에도 지난 44년간 잘 알려지지 않은 기술들이 우리 생활 속에도 많이 있다. 그 중 하나가 우리가 매일 보는 ‘영상 압축기술’이다.

    영상을 보기 위해선 원래 데이터를 압축했다가 풀어서 봐야 한다. 용량이 큰 고화질 데이터를 그냥 보내게 되면 시청자가 볼 수 없어 중간과정을 거치는 것이다. 국민들에게도 익숙한 대표적인 영상 압축 기술인 MP4(MPEG, Moving Picture Experts Group)와 초고화질(UHD) TV에 많이 쓰이는 초고화질 압축 코덱(HEVC) 또한 연구진의 피땀이 녹아있다. 두 기술 모두 국제 표준이다.

    연구진은 이에 만족하지 않고 최근 대세인 인공지능(AI)을 이용해 영상을 압축하는 기술에 도전하고 있다. 본 기술은 기존 국제표준 압축기술에 이어 진화하는 미디어 콘텐츠를 효율적으로 이용할 수 있도록 만들어줄 전망이다. AI를 이용해 기존 방식의 한계를 뛰어넘어 보자는 취지다.

  • TDX

    (Time Division Exchange)

    ETRI가 개발한 전화 교환기로서 1982년
    세계에서 10번째로 개발에 성공했음

    CDMA

    (Code division multiple access, 코드 분할 다중 접속)

    디지털 신호 각각에 코드를 부여해 하나의 채널로
    내보낸 다음 이를 받아 각 코드별로 재구성하는 방식
    - ETRI가 개발한 휴대폰 상용화의 대표기술임

  • 01

    주어진 사진에 기존 압축 기술 VVC(Versatile Video Coding)를
    적용한 뒤, ETRI-PQE을 적용해 화질을 개선한 사진

    02

    ETRI 연구진이 기존 압축 기술과 연구진의 기술 간
    화질 차이를 비교하는 모습

  • 세계적 기술력으로
    차세대 원천기술 확보

  • 지난 6월, 미국에서 AI를 이용해 영상을 압축하는 경연(CLIC)이 펼쳐졌다. 내로라하는 글로벌 기업과 대학 연구진이 참가해 AI 기술의 우수성을 뽐냈다. 미국 퀄컴, 중국 화웨이, 일본 히타치 등 글로벌 기업들의 영상 압축 기술력을 겨루는 가운데 ETRI가 당당히 세계 1위와 2위를 차지해 큰 화제를 불러모았다.

    올해로 3회째를 맞이하는 CLIC 대회는 구글, 페이스북, 넷플릭스 등 세계 유수의 기관들이 주관하고 후원하는 인공지능 기반 영상 압축기술 관련 유일한 대회다. 세계적인 컴퓨터 비전 관련 학회인 CVPR이 주관해 명성도 높다.

    대회 심사 부문 중 ETRI는 영상 압축의 효율성과 품질을 겨루는 ‘저(低) 비트율 영상 압축’ 분야에 두 팀이 나가 전 세계 55개 기업과 연구소와 자웅을 겨뤘다. 여기서 ETRI 소속 두 팀이 각각 세계 1위와 2위를 했는데 지난해 대회에서도 복원 속도 부문에서 세계 1위를 한 바 있어 2년 연속 입상하는 쾌거를 거두었다.

  • MPEG

    (Moving Picture Experts Group)

    1988년 설립된 ‘동영상을 전문으로 연구하는
    전문가 그룹(Moving Picture Experts Group)’으로,
    비디오, 오디오 압축표준 기술을 개발하는
    국제표준화기구 산하 동영상 연구 모임

  • 국제표준화 선도를 위한
    원천기술 확보

  • 저비트율 영상 압축 분야는 HD부터 4K 해상도의 다양한 자연 영상 428개를 화소당 0.15 비트율(bpp) 이하로 압축한 뒤, 다시 이를 복원한 결과물의 화질 수준을 평가한다. 원본 영상 대비 최대 1/160의 크기로 용량을 줄이면서도 화질을 떨어트리지 않는 것이 관건이다. 여기에는 신경망 회로 알고리즘의 AI 기술이 사용된다. 용량이 크고 복잡한 영상 데이터의 반복되는 유형을 찾아내 압축 효율을 높이는데 최적화하는 것이다. 이 기술을 얼마나 잘 사용하느냐의 여부가 영상 압축의 열쇠인 셈이다.

    평가는 어떻게 할까? 화질은 원본 영상을 압축한 뒤 복원한 영상의 ‘인지 화질’을 기준으로 한다. 거리와 밝기 등 정해진 기준을 두고 사람이 직접 점수를 매겨 순위를 매기는 평가 방식이다. 사람의 눈이 아직까지는 제일 정확하단 뜻이다. 하지만 언젠가는 이 화질 평가 역시 AI로 이뤄질 가능성도 점쳐지고 있다.

    ETRI 연구진을 비롯한 국내 연구진의 기술로 우리나라가 초실감 미디어 서비스 활용과 차세대 비디오 압축 국제표준화 선도할 수 있기를 기대해본다.

  • 글 · ETRI 홍보실장 정길호