
사람을 넘어,
기계를 위한 영상 기술
기계를 위한 영상 부호화 기술
초고화질 영상과 실감나는 색감은 오랫동안 미디어 기술의 목표였다. 그러나 인공지능과 IoT가 일상이 된 지금, 영상의 주요 소비자는 더 이상 사람만이 아니다. 자율주행차, 드론, 스마트시티의 카메라는 영상을 보는 대신 이해해야 한다. ETRI는 사람이 개입하지 않아도 기계가 영상을 이해하고 임무를 수행할 수 있도록, 기계를 위한 영상 부호화 핵심기술을 개발했다.

영상 소비의
주체가 바뀌다
미디어 환경은 빠르게 변화하고 있다. 이제 영상은 사람이 감상하기 위한 콘텐츠를 뛰어넘어 기계가 분석하고 판단하기 위한 데이터가 됐다. 인공지능 기술의 발전과 IoT 기기 확산으로 기계 간 영상 트래픽은 급증했고, 기존의 사람 중심 영상 압축 기술만으로는 이를 감당하기 어려워졌다.
특히 자율주행, 지능형 영상 감시, 산업 자동화 환경에서는 영상 전체보다 객체, 움직임, 특징 정보가 더 중요하다. 즉, 화질 중심의 영상 전송이 아니라 기계가 이해할 수 있는 정보만을 효율적으로 전달하는 방식이 요구된다. 이러한 문제의식에서 ‘기계를 위한 영상 부호화’라는 새로운 개념이 등장했다.
기계를 위해 다시 설계한 부호화 기술
ETRI 연구진은 기계 중심 영상 환경을 위해 세 가지 핵심기술을 개발했다. 먼저, 인공지능 기반 영상 특징 압축 부호화 기술이다. 신경망을 활용해 영상에서 필요한 특징만을 추출·압축하는 방식으로, MPEG 국제 표준 비교 평가에서 기존 VVC(Versatile Video Coding) 대비 92% 이상의 성능 개선을 기록하며 최상위 성과를 달성했다.
두 번째는 머신비전 영상 부호화를 위한 영상 변환 및 처리 기술이다. 관심 영역을 중심으로 영상을 부호화하고, 객체 분포에 따라 공간 해상도를 유연하게 조절함으로써 불필요한 데이터 전송을 줄였다. 이 기술 역시 MPEG 핵심 실험에서 VVC 대비 약 36%의 성능 향상을 보였다.
마지막으로 영상 특징 서술자 기반 머신비전 부호화 기술을 통해, 기계의 분석·인식 결과를 효율적으로 표현하는 데이터 형식을 구현했다. 이 기술은 MPEG IoMT 표준안으로 채택되며 국제 표준 기술로서의 가능성을 입증했다.


국제표준에서 산업 현장까지
이번 성과는 연구 수준에 머물지 않고 국제 무대에서 경쟁력을 입증했다. MPEG 표준화 회의에서 글로벌 기업들과의 기술 비교 평가를 통해 세계 최고 수준의 성능을 기록했고, 다수의 표준안 채택과 특허 확보로 기술적 공신력을 쌓았다.
이 기술은 자율주행차, 스마트시티, 드론, 산업 자동화, 영상 보안 등 다양한 분야에 공통으로 적용될 수 있다. 특히 원본 영상이 아닌 기계 임무 수행에 필요한 특징 정보만을 전송함으로써 통신 대역폭 부담을 줄이고, 영상 촬영으로 인한 사생활 침해 가능성도 근본적으로 낮춘다.
사람을 위한 미디어에서 기계를 위한 미디어로, ETRI의 영상 부호화 기술은 초연결 사회에서 기계가 서로 이해하고 협력하는 새로운 미디어 생태계의 기반이 되고 있다.

