바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

[2020-39호] ETRI, 세계 최고 성능 AI반도체 개발

ETRI, 세계 최고 성능 AI반도체 개발

 

- 전구 켜는 15W 전력만으로 초당 40조회 연산능력(40TF)

- 5백원 동전 크기, 딥러닝 연산에 특화된 반도체 칩 개발

- 연산능력 25배↑, 전력소모 20배 ↓, 상용칩 대비 가격 50배↓

- 무인차, 데이터센터 등 적용, 비메모리 반도체 혁신성장 견인



연구사진자료



국내 연구진이 세계 최고 성능의 인공지능(AI) 반도체를 개발했다.

 

기존 상용 제품에 비해 연산 능력이 뛰어나면서 전력 소모량은 대폭 낮췄다. 이동통신, 자율주행자동차, 지능형 로봇, 드론 등에 적용이 예상되고 우리나라 비메모리 반도체 산업의 발전에 획기적 전기가 될 전망이다.

 

한국전자통신연구원(ETRI)은 지난 2월 말, 고성능 프로세서인 ‘알데바란’의 새 버전‘AB9’(알데바란 9)을 칩으로 개발하고, 현재 국내 이동통신사를 통해 음성인식 서비스를 위한 최종 성능검증 단계에 있다고 밝혔다.

 

제4차산업혁명의 핵심 키워드로 AI가 대두되면서 핵심 두뇌 역할을 하는 기술에 경쟁이 심화되고 있다.

 

기존 컴퓨터와 모바일의 두뇌 역할로 중앙처리장치(CPU, AP 등) 등이 사용되어 왔지만, 이러한 반도체는 단순 계산에 적합하고 딥러닝처럼 복잡한 연산 처리에는 뚜렷한 한계가 존재했다.

 

연구진은 신경망처리장치(NPU)라 불리는 딥러닝 계산에 최적화한 칩 개발에 성공했다.

 

NPU는 구글 딥마인드의 ‘알파고’처럼 사람의 학습 및 추론 과정을 재현 및 가속하는 반도체 기술이다.

 

그동안 전력 효율을 낮춰 칩으로 만들기는 어려웠다.

 

ETRI는 고성능의 연산 능력과 전력 소모량 두 마리 토끼를 다 잡은 NPU를 개발했다.

 

연구진이 개발한 반도체 칩은 40테라플롭스(TFLOPS)수준의 연산 능력을 보여주면서도 전력은 15와트(W)만 든다.

 

기존 상용 제품보다 전력당 연산능력도 최대 25배로 높이고 전력소모량은 20배 낮췄다.

 

아울러 가격 경쟁력도 우수하다.

 

기존 상용제품인 GPU 칩 하나의 경우 800만 원~1,000만 원대로 고가였으나 연구진의 칩은 수십만 원대 가격 책정이 예상되어 최대 50배나 저렴한 경쟁력도 있다.

 

28나노 공정을 적용해 칩 소형화도 이뤘다.

 

5백원 동전크기 정도(17mm x 23mm)로 높은 연산 능력을 구현할 수 있고 딥러닝 연산에 특화하여 개발, 응용 분야도 다양해 상용화도 쉽다.

 

연구진은 그동안 알데바란 프로세서 코어 연구로 10년 넘게 축적한 노하우를 바탕으로 이번에 새롭게 NPU를 개발했다.

 

칩 내부는 크게 메모리, 행렬 연산기, 데이터이동기(DMA), 명령어 디코더 등으로 구성된다.

 

전력 효율 극대화를 위한 시뮬레이션을 통해 메모리의 크기와 행렬 연산기 개수를 결정했고 모듈 별 작동 시간 등을 병렬적으로 분배하는 등 연구 핵심 역량을 최적화 설계에 집중했다.

 

향후 본 칩은 보드에 다양한 형태로 올려져 데이터센터 등에서 AI 관련 서비스 서버 등에 활용케 될 계획이다.

 

특히 ETRI는 본 칩 하나를 무인자율차에 내장하면 카메라 영상을 받아 보행자, 차선, 신호등 인식 등 무인 이동과 안전 관련 제어가 동시에 가능한 성능 수준이라고 말했다.

 

아울러, 연구진은 인공지능 알고리즘의 기본 단위인 ‘행렬 연산’최적화를 위해, 칩과 사용자 사이에서 칩의 구동을 위한 컴파일러 기술(STC)도 자체 기술로 개발했다고 밝혔다.

 

ETRI는 본 기술의 차별성으로 딥러닝 최적화 구조와 전력 최적화 구조를 들었다.

 

고속 동작에 필요한 다수의 연산구조 데이터 복사를 최소화했고 내장된 고용량 온칩 메모리 및 16,384개의 연산기 전원을 유기적으로 동작 중 차단 및 활성화할 수 있다고 설명했다.

 

특히 연구진이 개발한 칩 하나는 10억 개의 트랜지스터(TR), 40MB의 메모리로 구성되며, 부동소수점 연산을 위한 연산기 개수도 32,768개에 달한다고 말했다.

 

연구진은 상용 NPU 제품 중 반도체 칩과 컴파일러가 통합 구조를 이룬 제품이 없어 이번 AI 반도체 원천기술의 의미가 더욱 크다고 말했다.

 

ETRI 권영수 지능형반도체연구본부장은“비메모리 반도체 영역에서 원천기술 확보에 난항을 겪어온 국내 반도체 업계에 찾아온 절호의 기회다.

 

토종 인공지능 프로세서인 본 칩이 우리나라 반도체 산업 경쟁력을 한 단계 끌어올리는 기회가 되기를 바란다”고 밝혔다.

 

연구진의 AI 반도체 칩은 AI 스피커, 무인자율차를 비롯, 고성능 서버, 원격 진료, 금융 서비스, 안면/행동 인식 등에 활용, 딥러닝이 적용된 분야에서 부품을 국산화하고 부가가치를 창출하는데 큰 도움이 될 전망이다.

 

현재 본 기술은 이동통신사, 시스템반도체 기업 등에 기술이전 되었고 서버에 탑재, 성능을 검증 중이다.

 

향후 포털사, 자동차회사, 로봇제조 회사 등에 추가 기술이전을 계획 중이다.

 

핵심특허는 NPU의 구조설계와 관련된 부분으로, ETRI 연구진이 개발 및 보유한 순수 국내 기술이다.

 

연구진은 향후 추론과 학습을 동시에 가능한 칩을 만드는 게 최종 목표라고 밝혔다.

 

이를 위해 3년내 현재보다 10배 연산능력이 뛰어난 120TF 수준의 칩을 만들 계획이다.

 

본 연구는 과학기술정보통신부 “초절전 하이퍼바이저 기반 지능정보 매니코어프로세서 및  SW기술개발” 과제로 진행되어 국내·외 특허출원 31건, SCI 논문 6건 등을 발표해 우수성을 인정받았다. <보도자료 본문 끝>

TOP