ETRI Webzine VOL.153 Special

VOL.153 May 2020

special

인공지능 반도체, 어디까지 왔을까?

인공지능은
전력을 얼마나
소모할까?
인공지능 시대를 앞당기기 위해서는 막대한 전력 소모 문제 해결이 관건이다. 전력 문제가 해결되지 않을 경우 사용자 빈부 차이가 AI 사용 격차로 나타날 수 있다는 지적도 나왔다. 이 때문에 구글은 물론 IBM 등 인공지능 선도 업체들은 인공지능 연구뿐 아니라 에너지 분야 연구에도 막대한 투자를 하고 있다.

2016년 3월 이세돌 9단과 바둑으로 격돌한 알파고는 정수(1, 2, 3…)로 초당 30조 개 연산을 해냈다. 그러나 인류를 이긴 계산 능력의 비결 뒤에는 대용량 서버와 엄청난 전력 소모가 있었다. 알파고는 1,202개의 중앙처리장치(CPU)와 176개의 그래픽처리장치(GPU)를 사용했다. 이 같은 시스템을 가동하기 위해서는 단순 계산으로 약 170kW의 전력(1202x100W+176x300W)이 필요하다. 인간의 뇌가 약 20W로 가동되는 것과 비교하면 엄청난 비효율이 발생한다. 자칫 인공지능의 편익보다 에너지 비용이 더 큰 상황을 초래할 수 있다는 지적도 나온다.

과거에는 빠른 계산이 중요했지만, 최근에는 전력 사용량을 줄이는 컴퓨팅 기술이 관건이라고 전문가들은 입을 모은다. 인공지능을 각 가정에 보급한다면, 전기 사용료가 엄청날 것이기 때문에 빈부 차이가 정보 취득 격차로 이어질 수 있다는 우려도 있다.

그렇기 때문에 구글과 IBM이 진행하고 있는 에너지 연구에 관심이 쏠린다. IBM의 인공지능 왓슨 프로젝트가 보편화되기 위해서는 많은 전력이 필요하다. 이에 IBM은 꿈의 배터리인 리튬공기전지 프로젝트(Battery 500)를 2009년부터 진행해 오고 있다. 리튬이온전지를 사용하는 지금의 모바일 환경에서 인공지능은 사실상 부팅도 어렵기 때문에 리튬과 산소의 화학반응을 통해 에너지 효율을 획기적으로 높인 리튬공기전지 같이 전력 소모를 최소화하는 기술이 필요하다.

구글은 2014년 전기 인버터 개발에 나섰다. 인버터는 태양광을 실생활에서 사용할 수 있는 전기 형태로 바꿔주는 장치다. 인공지능의 모태인 데이터센터를 관리하기 위해서는 막대한 에너지가 필요한데, 이를 태양광 등 친환경 에너지로 점진적으로 대체하겠다는 취지다.

01

NPU라 불리는 딥 러닝 계산에
최적화된 칩을 개발한 ETRI

두 마리 토끼를
한 번에 ...
AI 반도체 개발
국내에서는 지난 2월 말, ETRI가 10년 넘게 축적한 노하우를 바탕으로 NPU(Neural Processing Unit)를 개발했다. 바로 고성능 프로세서인 알데바란의 새 버전 ‘AB9’ 칩이다. 연구진은 기존 상용 제품에 비해 연산 능력이 뛰어나면서 전력 소모량은 대폭 낮췄다. 이동통신, 자율주행차, 지능형 로봇, 드론 등에 적용이 예상되고 우리나라 비메모리 반도체 산업의 발전에 획기적 전기가 될 전망이다.NPU는 구글의 딥마인드 ‘알파고’처럼 사람의 학습 및 추론 과정을 재현 및 가속하는 반도체 기술이다.

연구진이 개발한 반도체 칩은 40테라플롭스(TFLOPS) 수준의 연산 능력을 보여주면서도 전력은 15와트(W)만 든다. 기존 상용제품보다 전력당 연산 능력도 최대 25배로 높이고, 전력 소모량은 20배 낮춘 셈이다.

가격 경쟁력도 우수하다. 기존 상용제품인 GPU 칩 하나의 경우 800만 원~1,000만 원대로 고가였으나 연구진의 칩은 수십만 원대 가격 책정이 예상되어 최대 50배나 저렴하다.
알데바란

(Aldebaran)

ETRI가 버전을 거듭하며 개발해온
반도체 프로세서(CPU) 브랜드 이름

NPU

(Neural Processing Unit)

신경망처리장치로 뇌 신경망과
비슷한 기능을 할 수 있게 하는 기술

추론과 학습이 동시에 가능한 칩을 만들어가는 지능형반도체연구본부

추론과 학습,
동시에 가능한 칩
연구진은 28나노 공정을 적용해 칩 소형화도 이뤘다. 5백 원 동전 크기 정도(17mm x 23mm)의 크기의 칩만으로 높은 연산 능력을 구현한다. 딥러닝 연산에 특화하여 개발하였기에 응용 분야도 다양하고 상용화도 쉽다. 이처럼 대용량 데이터를 처리하기 위한 연산 능력 고도화는 4차 산업혁명 시대에 핵심기술이 될 전망이다.

연구진은 전력 효율 극대화를 위한 시뮬레이션을 통해 크기와 행렬 연산기 개수를 결정했고, 모듈별 작동 시간 등을 병렬적으로 분배하는 등 연구 핵심 역량을 최적화 설계에 집중했다. 향후 본 칩은 보드에 다양한 형태로 올려져 데이터센터 등에서 인공지능 관련 서비스 서버 등에 활용될 계획이다. 특히 ETRI는 본 칩 하나를 무인자율주행차에 내장하면 카메라 영상을 받아 보행자, 차선, 신호등 인식 등 무인 이동과 안전 관련 제어가 동시에 가능한 성능 수준이라고 말했다.

02

5백 원 동전 크기(17mm x 23mm)로
높은 연산 능력을 구현하는 ETRI의
알데바란 칩

03

15W 전력으로 40TFLOPS 수준의
연산 능력을 보여주는 알데바란

이처럼 연구진의 인공지능 반도체 칩은 인공지능 스피커, 무인자율주행차를 비롯해 고성능 서버, 원격 진료, 금융 서비스, 안면/행동 인식 등에 활용될 것으로 본다. 아울러 딥러닝이 적용된 분야에서 부품을 국산화하고, 부가가치를 창출하는 데 큰 도움이 될 전망이다.

연구진은 향후 추론과 학습을 동시에 가능한 칩을 만드는 게 최종 목표다. 현재 우리 일상 속 인공지능은 날씨가 어떠냐고 물었을 때 대답해주는 단순 형태의 추론이다. 그러나 ETRI는 기후변화 문제와 날씨를 연관 짓고 토론할 수 있는 정도로 고차원적인 대화가 가능하도록 학습 기능을 발달시켜 나가고 있다.
테라플롭스

(TFLOPS)

Tera Floating Point Operations Per Second.
초당 연산 수행 횟수를 알리는 지표로 테라플롭스는
1초에 1조 번 계산 가능한 수준을 의미