HWP문서[ETRI 보도자료] ETRI, AI반도체 플랫폼 개발 및 최신기술 공유_F.hwp

닫기

Embargo

배포일자 : 2025.7.17.(목)

배포번호 : 2025-54호

인공지능컴퓨팅연구소

온디바이스AI연구본부장

정영준(042-860-6397)

E-mail : jjing@etri.re.kr

온디바이스AI연구본부

온디바이스시스템SW연구실장

강성주(042-860-5881)

E-mail : sjkang@etri.re.kr

온디바이스시스템SW연구실

선임연구원

권용인(042-860-6323)

E-mail : yongin.kwon@etri.re.kr

대외협력본부

홍보실장

정길호(042-860-0670)

E-mail : khchong@etri.re.kr

홍보실

선임행정원

김민규(042-860-0681)

E-mail : kakapow@etri.re.kr

매수 : 보도자료 3매(참고자료 4매, 사진자료 9매)

배포처 : ETRI 홍보실

ETRI, AI 반도체 플랫폼 개발 및 최신기술 공유

- 반도체공학회서 AI 반도체 SW플랫폼 워크샵 및 설계 경진대회

- AI 반도체 융합 핵심기술 분야 미래 발전 방향 모색의 장 마련

국내 연구진이 AI 반도체 소프트웨어 플랫폼의 최신 기술을 공유하고, 차세대 인재를 발굴하기 위한 설계 경진대회를 개최했다. 이를 통해 국내 AI 반도체 생태계 활성화와 고급 인력 양성에 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)이 개발한 모듈형 엣지 AI 반도체 플랫폼 기술RISC-V 기반 개방형 아키텍처와 자체 개발된 MLIR 기반 컴파일러 기술을 결합한 하드웨어와 소프트웨어의 통합설계 기술이다.

이는 기존 상용 기술 대비 접근성과 확장성이 탁월한 오픈소스 기반 설계 방식이다. 국내 엣지 AI 반도체 생태계 활성화에 기여할 수 있는 기술적 가치가 매우 높은 것으로 평가되고 있다.

특히 기존 SoC 대비 연산기, 메모리, DMA 등을 모듈화하여 성능 수준과 응용 목적에 맞도록 조합할 수 있는 구조이기 때문에, 다양한 엣지 AI 환경과 NPU 제약에 유연하게 대처할 수 있다.

따라서 새로운 NPU가 추가되더라도 백엔드 모듈만 교체하면 적용할 수 있어서 특정 하드웨어에 종속되지 않고, 유지 보수성과 구조 확장성이 뛰어나고, 공개 저장소와 연계한 오픈소스 생태계 확장에도 유리하다. 또한 고급 경량화를 포함하는 컴파일러 기반 최적화 기술이 포함되어, 기존 상용 툴체인 대비 더 높은 성능과 정밀도 조절 유연성을 가진다.

한편, 이러한 기술의 활용 가능성은 지난 6월에 있었던 ETRI 컨퍼런스를 통해 실증 사례로도 소개되었다. 연구진은 외부 통신 없이 온디바이스 AI만으로 복잡한 보행로 상황을 설명하는 가이드독 로봇을 선보이며, 모듈형 엣지 AI 반도체 플랫폼의 실효성과 확장성을 입증해 보였다.

시각장애인을 보조하는 안내 로봇이라는 실제 응용 사례를 통해, 고성능 AI 연산이 제한된 엣지 환경에서도 안정적이고 신뢰도 높은 서비스가 가능하다는 점을 강조했다.

동 기술의 개발 현황 공유와 차세대 인재 발굴을 위하여, ETRI는 2025년도 반도체공학회 하계종합학술대회에서 AI반도체 SW플랫폼 워크샵 및 설계 경진대회를 개최해 미래 발전방향을 모색하는 시간을 가졌다고 밝혔다.

이번 워크숍에서는 AI 반도체 소프트웨어 플랫폼과 관련된 최신 기술 동향과 연구 성과가 공유됐다.

먼저, Beyond Silicon: NPU를 위한 소프트웨어 생태계발표에서는 AI 반도체가 실제 산업에 적용되기 위해서 소프트웨어 생태계, 특히 오픈소스 기반의 개발 환경이 중요하다는 점이 강조됐다. 국산 NPU를 위한 오픈소스 기반 대규모 언어모델(LLM) 서빙 라이브러리 개발 사례도 함께 소개돼 눈길을 끌었다.

이어 이기종 시스템에서의 DNN 스케줄링 최적화발표에서는 CPU, GPU 등 다양한 연산 장치가 혼합된 시스템에서 딥러닝 모델의 실행 속도를 높이기 위한 스케줄링 기법이 발표됐다. 모델 구조와 연산 자원의 특성을 고려해 병렬 처리 효율을 높이는 전략이 소개됐다.

리벨리온의 PyTorch 기술 개발 방향발표에서는 PyTorch 프레임워크를 기반으로 한 그래프 모드 및 즉시 실행 모드(eager mode) 개발 현황과, AI 산 최적화를 위한 Triton 커널 작성 기술, 고속 LLM 실행을 위한 vLLM 지원 기술 등이 소개됐다.

마지막으로, 경량화된 LLM의 성능 평가발표에서는 최신 거대 언어모델에 경량화 기법을 적용한 사례와 함께, 성능 저하 원인 및 실무 적용 시 고려사항이 설명됐다. 특히, 모델 크기나 과제 난이도에 따라 성능 변화가 어떻게 나타나는지에 대한 분석을 통해, 경량화 모델 활용 시 주의할 점이 제시됐다.

이와 함께, 대학생·대학원생을 대상으로 한 ARX/RVX 기반 AI 반도체 설계 경진대회도 성황리에 진행됐다. 해당 플랫폼은 RISC-V 기반 칩에 AI 산 가속기(ARX)를 결합한 설계 환경으로, 중소기업 및 스타트업, 대학에서도 쉽게 활용할 수 있는 기술로 평가받고 있다. 본 대회에는 약 40명이 참여해 설계 역량을 뽐냈으며, 현재는 혁신융합대학 1,400여 명의 디지털시스템설계 교육에도 활용 중이다.

주관인 AI반도체SW플랫폼연구회ETRI가 주도적으로 운영하는데 AI 반도체 기술의 개발 방향성과 소프트웨어 플랫폼화를 통해 산··연이 함께 활용할 수 있는 기반 마련을 목표로 활동하고 있다.

연구회는 특히 AI 데이터센터, 로봇, 자동차, XR 등 다양한 수요 분야에 적용 가능한 국산 AI 반도체 기술을 중심으로 특화 모델 개발, 모델 경량화, AI 컴파일러 및 컴퓨팅 기술을 지속적으로 논의·공유하고 있다.

ETRI 정영준 온디바이스AI연구본부장은 해외 상용 기술에 의존하던 핵심 기술 영역을 국산화함으로써 기술 수입 의존 구조를 개선하고 중소 기업의 시장 진입 기회를 확대시켜, AI 반도체 생태계와 고급 인력 양성의 기반이 되기를 기대한다고 밝혔다.

한편, 본 과제는 과학기술정보통신부 정보통신기획평가원 인공지능반도체 SW 통합플랫폼 기술개발사업의 일환으로, 서울대, 연세대, 중앙대, 성균관대, 한국전자기술연구원, 알티스트, 노타 등과 공동 수행 중이다.

2023년부터 시작된 1단계 사업을 통해 현재까지 국내 특허 17건, 국제특허 8건, 학술 성과 31건의 성과를 달성했다. 또한 기술 확산을 위해 오픈소스 저장소(https://gitlab.com/ones-ai)를 운영하며 관련 소스코드를 공개하고 있다. <보도자료 본문 끝>

용어설명

1) 모듈형 엣지 AI 반도체 플랫폼 기술 : ETRI의 모듈형 NPU 및 개방형 엣지 AI SoC 프로토타입 자동생성기를 기반으로 엣지 AI 응용의 요구사항에 따른 HW-SW 최적화가 가능한 플랫폼 기술명

2) RISC-V 기반 개방형 아키텍처 : 국제 RISC-V 재단에 의해 표준화된 축소 명령 세트 컴퓨터 기반의 개방형 명령 세트 아키텍처 기술명

3) MLIR 기반 컴파일러 기술 : Multi-Level Intermediate Representation으로 다양한 도메인에 최적화된 다단계 중간표현을 통한 유연한 컴파일러 프레임워크 기술명

4) DMA 등을 모듈화 : Direct Memory Access으로 CPU 개입 없이 고속으로 메모리 간 데이터 전송을 수행하는 기술을 범용성, 재사용성을 높이기 위해 모듈로 구성한 기술명

5) ARX : AI + RISC-V eXpressETRIRVX 기반 모듈형 NPU 개발이 가능한 AI SoC 설계 플랫폼 기술명

6) DNN : Deep Neural Network로 입력층과 출력층 사이에 다중의 은닉층을 포함하는 인공신경망 기술명

7) FPGA : Field Programmable Gate Array로 설계 가능한 논리 소자와 프로그래밍 가능한 회로가 포함되는 반도체 기술명

8) LLM : Large Language Model로 수많은 파라미터를 보유한 인공신경망으로 구성되는 거대 언어 모델 기술

9) NPU: Neural Processing Unit으로 인공신경망 연산을 위해 맞춤 유닛 기술명

10) RVX : RISC-V eXpressETRIRISC-V 기반 SoC 설계 플랫폼 기술명

11) SIMD : Single Instruction, Multiple Data로 하나의 명령어로 여러 값을 동시에 계산하는 병렬 컴퓨팅 기술명

12) SoC : 완전 구동이 가능한 제품, 시스템이 한 개의 칩에 구현하는 기술명

13) UAM : Urban Air Mobility로 하늘을 이동 경로로 활용하는 미래의 도시 교통 체계 기술명

14) XR : eXtended Reality로 증강 현실, 가상 현실, 혼합 현실을 포괄하는 기술명

참고1

개방형 엣지 AI SoC 플랫폼 개요

참고2

모듈형 NPU 특화 AI 모델최적화를 위한 컴파일러 기술 개념

참고3

AI반도체 SW플랫폼 연구회 개요

참고4

AI반도체SW플랫폼연구회 워크샵 프로그램

[AI반도체SW플랫폼연구회 워크숍] 프로그램

7/15(Tue.) 15:10-17:40, 2층 사파이어 3

좌장: 유미선 책임(ETRI)

시간

주제

발표자

15:10-15:20

인사말

ETRI

정영준 본부장

15:20-15:50

Beyond Silicon: NPU를 위한 소프트웨어 생태계의 중요성

스퀴즈비츠

김형준 대표

15:50-16:20

System Topology-aware Scheduling of Deep Neural Network Models on Heterogeneous Systems

연세대학교

박영준 교수

16:20-16:30

휴식

16:30-17:00

리벨리온의 PyTorch 관련 개발 방향

리벨리온

안민욱 박사

17:00-17:30

경량화된 LLM의 평가와 한계: 양자화 기법과 실제 성능의 균형

ETRI

이제민 선임

17:30-17:40

폐회