[ETRI 보도자료] ETRI, 100B급 멀티모달 모델 개발 본격 착수_251105_F.hwp
Embargo |
신문: 11.10.(월) 조간 / 온라인 : 11.9.(일) 정오 |
|
||||
배포일자 : 2025.11.9.(일) |
배포번호 : 2025-82호 |
|||||
문의 |
인공지능창의연구소 |
지능정보연구본부장 |
권오욱(042-860-6513) |
E-mail : ohwoog@etri.re.kr |
||
지능정보연구본부 |
언어지능연구실장 |
임수종(042-860-1297) |
E-mail : isj@etri.re.kr |
|||
언어지능연구실 |
책임연구원 |
신종훈(042-860-5161) |
E-mail : jhshin82@etri.re.kr |
|||
대외협력본부 |
홍보실장 |
정길호(042-860-0670) |
E-mail : khchong@etri.re.kr |
|||
홍보실 |
행정원 |
이서진(042-860-0635) |
E-mail : seojin@etri.re.kr |
|||
매수 : 보도자료 3매(참고자료 4매, 사진자료 6매) |
배포처 : ETRI 홍보실 |
|||||
ETRI, 100B급 파운데이션 모델 개발 본격 착수
- 출연연 유일 국가대표 AI 파운데이션 모델 개발팀 선정
- 산업·공공·학술 적용 가능한 AI 핵심 기술개발 목표
대한민국 대표 정부출연연구기관이 대한민국의 인공지능 주권 확보를 위한 핵심 연구 주체로 자리매김하고 있다.
한국전자통신연구원(ETRI)은 과학기술정보통신부가 추진하는 독자 AI 파운데이션 모델 개발 사업에서 엔씨(NC) AI 컨소시엄으로 국가대표 5개 연구팀에 선정되어 지난 8월부터 본격적인 AI 연구에 착수했다고 밝혔다.
특히 정부출연연구기관으로는 유일하게 선정되어 국가 연구기관으로서의 위상을 공고히 하고 연구계의 대표성을 확보했다는 점에서 큰 의미가 있다.
ETRI는 엔씨(NC) AI가 주관하는 컨소시엄에 참여해 ‘산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발’과제를 수행하고 있다.
이 과제는 산업 현장에서 활용 가능한 대규모 인공지능 모델을 자체 기술로 구현하기 위한 핵심 프로젝트로, 언어·음성·영상 등 다양한 데이터를 통합 처리할 수 있는 멀티 모달 AI 기술 확보를 목표로 한다. 산업 현장 중심의 적용성을 확보함으로써 향후 제조·의료·교육·문화 등 주요 산업 전반의 AI 혁신을 가속화할 것으로 기대된다.
현재 ETRI는 한국지능정보사회진흥원(NIA)의 데이터 지원과 정보통신산업진흥원(NIPA)의 GPU 자원 지원을 기반으로 대규모 모델 개발에 필요한 안정적 연구 인프라를 구축했다. 이를 통해 100B(1,000억 매개변수)급 모델의 사전학습을 순조롭게 진행하고 있으며, 향후 독자 기술 기반 초거대 AI 모델 개발의 국내 기술 자립화를 견인할 것으로 기대된다.
이번 사업은 국가 AI 경쟁력을 강화하기 위한 전략 프로젝트로, 대규모 언어모델(LLM)과 멀티모달 AI 기술을 독자적으로 확보해 산업·공공·학술 등 전 분야에 걸쳐 활용할 수 있는 기반 기술을 육성하는 것을 목표로 한다.
ETRI 지능정보연구본부는 이번 연구에 그간 수행해 온 자체 국책과제의 핵심 기술을 적극 접목하고 있다.
언어지능연구실은 그동안 ‘복합인공지능 원천기술 연구’를 통해 개발한 언어모델 ‘Eagle(이글)’의 개념적 이해 및 추론 능력, ‘생성형 언어모델의 최신성 학습 기술’의 희소 어댑터(sparse adapter) 기반 지속학습 기술을 대규모 모델에 적용해 모델의 최신성과 효율성을 강화하고 있다.
체화복합지능연구실은 ‘퇴행성 뇌기능 저하 평가 기술’과 ‘다화자 대화 모델링 기술’등 기존 연구성과를 토대로 음성·영상 중심의 멀티모달 AI 모델을 개발하고 있으며, 이를 범용 파운데이션 모델로 확장할 계획이다.
시각지능연구실 또한 텍스트 기반 이미지 생성 모델 ‘KOALA(코알라)’, 시각언어 질의응답 모델 ‘Ko-LLaVA(코라바)’등을 통해 축적한 기술을 바탕으로 비전-언어 융합 생성 성능과 AI 안전성을 동시에 강화하는 연구를 추진하고 있다.
ETRI 과제책임자인 권오욱 지능정보연구본부장은 “ETRI가 정부출연연구원 중 유일하게 국가대표 연구팀으로 선정된 이후, 초기의 자원 확보 난관을 극복하고 100B급 모델 사전학습을 안정적으로 수행하고 있다. NC AI 컨소시엄과의 긴밀한 협력을 통해 산업 AI 전환을 이끄는 확장 가능하고 신뢰성 높은 멀티모달 파운데이션 모델을 개발해 글로벌 최고 수준의 기술력 확보에 기여하겠다”고 밝혔다.
ETRI는 이번 선정을 계기로 기술개발–대규모 사전학습–산업 실증으로 이어지는 단계적 로드맵을 본격 추진하고 있다. NIA와 NIPA의 지원을 기반으로 한 100B급 모델 개발이 가시적 성과를 내면서, 대한민국이 독자적 초거대 AI 기술 역량을 확보하는 데 중요한 전환점을 마련할 것으로 기대된다.
ETRI는 앞으로도 국가 차원의 AI 생태계 혁신과 산업 전반의 지능화 전환을 이끌며, 대한민국이 글로벌 AI 기술 강국으로 도약하는 데 중추적 역할을 할 것으로 기대된다. <보도자료 본문 끝>
용어설명 |
1) AI 파운데이션 모델: 언어‧이미지‧음성 등 다양한 대규모 데이터를 이용하여 학습한 범용 인공지능 모델로 여러 분야의 특화 AI를 빠르고 효율적으로 개발할 수 있는 기반(Foundation)역할을 하는 AI 핵심 인프라
2) 100B(100 billion, 1,000억 매개변수)급: 매개변수는 AI 모델이 학습을 통해 조정하는 지능의 단위로 많을수록 더 복잡한 패턴과 문맥을 기억, 이해할 수 있음. 이는 인간 수준의 언어 이해‧추론‧창의적 생성이 가능한 대규모 파운데이션 모델의 기준 수준으로 글로벌 빅테크 기업들이 개발중인 최상위 모델과 동일한 수준의 성능
3) 대규모 언어모델(LLM): 방대한 양의 텍스트 데이터를 학습해 인간 언어를 이해하고 생성할 수 있는 인공지능 모델로 가장 유명해진 모델로는 GPT 계열의 모델을 들 수 있으며, 인공지능 혁심의 핵심 기술 기반으로 자리 잡고 있으며, 이를 기반으로 확장한 파운데이션 모델이 인공지능의 발전을 앞당기고 있음
4) 멀티모달 AI 기술: 텍스트, 이미지, 음성, 영상 등 서로 다른 형태의 데이터를 함께 이해하고 처리하는 인공지능 기술로, 다양한 모달리티 간 의미를 연결해 종합적인 판단과 추론을 수행하며 인간과 유사한 다감각적 인식 능력을 구현한 AI 기술
5) 언어모델 ‘Eagle(이글)’: ETRI가 개발한 한국어 중심의 언어모델로(26년 이후 멀티모달 파운데이션 모델로 전환 예정), 한국어 ‧수학‧정량 추론 성능을 강화하면서도 경량화와 효율성을 중시해, 연구사업현장에서 손쉽게 사용할 수 있도록 설계된 것이 특징. 현재 1B, 3B 모델이 공개되어 있고 25년말까지 6.7B급 모델이 공개될 예정
6) 희소 어댑터(sparse adapter): 대형 파운데이션 모델의 매개변수 전체를 업데이트 하지 않고, 일부 중요하거나 선택된 매개변수 일부만 학습하는 방식의 어댑터 기법으로, 모델 전체 중 소수의 활성 연결 (매개변수 경로)만 조정하는 것으로 학습 효율을 높이고 메모리 및 계산 비용을 절감하는 기술
7) KOALA(코알라): 텍스트를 입력하면 고해상도 이미지를 빠르고 효율적으로 생성하며 스테이블 디퓨전 기술을 최적화해 연산 비용을 줄이면서도 높은 품질의 결과를 제공하는 지식증류 기반의 경량 텍스트-이미지 생성 AI 모델
(https://huggingface.co/spaces/etri-vilab/KOALA)
8) Ko-LLaVA(코라바): 한글 기반 시각-언어 멀티모달 모델로, 이미지와 텍스트를 함께 이해하고 한국어로 질의응답을 수행하며 LLaVA 구조를 한국어 데이터로 학습해 시각적 언어 이해 능력을 강화한 AI 모델
(https://huggingface.co/spaces/etri-vilab/Ko-LLaVA)
참고1 |
ETRI AI 연구개발 동향 (1) - 생성형 언어모델 기술 |
□ 생성형 언어모델 기술 개발 동향 – ETRI 언어지능연구실
- ETRI 언어지능연구실에서는 ‘사람처럼 개념적으로 이해/추론이 가능한 복합인공지능 원천기술 연구’ 개발 과제를 통해 언어지능을 포함한 수리-논리 지능, 시공간 지능 등이 결합된 복합지능 기술 개발을 추진하고 있으며, 이를 위한 기반이 되는 파운데이션 모델 EAGLE(ETRI Advanced Generative Language Engine)을 개발, 공개하고 있음 - 이를 바탕으로 수학 추론 및 수학 AI 튜터링을 위한 복합지능 대화 시스템을 개발하고 있으며, 해당 기술을 확장하여 멀티모달 콘텐츠 기반 수학 AI 튜터 서비스를 실증 예정 |
|
|
<군집화된 소형 생성 언어모델을 결합한 복합지능 대화 시스템 구조도 및 수학 튜터링 AI 서비스 형상> |
|
- 또한, ‘생성형 언어모델의 지속 가능성과 시간의 흐름에 따른 최신성 반영을 위한 학습 및 활용기술’ 과제를 통해 학습 이후의 새로운 지식을 내재화할 수 있는 Sparse adapter 기반의 지속 학습 기술과 파운데이션 모델 지속 편집 기술을 개발하여 최신 정보에 빠르게 대응할 수 있는 추론 기술을 개발하고 있음 |
|
|
<최신성 학습을 위한 Sparse Adapter 기반 지속 학습 및 최적화 기술 개념도> |
|
참고2 |
ETRI AI 연구개발 동향 (2) - 멀티모달 기술(체화복합지능연구실) |
□ 멀티모달 기술 개발 동향 – ETRI 체화복합지능연구실
- ETRI 체화복합지능연구실에서는 ‘멀티모달 기반 퇴행성 뇌기능 저하 평가 기술’과 회의, 대규모 행사 환경 등 고도의 잡음 및 다화자 환경에서 정확하게 음성을 인식하고, 그에 맞는 대화 응답을 생성하는 ‘다화자 대화 모델링 기술’ 개발을 진행하고 있음 - ‘다화자 대화 모델링 기술’은 휴머노이드 로봇에 탑재하여, ETRI 컨퍼런스 2025년에 일반 공개, 시연한 바 있음 |
<음성/시각 정보 기반의 멀티모달 교감 대화 시스템 시연>
참고3 |
ETRI AI 연구개발 동향 (3) - 멀티모달 기술(시각지능연구실) |
□ 멀티모달 기술 개발 동향 – ETRI 시각지능연구실
- ETRI 시각지능연구실에서는 시각 및 언어 정보를 바탕으로 텍스트에서 이지미를 빠르게 생성하는 코알라(KOALA) 기술과 이미지와 비디오를 읽어 대화 및 질의응답을 수행하는 코라바(Ko-LLaVA) 기술을 연구 개발함 |
참고4 |
독자 AI 파운데이션 모델 앰블럼 |
정예 국가대표로 선정된 5개 연구팀만 사용 가능한 앰블럼