main contents

ETRI

ENG

ETRI  45 th Anniversary

MENU
× ETRI 45주년 한눈에 보는 ETRI의 역사 대한민국 ICT를 빛낸 연구자들 사진으로 보는 ETRI 45년 ETRI 45년, 45개의 연구성과 숫자로 보는 ETRI 45년

SF 영화 속 만능 비서를
구현해나가는 연구

자연어 심층질의응답기술 ‘엑소브레인’

엑소브레인이 지난 2016년 EBS 장학퀴즈에서 우승한 이후 2017년부터 70건의 기술이전 및 사업화로 성과로 99억 원의 매출액을 달성했다. 최근에는 장학퀴즈와 같이 단답형 답변뿐만 아니라 서술형이 가능한 심층 질의응답 기술개발에도 성공했다. 현재는 전문용어와 한자어가 많은 법률 분야에서 활용되고 있다. 가령 “민식이법에서 어린이보호구역의 규정 속도는?”이라고 엑소브레인에 물어보면, “시속 30킬로미터 이내입니다. (근거: 도로교통법, 제2장 보행자의 통행방법, 제12조 어린이 보호구역의 지정 및 관리)”라고 답한다.

• • •

고난이도 서술형
질의응답이 가능한 기술

우리의 영원한 히어로 ‘아이언맨’에게 슈트만큼이나 없어서는 안 되는 것이 하나 있다. 바로 인공지능 비서 ‘자비스’다. 자비스와 같이 SF 영화 속에 등장하던 인공지능 비서는 최근 스마트폰에 적용되는 등 많은 발전을 이루어 왔다. 그러나 현재의 인공지능 서비스는 단순한 문서를 찾아주는 웹 검색 기능이나 단답형으로 응답하는 수준에 그쳤다.

이러한 기술적 한계를 극복하고자 최근 국내 연구진이 추진하는 혁신성장동력 프로젝트인 ‘엑소브레인 사업’을 통해 최첨단 언어 인공지능 기술을 상용화하는 데 성공했다. 이로써 AI 비서, 자연어 질의응답, 지능형 검색, 빅데이터 분석 등 한국어를 활용한 인공지능 서비스 개발에 탄력이 붙을 전망이다.

이 기술은 단순히 문서를 찾아주는 웹 검색 기능이나 단답형으로 응답을 하는 수준을 넘어 고난이도 서술형 질의응답이 가능하다. 이를 활용해 ‘일반상식 심층 질의응답 기술’과 ‘법령지식 심층 질의응답 기술’ 서비스를 개발한 결과, 성공적인 상용화로 이어질 수 있었다.

한컴오피스 2020
지식검색 기능으로 탑재되다

연구진이 개발한 일반상식 심층 질의응답 기술은 위키백과를 분석하여 관련된 정답을 찾아준다. 즉, 기계가 문제 유형을 판별한 뒤 유형별로 최적화된 해법을 적용하여 정답을 찾아내는 방식이다. 이 기술은 기존 단어 일치를 기반으로 문서를 찾아주는 웹 검색을 뛰어넘는다. 컴퓨터가 사람이 사용하는 언어를 이해하고, 주어진 질문에 올바른 정답을 추론하는 기술이다. 이를 위해 연구진은 심볼릭 기반 언어이해 기술과 KorBERT 딥러닝(뉴럴) 언어모델 기술을 이용한 뉴럴-심볼릭 하이브리드 질의응답 기술을 개발하였고, 이를 일반분야 및 법령 분야에 성공적으로 적용하였다.

엑소브레인 일반분야 질의응답 기술은 지난해 9월 10일 공개한 최신 ‘한컴오피스 2020’에 지식검색 기능으로 탑재되었다. 사용자는 문서 편집 중 모르는 내용을 한컴 지식검색에 입력하면, 해당 질문에 대한 정답을 얻고 문서 편집에 반영할 수 있다. ㈜한글과컴퓨터사는 일반상식 분야 문제를 대상으로 엑소브레인을 구글 서비스와 비교한 결과, 엑소브레인이 10% 이상 높은 성능을 보였다고 밝혔다.

ETRI가 개발한 ‘엑소브레인(Exobrain)’은 현재 ‘한컴오피스 2020’에 탑재되는 등 이미 상용화가 이뤄진 인공지능으로 ▲언어분석 기술 ▲딥러닝 언어모델 기술 ▲질의응답 기술 등이 적용되었다. 예컨대, ‘패션검색’을 주제로 AI 서비스를 하기 위해선 기존에는 언어처리 기술 준비작업이 만만치 않았으나 ETRI 엑소브레인 API를 활용하면 서비스에 더 집중할 수 있게 되는 것이다.

ETRI가 공개한 구어체 언어분석 기술은 크게 ▲형태소분석 기술과 ▲개체명 인식 기술 두 가지이다. ETRI가 공개한 기술은 TTA 표준 가이드라인을 따르며, 형태소 태그는 47개, 개체명 태그는 146개다. 형태소분석 기술은 한국어 의미의 최소 단위를 분석하는 기술로 한국어 처리에 필수적으로 활용된다.

SF 영화 속 과학기술을
구현해나가는 ETRI

ETRI 연구진은 구어체 언어분석 API와 더불어 기존 대비 성능을 개선한 문어체 언어분석 API도 추가로 공개했다. 추가로 공개된 API는 형태소분석과 개체명 인식 기술이 각각 96.80%, 89.40%의 높은 정확도를 보였다.

ETRI 언어지능연구실 임준호 박사는 “기존 엑소브레인 언어분석 기술이 백과사전 및 법령을 분석하기 위한 목적으로 개발되었음에도 구어체 분야에 많이 적용되고 있었다. 이번 구어체 언어분석 API 공개로 언어분석의 정확도 및 신뢰도를 제고해 국내 인공지능 시장이 더욱 활성화되길 기대한다.”라고 밝혔다.

또한, 엑소브레인 법령 분야 질의응답 기술은 컴퓨터가 전문용어 및 한자어가 많은 법령 분야 지식을 이해하여 사용자의 질문에 답변하는 기술로, 고난이도로 평가되는 서술형 답변이 많은 점이 특징이다. 엑소브레인 법령 분야 질의응답 기술은 국회도서관 및 국가과학기술연구회와 실증테스트를 성공적으로 마무리하여 2020년도에 기술을 도입했다.

엑소브레인 사업단은 최근 3년간 기술이전 22건과 사업화 17건을 달성하여 외산 인공지능 솔루션의 국내시장 잠식을 막는 동시에 응용 서비스의 폭을 넓히는 데 힘쓰고 있다. 추후 딥러닝 언어모델의 지속적인 성능 개선 및 추가 공개를 통해 AI 기술 고도화 및 플랫폼 개발에 기여할 계획이다. 이처럼 SF 영화 속 과학기술이 현실로 구현하기 위한 ETRI의 노력은 계속된다.

45개의 연구성과 목록보기