HWP문서[ETRI 보도자료] ETRI, AI 의료기기 성능평가 국제표준화 시동_fin.hwp

닫기

Embargo

배포 이후

배포일자 : 2021.12.14.(화)

배포번호 : 2021-81호

지능화융합연구소

표준연구본부장

강신각(042-860-6117)

E-mail : sgkang@etri.re.kr

표준연구본부

지능정보산업표준연구실장

이강찬(042-860-6659)

E-mail : chan@etri.re.kr

지능정보산업표준연구실

책임연구원

전종홍(042-860-5333)

E-mail : hollobit@etri.re.kr

홍보실

실장

정길호(042-860-0670)

E-mail : khchong@etri.re.kr

홍보실

담당

백지헌(042-860-0823)

E-mail : ctabk@etri.re.kr

매수 : 보도자료 3매(사진 4매, 참고자료 7매)

배포처 : ETRI 홍보실

ETRI, AI 의료기기 성능평가 국제표준화 시동

- IEC TC 62에서 AI 의료기기 분야 최초 표준제안·승인

- 신뢰할 수 있는 인공지능 정조준, 핵심표준 주도할 것

국내 연구진이 인공지능(AI) 의료기기 성능평가 및 신뢰성 확보를 위한 국제표준 개발을 시작했다. 표준화된 성능·품질검증 체계 마련으로 의료 AI 확산을 위한 탄탄한 밑거름이 될 전망이다.

한국전자통신연구원(ETRI)은 지난달 26일, 국제전기표준화위원회(IEC) 의료용 전기기기(TC 62) 기술위원회에서인공지능/머신러닝 기반 의료기기에 대한 성능평가 프로세스국제표준 신규제안 1건이 승인되었다고 밝혔다.

연구진이 제안한 표준은 6주간 진행된 IEC TC 62 기술위원회 소속 30개국이 참여하여 이뤄진 투표에서 만장일치로 승인되었다. 특히, IEC TC 62에서 AI 의료기기 표준 승인이 이루어진 것은 처음이다. 국제표준 제정을 위한 첫걸음을 뗀 셈이다.

최근 의료 분야에서는 AI 기술을 도입해 CT, MRI, 심전도 등 양질의 의료 데이터를 분석하여 질병의 진단 및 예측을 돕는 시도가 활발해지고 있다. [참고 1]

의료기기는 안전성과 유효성이 보장되어야 하기에 객관적인 평가와 검증절차가 필수적이다. 그러나 AI가 탑재된 의료기기는 표준화된 성능평가 체계가 없어 의료기기 업체의 자체 임상시험 결과와 기술문서자료를 준으로 허가 및 심사를 받아왔다. [참고 2]

이로 인해 업체마다 평가 절차와 기준이 달라 객관적인 성능 비교가 어렵고 테스트·실제 성능 차이가 발생하는 등 산업화가 어려웠다. 평가 기준의 필요성이 꾸준히 제기된 이유다.

이번 국제표준 신규제안 승인으로 연구개발 및 인허가 공통 기준이 수립되면 더욱 안전하고 정확한 인공지능 의료시대를 열 수 있다. 인허가에 필요한 시험 절차와 비용도 절감되어 시장이 빠르게 확대될 전망이며, 다른 AI 산업분야 성능과 품질평가 용도로도 손쉽게 확장할 수도 있다. [참고 3] [참고 4]

본격적인 표준 개발을 위해 이달 1일 미국 FDA, 중국 NIFDC 등 국제 의료기기 표준 전문가들이 참여하는 프로젝트 팀이 신설됐다. 프로젝트 팀 의장과 프로젝트 리더에는 ETRI 전종홍 책임연구원이 지명됐다. 표준 개발에는 약 3년이 소요될 것으로 내다봤다. [참고 5]

이 밖에도 ETRI는 종합적인 인공지능 성능평가 체계를 구축하기 위해 ISOIEC의 합동 기술위원회를 통해인공지능 시스템 테스팅국제표준과 시험용 데이터 표준 운영 절차서등 국제표준 2건도 이미 제안한 상태다.

연구진은 인공지능 의료기기 분야 국제 공통 가이드라인 제정 및 국내 표준화 경험을 바탕으로 IEC TC 62 산하 SNAIG 자문그룹 활동을 적극적으로 주도한 결과, 이번 국제표준화를 선도할 수 있었다고 밝혔다.

연구진은 내년 2월, 신규제안 2건에 대한 투표가 끝나면 표준화된 시험용 데이터 준비 - 성능·품질 평가 인공지능 시스템 시험으로 연계되는 인공지능 종합 평가체계를 위한 국제표준을 연이어 개발할 계획이다.

연구진은 이 표준들이 의료용 AI에만 국한되는 것이 아니라 유럽연합(EU), 미국 FDA 등에서 제안하는 인공지능 관련 규제 및 과학기술정보통신부에서 발표한신뢰할 수 있는 인공지능 실현의 기초가 될 것이라 예상했다.

ETRI 김명준 원장은ETRI는 신뢰할 수 있는 인공지능 실현에 필요한 기술과 표준 선도를 위해 계속 노력할 계획이며, 이를 통해 다가올 AI 패권 전쟁에서 우위를 점할 수 있도록 할 것이다.고 말했다.

식품의약품안전처 강영규 팀장은인공지능 의료기기 인허가가 많아지고 있는 상황에서 한국 주도로 성능평가 국제표준 개발을 선도하게 되었다는 데 매우 큰 의미가 있다. 국제 규제 조화를 위해 다른 국제표준화 기구와 협력을 더욱 강화해 나가겠다.고 말했다.

본 성과는범부처 전주기 의료기기 연구개발 사업의 일환으로 수행된 결과다. 사업에는 연세대 세브란스 병원 김휘영 교수, 서울여대 홍헬렌 교수, 인그래디언트 등이 참여했으며 40여 명의 산···병 자문위원단이 국제표준화에 도움을 제공하고 있다. <보도자료 본문 끝>

참고1

인공지능 산업 및 의료 인공지능 시장 전망

(출처: 식품의약품안전처, 2020 신개발 의료기기 보고서 등)

IDC는 2021년 '세계 인공지능 시장 전망 예측 (IImproved Growth for Global AI Market in 2021)'보고서에서 2024년까지 시장은 연평균 성장률(CAGR)이 17.5%이고 총 매출은 5,543억 달러(약 622조 원)에 달할 것이라고 예측 (IDC, 2021)

의료분야는 인공지능 기술의 도입이 가장 활발하게 이뤄지는 산업 중 하나이다. 인공지능 헬스케어(AI in Healthcare) 시장 규모는 2018년 약 2조 3천억 원(19억 달러), 2019년 약 3조원(25억 달러)이며 연평균 성장률 45.1%로 예상되어 2023년에는 약 14조 원(115억 달러)을 기록할 것으로 예상

헬스케어 시장 규모의 글로벌 인공 지능은 2020년에 67억 달러로 평가되었으며 2021년에서 2028년까지 41.8%의 CAGR(연간 복합 성장률)로 확장될 것으로 예상 (Grand View Research, 2021 보고서)

헬스케어 시장의 AI, 헬스케어 기기 기술 혁신으로 2027년까지 994억9100만 달러 도달 (Allied Market Research, 2021 보고서)

의료영상데이터 활용 인공지능 기반 독립형소프트웨어의료기기의 시장 규모는 2018년 약 1,100억 원(92백만 달러), 2019년 약 1,560억 원(126백만 달러)이며 연평균 성장률 42.2%예상되어 2023년에는 약 6,200억 원(518백만 달러)을 기록할 것으로 예상

생체데이터 활용 인공지능 기반 독립형소프트웨어의료기기의 시장 규모는 2018년 4,560억원(380백만 달러), 2019년 6,204억 원(517백만 달러)이며 연평균 성장률 46.7%로 예상되어 2023년에는 2조 9,748억 원(2,479백만 달러)을 기록할 것으로 예상

국내 인공지능·빅데이터 기반 독립형소프트웨어의료기기 등 인공지능 헬스케어 시장 규모는 2018년 약 410억 원, 2019년 약 554억 원이며 세계시장과 비슷한 연평균 성장률 44.60%로 예상되어 2023년에는 약 2,465억 원을 기록할 것으로 예상

참고2

인공지능 의료기기 성능평가

의료기기는 안전성과 유효성이 보장되어야 하기에, 이에 대한 평가와 검증이 필수적임.

- 안전성(Safety)은 허용될 수 있는 위험수준으로 정의하며, 기본안전(Basic Safety) 보장과 위험관리, 필수 성능(Essential Performance) 장과 위험관리를 포괄

- 기본안전은 물리적, 전기적 위험에 대한 관리, 필수성능은 기본안전 이외의 임상적 기능 수행과정에서 발생하는 위험에 대한 관리를 의미

식품의약품안전처는 2017년 세계 최초로 인공지능 의료기기에 대한 허가심사 가이드라인을 공개한 후, 추가 가이드라인들을 개발 제공 중

- 빅데이터 및 인공지능 기술이 적용된 의료기기 허가심사 가이드라인(’17.10 공개, ‘19.11 개정본 공개)

- 인공지능 기반 의료기기의 임상 유효성 평가 가이드라인 (’17.12 공개, ‘19.11 개정본 공개)

- 치매, 전립선암, 대장암 등의 인공지능(AI) 의료기기 소프트웨어 3종신속한 제품화를 위한 안전성 및 성능 평가 기준 공개 (’20.12)

인공지능 의료기기에 대한 허가심사를 위해서는 성능임상적 유효성검증이 필수 사항으로 요구

- 빅데이터 및 인공지능 기술이 적용된 의료기기의 성능 및 임상적 유효성 검증은 민감도(Sensitivity), 특이도(Specificity), 양성 예측도(Positive Predictive Value), 음성 예측도(Negative Predictive Value), ROC(Receiver Operating Characteristic) Curve, AUC(Area Under the Curve) 등의 항목을 이용하여 제품의 진단에 대한 정확도를 확인

- 성능 변경은 변경 허가 대상

- 학습 데이터의 변경에 의하여 진단의 정확도가 허가·인증 시 제시된 진단의 정확도 범위 미만으로 변경되는 경우는 변경허가인증에 대한 임상자료 심사 대상임

참고3

인공지능 의료기기 성능 평가 개념도

IEC TC 62에서 개발 시작한 인공지능 의료기기 성능 평가 프로세스 표준에서는 그림과 같은 성능 평가 체계 속에서 성능을 상세하게 분석

인공지능 의료기기의 성능(Performance)은 3대 성능요소(Performance element)를 기반으로 종합적으로 평가하는 것을 특징으로 함

- '임상 성능'은 임상 환경 또는 임상 프로세스에 적용시 연관된 결과를 산출하기 위한 측정 가능한 결과

- '분석 성능'이란 기술적 성능의 증거를 제공하는 측정 가능한 결과

- '과학적 타당성'은 해당 이론과 과정을 반복할 때 동일한 결과를 얻을 수 있는 재현성과 재구현성을 의미

성능 평가 프로세스는 PDCA 순환 구조 속에서 6가지 성능 평가 단계별 작업과 활동들을 수행하도록 구성

인공지능 의료기기 표준은 기존 의료기기 기본안전 및 필수성능 표준인 IEC 60601 시리즈, 의료용 소프트웨어 생애주기 관리 표준인 IEC 62304, 소프트웨어 품질 및 성능 평가 표준인 ISO/IEC 250XX, ISO/IEC/IEEE 29119 시리즈, IMDRF 표준들과 연계되어 있음.

참고4

성능평가 표준화 기대효과

인공지능/머신러닝 성능 평가는 [모델선정학습/훈련제품개발제품 인허가설치 및 운영사후관리] 등의 전과정에서 사용되는 가장 필수적인 품질평가 요소다.

그러나 현재는 표준화된 절차와 방법이 부재해 서로 다른 제조사/제품간 객관적인 성능 검증과 비교가 어려웠고, 국제표준화가 절실한 상황이었다.

이번 성능 평가 프로세스 표준화를 통해 예상되는 장점은 다음과 같다

- 인공지능 의료기기 연구개발과 인허가 과정에서 반드시 필요한 품질 및 성능 검증 과정을 표준 기반 절차를 통해 획기적으로 개선 가능

- 현재는 표준화된 성능 평가 체계가 없어 개별적 임상 시험 결과에만 의존해왔다면, 향후에는 표준 기반으로 제3자 시험 기관의 객관적 성능 평가와 시험이 가능해짐

- 의료용 소프트웨어 생애주기 관리 표준으로 IEC 62304 표준이 공통적으로 활용되는 것처럼, 다양한 국가의 인공지능 의료기기 인허가 과정에서 성능 평가 프로세스 표준 공통 적용 및 규제 조화 가능

주요 장점들

종전

표준화 이후

1) 전문기관 성능평가 시험

불가능

가능

2) 성능 비교

불가능

가능

3) 성능 평가/검증 방법

개별 임상시험

표준 성능 평가,

임상 시험

4) 성능 평가/검증 비용

고가

저가

5) 기술적 자동 시험 고려

불가능

가능

6) 자동화된 신뢰성 검증

불가능

가능

7) 소프트웨어 테스팅과 연계

불가능

가능

8) 국제 규제 조화

불가능

가능

9) 표준화된 테스트 데이터 활용

불가능

가능

참고5

IEC TC 62 투표 결과

IEC TC 62에서 한국에서 제안한 Artificial Intelligence/Machine Learning-enabled Medical Device - Performance Evaluation Process신규 표준 개발에 관한 투표를 6주간 (10월15일~11월26일) 실시함

투표 참여 국가 (30개국)

투표의견 제시 국가(25개국): 한국, 미국, 브라질, 오스트리아, 캐나다, 중국, 덴마크, 핀란드, 프랑스, 독일, 헝가리, 인도, 아일랜드, 이탈리아, 일본, 네덜란드, 노르웨이, 포르투칼, 러시아, 사우디아라비아, 남아공, 스페인, 스웨덴, 스위스, 호주

안건별 투표 결과

1호 안건 -인공지능/머신러닝 기반 의료기기의 성능 평가 프로세표준 개발 시작에 동의 여부 : 23개국 찬성, 2개국 기권

2호 안건 - 표준 개발을 위한 프로젝트 팀 신설 동의 여부 : 23개국 찬성, 2개국 기권

3호 안건 본 표준 개발을 위해 ETRI 전종홍을 프로젝트 리더로 지명하는데 동의 여부 : 22개국 찬성, 3개국 기권

국가별 참여 기관/회사

(한국) ETRI, 연세대 세브란스 병원 (미국) FDA, Medtronic (인도) GE healthcare (독일) Siemense Healthineers (네덜란드) Philips (중국) NIFDC (스위스) Varian

프로젝트 팀 신설 (‘21.12.1)

PT 8 : Artificial Intelligence-enabled Medical Device Evaluation process