의료 인공지능 10대 표준화 동향 및 전망

Top 10 Key Standardization Trends and Perspectives on Artificial Intelligence in Medicine

저자

전종홍지능정보표준연구실		hollobit@etri.re.kr
이강찬지능정보표준연구실		chan@etri.re.kr

권호: 35권 2호 (통권 182)

논문구분: 일반논문

페이지: 1-16

발행일자: 2020.04.01

DOI: 10.22648/ETRI.2020.J.350201

본 저작물은 공공누리 제4유형: 출처표시 + 상업적이용금지 + 변경금지 조건에 따라 이용할 수 있습니다.

초록: “Artificial Intelligence+” is a key strategic direction that has garnered the attention of several global medical device manufacturers and internet companies. Large hospitals are actively involved in different types of medical AI research and cooperation projects. Medical AI is expected to create numerous opportunities and advancements in areas such as medical imaging, computer aided diagnostics and clinical decision support, new drug development, personal healthcare, pathology analysis, and genetic disease prediction. On the contrary, some studies on the limitations and problems in current conditions such as lack of clinical validation, difficulty in performance comparison, lack of interoperability, adversarial attacks, and computational manipulations are being published. Overall, the medical AI field is in a paradigm shift. Regarding international standardization, the work on the top 10 standardization issues is witnessing rapid progress and the competition for standard development has become fierce.

4735 Downloaded 11563 Viewed

PubReader PDF

Ⅰ. 서론

2019년 발간되었던 중국의 의료 인공지능 백서에는 “인류가 4번의 산업혁명을 겪는 동안 중국은 2번의 기회를 놓쳤다.”라는 문구가 실렸었다. 1차 산업혁명과 2차 산업혁명을 따라잡지 못해 역사 속에서 큰 어려움을 겪었다는 반성인 동시에, 4차 산업혁명에 대해서는 이제는 추격자가 아닌 선도를 하겠다는 큰 의지를 담고 있는 선언문이기도 하다[2].

중국뿐만 아니라 세계 각국은 4차 산업혁명 패러다임과 함께 인공지능 기술을 핵심 필수 경쟁력으로 판단하면서 인공지능 기술 경쟁력 확보를 위한 다양한 정책을 추진하고 있다[3,4].

인공지능(人工知能, AI: Artificial Intelligence) 기술은 인간이 가진 지각, 학습, 추론, 자연언어 처리 등의 능력을 컴퓨터가 실행할 수 있도록 구현하는 기술로, 규칙 기반 처리, 기계학습(머신러닝), 딥러닝, 자연어 처리, 음성인식, 시각인식 등과 같은 다양한 지능화 기술들을 통칭한다.

인공지능 기술의 산업 파급력과 영향력을 분석하면, 가장 중요한 산업 분야로 평가되는 것이 헬스케어 분야이다. 헬스케어의 다양한 영역에 인공지능 기술을 결합함으로써 큰 기대효과를 가져올 수 있을 것으로 전망되기 때문이다.

중국 국무원은 2030년을 겨냥한 신세대 인공지능 발전 계획 속에 스마트 의료 체계 구축을 핵심 과제로 제시한 바 있다. 최근 우리 정부가 발표한 인공지능 국가전략에서도 바이오/의료 분야를 AI활용을 통해 차세대 주력산업으로 중점 육성하겠다는 계획을 포함하고 있다[4].

인공지능 기술을 의료 분야에 적용하면 영상 의학 분야, 진단 보조 및 임상 의사결정, 신약 개발, 건강관리, 병리 분석 및 질병 예측 등의 5대 의료 영역에서 많은 기회와 장점을 얻을 것으로 예상되며, 이에 관련 연구개발과 투자들이 다양하게 진행되고 있다[2,5-8].

의료 인공지능 기술은 의료 사고의 증가와 중환자실 안전 위험, 낮은 의료 접근성, 의료 인력 부족 문제 등을 해결할 수 있는 대안으로도 주목받고 있다[1,9].

또한, 의료 인공지능 기술은 축적된 의료 데이터들을 토대로 의료영상 판독, 질환 진단·예측 속도와 정확도를 높여 적시 치료를 가능하도록 한다. 나아가 신약 개발의 기간을 단축하고, 의료 분야 난제들을 풀며, 의료 비용을 절감과 의료 서비스의 질적 수준을 높이는 혁신 촉매제 역할을 할 것으로도 전망되고 있다[1,6,9-11].

본 고에서는 지난 10월에 발간하였던 논문[1]에 이어 추가적인 의료 인공지능 관련 표준화 동향들을 살피고, 기술과 산업 활성화를 위해 필요한 10대 핵심 동향을 도출하여 현황과 전망을 살펴보고자 하였다.

WHO(세계보건기구, World Health Organization)와 ITU(국제전기통신연합, International Telecommunication Union)가 ITU-T 산하에 신설한 FG-AI4H(Focus Group on AI for Health)는 2018년 7월에 2년의 활동 기간을 목표로 신설되어 다양한 조사/분석 작업을 진행하여 오고 있다[12,13].

FG-AI4H의 주요 활동 목표는 헬스케어 분야에서 인공지능 기술을 적용하는 과정에서 나타나고 있는 다양한 문제들—해석과 설명(interpretability and explainability) 불가능성의 해소, 신뢰성과 견고성(trustworthiness and robustness) 보장, 학습에 필요한 의료 데이터의 개인정보보호(privacy) 이슈, 그리고 성능 평가(performance evaluation) 방법과 절차에 대한 표준화 이슈들을 발굴하는 데 있다.

FG-AI4H 그룹은 2018년 9월 25일부터 27일까지 스위스 제네바 WHO 건물에서 첫 워크숍과 회의를 개최한 이후로 현재까지 총 8번의 공개 세미나와 대면 회의를 개최하여 왔다. 앞으로 2020년 5월까지 2회의 회의와 워크숍을 더 개최하기로 예정되어 있다.

• 1차 2018년 9월 25일(워크숍), 26~27일(회의)-스위스 제네바, WHO

• 2차 2018년 11월 14일(워크숍), 15~16일(회의)-미국 뉴욕, 컬럼비아 대학

• 3차 2019년 1월 22일(워크숍), 23~25일(회의)–스위스, Lausanne, EPFL SwissTech Convention Center

• 4차 2019년 4월 2일(워크숍), 3~5일(회의)–중국 상하이

• 5차 2019년 5월 29일(워크숍, AI for Good 공동), 30~31일, 6월 1일(회의)–스위스 제네바

• 6차 2019년 9월 2일(워크숍), 3~5일(회의)–탄자니아 Zanzibar

• 7차 2019년 11월 12일(워크숍), 13~15일(회의)–인도 뉴델리

• 8차 2020년 1월 21일(워크숍), 22~24일(회의)–브라질 브라질리아

• 9차(예정) 2020년 3월 16일(워크숍), 17~20일(회의)–싱가포르

• 10차(예정) 2020년 5월 스위스 제네바

FG-AI4H는 총 6개의 WG을 구성하여 문서 이슈들을 논의하고 있으며, 표 1과 같이 18개의 TG(Topic Group)으로 확장하여 주제별 표준화 이슈 발굴을 위한 노력을 진행하고 있다.

표 1 FG-AI4H Topic Group 현황(2020년 2월 1일 기준)

TG명 (2019년 7월)	TG명 (2020년 2월)	AI 기술 적용 범위
Cardiovascular disease risk prediction (TG-Cardio)	좌동	심혈관 질환 위험 탐지 및 예측
Dermatology (TG-Derma)	좌동	피부과 질환 및 응용
Falls among the elderly (TG-Falls)	좌동	노인 낙상 예방
Histopathology (TG-Histo)	좌동	조직 병리학 분석–유방암 위험성
Neuro-cognitive diseases (TG-Cogni)	Neurological disorders (TG-Neuro)	신경 인지 질환 진단
Outbreak detection (TG-Outbreaks)	좌동	감염병 탐지
Ophthalmology (TG-Ophthalmo)	좌동	망막 영상을 이용한 안과 질환 진단
Psychiatry (TG-Psy)	좌동	정신과 치료 및 응용
Radiotherapy (TG-Radiotherapy)	Radiology (TG-Radiology)	영상 의학
Snakebite and snake identification (TG-Snake)	좌동	뱀에게 물린 후 뱀 식별
Symptom assessment (TG-Symptom)	좌동	증상 평가
Tuberculosis (TG-TB)	좌동	결핵 예후, 진단 및 예측
Volumetric chest computed tomography (TG-Diagnostic CT)	좌동	흉부 CT 검사
TG-Growth	Maternal and child health (TG-MCH)	어린이 성장 모니터링
-	Diagnoses of bacterial infection and anti-microbial resistance (AMR) (TG-Bacteria)	박테리아 감염 및 항균 내성 진단
-	Dental diagnostics and digital dentistry (TG-Dental)	치과 진단 및 디지털 치과
-	AI-based detection of falsified medicine (TG-FakeMed)	위조 의약품 탐지
-	Malaria detection (TG-Malaria)	말라리아 감지

2019년 11월에 인도 뉴델리에서 열렸던 7차 회의에서는 그동안의 활동 결과들을 기반으로 윤리적 고려사항, 규제기관 고려사항, 데이터 규격, 성능평가 규격, 유즈케이스 TG별 이슈 등과 같은 10가지 문서 초안을 만들기로 결정하였고 대표 초안 작성자를 중심으로 문서 작성을 진행하고 있다(표 2 참조).

표 2 FG-AI4H의 문서 작성 계획

No.	Deliverable	Initial draft editor
1	AI4H ethics considerations	Andreas Reis (WHO), Julia Mohapatra (NICF, India)
2	AI4H regulatory [best practices \| considerations]	Jackie Ma (Franhofer HHI, Germany)
3	AI4H requirements specification	Pradeep Balachandran, Tina Purnat (WHO)
4	AI software life cycle specification	Pat Baird (Philips, USA), Tina Purnat (WHO)
5	Data specification	Marc Lecoultre (ML Lab, Switzerland)
6	AI training best practices specification	Rainer Berger (AI Singapore)
7	AI4H evaluation specification	Markus Wenzel (Fraunhofer HHI, Germany)
8	AI4H scale-up and adoption	Sameer Pujari (WHO)
9	AI4H applications and platforms	Manjeet Chalga (ICMR, India), Aveek De (CMS, India)
10	AI4H use cases: Topic description docs.	Eva Weicken (Fraunhofer HHI, Germany)

특히 2020년 1월 8일과 9일, 양일간 진행하여 DASH(Data and AI solution handling) 워킹그룹과 DAISAM(Data and AI solution assessment methods) 워킹그룹의 합동 워크숍의 내용은 주목할 만하다.

독일 베를린의 프라운호퍼 통신 연구소에서 열린 워크숍에서는 총 4개 트랙(Plenary, Tests, Data, Assessment Platform)으로 나누어 양일간 표 3과 같이 주제 발제를 하며 WS(Work session)를 진행하였다.

표 3 DASH/DAISAM WG Joint Workshop 논의 주제들

	Tests WS 트랙		Data WS 트랙		Assessment Platform WS 트랙
1일차	•	Networks for Analyzing Structural MRI Data in Neurological Diseases	•	Reference Data for Machine Learning	•	Precision Evaluation: A Standardized Domain-Agnostic Framework and Platform For Evaluating AI Systems
	•	ML for Mammography & Inspecting Adversarial Examples Using the Fisher Information	•	The Long Tail of Medical Data	•	AWS Sagemaker + CI/CD + Docker as a Platform Blueprint
	•	Can Assessment of AI-based Medical Devices Learn From Standardization and Round Robin Tests for Clinical Chemistry?	•	Towards Deep Federated Learning in Healthcare	•	Clinical Validation Techniques for Medical Imaging AI - A Platform Approach
	•	Applicability of AI in Aiding Pathology Diagnosis in Low and Middle Income Countries	•	An Alternative to Federated Learning: Generative Adversarial Networks for Data Sharing and Data Privacy	•	A Tale on Data Quality
2일차	•	Novel Decision-Informed Metrics for Medical AI Validation	•	Diagnosis of Brain Diseases with AI Applications in	•	Big Data Governance
	•	Degrees of medical XAI	•	Federated Data Sharing Environment	•	Enterprise Data Pipelines
			•	A Federated Convolutional Denoising Autoencoder for MRI Applications	•	AIcrowd Platform
			•	Validating Image Compression for AI in Microscopy

1) Tests WS 트랙: 평가 영역 및 평가 요소 등과 같은 AI 모델의 평가 이슈들 논의

2) Data WS 트랙: AI 평가를 위해 필요한 데이터 품질 평가 및 데이터 요구사항들에 대해 논의

3) Assessment Platform WS 트랙: AI 모델 평가를 위한 평가 플랫폼 요구사항과 데이터 운용 방법, 구현 방법 논의

각 트랙에서는 5~6개의 핵심 발제를 양일간 진행하고 각 발제 주제별로 고려해야 할 문제점이나 도전사항, 이슈 등과 함께 해결 방법들을 참석자들이 함께 제안하여 정리하는 방식으로 진행하였다.

또한, 그 주제들이 FG-AI4H의 주요 문서의 어떤 부분들과 연관되는지를 분석하고, 표 2의 문서 중 다음의 주요 문서들에 대한 작성을 분담하였다.

• 2. Regulatory Best Practices and Considerations

• 5. Data Spec의 주요 부분(훈련과 학습용 데이터 규격, 데이터 핸들링 부분)

• 7. AI evaluation Spec의 주요 부분(AI test metrics 규격의 평가 항목 기준들, Clinical Validation)

ITU-T의 FG-AI4H는 WHO의 기본 철학처럼 선진국과 후진국을 모두 아우르는 의료 인공지능 분야 표준화 이슈들을 발굴하고 평가 체계를 만들려는 노력을 진행하여 왔다는 점에서 큰 의미를 갖는다고 할 수 있다.

기술 우위를 갖는 선진국 중심의 표준화만이 아니라 아시아, 아프리카, 남미 등의 개발도상국 등을 포괄하며 의료 인공지능 응용과 표준화의 방향성을 찾으려고 했다는 점에서 더욱 그렇다.

앞으로 남은 기간 동안 2년간의 1단계 활동을 매듭짓는 활동이 예상된다. 계획하였던 개방형 데이터의 발굴, 시험 방법 정리, 벤치마킹 플랫폼의 시범 운영 등과 함께 주요 문서 초안의 작성 및 향후 계획 수립을 진행할 예정이므로 지속적인 관심이 필요하다.

나. DICOM

의료용 디지털 영상 및 통신(DICOM: Digital Imaging and Communications in Medicine) 표준은 의료용 기기에서 디지털 영상표현과 통신, 저장과 관련된 규격을 정의하고 있다. DICOM 표준은 영상 의학 분야 모든 촬영술에서 생성되는 영상 데이터들을 제조사나 모델과 관계없이 교환할 수 있도록 한다.

DICOM 표준은 미국 방사선의학회(ACR: American College of Radiology)와 미국전기공업회 (NEMA: National Electrical Manufacturers Associations)가 참여하는 연합표준위원회를 통해 만들어졌다. 애초에는 1985년에 ACR-NEMA 버전 1.0이라는 이름과 1988년 ACR-NEMA 버전 2.0이라는 이름으로 발표되었으나, 1993년에 네트워크 통신과 객체지향 정보 모델이 적용되면서부터 DICOM 3.0으로 명명되었다. DICOM 표준은 현재 총 22개 파트까지 확장되어 구성되어 있고, 32개의 WG을 통해 지속적인 신규 기술 수용과 개정 작업을 진행하고 있다[14].

최근 의료영상 기반의 CADx, CDSS 의료 인공지능 제품과 서비스가 급속하게 확산됨에 따라 DICOM 표준에 대한 관심이 다시 높아지고 있다.

의료영상 기반 인공지능 응용을 위해서는 의료 이미징 데이터의 상호 운용성 확보가 가장 중요하기 때문이다. 대다수의 의료영상 진단 장비와 응용들에서 DICOM 표준을 저장/유통의 필수 표준으로 사용하고 있고, DICOM 규격을 이용해 인공지능 학습에 필요한 모든 유형의 annotation 처리들을 할 수 있기에 의료영상 기반 인공지능 기기와 서비스를 위해 DICOM 표준의 확장은 중요한 이슈가 되었다.

특히 과거에는 annotation이 몇몇 기기에서 특별한 용도로만 사용되어 상호호환성의 이슈가 없었지만, 최근에는 AI 응용 개발사와 기기 제조사가 다양하게 분화되고, semantic annotation이 중요해지고 있으며, AI로 자동 생성되는 annotation들을 호환되게 처리할 필요성들이 높아지고 있는 등 annotation 상호호환성 확보와 표준 기반의 AI workflow 지원 필요성이 높아지고 있다.

이에 DICOM은 2018년 11월, WG 23의 명칭과 활동 범위에 AI를 추가하고, 본격적인 활동을 개시하였다. DICOM WG 23은 임상 환경에서 AI workflow 효과적으로 지원하기 위한 DICOM 메커니즘 응용 프로그램과 백엔드 DICOM 인프라 사이의 인터페이스 개발을 목표로 활동하고 있다[15].

다. IHE

HIMSS(Healthcare Information and Management Systems Society)와 RSNA(Radiological Society of North America)의 후원으로 1999년부터 활동을 시작한 IHE(Integrating the Healthcare Enterprise)에서도 DICOM과 함께 의료 인공지능 응용에 관한 신규 프로파일 표준 개발을 시작하였다.

IHE 프로젝트는 DICOM, HL7 등의 표준들을 효과적으로 활용하도록 하는 프레임워크와 실무 가이드라인을 제공하고, 이를 통해 병원 정보시스템들과 의료기기들의 실제적인 연동과 상호호환성을 촉진시키기 위한 활동이라 할 수 있다.

IHE의 Radiology(RAD) 기술 프레임워크 작업과 관련하여 DICOM WG23을 통해 AI workflow와 AI Result라는 두 개 신규 항목이 제안되었고, 이중 그림 1과 같이 “이미지 기반 AI Workflow”에 대한 프로파일 표준 개발을 결정하고, DICOM WG23과 함께 공동 개발 중에 있다[16].

그림 1

AI Workflow의 Transaction map[16]

출처 IHE, “Image Based AI Workflow.”

images_1/2020/v35n2/HJTODO_2020_v35n2_1f1.jpg

라. IEC TC 62

IEC(국제 전기 기술위원회, International Electrotechnical Commission) 산하의 기술위원회 TC 62는 의료용 전기 기기 및 시스템 국제표준화를 위한 핵심 기술 위원회로 총 4개의 SC—공통 사항(SC A), 진단 영상 장치(SC B), 방사선 기기(SC C), 의료용 전자기기(SC D)—로 나뉘어 활동하고 있다.

TC 62는 그동안 의료용 전기기기 안전에 관한 필수 성능 및 요구사항 등에 대한 정의를 담은 IEC 60606 표준 시리즈를 제정하였고, ISO TC210 등과 함께 위험관리, 품질관리, 의료용 소프트웨어 라이프 사이클 관리 등에 대한 다양한 표준도 제정하였다.

최근 TC 62는 SW 기반 의료기기, ICT와 네트워크 기술의 성장, 인공지능 및 자동화 기술의 성장과 같은 환경 변화를 반영하기 위해 SBP(Strategic Business Plan) 수정 보완에 대한 의견 수렴을 진행하였다.

그 논의 결과를 기초로 2019년 10월 중국 상해에서 열렸던 TC 62 총회에서 소프트웨어 네트워크, 그리고 인공지능 기술에 대한 자문을 위한 AG SNAIG(Software Network and Artificial Intelligence advisory Group)를 구성하였다(Resolution 62/2019/4).

SNAIG 자문그룹의 역할은 인공지능 및 데이터 관련 이슈를 포함해 연결되는 주제들(머신러닝, 빅데이터, 데이터 분석, 로보틱스, 사물인터넷)과 관련하여 외부 정보들을 분석하고 모니터링하며, TC 62에 조언하는 것으로 하고 있다.

의료기기 안전에 대한 핵심 표준을 다루는 TC 62에서 인공지능과 소프트웨어 네트워크에 대해 집중한다는 것은 중요한 변화라 할 수 있다. SaMD를 비롯한 빅데이터, 인공지능 등 SW 기반 환경으로 패러다임 전환을 하는 상황에서 인공지능, 사물인터넷, 빅데이터 등을 지원하는 의료기기에 대한 공통 안전 요구사항을 포괄하는 형태로 IEC 60601 공통 규격을 확장하는 것을 포함해 TC62의 향후 다양한 변화 가능성을 예상할 수 있는 부분이기도 하다.

앞으로 SNAIG 자문 그룹의 활동을 통해 다양한 의료 인공지능 관련 국제표준화 활동에 대한 분석과 함께, TC 62와의 표준화 협력이 진행될 것으로 예상되므로 국내에서도 적극적인 대응 활동이 필요한 상황이다.

표 4 IEEE 의료 인공지능 관련 표준화 프로젝트

표준 번호	표준명	연관 산업계 및 사업자
P2801	Recommended Practice for the Quality Management of Datasets for Medical Artificial Intelligence	의료기기 제조 업계, 규제기관, 의료 데이터 서비스 사업자
P2802	Standard for the Performance and Safety Evaluation of Artificial Intelligence Based Medical Device: Terminology	의료기기 제조 업계, 규제기관, 의료 데이터 서비스 사업자
P3652.1	Guide for Architectural Framework and Application of Federated Machine Learning	의료, 재무, 마케팅, 교육, 통신 및 기타 연구 분야

마. IEEE

전기전자기술자협회(IEEE: Institute of Electrical and Electronics Engineers)의 SA(Standards Association)에서도 의료 인공지능 관련된 표준화 프로젝트들이 신설되어 활동 중에 있다.

1) P2801

IEEE EMB(Engineering in Medicine and Biology Society) 산하의 AIMDWG(Artificial Intelligence Medical Device Working Group)에서 2018년 12월에 시작한 프로젝트로 인공지능 의료기기에서 이용되는 데이터 세트의 품질관리시스템 구축에 필요한 모범 사례 발굴과 정의(데이터 수집, 전송, 활용, 저장, 유지 관리 및 업데이트와 같은 항목을 포함하여 전체 데이터 세트 관리 주기가 포함)를 목표로 하고 있다.

또한, 데이터 소스, 데이터 품질, 주석, 개인 정보 보호, 인력 자격/훈련/평가, 도구, 장비, 환경, 프로세스 제어 및 문서화 등과 같이 데이터 세트의 품질에 영향을 미치는 중요한 요소 목록 발굴도 목표로 하고 있다.

2) P2802

마찬가지로 IEEE EMB 산하의 AIMDWG에서 2018년 12월에 시작한 프로젝트로 인공지능 의료기기에서 사용되는 용어와 함께, 인공지능 의료기기의 안전, 효과, 위험 및 품질관리 등을 설명하는 기본 개념 및 방법론을 정의하는 것을 목표로 하고 있다.

3) P3652.1

IEEE FML(Federated Machine Learning) WG에서 2018년 12월부터 시작한 프로젝트로, 다양한 분산 데이터를 학습 데이터 세트로 구성하는 연방 학습(Federated Learning) 체계를 정의하는 것을 목표로 하고 있다.

이 표준에서는 개인 정보 보호, 보안 및 규제 요구사항들을 충족시키면서, 분산 데이터를 사용하는 학습방법과 모델을 구축하는 방법들을 정의하고자 하고 있다.

이를 위해 1) 연방 학습의 설명과 정의, 2) 연방 학습의 유형과 시나리오, 3) 연방 학습의 성능평가, 4) 연관되는 규제 요구사항 등을 도출하고 정의하는 것을 목표로 하고 있다.

IEEE FML WG에는 WeBank, Sinovation Ventures, JD, China Telecom, Tencent, MI, Alibaba, YITU, Clustar, 4Paradigm, Huawei, VMWare, LogiOcean, SensesGlobal, Swiss Re, Intel, CETC BigData, ChinaAMC, Fudata Technology 등이 참여하고 있고, 2019년 한 해 동안 선전, LA, 마카오, 베이징 등에서 4차례 대면 회의를 진행하면서 표준 개발을 진행하였다. 현재 2020년 2월 초안 공개를 목표로 작업 중에 있다.

2. 표준화 프레임워크

국내에서 의료 인공지능 관련 표준으로 아직 개발되거나 진행 중인 사항은 없으나 빠르게 진행되고 있는 다양한 국제표준화 활동과 연계한 적극적인 대응 활동이 필요하다.

ETRI에서는 2019년 선제적 차원에서의 의료 인공지능 분야 표준화 항목 발굴과 전략 수립을 위해 관련 국내 전문가들과 함께 표준화 프레임워크 개발 작업을 진행하였다[17].

의료 인공지능 분야 중 인공지능 기반 의료기기와 인공지능 주치의라는 2개 분야에 대해 총 5가지의 유즈케이스를 도출하고, 관련 표준화 갭 분석 및 전략들을 도출하였다.

표준 갭 분석을 통해 식별된 60여 건 이상의 잠재 표준 개발 요구들은 향후 의료 인공지능 표준 개발 전략을 수립하는 데 활용될 수 있을 것으로 기대된다.

표 5 의료 인공지능 주요 유즈케이스

서비스 패키지	단위 서비스 유스케이스
(SP-01) 인공지능 기반 의료기기	• (SU-01-01) 자동 진단 보조
	• (SU-02-01) 다기관 데이터 기반 CDSS
	• (SU-03-01) 자동 음성인식 의료 정보 기록
(SP-02) 인공지능 주치의 서비스	• (SU-04-02) 인공지능 기반 주치의 서비스
(SP-02) 인공지능 주치의 서비스	• (SU-05-02) 만성질환 케어 에이전트

[i]

출처 ETRI, “스마트 헬스 ICT 융합 표준화 프레임워크,” 2019.

Ⅲ. 10대 핵심 이슈

지난 논문에서 의료 인공지능과 관련하여 다음과 같이 8가지 주요 법/제도 및 표준화 이슈들이 있음을 확인한 바 있다[1].

(1) 정의와 분류 체계

(2) 위험관리

(3) 성능평가

(4) 표준 데이터 및 인허가 기준 데이터

(5) 임상 평가

(6) SW 품질 및 생애 주기 관리

(7) 보안 및 프라이버시

(8) 윤리적 이슈

본 논문에서는 여기에 다음과 같이 기술적인 2가지 이슈를 추가하여, 총 10대 핵심 표준화 이슈로 세분화하여 이슈 분석과 전망을 기술하였다.

(9) 연동 및 상호호환성

(10) 응용 요구사항

의료 인공지능의 대표적 응용 분야인 인공지능 기반 의료기기를 중심으로 살펴보면 8가지 핵심 이슈들은 그림 2와 같이 연관되어 있다고 도식화할 수 있으며, 추가적인 이슈들은 6번 주제와 마찬가지로 모든 단계에서 고려되어야 하는 이슈라고 할 수 있다.

그림 2

핵심 정책/표준화 이슈와 인공지능 기반 의료기기 생애 주기 연관도

출처 전종홍, 이강찬, “의료 인공지능 표준화 동향,” 전자통신동향분석, 34권 5호, 2019, 공공누리 제4유형

images_1/2020/v35n2/HJTODO_2020_v35n2_1f2.jpg

1. 정의와 분류

의료 인공지능 관련 표준화에서 가장 우선하여 필요한 부분은 “의료 인공지능” 관련 핵심 용어와 범위에 대한 국제표준 정의가 필요하다는 점이다.

현재 IMDRF의 SaMD key definition 표준에서는 Medical device와 SaMD에 대한 정의를 하고 있고, ISO/IEC JTC1 SC42에서 개발 중인 ISO/IEC 22989 문서에서는 인공지능 개념과 용어들을 정의하고 있으며, IEEE P2802에서 일부 시도를 하고 있으나, 좀 더 체계적이고 폭넓은 의료 인공지능 관련 용어들에 대한 정의 노력과 표준화 작업이 필요하다[1].

2. 위험 평가 및 관리 체계

인공지능 기반 의료기기에 대한 등급분류는 「의료기기법」 제3조(등급분류와 지정)에 따라 의료기기의 사용 목적과 사용 시 인체에 미치는 잠재적 위해성의 차이로 분류된다. 이처럼 의료기기 분야에서 위험 요인을 식별하고 위험을 평가 관리하는 위험관리 프로세스는 가장 필수적이며 핵심적인 요소라 할 수 있다.

위험관리에 대한 표준은 ISO 31000 시리즈를 중심으로 각 산업 분야별로 다양한 위험관리 프로세스 표준들이 제정되어 있으며, 의료기기 분야에서는 ISO 14971 표준이 핵심 요소라 할 수 있다.

인공지능과 관련해서 ISO/IEC JTC1 SC42에서도 ISO/IEC 23894 위험관리 표준 초안을 개발하고 있고, IMDRF에서는 SaMD에 대한 Risk Categorization과 Framework 등을 정의하는 N12 문서를 제정한 바 있다.

그러나 현재 의료 인공지능 응용과 서비스들을 포괄하는 위험관리 체계와 절차에 대한 표준은 없는 상태로, 앞으로 관련 제품과 서비스의 성장에 따라 표준화 필요성이 커질 것으로 예상된다[8].

표 6 SaMD 위험도 분류 체계

건강관리 상황 또는 조건의 상태	건강관리 의사결정에 SaMD가 제공한 정보의 중요도
건강관리 상황 또는 조건의 상태	치료 또는 진단	임상 관리 실행	임상 관리 고지
치명적	IV	III	II
심각	III	II	I
비심각	II	I	I

[i]

출처 식품의약품안전처, “빅데이터 및 인공지능(AI) 기술이 적용된 의료기기의 허가·심사 가이드라인(민원인 안내서),” 2017.11

3. 성능평가

성능(performance)은 측정 가능한 품질 요소로 측정 대상의 활동 결과를 나타낸다. 성능을 사정(assess)하거나 평가(evaluate)하는 과정을 통해 품질(quality)을 정량화할 수 있게 된다.

의료기기 필수 성능과 안전에 대한 요구사항 표준인 IEC 60601-1 시리즈에서는 필수 성능(essential performance)이라는 용어를 사용하는데, 이는 기본 안전 및 위험에 영향을 미칠 수 있는 성능 요소를 의미한다.

성능 사정과 평가에 대한 다양한 표준화 개발 시도들이 진행되고 있는데, 특히 ITU/WHO의 FG-AI4H에서는 evaluation spec, data spec, application and platform 등 성능 사정에 필요한 제반 요소들에 대한 표준 이슈 발굴 작업을 진행하고 있다. ISO/IEC JTC1 SC42에서도 성능평가 요소(performance metrics)에 대한 표준화 시도를 시작하고 있다.

그러나 아직 이런 모든 작업들이 초기 단계에 있고, 평가 대상 범위, 성능에 대한 기준, 필수 성능에 대한 정의, 성능평가 방법과 절차, 평가 시스템, 평가용 데이터 품질 요소 등 연관 논의가 필요한 요소들이 많아서 좀 더 추가적인 논의 과정이 필요한 상태이다[6].

현재 국내에서는 관련 국제표준화에 아직 적극적인 참여를 하고 있지 않으나, 성능평가 표준화에 대한 파급력과 중요성을 인식하고 체계적인 대응을 하는 것이 필요하다.

특히 식약처 가이드라인 등을 기반으로 2번 동향에서 5번 동향까지 국내에서 얻은 선행 결과물들[18,19]을 국제표준화와 연계시켜 대응하는 전략도 효과적일 것으로 예상된다.

4. 표준 데이터 및 기준 데이터

성능평가 과정에서 비교 평가 등을 위해서는 기준으로 활용할 수 있는 공인된 데이터가 필요하게 된다.

산업자원부의 “참조표준 제정 및 보급에 관한 운영요령”에 정의된 기준으로는 “참조 데이터(Reference Data)”는 참조표준으로 등록되기 전의 측정데이터 및 정보를 말하며, “참조 표준(Standard Reference Data)”은 데이터의 정확도와 신뢰도를 과학적으로 분석·평가하여 공인함으로써 국가사회의 모든 분야에서 널리 지속적으로 사용되거나 반복사용이 가능하도록 마련된 자료로서 유효 참조표준, 검증 참조표준, 인증 참조표준으로 분류하고 있다[20].

의료 인공지능 분야에서 데이터 관련된 표준화 이슈들은 수집과 공유 체계, annotation 포맷, annotation 상호호환성, 데이터 품질관리, 참조표준 데이터 확보, 시험인증 및 성능 비교를 위한 기준 데이터 확보 등이 있다[7,8].

DICOM에서는 의료영상 데이터의 annotation 상호호환성 확보를 위한 노력을 하고 있고, IEEE P2801 프로젝트에서는 의료 인공지능을 위한 데이터 세트의 품질관리 가이드를 개발하려 하고 있으며, ITU-T/WHO의 FG-AI4H에서는 데이터 요구사항, 데이터 수집, 데이터 annotation 규격, 훈련 및 시험용 데이터 규격, 데이터 핸들링, 데이터 공유 가이드 등의 내용을 포괄하는 데이터 규격을 개발하려 노력 중에 있다.

국내에서도 CDSS를 위한 질환별 참조표준 데이터 개발과 임상 검증용 표준 데이터 마련을 추진하고 있고, 인공지능 국가전략과 연계하여 AI 허브를 통한 AI 학습용 데이터 개방 및 공공데이터 개방을 적극 추진하고 있다[4].

향후 이러한 경험과 결과들이 국내용으로 국한되지 않게 하려면 국제표준화 연계 전략 보완도 필요하다.

5. 임상 평가

의료 인공지능을 적용한 응용과 서비스를 의료용으로 활용하기 위해서는 반드시 임상 시험(Clinical Trial/Study)을 통한 임상 유효성 평가 (Clinical Efficacy Evaluation)가 동반되어야 한다[6,19,21].

임상 시험이란 제품의 안전성과 의학적 효용성을 증명할 목적으로 사람을 대상으로 실시하는 시험 또는 연구를 말한다. 임상 시험은 그 시험 대상과 방법에 따라 전향적(Prospective)과 후향적(Retrospective) 연구방법으로 나뉜다.

국내의 경우 빅데이터 및 인공지능 기술이 적용된 의료기기의 성능 및 임상적 유효성 검증은 민감도(Sensitivity), 특이도(Specificity), 양성 예측도(Positive Predictive Value), 음성 예측도(Negative Predictive Value), ROC(Receiver Operating Characteristic) Curve, AUC(Area Under the Curve) 등의 항목을 이용하여 평가하도록 하고 있다[18,19].

현재로는 의료 인공지능 관련 임상 평가에 대한 표준화로는 IMDRF에서 제정된 SaMD Clinical Evaluation 표준(N41)이 유일한데, FG-AI4H에서 논의 중인 evaluation spec에서도 논의가 진행되고 있다[22].

앞으로는 의료 인공지능 제품과 서비스가 다양해지고 참조표준 데이터들이 확보된다면 질환별/분야별 필수 성능평가와 임상 평가 표준 개발이 더욱 원활해질 것으로 보인다.

6. 품질관리 프로세스

의료기기 분야에서는 의료기기의 설계·개발, 제조, 시판 후 관리 등 전 과정에 대한 품질 시스템의 확보를 통해 안전하고 유효하며 의도된 용도(intended use)에 적합한 품질의 제품을 일관성 있게(consistently) 생산하도록 품질관리 체계를 강제 표준으로 정의하여 적용하고 있다.

의료기기 분야의 품질경영시스템 표준인 ISO 13485 표준은 ISO 9001 표준을 바탕으로 의료기기에 특별히 적용되는 관련 법규 준수, 제조환경관리, 오염관리, 위험관리, 고객과의 의사소통, 식별 및 추적성 관리, 라벨링, 제품의 청결 및 오염관리, 타당성 확인(Validation), 검증(Verification) 등의 사항을 추가하여 만들어진 표준이다. 이와 비슷한 목적으로 의료기기 소프트웨어의 품질관리와 위험관리를 위해 라이프사이클 프로세스를 정의하고 있는 IEC 62034 표준이 있다.

한국을 비롯해 대부분의 국가들이 ISO 13485 표준을 기반으로 한 우수 생산 품질 시스템인 GMP(Good Manufacturing Practice) 인증 제도를 운용하고 있다.

의료 인공지능 관련 표준으로 품질관리 체계를 다루고 있는 것은 IMDRF의 SaMD QMS(Quality Management System) 표준(N23)이 유일한 상태이다.

2019년 FDA는 IMDRF의 SaMD QMS를 근간으로 AI/ML 기반 SaMD 변경에 관한 새로운 규제 체계(안)을 공개하고 의견 수렴을 받았었다. 이처럼 SaMD로서의 특징을 갖고 있으며 누적 학습 데이터가 늘어나는 상황에서 이를 반영한 학습과 성능개선을 지속적으로 가능하도록 하는 의료 인공지능 제품의 생애 주기 관리와 품질관리 체계를 어떻게 만들고 운영할 것인지에 대한 고민은 계속 커질 것으로 예상된다[23].

7. 보안 및 프라이버시

최근 ICT 기술을 결합한 의료기기와 의료정보시스템의 증가에 따라 의료기관 및 의료정보를 대상으로 하는 사이버 공격의 위협은 급증하고 있다.

의료 인공지능 시스템들을 기본적으로 네트워크를 통해 CT/MRI, PACS, EMR, 클라우드/빅데이터 시스템 등 다양한 병원 내 시스템과 연결되어야 하는 특성이 있기에, 보안 이슈는 대단히 중요하다고 할 수 있다. 또한, 환자의 다양한 민감 정보들을 종합적으로 다루게 되므로 프라이버시 보호 이슈도 크다고 할 수 있다.

이처럼 새롭게 등장하여 커지고 있는 보안 위험에 대한 분석과 대응 체계 마련이 시급해지고 있어, 미국 FDA를 비롯해 한국 MFDS까지 모두 사이버 보안에 대한 대응 체계 마련을 서두르고 있다[24].

의료 인공지능과 관련한 보안 위협들은 개인 정보(데이터) 유출, 악성코드 감염, 기기 오작동, 비인가 접근, 서비스 마비, 데이터 위변조 등의 형태뿐만 아니라 응용 레벨에서의 적대적 공격(adversarial attack) 등과 같은 형태로도 나타날 수 있다[25,26].

의료 인공지능과 연관된 보안 표준으로 DICOM에서는 의료영상 데이터의 전송 구간 보호를 위한 PS3.15 Security and System Management Profiles 표준을 제정하여 활용하고 있다. 또한, IMDRF의 Cybersecurity harmonization WG에서는 SaMD를 포함하는 Medical Device Cybersecurity를 위한 가이드 표준을 개발하고 있다.

8. 윤리적 위험관리

인공지능의 윤리적 이슈에 대해서는 USA, EU 등 많은 국가뿐만 아니라 OECD, ISOC, IEEE, ACM, HIMSS 등과 같은 다양한 조직들에서도 큰 관심을 표명하고 있는 주제이다.

특히 영상 의학을 비롯한 의료 전 분야에서 인공지능 기술을 적용한 연구와 사례들이 늘어남에 따라 윤리적 위험관리를 위한 요구들이 늘어나고 있고 다양한 윤리 가이드라인들도 만들어지고 있다.

84개의 발행된 인공지능 윤리 가이드라인에 키워드 분석 작업[27]을 통해 가장 빈도수가 높게 등장하는 윤리 기준 키워드와 연관된 주요 유사 연관 단어들을 요약해 보면 참고문헌 [27의 표 3]과 같다. 이중 상위 4개 기준의 관련 키워드들은 다음과 같다.

• Transparency (87%): explainability, explicability, understandability, interpretability, communication, disclosure, showing

• Justice, fairness (84%): consistency, inclusion, equity, (non-)bias, (non-)discrimination, diversity, plurality, accessibility, reversibility, remedy, redress, challenge, access and distribution

• Non-maleficence(71%): security, safety, harm, protection, precaution, prevention, integrity(bodily or mental), non-subversion

• Responsiblity(71%): accountability, liability, action with integrity

의료 인공지능에서 예상되는 윤리적 위험성은 1) AI가 잘못된 결정을 내릴 가능성, 2) AI 학습 데이터를 이용한 편견과 차별 학습, 3) AI가 악의적인 목적으로 사용될 가능성, 4) 이익 극대화를 위한 변경 조작, 5) 인간 존엄성과 선택권에 대한 미고려, 6) 딜레마 상황에서의 가치 판단 기준, 7) 사고 발생 시 설명 가능 여부와 책임 소재 등이다. 의료 인공지능에서의 단계별 윤리적 이슈들과 적용 대상, 해결 방법 등에 대해서는 앞으로도 지속적인 논의와 정형화 노력이 필요하다[6,28].

현재 인공지능 윤리에 관한 표준화 들은 ISO/IEC JTC1 SC42의 WG3에서 개발을 시작한 기술 문서들 TR 24027(Bias in AI systems and AI aided decision making), TR 24368(Overview of ethical and societal concerns)을 통해 정리 작업이 진행되고 있으며, ITU-T/WHO의 FG-AI4H에서도 AI4H ethics considerations 문서 개발을 논의하고 있다. 이밖에도 IEEE를 중심으로 다양한 표준화 기구들이 윤리적 이슈에 대해 협력하기 위해 OCEANIS(Open Community for Ethics in Autonomous and Intelligent Systems) 협의체를 구성하여 활동하고 있기도 하다.

JTC1 SC42의 WG3에서는 향후 표준화 방향 분석을 위해 Roadmap Ad-hoc Group을 신설하고, 핵심 이슈들인 Transparency, Explainability, Verifiability, Availability, Resiliency, Reliability, Accuracy, Safety, Security, Privacy 등과 관련한 국제 표준화 현황과 협력 방향, 활동 계획을 분석하고 있다.

윤리적 이슈는 더욱더 많은 논의가 필요한 이슈로, 앞으로보다 세부적인 단계별 위험 분석, 절차적/기술적 해결 방법 등에 대한 고민과 함께 구체적인 가이드라인 개발과 표준화 노력이 연계되어야 할 것으로 예상된다.

9. 연동 및 상호호환성

의료영상 정보를 효과적으로 유통하기 위해 DICOM 표준이 중요한 역할을 했던 것처럼, 의료 인공지능은 의료 서비스 생태계 내의 다양한 시스템들이 유기적으로 연동되어야 효과적으로 동작할 수 있다.

DICOM과 IHE는 annotation 상호호환성 확보와 표준 기반의 AI Workflow 지원을 위해 “이미지 기반 AI Worklfow” 프로파일 개발과 함께, 의료영상 기기에서의 AI 뷰어들이 효과적이고 공통되게 결과의 저장, 검색, 표시를 할 수 있도록 하는 표준화를 논의하고 있다.

IEEE의 연방 학습 WG에서는 다양한 분산 데이터를 학습 데이터 세트로 구성하는 연방 학습(Federated Learning) 체계를 정의하고자 P3652.1 프로젝트를 시작하였다. 의료 분야의 경우 다기관 데이터 학습 및 활용 등을 위해 CDM과 FL을 연계한 학습방법 등에 관한 연구도 활발하게 이루어지고 있다[7].

앞으로 의료 데이터 연동 및 시스템 연동을 위해 HL7/FHIR를 비롯해 의료영상 이외의 데이터들에 대한 호환 포맷 등 다양한 연동 및 상호호환성 표준화 논의가 시작될 것으로 예상된다.

10. 응용 요구사항

의료 인공지능의 응용 분야가 심혈관계/신경과/피부과/부인과/안과/소아·청소년과/치과/응급의학과 등으로 세분화되고, 활용 데이터 유형 및 연동 시스템들이 더욱 다양하게 연동됨에 따라 분야별 응용 요구사항들이 새롭게 추가될 것으로 예상된다. 더불어 시스템 복잡도 증가에 따른 사용자 오류 예방을 위해 IEC 62366(Usability, 사용 적합성) 검토도 필요할 것으로 예상된다[6-8].

ETRI에서 작업한 ICT 표준화 프레임워크에서도 20가지 이상의 의료 인공지능 시스템 관련 잠재 요구사항 표준들을 도출한 바 있다[17]. ITU-T/WHO의 AI4H에서는 의료 인공지능 분야의 유즈 케이스들과 응용 주제별 표준화 이슈 분석과 문서화 작업을 진행하고 있다. ISO/IEC JTC1 WG12에서는 의료 인공지능 기술을 적용하여 영상 분할을 하고 3D 모델을 최적화하는 방법에 대한 표준 개발을 시작하였다.

의료 인공지능은 한 축으로는 의학 분야 이외에 병리학, 간호학, 약학, 한의학, 치의학 등의 새로운 영역으로 응용 분야를 넓혀가고 있고 동시에 또 다른 축에서는 의료 3D 프린팅과 결합되는 형태와 같이 새로운 융합 서비스 모형을 만들고 있다.

의료 인공지능의 응용 범위가 확대대고, 다른 산업들과 융합 응용 서비스들을 만들어 나간다면 새로운 응용 레벨의 표준화도 필요하게 될 것으로 예상된다.

Ⅳ. 결론

최근 3년 동안의 의료 인공지능 분야는 놀라울 정도로 급성장하고 있다. 관련 연구와 논문들은 폭발적으로 쏟아져 나오고 있고, RSNA 전시장에서 몇몇 부스로 시작한 의료 인공지능 관련 전시가, 2019년 말에는 RSNA 전체 전시 행사의 20% 이상을 차지하는 규모로까지 성장하였다. 전 세계 시장 규모도 2025년에는 20조 원에 달할 것으로 전망되고 있다.

반면 다른 한편에서는 현 단계의 한계점과 문제점을 명확하게 인식해야 한다는 연구 결과들도 나오고 있다. 구글 연구진이 BMC Medicine에 기고한 논문에서는 임상 유효성 확인 부족, 성능 비교의 어려움, 상호호환성 부족, 적대적 공격이나 전산 조작에 대한 취약성, 지속적으로 변화하는 인공지능을 평가/관리하기 위한 체계의 결여, 설명 가능한 인공지능 기술의 필요성 등과 같은 15가지 이슈들이 지적되기도 하였다. 이러한 이슈와 한계점들은 앞서 정리하였던 표준화 이슈들에서 이미 언급되었던 문제점들이기도 하다[6].

현재 의료 인공지능 분야 기술은 빠르게 성장하는 패러다임의 변환기에서 있다. 국제적인 표준과 기준 규격에 대한 논의는 시작 단계에 있지만, 국가별 독자 규제 체계 신설 노력과 함께 국제 조화의 필요성도 동시에 커지고 있다.

지금까지 살펴본 동향들에서 알 수 있듯이 최근 2년 사이에 다양한 기술개발이 진행되면서 표준화 시도들도 빠르게 확산되고 있다. 표준화 추진 방향도 10가지 핵심 이슈들로 수렴되고 있고, 국제표준화 기구 간의 주도권 경쟁도 치열해지고 있다.

미국과 중국의 인공지능 육성 전략에서 보듯 표준화는 산업 육성을 위해 필수적으로 뒷받침되어야 하는 요소이다. 우리 정부가 인공지능 국가전략을 수립/공표하고 적극적인 대응을 시작한 것처럼 의료 인공지능 기술 개발과 연계한 국제표준화 및 규제체계 수립이 필요하다. 나아가 종합적 관점에서 의료 인공지능 기술-표준 기반 산업 육성 전략을 수립하고 중장기적인 로드맵 개발과 추진 노력이 동반되길 기대한다.

약어 정리

Artificial Intelligence

AHG

Ad-hoc Group

AUC

Area Under the Curve

CAD

Computer Aided Diagnosis

CDSS

Clinical Decision Support System

Clinical Terms

DICOM

Digital Imaging and Communications in Medicine

Focus Group

FDA

Food and Drug Administration

FML

Federated Machine Learning

GDPR

General Data Protection Regulation

HIMSS

Healthcare Information and Management Systems Society

IEC

International Electrotechnical Commission

IEEE

Institute of Electrical and Electronics Engineers

IHE

Integrating the Healthcare Enterprise

IMDRF

International Medical Device Regulators Forum

ISO

International Organization for Standardization

ITU

International Telecommunication Union

JTC

Joint Technical Committee

ROC

Receiver Operating Characteristic

ROI

Region of Interest

RSNA

Radiological Society of North America

SaMD

Software As Medical Device

Sub Committee

SNOMED

Systematized Nomenclature of Medicine

Working Group

WHO

World Health Organization

참고문헌

[1]

전종홍, 이강찬, "의료 인공지능 표준화 동향," 전자통신동향분석, 제34권 제5호, 2019, pp. 113-126.

[2]

ETRI, "중국 의료 인공지능 백서," 2019.

[3]

중국공업정보화부, "차세대 인공지능발전 촉진 3개년 행동계획 (2018-2020년)," 2017.12.17.

[4]

관계부처 합동, "인공지능 국가전략," 2019. 12.

[5]

ETRI, "중국 의학 영상 인공지능 백서," 2019.

[6]

C.J. Kelly et al., "Key challenges for delivering clinical impact with artificial intelligence," BMC Medicine, vol. 17, 2019, pp. 139:1-9.

[7]

C.P. Langlotz et al., "A Roadmap for Foundational Research on Artificial Intelligence in Medical Imaging: From the 2018 NIH/RSNA/ACR/The Academy Workshop," Radiology, vol. 291, no. 3, June 2019, pp. 781-791

[8]

B. Allen Jr et al., "A Road Map for Translational Research on Artificial Intelligence in Medical Imaging: From the 2018 National Institutes of Health/RSNA/ACR/The Academy Workshop," J. Am. College Radiology, Sept. 2019.

[9]

김정언 외, "수요자 중심 인공지능 기술 혁신 방안," 국가과학기술자문회의, 정책연구-2017-25호, 2018.6.29.

[10]

의료기기산업팀, "인공지능(AI) 기반 의료기기 현황 및 이슈 (1)," 한국보건산업진흥원, KHIDI Brief (보건산업 브리프), 2018.12.31.

[11]

의료기기산업팀, "인공지능(AI) 기반 의료기기 현황 및 이슈 (2)," 한국보건산업진흥원, KHIDI Brief (보건산업 브리프), 2018.12.31.

[12]

M. Salathe et al., "Focus Group on Artificial Intelligence for Health," ITU-T FG-AI4H, pp. 1-6.

[13]

M.A. Wenzel and T. Wiegand, "Towards International Standards for the Evaluation of Artificial Intelligence for Health," in Proc. Kaleidoscope: ICT Heath:Netw. Standards Innovation, Atlanta, CA, USA, Dec. 2019, pp. 1-10.

[14]

김종효, "영상정보학: 인공지능-빅데이터-데이터 과학 시대의 영상의학을 위한 새 지평," 대한영상의학회지, 제80권 제2호, Mar 2019, pp. 176-201.

[15]

DICOM, WG-23: Artificial Intelligence/Application Hosting,[https://www.dicomstandard.org/wgs/wg-23/]

[16]

IHE, "Image Based AI Workflow."

[17]

ETRI, "스마트 헬스 ICT 융합 표준화 프레임워크," 2019.

[18]

식품의약품안전처, "빅데이터 및 인공지능(AI) 기술이 적용된 의료기기의 허가·심사 가이드라인(민원인 안내서)," 2019. 10.

[19]

식품의약품안전처, "인공지능(AI) 기반 의료기기의 임상 유효성 평가 가이드라인(민원인 안내서)," 2019. 10.

[20]

국가기술표준원, "참조표준 제정 및 보급에 관한 운영요령," 국가 기술표준원 고시 제2018-313호, 2018. 8.

[21]

박성호 외, "첨단 디지털 헬스케어 의료기기를 진료에 도입할 때 평가원칙," 대한의사협회지, 제61권 제12호, 2018.12, pp. 765-775.

[22]

IMDRF, "Software as a Medical Device (SaMD): Clinical Evaluation," IMDRF/SaMD WG/N41FINAL: 2017.

[23]

FDA, "Proposed Regulatory Framework for Modifications to Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD)," 2019. 4.

[24]

식품의약품안전처, "의료기기의 사이버 보안 허가·심사 가이드라인 (민원인 안내서)," 2019. 12.

[25]

한국인터넷진흥원, "스마트의료 사이버보안 가이드," 2018. 5.

[26]

김휘영, 정대철, 최병욱, "딥러닝 기반 의료 영상 인공지능 모델의 취약성: 적대적 공격," 대한영상의학회지, 제80권 제2호, 2019, pp. 259-273.

[27]

A. Jobin, M. Ienca, and E. Vayena, "The global landscape of AI ethics guidelines," Nature Machine Intell., vol. 1, Sept. 2019, pp. 389–399.

[28]

정보통신정책연구원, "4차산업혁명시대 산업별 인공지능 윤리의 이슈 분석 및 정책적 대응방안 연구," 2018, pp. 1179-1189.

그림 1

AI Workflow의 Transaction map[16]

출처 IHE, “Image Based AI Workflow.”

그림 2

핵심 정책/표준화 이슈와 인공지능 기반 의료기기 생애 주기 연관도

출처 전종홍, 이강찬, “의료 인공지능 표준화 동향,” 전자통신동향분석, 34권 5호, 2019, 공공누리 제4유형

표 1 FG-AI4H Topic Group 현황(2020년 2월 1일 기준)

TG명 (2019년 7월)	TG명 (2020년 2월)	AI 기술 적용 범위
Cardiovascular disease risk prediction (TG-Cardio)	좌동	심혈관 질환 위험 탐지 및 예측
Dermatology (TG-Derma)	좌동	피부과 질환 및 응용
Falls among the elderly (TG-Falls)	좌동	노인 낙상 예방
Histopathology (TG-Histo)	좌동	조직 병리학 분석–유방암 위험성
Neuro-cognitive diseases (TG-Cogni)	Neurological disorders (TG-Neuro)	신경 인지 질환 진단
Outbreak detection (TG-Outbreaks)	좌동	감염병 탐지
Ophthalmology (TG-Ophthalmo)	좌동	망막 영상을 이용한 안과 질환 진단
Psychiatry (TG-Psy)	좌동	정신과 치료 및 응용
Radiotherapy (TG-Radiotherapy)	Radiology (TG-Radiology)	영상 의학
Snakebite and snake identification (TG-Snake)	좌동	뱀에게 물린 후 뱀 식별
Symptom assessment (TG-Symptom)	좌동	증상 평가
Tuberculosis (TG-TB)	좌동	결핵 예후, 진단 및 예측
Volumetric chest computed tomography (TG-Diagnostic CT)	좌동	흉부 CT 검사
TG-Growth	Maternal and child health (TG-MCH)	어린이 성장 모니터링
-	Diagnoses of bacterial infection and anti-microbial resistance (AMR) (TG-Bacteria)	박테리아 감염 및 항균 내성 진단
-	Dental diagnostics and digital dentistry (TG-Dental)	치과 진단 및 디지털 치과
-	AI-based detection of falsified medicine (TG-FakeMed)	위조 의약품 탐지
-	Malaria detection (TG-Malaria)	말라리아 감지

표 2 FG-AI4H의 문서 작성 계획

No.	Deliverable	Initial draft editor
1	AI4H ethics considerations	Andreas Reis (WHO), Julia Mohapatra (NICF, India)
2	AI4H regulatory [best practices \| considerations]	Jackie Ma (Franhofer HHI, Germany)
3	AI4H requirements specification	Pradeep Balachandran, Tina Purnat (WHO)
4	AI software life cycle specification	Pat Baird (Philips, USA), Tina Purnat (WHO)
5	Data specification	Marc Lecoultre (ML Lab, Switzerland)
6	AI training best practices specification	Rainer Berger (AI Singapore)
7	AI4H evaluation specification	Markus Wenzel (Fraunhofer HHI, Germany)
8	AI4H scale-up and adoption	Sameer Pujari (WHO)
9	AI4H applications and platforms	Manjeet Chalga (ICMR, India), Aveek De (CMS, India)
10	AI4H use cases: Topic description docs.	Eva Weicken (Fraunhofer HHI, Germany)

표 3 DASH/DAISAM WG Joint Workshop 논의 주제들

	Tests WS 트랙		Data WS 트랙		Assessment Platform WS 트랙
1일차	•	Networks for Analyzing Structural MRI Data in Neurological Diseases	•	Reference Data for Machine Learning	•	Precision Evaluation: A Standardized Domain-Agnostic Framework and Platform For Evaluating AI Systems
	•	ML for Mammography & Inspecting Adversarial Examples Using the Fisher Information	•	The Long Tail of Medical Data	•	AWS Sagemaker + CI/CD + Docker as a Platform Blueprint
	•	Can Assessment of AI-based Medical Devices Learn From Standardization and Round Robin Tests for Clinical Chemistry?	•	Towards Deep Federated Learning in Healthcare	•	Clinical Validation Techniques for Medical Imaging AI - A Platform Approach
	•	Applicability of AI in Aiding Pathology Diagnosis in Low and Middle Income Countries	•	An Alternative to Federated Learning: Generative Adversarial Networks for Data Sharing and Data Privacy	•	A Tale on Data Quality
2일차	•	Novel Decision-Informed Metrics for Medical AI Validation	•	Diagnosis of Brain Diseases with AI Applications in	•	Big Data Governance
	•	Degrees of medical XAI	•	Federated Data Sharing Environment	•	Enterprise Data Pipelines
			•	A Federated Convolutional Denoising Autoencoder for MRI Applications	•	AIcrowd Platform
			•	Validating Image Compression for AI in Microscopy

표 4 IEEE 의료 인공지능 관련 표준화 프로젝트

표준 번호	표준명	연관 산업계 및 사업자
P2801	Recommended Practice for the Quality Management of Datasets for Medical Artificial Intelligence	의료기기 제조 업계, 규제기관, 의료 데이터 서비스 사업자
P2802	Standard for the Performance and Safety Evaluation of Artificial Intelligence Based Medical Device: Terminology	의료기기 제조 업계, 규제기관, 의료 데이터 서비스 사업자
P3652.1	Guide for Architectural Framework and Application of Federated Machine Learning	의료, 재무, 마케팅, 교육, 통신 및 기타 연구 분야

표 5 의료 인공지능 주요 유즈케이스

서비스 패키지	단위 서비스 유스케이스
(SP-01) 인공지능 기반 의료기기	• (SU-01-01) 자동 진단 보조
	• (SU-02-01) 다기관 데이터 기반 CDSS
	• (SU-03-01) 자동 음성인식 의료 정보 기록
(SP-02) 인공지능 주치의 서비스	• (SU-04-02) 인공지능 기반 주치의 서비스
(SP-02) 인공지능 주치의 서비스	• (SU-05-02) 만성질환 케어 에이전트

출처 ETRI, “스마트 헬스 ICT 융합 표준화 프레임워크,” 2019.

표 6 SaMD 위험도 분류 체계

건강관리 상황 또는 조건의 상태	건강관리 의사결정에 SaMD가 제공한 정보의 중요도
건강관리 상황 또는 조건의 상태	치료 또는 진단	임상 관리 실행	임상 관리 고지
치명적	IV	III	II
심각	III	II	I
비심각	II	I	I

출처 식품의약품안전처, “빅데이터 및 인공지능(AI) 기술이 적용된 의료기기의 허가·심사 가이드라인(민원인 안내서),” 2017.11

Sign Up: 전자통신동향분석 이메일 전자저널 구독을 원하시는 경우 정확한 이메일 주소를 입력하시기 바랍니다.

ETRI

의료 인공지능 10대 표준화 동향 및 전망

Top 10 Key Standardization Trends and Perspectives on Artificial Intelligence in Medicine

Share

Ⅰ. 서론

Ⅱ. 국제/국내 표준화 동향

1. 국제표준화 기구별 동향

그림 1

AI Workflow의 Transaction map[16]

2. 표준화 프레임워크

Ⅲ. 10대 핵심 이슈

그림 2

핵심 정책/표준화 이슈와 인공지능 기반 의료기기 생애 주기 연관도

1. 정의와 분류

2. 위험 평가 및 관리 체계

3. 성능평가

4. 표준 데이터 및 기준 데이터

5. 임상 평가

6. 품질관리 프로세스

7. 보안 및 프라이버시

8. 윤리적 위험관리

9. 연동 및 상호호환성

10. 응용 요구사항

Ⅳ. 결론

약어 정리

그림 1

AI Workflow의 Transaction map[16]

그림 2

핵심 정책/표준화 이슈와 인공지능 기반 의료기기 생애 주기 연관도

ETRI