ettrends banner

김성민 (Kim S.M.)
홍아름 (Hong A.R.)
연승준 (Yeon S.J.)



Keywords: ETRI AI Strategy, AI platform, AI hub, open source, open innovation

Ⅰ. 서론

1. 배경 및 필요성

글로벌 AI 생태계는 개방형 플랫폼 기반으로 협업과 경쟁이 이루어지고 있다. AI가 구현되고 진화 발전하기 위해 필요한 AI 기술, 데이터, 클라우드 기술들이 플랫폼 기반으로 빠르게 진화, 발전하고 있다. 글로벌 기업들은 소스코드를 공개하거나 API를 공개하는 방식으로 자사 기업 밖의 개발자들을 끌어들여 개발을 가속화하고 생태계를 확장하고 있다.

1990년대 리눅스로부터 시작된 오픈소스 개발 방식은 컴퓨터 운영체계와 웹서비스를 넘어 제4차 산업혁명의 핵심기술인 AI 서비스 구현기술들을 급속도로 발전시키고 있다. 머신러닝 분야에서는 구글(텐서플로), 페이스북(카페2, 파이토치), 마이크로소프트(CNTK), 바이두(패들패들) 등의 기업들이 AI 프레임워크를 공개하여 개발 속도를 가속화하고 있다. 빅데이터 분야에서는 빅데이터 처리 프레임워크로 아파치 재단의 하둡(Hadoop) 프로젝트와 통계처리 프로그램 R이 주류로 활용되고 있다. 클라우드 분야에서는 아마존, 구글, 마이크로소프트 등은 자사의 퍼블릭 클라우드 기능개선 및 신규 개발을 위해 오픈소스SW인 클라우드파운드리, 도커, 쿠버네티스 등을 활용하고 있다[1]. 최근들어서는 자율주행, 스마트시티, 스마트의료 등 다양한 산업의 응용기술들도 오픈소스 방식으로 개발되고 있다.

이러한 오픈소스의 확산을 주목해야 할 이유가 무엇일까? 여러 이유들 중 중요한 한 가지는 전 세계 개발자들이 물리적으로는 흩어져 있지만 가상의 세계에 모여서 협업 개발을 하면서 제4차 산업혁명시대의 주요 기술들을 매우 빠르게 발전시키고 있다는 것이다. 즉 전 세계 SW 개발자들이 깃허브, 깃랩, 소스포지 등 오픈소스 코드 저장소에 소스코드를 공개[2]하고, 개발자들과 협업하여 거대한 SW를 발전시켜가고 있다.

글로벌 사업자들은 기술 사용자 생태계를 확대하기 위한 다른 방편으로 클라우드 기반의 AI 서비스(AIaaS: AI as a Service)를 제공하고 있다. AI가 제품이나 서비스로 구현되고 진화, 발전하기 위해서는 AI 기술, 학습 데이터, 컴퓨팅 자원 등 다양한 기술과 자원이 필요하다. 그런데 일부 IT 대기업을 제외한 대부분의 기업들은 이러한 자원을 스스로 확보하기 어렵다. 구글, 아마존, 마이크로소프트 등 글로벌 기업들은 AI 서비스 개발에 필요한 모든 자원을 자사 클라우드를 기반으로 서비스 형태로 제공하고 있다[3]. 즉 이들은 다양한 AI 기술을 API 형태로 제공하는 한편, 개발 초기에 필요한 데이터와 컴퓨팅 자원을 서비스로 제공하여 새로운 수익원을 확보하고 자신들에게 유리한 생태계를 조성하고 있다.

우리나라의 인공지능 기술 수준은 미국 대비 81.6% 수준으로 중국과 일본보다 낮으며, 민간과 공공분야의 인공지능 활용 수준도 낮다[4]. 중국과 일본의 인공지능 기술 수준은 각 88.1%, 86.4%이며, 자국 내 업체들의 인공지능을 활용하고 있다.

우리나라의 AI 기술역량을 높이기 위한 방안으로 AI 핵심인력을 확보하고 육성하는 논의와 함께 전 세계적으로 공유되고 있는 오픈소스SW 기술을 어떻게 활용하고 어떻게 생태계에서 자리 잡을 것인지에 대한 논의도 필요하다. 아울러 글로벌 사업자에 대한 의존도가 높아지고 있는 클라우드 플랫폼 기반의 AIaaS 전략은 어떻게 세울 것인지에 대한 논의도 필요하다.

ETRI는 그간 ICT 전문 연구기관으로서 대한민국 ICT 산업의 성장에 기여해 왔다. 이제 AI 시대로의 전환점에서 대한민국이 ‘IT 강국을 넘어 AI 강국으로’ 성장할 수 있도록 ETRI는 ‘국가지능화 종합연구기관’으로 거듭나고자 한다. 이를 위해서는 AI를 비롯한 SW 개발 생태계의 ‘게임의 룰’로 자리 잡아가고 있는 ‘오픈’, ‘공유’, ‘협업’ 환경에서 ETRI가 어떻게 적응해가야 할지 전략적 대응체계와 이에 따른 새로운 거버넌스의 확립, 그리고 연구개발 프로세스의 재정비가 필요하다.

2. 그간의 ETRI 추진 성과

ETRI는 그간 오픈소스 기반 R&D 혁신을 위해 다양한 노력을 해왔다. 2017년, 정부출연연구원 최초로 오픈소스 거버넌스 체계를 구축하였으며, 관련 제도와 정책을 기반으로 연구개발 시 오픈소스 라이선스 위반 및 특허 침해 등 위험관리 중심의 대응을 해오고 있다. 2019년부터는 오픈소스 기반 연구활동을 내부 규정으로 제도화했고, 2020년 부터는 오픈소스 전문위원제도를 도입하여 오픈소스 연구개발 활동을 적극 장려하고 있다[5]. 그 외에도 AI 기술을 공개하는 등 AI 생태계 기반 마련을 위한 여러 가지 노력을 하고 있다.

ETRI는 개발된 AI 기술의 확산과 AI 플랫폼 활성화를 위해 과학기술정보통신부의 AI 허브[6]를 통한 AI API 공개, 연구데이터 공개, 프레임워크 기술 개발 및 지원 등 다양한 노력을 해왔다. 또한 보다 적극적인 기술과 데이터 공유를 위해 독자적으로 오픈API·DATA 서비스 포털[7]을 마련하고 과학기술정보통신부 R&D를 통해 개발된 다양한 인공지능 기술 및 데이터를 누구나 체험하고 연구 목적으로 사용할 수 있도록 공개하였다. 이외에도 판교센터 AI 공유플랫폼[8]을 통해 데이터 세트를 공개하고 있으며, AI 기술적용 및 활용을 위한 전주기 인공지능 프레임워크/플랫폼 기술인 ‘BeeAI’ 기술을 개발하여 다양한 도메인에서 공통적으로 활용할 수 있도록 공개하였다[9].

3. ETRI 개방형 플랫폼 추진 방향

2030년까지 ETRI가 중점적으로 확보할 원천기술의 로드맵을 수립하고, AI 인프라와 x+AI 서비스 기술 경쟁력의 동반 상승을 도모하기 위한 연구 전략을 수립하였다. 이를 위해 주요국 AI R&D 계획 및 전문기관의 AI 기술전망을 분석하여 AI 유망기술을 도출하고 ETRI의 주요 역할 및 기술력에 기반하여 ETRI AI 추진과제를 다음과 같이 도출하였다.

1) AI-R&D 협력 연구를 위한 AI 오픈소스 플랫폼(OSP) 구축 및 운영

2) x+AI 기술확산을 위한 x+AI 개방형 플랫폼(XOP) 구축 및 운영

Ⅱ장에서는 이 2가지 개방형 플랫폼 분야에 대한 기술 개념 및 국내·외 연구동향을 살펴보고, Ⅲ장에서는 ETRI 추진과제에 대해 상세히 소개한다. Ⅳ장에서는 ETRI가 이러한 개방형 플랫폼을 어떻게 발전시켜갈 것인지 전략방향을 소개하고자 한다.

Ⅱ. 관련 동향

1. 오픈소스 플랫폼 관련 동향

가. 해외

세계 최대 오픈소스 개발 플랫폼인 깃허브는 2019년 9월말 기준, 70여 개국의 4천만 개발자(사용자 계정수)가 참여하는 글로벌 개발 플랫폼으로 급성장하고 있다. 깃허브의 성장은 최근 급격히 두드러져서 최근 1년간 개설된 계정수가 1천만 개, 신규 프로젝트는 4,400만 개에 달한다. 깃허브에 올려진 오픈소스 프로젝트는 평균 41개 국가나 지역에 사는 개발자가 구축한 것이며, 깃허브 사용자의 80% 이상은 미국 이외 국가에서 사용하며, 중국, 인도, 독일, 영국, 일본 등의 개발자 비율이 높다. 이 중 텐서플로우는 깃허브에서 가장 인기 있는 프로젝트 중 하나로 2018년 10월부터 2019년 9월 사이 참가자 2,200명이 개발에 참여하였으며, 텐서플로우와 종속 프로젝트 참가자를 모두 포함하면 2만5천 명이 개발에 기여했다고 할 수 있다[10].

산업분야를 구분하여 볼 때도 다양한 산업에서 오픈소스 사용이 확대되고 있다. 시놉시스의 2019년 보고서에 따르면 17개 산업 분야 코드베이스 중 99%가 오픈소스를 포함하고 있으며, 최대 70%까지 오픈소스로 구성된다[11]. 한국리눅스재단에 따르면 IT 기술에 사용되는 시스템과 서비스 코드는 대부분 실사용 기업의 외부에서 개발되어 평균 29%에서 최대 80%까지 외부에서 오픈소스로 개발된 코드를 사용하고, 20~70%에 기업의 가치 창출을 위해 차별화한다[12].

오픈소스는 공개되어 있고, ‘무료’로 사용하지만 라이선스에 정의된 의무사항을 따라야 하며, 불이행시 법적, 경제적 손해를 입을 수 있다. 오픈소스 이니셔티브(OSI)에서 공인된 라이선스는 82개, 소프트웨어 패키지 데이터 익스체인지(SPDX)에서 다루는 라이선스는 350개, 블랙덕 날리지베이스에는 2,600여 개의 라이선스가 파악되고 있다. 이 중 가장 많이 쓰이는 라이선스 20개가 실제 사용되는 오픈소스의 98%를 커버하지만, 유명하지 않은 라이선스라도 해당코드 작성자가 적용한 라이선스를 따라야 한다. 오픈소스 활용이 높아지면서 라이선스가 복잡하여 법적 분쟁과 소송의 우려가 높고, 악성코드로 보안의 취약성도 높을 수 있다. 시놉시스에서 2019년 감사한 코드베이스 중 75%가 최소 하나 이상의 공개된 취약성을 가지고 있었고, 49%가 고위험 취약성이었다. 시놉시스가 감사한 코드베이스 중 73%가 오픈소스 라이선스 충돌이 일어나거나 라이선스를 갖지 않은 컴포넌트를 포함하였다. 오픈소스 라이선스 위반 시, 국제소송 및 경제적 피해가 생길 수 있으므로 전문적인 대응체계 및 조직을 갖춰야 한다. 2018년 한컴은 듀얼라이선스인 고스트스크립트(Ghostscript)를 사용하면서 코드를 공개하거나 사용료를 내야 하는 의무를 위반하여 분쟁소송 끝에 23억 원을 지불하였으며, 삼성전자도 자사 제품에 오픈소스 Busybox를 사용하고 GPL 라이선스 규정을 준수하지 않아 뉴욕법원에 제소하였다. 이 분쟁은 2009년 합의로 종료되었지만 막대한 소송비용, 배상비용, 기업이미지 실추 등의 손해가 발생하였다[13].

나. 국내

국내 AI 생태계가 글로벌 생태계를 따라잡기 위해서는 무엇보다 개방형 혁신의 가속화가 필요하다. 그간 우리 정부에서 오픈소스 기반 연구개발을 지원하고 협력적인 AI 생태계 조성을 위한 여러 가지 노력을 해오면서 오픈소스 생태계가 성장하기 시작하였다. 정부는 「소프트웨어산업 진흥법」을 개정하고 국가연구개발사업을 하는 경우 공개소프트웨어방식으로 개발하고 결과물을 배포하는 노력을 하도록 명시하였다(2020년 5월). 또한 오픈소스를 확대하기 위해 오픈소스 기반 연구 개발 과제를 지원함은 물론 개발자 커뮤니티 지원 및 해커톤 대회 개최 등 다양한 지원사업을 추진해오고 있다. 이러한 노력으로 국내 오픈소스 시장 규모는 2018년 2,337억 원 수준으로 2017년 대비 23.7% 성장하였으며, 2022년까지 연평균 19.9%씩 성장하여 4,678억 원 규모에 이를 전망1)이다. 금융, 제조, 유통/물류 등 8개 산업에서 제4차 산업 핵심기술을 도입한 기업들이 현재 활용하고 있는 제4차 산업 핵심기술은 빅데이터 53.6%, 클라우드 42.4%, IoT 31.2%, AI 24.0% 순으로 나타났다. 이들 중 공개SW에 기반을 둔 기업은 42.4%이며 향후 공개SW를 도입할 의사가 있는 기업은 81.5%이다[14].

NIPA 2018 공개SW 기업 편람에[15] 따르면 오픈소스SW 활용의 가장 큰 장점으로는 비용절감(라이선스, 유지보수비 등)으로 꼽혔으며, 단점은 신속한 지원을 받기 어렵다는 것으로 조사되었다.

SW 기업이 오픈소스SW를 사용하는 장점은 자사 엔지니어 기술 능력의 향상 기회 제공, 소스코드를 직접 수정 가능, 시스템 개발 기간 단축 등이 꼽혔다. Non-SW 기업이 오픈소스SW를 사용하는 장점으로는 특정 벤더에 대한 솔루션 종속력 완화, 소프트웨어와 솔루션의 선택권이 넓어지는 것을 중요한 장점으로 꼽았다.

SW 기업이 오픈소스SW를 사용하는 단점은 소스코드 관리의 어려움, 보안 취약점 대응이 어려움 등이었으며, 개인(개발자)의 입장에서는 활용 수준이 일정 수준에 이르기까지 다루기 어렵고, 벤더나 SI 제공 업체들의 지속적인 지원이 받기 어려운 점을 꼽았다.

기술개발을 오픈소스로 공개할 때, 공개된 소스가 활용되고 프로젝트가 지속가능하게 되기 위해서는 개발자 커뮤니티, 지속적인 투자, 커뮤니티의 개발자를 고용하는 기업 등의 선순환 고리가 형성되어야 한다. 해외에서는 글로벌 기업이 지속적으로 자금을 투자하고, 커뮤니티 개발자를 고용하여 개발자 커뮤니티가 지속적으로 성장하는 선순환 고리 형성되었으나, 국내에서는 소프트웨어 시장 규모가 작고, 오픈소스 커뮤니티가 활성화되지 못하였으며, 중소기업들은 오픈소스 활용 역량이 부족한 등 다양한 요인들로 인해 아직 오픈소스 생태계가 본격적으로 성장하는 데 어려움을 겪고 있다.

2. AI 플랫폼 관련 동향

가. 해외

아마존, 구글, 마이크로소프트, IBM 등이 자체 클라우드를 바탕으로 AI 플랫폼 및 AI 서비스를 제공하고 있다. 컴퓨팅 인프라 및 프레임워크, 클라우드 등을 구축하여, 고객들이 해당 자원들을 활용하여 데이터를 가공하고 AI 모델을 구축할 수 있도록 하는 AI 플랫폼(머신러닝 플랫폼)을 제공하고 있다. 또한 음성인식, 번역, 이미지 분석 서비스 등 데이터만 적용하면 결과를 도출할 수 있도록 하는 API 형태의 AI 서비스를 제공하기 때문에 AI 개발 역량이 낮은 고객들도 쉽게 이용할 수 있다. 비용은 대부분 각 서비스별 이용량당 지불하며, 측정단위는 각 서비스에 따라 이용시간·문자길이·음성 시간 등 차이가 있다[16]. 해외사업자 중 SAS의 경우에는 자체 클라우드를 보유하고 있지 않지만 모든 클라우드 플랫폼, 온프레미스, 하이브리드 환경에서 이용 가능한 AI 분석 플랫폼을 제공하고 있다. 구글은 구글 클라우드에 ‘Google AI Platform’을 통해 AI 기술-데이터-컴퓨팅 자원에 대한 고객들의 접근성을 높이고 있다. 마이크로소프트는 오픈 AI(OpenAI)와 협력하여 자사의 클라우드 플랫폼인 애저(Azure)를 활용한 AI 플랫폼 서비스를 제공하고 있다2).

나. 국내

국내에서도 AI 플랫폼이 형성되고 있다. 정부에서 AI 기술의 확산을 위해 ‘AI 허브’를 구축하고, 이를 통해 우리 기업들이 독자적으로 확보하기 어려운 컴퓨팅 자원, AI 학습용 데이터와 API 형태의 AI 기술을 제공하고 있다. 또한 공공기관이 보유한 데이터를 민간이 활용할 수 있도록 데이터 개방과 유통을 활성화하기 위해 공공데이터 포털 등 다양한 사업을 추진하고 있다.

민간 영역에서는 AI에 대한 관심과 수요가 높아지면서 AI 플랫폼에 대한 관심도 높아지고 있다. 아직까지는 국내 AI 플랫폼 시장도 해외사업자 위주로 시장이 형성되어 마이크로소프트, IBM, 인텔, 구글, 아마존 등의 해외 대형 사업자들이 높은 점유율을 차지하고 있다[17]. 그러나 네이버, 삼성 SDS, LG CNS 등의 대형 사업자와 스타트업이 AI 플랫폼 시장에 뛰어들고 있다. 네이버는 음성인식과 번역에 특화된 Clova 플랫폼을 제공하고 있으며[18], 삼성SDS, LG CNS와 같은 시스템 통합 업체들도 자체 클라우드를 기반으로 AI 플랫폼을 제공하고 있다[19,20]. 스타트업 기업인 솔트룩스, 아크릴, 마인즈랩 등이 범용 AI 플랫폼을 구축하였으며, 루닛, 뷰노 등이 의료분야에 특화된 AI 플랫폼을 제공하고 있다[21].

3. 개방형 플랫폼을 활용한 수익화 전략

글로벌 사업자들은 오픈소스와 AI 플랫폼을 전략적으로 조합하여 생태계를 확장하는 동시에 수익을 확대하고 있다. AI 구현을 위해 필요한 기술스택 중 많은 부분을 오픈소스로 공개하지만 특정 계층의 핵심기술은 공개하지 않는다. 구글은 AI 서비스를 위한 Tensorflow와 개발환경을 위한 Kubernetes는 오픈소스로 개방하지만 핵심적인 머신러닝 엔진과 TPU는 개방하지 않아 서비스를 차별화하고 수익을 확보하는 전략을 추진한다. 아마존은 오픈소스 기반으로 생태계 협력체계를 구축하여, 개발자들이 아마존 클라우드에서 다양한 새로운 서비스를 개발하고 품질을 높일 수 있게 함으로써 아마존 클라우드의 경쟁력을 강화한다. 마이크로소프트도 2014년 오픈소스 중심으로 전략을 변화하고 애저 중심의 오픈소스 서비스 생태계를 확대하고 있다[22].

Ⅲ. ETRI 추진과제

AI 협력개발과 AI 기술 생태계의 확산이 유기적으로 일어날 수 있도록 AI 오픈소스 플랫폼(OSP)과 x+AI 개방형 플랫폼(XOP)으로 구성된 ‘AI 개방형 플랫폼’ 구축을 추진한다.

1. AI 오픈소스 플랫폼(OSP) 구축 및 운영

가. 개념 및 필요성

ETRI에서 추진하는 ‘AI 오픈소스 플랫폼(Open Source Platform)’이란 AI 알고리즘, 데이터, 컴퓨팅 등 다양한 자원이 종합적으로 구현하는 AI 서비스의 협력 연구개발을 위한 ‘유형(有形)의 플랫폼’과 이를 중심으로 협력개발을 활성화하기 위한 ‘무형(無刑)의 제도 및 지원 체계’를 포함한다. ‘ETRI AI 오픈소스 플랫폼’은 깃허브 및 깃랩 등의 저장소를 기반으로 ETRI 내에서 개발되는 SW 기술을 공유하는 한편, 국내·외 외부 생태계와 안전한 개방형 협업을 위해 필요한 라이선스 검증 및 대응, 보안점검, 컴플라이언스, 거버넌스 등의 무형의 지원 체계를 제공한다(https://oss.etri.re.kr/).

오픈소스 방식은 개방형 협업을 위한 탈중앙식 개발 모델로, 기업·기관 외부 개발자를 개발에 참여시켜 비용절감, 품질향상, 기술 보급 확대 등의 장점이 있으나 법적 분쟁의 위험 및 실질적 이득이 없을 수 있으므로 기술적/전략적 준비가 필요하다. 즉 공개된 오픈소스 기술을 활용할 경우, 개발 기간과 비용을 단축시킬 수 있으나 라이선스 규칙 위반 및 특허 침해 시 저작권 침해로 법적인 책임이 있을 수 있다. 또한 개발된 기술을 공개함으로 인해, 많은 기업이 활용할 수 있는 장점이 있으나 해단 기술의 공개는 수익 창출을 오히려 어렵게 할 수도 있다.

나. 그간의 추진 경과

ETRI도 오픈소스 R&D를 장려하고 AI 기술을 공개하는 등 AI 생태계 기반 마련을 위한 여러 가지 노력을 하고 있다. ETRI는 전 세계적 오픈소스 SW 활동에 대한 전사적 대응과 개방형 R&D 환경에 대한 대응 전략으로 ETRI 오픈소스 전담조직 신설을 결정하였다(2017년 5월 22일). ETRI 오픈소스 센터를 신설하고(2017년 6월), 오픈소스센터 역할 및 임무로 원내 오픈소스 정책 수립 및 거버넌스 대응 총괄, 오픈소스 컴플라이언스 지원 총괄, 대외 오픈소스 정책 및 기술대응/지원, 오픈소스 프로젝트 확산 및 기여자, 커미터 지원, 원내 오픈소스 연구개발 활동 지원 등의 임무를 부여하였다. 그 후, ETRI 오픈소스 위원회를 신설(2017년 8월 14일)하여 운영하면서 정부출연연구기관 최초로 오픈소스 연구 활동 요령을 원규로 제정하였다[23].

다. 향후 추진과제

1) 오픈소스를 위한 전주기적 지원 강화

오픈소스 전담조직인 ETRI 오픈소스 센터를 중심으로 오픈소스 활용 및 공개를 위해 다음과 같이 전주기적으로 지원 활동을 체계화한다.

(1) 오픈소스 플랫폼을 운영 및 고도화한다. ETRI 내부 및 외부 개발자 간 오픈소스 협업 기반의 R&D 혁신을 위한 공통 플랫폼 인프라(오픈소스 저장소인 깃허브와 깃랩 기반)를 확보하고, 커뮤니티, 컴플라이언스 기능 등 R&D 협업을 지원하는 개발환경을 제공한다.

(2) 오픈소스SW의 활용을 지원한다. 안전하고 효율적인 오픈소스 활용을 위해 안전한 오픈소스 목록 제공, 라이선스 및 보안 취약점 검증 지원, 법률자문 지원체계 수립을 추진한다.

(3) 기술개발 과제를 오픈소스로 공개하는 것을 지원한다. ETRI 내부/외부 및 클라우드 저장소 지원, 오픈소스 공개 계획 심의 제도 도입, 오픈소스 등록 제도 및 법률 지원, 오픈소스 커뮤니티 운영 체계 및 활성화를 위한 다양한 지원활동을 제공한다.

(4) 오픈소스 활성화를 지원한다. 오픈소스 거버넌스 정책 및 제도 고도화, 오픈소스 기여자 및 커미터 육성 및 양성, ETRI 오픈소스 비즈니스 전략 개발, 정부, 유관기관, 단체와 협력체계 구축 및 대응 등의 활동을 추진한다.

2) ETRI 오픈소스 플랫폼 체계화 및 기능 강화

ETRI 오픈소스 R&D 포털에서 오픈소스SW의 활용 및 검증, 주요 연구개발 결과물의 오픈소스SW 공개, 내·외부 개발자들과의 협업 프로젝트 등 오픈소스SW 과제 수행 전주기 활동을 지원한다.

(1) Inner Source: ETRI 내부 연구원들 간 협업이 용이하도록 지원하고 인센티브를 제공하여 ETRI 내의 효과적인 기술축적을 위한 내부 R&D 공유 플랫폼을 운영한다.

(2) Open Source: 검증된 AI 기술 중 전략적으로 외부 공개가 유리한 과제들에 대해 외부에 공개하여 생태계 구성원과 협력 개발 및 신속한 기술 확산을 유도한다.

(3) 표준·가이드: 오픈소스 활용 및 개발을 위한 R&D 전주기 활동을 지원하는 오픈소스 R&D 표준 프로세스, 라이선스 가이드, 라이선스 검증 가이드, 공개 가이드, 저장소 사용 가이드, 외주과제 SW결과물 오픈소스 관리 가이드 등을 제공한다.

3) 오픈소스SW 특허 관리 전문화

(1) 오픈소스SW 특허 관리: 특허권 행사에 태생적 제약이 존재하는 오픈소스SW 관련 특허를 분류·식별하고 별도 관리하기 위한 OSS 특허 관리 프로세스 및 단계별 가이드를 수립 및 시행한다.

(2) OSS 특허 관리 프로세스를 정립한다. 기존 특허관리시스템에서 “일반 특허”와 “표준 특허”로 구분되는 특허 종류에 “OSS 특허”를 신설 추가하여, 직무발명신고 단계부터 “OSS 특허”를 특정하고 특허 관리 프로세스 전반에 걸친 별도 관리를 추진한다.

(3) OSS 공개·비공개 기술을 식별하고 관리한다. 특허권 무료 라이선스가 명시적 또는 묵시적으로 허용되는 “OSS 공개 기술”은 적정 수준의 권리를 확보하고 관리하는 한편, OSS 특허에 포함된 “OSS 비공개 기술”은 밀착지원을 통한 별도 권리화를 추진한다.

2. x+AI 개방형 플랫폼(XOP) 구축 및 운영

가. 개념 및 목적

x+AI 개방형 플랫폼은 학습, 데이터 분석, 추론 등 AI 서비스 구축을 위해 필요한 컴퓨팅 자원과 소프트웨어 등 여러 기술요소를 한 곳에 통합하여 이를 다양하게 조합하여 활용할 수 있도록 제공하는 플랫폼이다. ETRI ‘x+AI 플랫폼’은 AIaaS(AI as a Service) 구현을 위한 API, 데이터, 컴퓨팅 자원, 활용확산 기술 등을 지원하는 플랫폼 기술 및 플랫폼을 포함한다. AI 제품 및 서비스를 개발하려는 기업들이 AI 기술(API)과 데이터, 컴퓨팅 등 필요한 기술요소 및 자원을 통합, 제공할 수 있도록 접근성 제고를 목적으로 한다.

나. 그간의 추진 경과

ETRI는 AI 플랫폼 활성화를 위해 과학기술정보 통신부의 AI 허브[6]를 통한 AI API 공개, 연구데이터 공개, 프레임워크 기술 개발 및 지원 등 다양한 노력을 해왔다. 인공지능 SW 결과물(언어처리, 음성지능, 시각지능, 대화처리 등) 30종을 공개하여 총 3,200만 건이 활용(2020년 9월 기준)되었는데, 활용한 수요자는 산업체(37%), 대학교(34%), 개인(24%), 기타(5%)의 개발자들이었다(2017년 3월 이후). ETRI는 보다 적극적인 기술과 데이터 공유를 위해 독자적으로 오픈API·DATA 서비스 포털[7]을 마련하고 과학기술정보통신부 R&D를 통해 개발된 다양한 인공지능 기술 및 데이터를 누구나 체험하고 연구목적으로 사용할 수 있도록 공개하였다. 이외에도 판교센터 AI 공유플랫폼[8]을 통해 데이터 세트를 공개하고 있으며, AI 기술적용 및 활용을 위한 전주기 인공지능 프레임워크/플랫폼 기술인 ‘BeeAI’ 기술을 개발하여 제조, 농업, 공공, 의료 등 x+AI 기술을 필요로 하는 도메인에서 공통적으로 활용할 수 있도록 공개하였다. BeeAI는 IoT, 빅데이터, 기계학습, 응용 개발과 서빙 기술을 규격화하고, 이들을 융합하여 다양한 지능 서비스를 생산하여 현장에 적용하기까지의 일련의 절차를 수행하는 파이프라인 시스템을 동적으로 구성(개발), 배포, 운영할 수 있는 인공지능 프레임워크/플랫폼이다.

다. 향후 추진과제

기 추진 중인 사업을 확대하는 한편, 공동개발 및 기술확산의 플랫폼으로 체계화해야 한다.

(1) AI API 공개 확대: 대학 및 산업계 등에서 쉽게 ETRI AI 기술을 활용할 수 있도록 과학기술정보통신부 AI 허브(www.aihub.or.kr)를 통해 API 제공을 확대할 예정이다. 향후 아랍어 음성인식, 한국어 발음평가, 포즈 검출 기술 등이 공개될 예정이며, 보다 많은 ETRI AI 기술이 공개될 수 있도록 추진 예정이다.

(2) 데이터: ETRI의 기술력, 신뢰성, 공정성을 기반으로 공공기관의 빅데이터 수집 및 학습데이터를 가공·공유·활용할 수 있는 환경을 제공하여 정부의 데이터 활용정책을 지원한다. AI 플랫폼을 통해 ETRI에서 구축한 학습데이터 공개를 확대할 수 있도록 한다.

(3) AI 융합 프레임워크: 다양한 AI를 융합하여 고도화된 서비스 및 현장형 응용 개발을 돕는 ‘BeeAI’와 같은 융합 전문 프레임워크 기술 확산을 추진하는 한편, 이를 제3의 업체/기관을 통해 AI 상용화 전문 서비스로 확대하는 방안에 대한 검토도 추진한다.

(4) 장비 임대 및 컨설팅: ETRI 보유 장비와 전문인력을 활용하여 기업들이 개발한 기술에 대한 테스트 및 컨설팅 제공, 대학 및 기업과 공동 플랫폼으로 활용을 추진한다. ETRI는 서울대 반도체공동 연구소와 기관 간 반도체 연구시설을 공동 플랫폼으로 활용하는 등의 차세대 AI 반도체 분야 협력기반을 마련하였다.

Ⅳ. 결론

ETRI가 오픈소스와 개방형 플랫폼으로 대변되는 개방형 협력 개발 생태계를 통해 연구개발 혁신을 이루고, 국내·외 AI 생태계에서 영향력을 확대해가기 위해서는 AI 개방형 플랫폼을 체계화하고 전략적으로 활용을 확대해야 한다. 특히 글로벌 IT 기업들에 비해 국내 기업, 대학, 정부출연연구기관 연구자들은 AI 기술, 데이터, 컴퓨팅 자원 등 모든 면에서 열위에 있다. ETRI는 이러한 열악한 상황을 극복하고 국내 AI 기술 및 생태계 경쟁력을 확보하기 위해 다음과 같이 AI 개방형 플랫폼을 고도화 해가야 한다.

첫째, ETRI 플랫폼을 통해 제공하는 Open API, 학습데이터, 컴퓨팅 성능 등을 확대하고, 안전하게 연구 결과물을 공유할 수 있는 컴플라이언스 및 지원제도를 확충하여 플랫폼이 지원하는 범위를 포괄적으로 충분하게 확대해야 한다. AI 기술뿐만 아니라 SW로 개발되는 다양한 기술범위로 영역을 확대하고 기술지원, 법률지원, 표준화 및 특허관련 지원 등 지원 범위를 확대하여 다양성을 확보해야 한다.

둘째, 개발자들이 이용하기 편하게 플랫폼의 구조와 기능을 제공할 뿐만 아니라, 기술의 수요자와 일반 이용자들을 유형화하여 이들의 눈높이에 맞는 편리성을 제공해야 한다. ETRI 내부에서의 협업 및 기술축적을 위한 Inner Source 플랫폼과 외부와의 협업 개발을 위한 Open Source 플랫폼을 공통 플랫폼으로 제공하며 안전하고 효율적인 협업을 할 수 있도록 필요한 기능을 제공해야 한다. 공통플랫폼을 중심으로 원활한 의사소통을 위한 커뮤니티를 지원해야 하며 이를 통해 R&D 방법론에 대한 혁신이 이루어질 수 있도록 지원해야 한다.

셋째, 기술의 공개 범위, 서비스의 유형화(일반/고급 서비스 등)와 사용료 적용 여부를 다각화하며 기술의 성격 및 포지션에 따라 전략적으로 비즈니스 모델을 선택하여 추진할 수 있도록 준비해야 한다.

넷째, ETRI 플랫폼과 정부 주도의 AI 플랫폼(AI 허브, 빅데이터 플랫폼 등)과의 연계성 및 시너지를 강화해야 한다. 이를 위해, 1단계는 ETRI 개방형 플랫폼을 연계하여 ETRI가 운영하는 SW 개발 플랫폼을 하나로 연계하여 부서 간의 다양한 협력 연구가 가능할 수 있도록 one-stop 창구를 구축하고 개방형 협업을 위한 전주기 활동 지원한다. 2단계로 데이터-컴퓨팅-AI 기술 통합 활용체계를 구축해야 한다. 개방형 플랫폼의 확대·성능 고도화와 함께 내부 R&D자원의 통합 활용체계를 구축하고, 오픈 API, 오픈소스, AI 프레임워크, R&D 데이터, 데이터 처리 기술, 컴퓨팅(AI 반도체 포함) 등의 통합 활용체계를 구축해야 한다. 3단계에서는 ETRI 개방형 플랫폼을 중심으로 외부 기관과의 Alliance 체계를 구축해야 한다. 빅데이터센터와 ETRI 개방형 플랫폼-활용 기관 간 연계 체계를 구축해야 한다.

이러한 모든 것이 활발하게 추진되기 위해서는 개방형 플랫폼을 추진하는 데 장애물이 되는 사항은 없는지 R&D 제도에 대한 검토와 개선이 필요하다. PBS 비중이 높은 정부출연연구기관은 연구과제 기획-수주-평가 제도에 의해 연구의 전 과정이 좌우되는데, ‘중복성’, ‘독창성’이 과제 선정의 중요한 기준이며, 과제 평가 지표에 ‘기술이전 건수’ 및 ‘기술료 수입’ 등이 포함되어 있다. 이러한 제도하에서는 정부출연연구기관의 연구개발 과정에서 유연한 외부와의 협업뿐만 아니라 개발한 연구결과물의 적극적인 공개를 유도하기 어렵다.

기술 및 과제의 성격에 따라 오픈소스 전략 및 개방형 플랫폼 전략을 선택하여 적극 추진할 수 있도록 오픈소스 기반의 R&D 수행 체계에 대한 제도적 뒷받침이 필요하다. 또한 대부분의 개방형 플랫폼이 빅데이터와 클라우드 기술에 기반하므로 개방형 플랫폼을 제공하기 위해서는 클라우드와 빅데이터 인프라를 구축하고 운영, 유지 보수를 위한 전문적인 전담 인력의 확보와 조직적인 체계화도 필요하다.

용어해설

오픈소스SW SW의 설계도인 소스코드를 공개하여 특정 라이선스 방식을 통해 배포되고, 수정, 복제, 사용, 재배포가 자유로운 SW를 지칭

API(Application Programming Interface) 응용 프로그램에서 사용할 수 있도록 운영체제나 프로그래밍 언어가 제공하는 기능을 제어할 수 있게 만든 인터페이스

AIaaS(AI as a Service) AI를 클라우드에 구현해서 서비스로 제공하는 것으로, 사용자가 컴퓨팅 인프라, 플랫폼, AI 솔루션들을 직접 구축하지 않고 서비스로 활용할 수 있도록 제공

약어 정리

AIaaS

AI as a Service

API

Application Programming Interface

OSP

Open Source Platform

XOP

x+AI Open Platform

Footnotes

1) ‘2018년 공개소프트웨어 시장조사보고서’(NIPA, 2019)는 8개 업종(공공, 금융, 제조, 유통/물류, 서비스업, 보건/의료, 교육, ICT)으로 재분류하여 조사함. 조사에 응한 1,024개의 기업 중 ICT 기업은 29.3%, Non-ICT 기업이 70.7%로 구성됨.
1) 아마존 클라우드, 구글 클라우드, IBM, 마이크로소프트 클라 우드 사이트 등을 참조로 작성.

참고문헌

[1] 권영환 외, "소프트웨어안전 분야에서 공개소프트웨어 활성화 방안," 연구보고서 2018-013, 소프트웨어정책연구소, 2018.
[2] 이진휘, "오픈소스 중요성과 시사점," 정보통신산업진흥원, 이슈리포트 2019-20, 2019. 7. 24., pp. 1-37.
[3] 박재현, "[시장동향] AI에도 클라우드 바람, AIaaS로 코드 없는 AI 개발 가능," 컴퓨터월드, 2019. 12. 30.
[4] 정준화, "인공지능 기술·활용·인재 현황과 시사점," NARS 지표로 보는 이슈, 제149호, 국회입법조사처, 2019. 12. 31.
[5] ETRI, "오픈소스 문화 정착시키고 연구개발 혁신 발판 마련한다!" ETRI 웹진 vol. 160. 2020년 9월.
[6] http://aihub.or.kr/
[7] http://aiopen.etri.re.kr/
[8] http://nanum.etri.re.kr:8080/etriPortal/main
[9] https://csleoss.etri.re.kr/kor.do
[10] TechRecipe,"깃허브커뮤니티전세계로확산되고있다,"2019. 11. 14.
[11] Synopsys, "2020 오픈소스 시큐리티&리스크 분석보고서(한글본)," 2020. 6.
[12] 이제응, "Cloud Native Computing Foundation," 오픈 테크넷 서밋 2020 버추얼 컨퍼런스발표자료, 2020. 9. 16.
[13] 길민권, "금융권, 오픈소스 리스크 관리 X 법적 분쟁, 보안사고 위험," 데일리시큐, 2020. 7. 26.
[14] 정보통신산업진흥원, "2018년 공개소프트웨어 시장조사보고서," 2019.
[15] 정보통신산업진흥원, "2018 공개SW 기업 편람," 2017.
[16] Gartner, "Solution Comparison for Cloud-based AI Services," 2019. 10. 24.
[17] Industry ARC, "Artificial Intelligence Platform Market," 2019.
[18] https://www.ncloud.com/
[19] https://www.brightics.ai/
[20] https://dap.lgcns.com/html/overview.html
[21] 박외진,"인공지능 플랫폼의 개념과 도입 전략,"주간기술 동향, 2018.
[22] 이진휘,"AI 기술동향과 오픈소스," 정보통신산업진흥원, 이슈리포트 2020-제3호, 2020. 5.
[23] 이승윤, "오픈소스 R&D 개요 및 중요성," 2020. 7. 21.