ettrends banner

최정란 (Choi J.R.) SW·콘텐츠미래기술연구실 선임연구원
송영미 (Song Y.M.) SW·콘텐츠미래기술연구실 연구원
김철홍 (Kim C.H.) SW·콘텐츠미래기술연구실 책임연구원
김선자 (Kim S.J.) SW·콘텐츠미래기술연구실 책임연구원/실장

Ⅰ. 개요

4차 산업혁명 시대에 최근 인공지능, 자율주행차, IoT 등 분야가 미래 산업으로 크게 주목받고 있다. 이러한 인공지능, IoT 등의 활성화에 반드시 따라오는 기술 분야가 클라우드 컴퓨팅과 빅데이터이다. 인공지능의 머신러닝/딥러닝을 처리하기 위해서는 대용량의 빅데이터가 필요하고, 이러한 빅데이터를 처리하기 위해서는 고성능의 컴퓨팅 인프라가 필수이다. 하지만 고성능 인프라와 대용량 데이터는 소규모 기업이나 개인이 구입하기는 불가능한 자원이라 할 수 있다. 그렇기 때문에 클라우드 컴퓨팅의 필요성이 대두되는 이유이다.

인공지능 분야에서 클라우드 컴퓨팅 산업은 컴퓨팅 자원의 구축과 데이터 자원의 확보가 가능한 업체들 중심으로 산업이 형성되고 있다. 최근 IBM, 마이크로소프트, 구글, 아마존 등이 클라우드 컴퓨팅 플랫폼에 인공지능 서비스를 적극적으로 지원하는 것 또한 같은 이유라 할 수 있다.

초기 클라우드 컴퓨팅이 IaaS(Infrastructure as a Service) 중심으로 이루어졌다면, 최근에는 PaaS (Platform as a Service)로 서비스 계층이 위로 올라오는 추세라 할 수 있다. 개발 환경이 모바일 앱의 스타트업 중심으로 변화되어 적은 인원으로 빠르게 관리할 수 있는 플랫폼이 요구되고, 개발된 애플리케이션의 빠른 배포 및 서버의 필요성으로 인해 PaaS의 필요성이 증가하고 있다. 또한, 인공지능 분야에서 본다면 기존 인공지능은 특정 전문가들 사이에서 특화된 기술이 필요한 기술이 있고, 이를 일반 개발자가 빠르게 적용하여 서비스화하는 것에 어려움이 있기 때문에 대형 클라우드 벤더들이 빠르게 사용자 흡수를 하기 위하여 PaaS 계층에서 인공지능 지원을 하는 것이다.

개발자 입장에서 좋은 PaaS 모델은 애플리케이션 라이프 사이클을 좀 더 빠르고 쉽게 만들 수 있는 다양한 런타임(Java, JavaScript, Ruby, Python 등)과 서비스들을 제공하는 것이다. 즉 사용자가 애플리케이션을 개발하기 위해 런타임을 설정하거나 DB 통합 등의 작업을 추가로 할 필요 없이 PaaS가 이러한 솔루션을 제공하는 것이다.

대용량, 고성능의 자원을 필요로 하는 인공지능 분야는 컴퓨팅 자원을 구축할 수 있는 역량을 갖춘 업체만이 관련 클라우드 컴퓨팅 산업에 뛰어들 수 있다. 최근 IBM을 시작으로, 마이크로소프트, 구글, 아마존 등이 클라우드 컴퓨팅 플랫폼에 인공지능 서비스를 적극적으로 지원하고 앞장서는 이유라 할 수 있다.

이러한 글로벌 기업들이 인공지능 클라우드 플랫폼 산업을 앞다투어 선점하려 하는 이유는 빅데이터 수집과 밀접한 관계를 맺고 있다. 해당 업체가 제공하는 클라우드 인프라를 적극적으로 활용하게 되면 인공지능 관련 빅데이터가 쌓이게 된다. 축적된 빅데이터를 이용하기 위하여 관련 서비스 업체들은 이 클라우드 컴퓨팅 업체를 이용하게 될 것이고, 이러한 데이터가 쌓이고, 과정이 반복되게 되면 자연스럽게 생태계의 구축이 가능하게 될 것이다.

본고는 Ⅱ장에서 글로벌 기업들의 인공지능을 위한 클라우드 컴퓨팅 플랫폼 지원 현황을 살펴본다. Ⅲ장에서는 국내 클라우드 컴퓨팅 산업에서 인공지능 서비스 현황을 기술하였고, Ⅳ장에서는 인공지능을 위해 클라우드 컴퓨팅에서 주목해야 할 이슈들에 대해, Ⅴ장에서는 클라우드 생태계 활성화와 데이터 경쟁력에 대하여 기술한다.

Ⅱ. 해외 동향

1. IBM 블루믹스

IBM은 이미 SoftLayer라는 제품군을 통해 아마존과 유사한 IaaS 서비스를 제공하였다. 여기에 node.js, Java와 같은 런타임을 미리 설치하고, 거기에 소스코드를 넣어 돌리는 구조를 가진다. 즉, IaaS 위에 PaaS 클라우드 서비스가 구축된 형태가 바로 블루믹스 (Bluemix[1])이다. 블루믹스는 Cloud Foundry, Docker, OpenStack 등 세 가지의 오픈소스 컴퓨터 기술을 제공한다. 즉 응용들이 인스턴트 런타임(instance runtime), 컨테이너(container), 가상머신(virtual machine) 등에서 각각 실행될 수 있다. 애플리케이션들은 IBM SoftLayer 40의 전 세계에 있는 데이터 센터에서 ‘Public’ 또는 ‘Dedicated’ 방식으로 설치되거나 개별 데이터 센터 안에서 ‘Local’ 형태로 동작할 수 있다[(그림 1) 참조].

(그림 1)
IBM 블루믹스 아키텍처

블루믹스는 PaaS를 제공함으로써 개발자가 응용 개발 이외의 복잡한 작업을 수행하는 시간인 워크로드 시간을 줄여준다. 블루믹스는 OpenStack, VMware, IBM SoftLayer를 포함한 클라우드 인프라 플랫폼을 제공한다. 여기에 CloudFoundry를 통하여 프로그래밍 런타임 및 프레임워크(Java, Ruby, JavaScript, Python 등)을 지원한다.

블루믹스는 응용의 라이프사이클 관리를 빠르고 쉽게 하기 위하여 DevOps를 이용하여 유지관리 하고 있으며, 오픈소스 기반의 클라우드 컴퓨팅 기술들을 적극적으로 받아들이고 있다.

이들 특징을 살펴보면 다음과 같다[2]

• 손쉬운 개발환경 구성: 개발 언어를 선택하여 사용 가능하며, 단순히 코드를 업로드하고 실행할 수 있음.

• 다양한 API 및 서비스 제공: 오픈소스 및 IBM이 제공하는 API와 서비스에 대한 카달로그 제공을 통해 단 몇 분 만에 소스코드와 연계하여 사용 가능.

• 하이브리드 통합: 하이브리드 클라우드 환경에서 자체 운영 환경 및 외부의 클라우드 환경과의 연계를 통해 개발 및 운영 환경 구현이 가능함.

• DevOps 지원: 개발, 모니터링, 배포, 로깅 도구들을 통해 개발자들이 손쉽게 개발하고 실행/운영할 수 있음.

IBM은 블루믹스 PaaS 상에서 기상 예측, 언어 분석 시스템, 이미지 인식 시스템, 언어 번역, 감성 및 톤(tone) 분석 등 여러 머신러닝 기반 서비스를 출시했다.

이처럼 IBM은 클라우드 기반의 인공지능 서비스를 위한 기반 기술들을 많이 보유한 기업 중 하나이다. 특히 분석(analytics)과 리포팅(reporting) 도구에 노력을 기울기고 있고, 기상, 의료 등 분야에서 전략적 인수를 다수 추진하여 왓슨을 성장시키기 위한 노력도 지속하고 있다.

2. 구글 클라우드 플랫폼(Google Cloud Platform)

구글 클라우드는 구글 데이터 센터 인프라를 기반으로 컴퓨터, 스토리지, 네트워킹, 빅데이터, 머신 러닝 등의 서비스를 제공하는 글로벌 클라우드이다. 컴퓨터 서비스는 VM기반의 IaaS인 컴퓨터 엔진, PaaS인 앱엔진, 쿠버네티스 기반의 도커 런타임인 컨테이너 엔진 등 사용자의 요구에 맞는 다양한 형태를 제공한다. 구글은 지메일, 유튜브, 검색엔진 등 억 단위의 사용자를 보유한 대규모 서비스를 전 세계에 제공하는 회사로, 빅데이터 처리에 관한 노하우를 많이 가지고 있다. 이러한 노하우를 바탕으로 구글 클라우드 플랫폼을 통해 다양한 서비스를 제공하고 있다. 구글의 빅데이터 서비스는 빅데이터와 머신러닝으로 구별된다. 이 중 머신러닝 플랫폼은 머신러닝 API군과 텐서플로 기반의 머신러닝 플랫폼을 제공한다[3].

구글 클라우드 플랫폼[4] 서비스는 인공신경망 기반 기계학습 플랫폼, 이미지 검색, 음성검색, 번역 등을 제공한다. 기계학습 플랫폼(Cloud Machine Learning)은 대용량의 정보를 학습할 수 있는 머신러닝 플랫폼으로 텐서플로 프레임워크로 개발된 코드는 바로 적용할 수 있다. 클라우드 형태의 서비스를 제공하기 때문에 클러스터 제어에 대한 오버헤드가 적어 기계학습 모델링에 집중할 수 있는 장점이 있다[(그림 2) 참조].

(그림 2)
구글 클라우드 서비스 포트폴리오 일부

Cloud Vision API는 이미지에 있는 객체를 수천 가지의 카테고리로 분류하고, 얼굴인식으로부터 감정을 분석하는 등 이미지 분석하는 기술과 이미지를 텍스트로 설명하고 이미지에서 텍스트를 인식하는 기능을 제공한다. Cloud Speech API는 음성과 문자 간 변환 및 관련 인터페이스를 제공하고, 소음이 있는 환경에서 정확한 음성인식을 보장한다. Cloud Translate API는 번역 API로 90여 개 이상의 언어를 지원하고 있다. 이러한 API 서비스는 머신러닝 개념을 모르더라도 최소한의 코딩만으로 머신러닝 기능을 사용할 수 있도록 도와준다.

구글은 AI 검색 알고리즘인 RankBrain, 알파고, 텐서플로 등 인공지능 관련 기술 보유의 선두주자로 최근에는 TPU(Tensor Processing Unit)라는 기계 학습에 최적화된 연산처리 장치를 자체적으로 개발하는 등 적극적으로 인공지능 분야에 뛰어들고 있다. 또한, 세계 최대 규모의 데이터 센터 및 대규모 사용자와 데이터들의 보유는 구글이 가진 막대한 힘이라 할 수 있다.

3. 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning)

마이크로소프트(MS)는 그동안 운영체제, 오피스 등을 기반으로 시장을 유지해왔지만, 최근 모바일 중심의 ‘클라우드 퍼스트’로 전략과 비전을 수정하였다. 자사의 제품을 클라우드 서비스인 애저(Azure)를 통해 지원하고 여기에 인공지능을 더하여 클라우드 플랫폼 중심으로 서비스로의 변화를 꾀하고 있다.

마이크로소프트 애저 머신러닝[5]은 2014년에 런칭하여 다양한 수준의 과학자들을 위해 전 범위의 단순화된 경험을 제공하는 클라우드 기반의 예측 분석 서비스이다. 애저 머신러닝 스튜디오(Azure Machine Learning Studio)의 가장 큰 장점은 편의성이라 할 수 있다. 웹 기반의 드래그 앤드 드롭 인터페이스를 통해 데이터를 수집/처리하여 머신러닝 모델을 훈련하고 결과를 REST API로 공유한다. 또한, 머신러닝 중간 결과를 쉽게 확인, 재시작, 실행 기능을 제공하여 데이터 과학자가 최소 비용으로 가치 있는 결과를 얻는데 주력할 수 있다[(그림 3) 참조].

(그림 3)
마이크로소프트 머신러닝 스튜디오 기능

마이크로소프트의 인공지능 플랫폼은 실용적인 측면에 초점을 두어 실제 비즈니스 수요에 맞춘 솔루션을 내놓고 있다. R과 파이썬(Python)을 지원하고, 표준 머신러닝 알고리즘 및 도구(Text mining, Regression, Classification, Clustering, Anomaly detection) 등을 제공한다.

4. 아마존 AWS(Amazon Web Service)

아마존은 머신러닝/딥러닝을 위하여 새로운 빌딩 블록들을 추가하였다[(그림 4) 참조]. 인공지능을 위한 아마존 빌딩 블록을 보면 일반 개발자들을 위해 3개의 서비스(Rekognition, Polly, Lex)를 제공하는 것을 알 수 있다. Rekognition은 딥러닝 기반 이미지 인식 및 분석 서비스, Polly는 딥러닝 기반 음성 합성서비스(24개 언어 47개 목소리 지원), Lex는 자동음성 인식 및 자연어 처리를 지원하는 서비스이다. 사용자 또는 서비스 개발자는 이 서비스를 이용하여 다양한 응용(자동 초인종 인지, 책 읽어주기, 호텔 예약 등) 서비스를 개발할 수 있다[6].

(그림 4)
아마존 인공지능 빌딩 블록

머신러닝/딥러닝의 빅데이터 처리를 지원하기 위해 아마존은 GPU를 지원하는 Amazon EC2 인스턴스(G2, P2, C4, F1 등)를 다양화하여 제공하고 있다. 예를 들어, P2 인스턴스(최대 16개 NVIDIA K80 GPU, 64개 vCPU, 메모리 732GiB)는 CUDA 및 OpenCL을 활용하여 GPU 컴퓨팅 어플리케이션을 설계할 수 있고, 기계 학습, 고성능 데이터베이스, 전산유체역학, 컴퓨팅 금융, 내진 해석, 분자 모델링, 유체역학, 렌더링, 대용량 병렬 부동 소수점 등을 처리할 수 있다.

아마존은 자신들의 딥러닝 엔진용 라이브러리(DSSTNE)를 개발하였으나, 최근에는 구글 텐서플로의 대항마로 오픈소스 MXNet에 집중 투자하고 있다. 그 외의 대표적으로 활용되는 Caffe, Torch, Theano, CNK 등 딥러닝 프레임워크를 사전에 설치된 Deep Learning AMI를 사용하여 이미지 형태로 바로 사용할 수 있다. 앞서 설명한 GPU 드라이버와 CUDA 도구도 NVIDIA AMI를 이미지로 바로 사용할 수 있다.

Amazon Machine Learning은 개발자를 위한 머신러닝용 완전 관리형 서비스로 간단한 API로 개발자도 쉽게 사용 가능하고 아마존 내부 시스템 위에서 빠른 머신러닝 기술을 사용할 수 있도록 하고 있다. 아마존에 저장된 데이터는 S3(Simple storage service)에 저장되어 바로 사용할 수 있도록 데이터 모델링 되어 있다.

이처럼 아마존은 인공지능 생태계 선점을 위해 IaaS 중심의 클라우드 서비스에서 머신러닝/딥러닝의 효과적 활용을 위해 PaaS 중심의 서비스로 이동하고 있다.

Ⅲ. 국내 동향

1. SK와 IBM 왓슨(Watson)

SK C&C는 IBM 왓슨과 업무협약을 맺고 연구 개발을 위한 판교 클라우드 데이터 센터를 세우고 ‘클라우드 Z’ 브랜드를 통해 서비스 제공을 시작하였다. IBM의 ‘Watson knowledge studio’, 블루믹스 플랫폼을 기반으로 왓슨이 제공하는 ‘Language’, ‘Speech’, ‘Vision’, ‘Data insight’ API를 사용하여 각종 서비스 솔루션을 개발하고 있다[(그림 5) 참조].

(그림 5)
IBM 블루믹스 아키텍처

SK C&C는 왓슨을 활용하여 각종 산업 영역에 서비스를 개발하기 위하여 ‘에이브릴(ABRIL)’ 서비스로 AI 사업 영역을 확장하고 있다[7]. 영어 기반의 왓슨이 한글을 학습하고, 관련 분야 지식의 정형화, ‘지식 기반’ 구축 작업을 통해 각종 서비스 솔루션을 개발 중이다. 한 사례로 고려대 의과대학과 공동으로 2017년 헬스케어 분야에서 항생제 물질의 오남용을 막기 위한 ‘ABRIL Antibiotics Advisor’를 개발 중이다. 현재 병원의 항생제 사례의 학습 트레이닝이 진행 중이며, 향후 왓슨의 한글 트레이닝이 완료되면 챗봇 기능을 추가한 음성서비스도 제공 예정이다.

음성 서비스 지원에 대한 확장으로 SK C&C는 ‘AIBRIL Chatbot Framework’을 올해 7월부터 제공하고 있다. 본 프레임워크를 통해 챗봇 응용 개발 시 챗봇의 대화 모델 구성시간을 줄여 개발 시간을 단축하고 개발 생산성을 향상 시킬 수 있어 응용을 더욱 쉽게 개발하도록 챗봇에 특화된 프레임워크이다. 또한, 서비스 모니터링 분석 결과를 통해 대화 모델 개선 및 학습을 진행하여 만족도를 향상시킬 수 있다. 미리 구축된 대화 모델(일반영역, 도메인 특화 영역), 로그 관리 및 분석, 기존 시스템과 연계 등을 지원하고 있다. 향후 일반 영역(인사, 날씨 등)에서 특정 도메인(금융, 유통, 통신 등)의 영역까지 대화 모델을 확장할 예정이다[7].

최근 Person Insight, Visual Recognition, Natural Language Understanding 등 ABRIL 신규 API를 오픈하여 서비스하는 등 SK C&C는 클라우드 컴퓨팅의 PaaS는 IBM의 기술을 활용하고, 재빠른 서비스 솔루션들 확보를 통해 AI 시장을 선점하기 위하여 노력하고 있다.

2. 네이버 클라우드 플랫폼(Naver Cloud Platform)과 카카오 AI

네이버는 2017년 4월 네이버 클라우드 플랫폼을 출시하면서 클라우드 사업을 본격적으로 시작하였다. 인공지능, 자율주행, IoT 등 미래산업 기반으로 클라우드의 경쟁력이 중요해지면서, 기반 생태계 확대를 통한 기회로 삼고자 하였다. 네이버는 4천 2백만 회원, 모바일 1일 방문자 수 2천6백만의 네이버 포털, 6억 명 이상의 사용자와 하루 179억 개의 메시지를 처리하는 LINE 등 국내 대표적인 포털 사이트, 메신저 등을 통해 대용량의 데이터를 보유하고 있기 때문에 기반 생태계 확보가 가능하다[8].

이미 네이버, 라인, 스노우, V 등의 서비스를 클라우드 환경에서 안정적으로 운영한 기술과 경험을 바탕으로, 대용량의 데이터 처리 및 트래픽 대처가 가능한 HW가속 기술, 고성능 메모리 기술, 소프트웨어 정의 인프라의 원천기술을 확보하였다고 한다. 또한, 이러한 서비스를 바탕으로 아시아에 일본, 대만 등 7개, 독일 1개, 미국 2개의 리전을 보유하고 있다.

기존 네이버 클라우드는 컴퓨팅, 데이터, 보안, 네트워크 등 인프라 위주의 기술과 서비스를 제공하였으나, 검색, 음식인식, 음성합성, 지도 등과 관련한 Open API, 인공지능 플랫폼인 ‘클로바(Clova, Cloud Virtual Assistant),’ 텐서플로 클러스터, 인프라에서는 도커, GPU 서버 등을 지원할 예정(’17년 6월 30일 클로바 음성인식, 음성합성(beta), 얼굴인식(beta) API, 자동번역기 파파고의 API 등 제공을 시작)이다[9].

클로바는 인간의 오감을 활용한 인공지능 플랫폼을 목표로 하고 있다. 클로바는 인간의 오감에 해당하는 ‘클로바 인터페이스(Clova Interface),’ 두뇌에 해당하는 ‘클로바 브레인(Clova Brain)’을 핵심으로, 디바이스 및 애플리케이션을 연결하는 ‘클로바 인터페이스 커넥트(Clova Interface Connect),’ 콘텐츠/서비스 연결로 ‘클로바 브레인’의 기능을 확장하기 위한 ‘클로바 익스텐션 키트(Clova Extension kit)’ 등으로 구성된다. 클로바 브레인은 자연어 처리(NLU: Natural Language Under-standing)기술, 다이얼로그 매니저(Dialog Manager), 인공신경망 기계번역(NMT: Neural Machine Transla-tion), 추천, 검색엔진 등 다양한 모듈과 엔진이 결합된 형태이다. 이를 통해 클로바 브레인은 클로바 인터페이스로 인지된 상황을 자동으로 분석하고, 이에 맞는 결과를 제시하는 등 핵심적인 역할을 수행한다[10], [(그림 6) 참조].

(그림 6)
클로바 아키텍처

네이버는 이미 자사의 NCloud부터 지속적으로 인프라 중심의 클라우드 서비스를 제공한 기술 노하우를 바탕으로 향후 인공지능 등 미래 산업을 위한 클라우드 컴퓨팅 생태계에 국내 가장 근접한 기업이 아닐까 생각한다.

그 외 다음 카카오도 인공지능 전담 조직인 카카오브레인을 구성해 최근 ‘카카오 AI Report’를 내는 등 인공지능 서비스 구축에 시동을 걸고 있다[(그림 7) 참조].

(그림 7)
카카오 AI 구조 및 에코시스템

Ⅳ. 인공지능을 위한 클라우드 컴퓨팅 주요 이슈들

앞서 기술한 바와 같이 글로벌 대형 클라우드 벤더들은 앞다투어 인공지능을 지원하기 위한 서비스를 내놓고 있다.

이러한 서비스들을 지원하기 위해 클라우드에서의 머신러닝 프레임워크 지원, 고성능 자원 제공, 서버리스 컴퓨팅, 컨테이너, 보안, DevOps, 클라우드 마이그레이션 등 관련 이슈들이 제기되고 있다. 본고에서는 대표적인 몇 가지에 대해 언급하고자 한다.

• 머신러닝 프레임워크 지원

클라우드에서 머신러닝 프레임워크를 지원하기 위해 구글은 텐서플로를 자신의 구글 클라우드 플랫폼에서 쉽게 사용할 수 있도록 PaaS 형태로 제공하고 있다. 아마존은 자신들이 개발한 딥러닝 엔진용 라이브러리(DSSTNE: Deep Scalable Sparse Tensor Network)를 개발하였으나, 텐서플로 대항마로 오픈소스 형태의 MXnet에 집중 투자하고 있다. 또한, Caffe, Torch, Theano, CNTK 등 대표적인 인공지능 프레임워크를 클라우드에서 사용할 수 있도록 지원하고 있다.

• 고성능 자원 제공

고성능의 인공지능 빅데이터 처리를 위해 구글은 자신들이 개발한 TPU라는 빅데이터 및 딥러닝 전용 하드웨어를 개발, GPGPU와 유사한 벡터/행렬 연산의 병렬처리에 특화되어 고성능 처리를 지원하고 있다. 아마존은 이를 위해 별도의 GPGPU 계산 모델을 지원하고 있다. 또한, 마이크로소프트는 모든 리전(region)의 Azure 계산 노드가 FPGA(Field Programmable Gate Arrays)를 가지고 있어 머신러닝 실행을 지원한다.

• 서버리스 컴퓨팅

서버리스 컴퓨팅은 클라우드 컴퓨팅에서 차세대 추상화 계층이라고 불릴 만큼 주목 받고 있는 기술이다. 마이크로소프트 ‘Azure Function’, 구글의 ‘Google Cloud Function’, AWS의 ‘Lambda’, IBM Bluemix의 ‘OpenWhisk’ 등 세계 주요 클라우드 벤더들이 빅데이터, 인공지능, IoT 등을 서비스로 올리면서 본 방식을 적용하고 있다.

그동안 개발자가 서버의 개발 환경에 의존해 왔다면 본 기술은 개발자에게 서버 환경에서의 독립성을 부여하고 있다. 개발자는 컨테이너라는 자신의 환경에 자신만의 언어로 응용을 개발하고, 응용의 동작은 이벤트 기반으로 움직인다. 본 기술이 인공지능 클라우드 환경에서 주목받는 이유는 개발자 함수의 실행만큼만 비용 지불이 가능하고, 서버에 독립적인 만큼 확장성이 용이하며, 개발/프로토타입/반복 등 일련의 개발 과정을 단축할 수 있기 때문이다.

• 컨테이너

서버리스 컴퓨팅과 함께 컨테이너가 주목받는 이유는 PaaS 시스템에 매우 적합한 기술이기 때문이다. 인공지능이 쟁점화되면서 클라우드에서 플랫폼에 대한 개발 및 운영환경에 대한 요구가 늘면서 기존에 이미 존재하였던 컨테이너가 적합 기술로 제기되고 있다. 컨테이너는 가상화 기술로 기존의 하아퍼바이저를 통해 물리 자원을 가상머신에 할당하고 별도 운영체제를 설치하는 방식과는 달리 컨테이너는 커널 레벨을 공유하면서 응용에 필요한 환경을 제공하여 마치 응용이 서로 다른 서버에 구동되는 듯한 환경을 제공한다. 하여 가상머신보다 기본 사이즈는 작고, 구동시간도 즉각 반응하며, 시스템 오버헤드도 낮아 성능측면에서 상대적으로 가상머신보다 우위에 있어 대용량의 응용을 구동하는 데 장점으로 작용하고 있다. 대표적으로 Docker 컨테이너가 있는데, 구글, 아마존 등 대형 클라우드 벤더들은 이미 Docker를 이용한 서비스를 제공하고 있다.

최근 대용량/고성능의 자원과 빠른 개발/배포 프로세스가 클라우드 환경이 요구되는 만큼 관련된 기술들의 중요성도 커지고 있다. 서버리스 컴퓨팅, DevOps, 컨테이너 기술 등을 적용하면 개발자는 작은 단위의 함수들을 기반으로 사용한 시간만큼 비용 지불이 가능하고, 서버의 환경에 영향을 받지 않고, 상대적으로 오버헤드가 낮은 프로세스 기반으로, 빠른 개발/배포가 가능하므로 대용량/고성능을 요구하는 인공지능 분야에서는 큰 장점이 될 것이다.

Ⅴ. 결론 및 시사점

4차 산업혁명에서 인공지능이 핵심 키워드가 되면서 산업 전반에 인공지능이라는 말이 빠지지 않을 정도로 주목받고 있다. 이에 따라 수많은 기업이 인공지능 관련 분야에 관심을 두면서 이 분야가 활성화되었다. 인공지능 활성화에 반드시 따라오는 기술 분야는 클라우드컴퓨팅과 빅데이터이다. 인공지능의 머신러닝을 수행하기 위해서는 대용량의 빅데이터가 필요하고, 이러한 빅데이터를 처리하기 위해서는 고성능의 컴퓨팅 인프라가 필수인데, 일반적인 기업이나 개인에게는 불가능한 자원이라 할 수 있다.

컴퓨팅 자원과 대규모 데이터 구축 등의 역량을 갖춘 업체만이 인공지능 클라우드 컴퓨팅 산업에 뛰어들 수 있다. 하여 최근 IBM을 시작으로, 마이크로소프트, 구글, 아마존 등이 클라우드 컴퓨팅 플랫폼에 인공지능 서비스를 적극적으로 지원하고 있다.

글로벌 클라우드 벤더들이 인공지능 클라우드 플랫폼 산업을 선점하려는 이유 중의 하나는 빅데이터 수집과 밀접한 관계를 맺고 있다. 벤더들이 제공하는 클라우드 인프라를 적극적으로 활용하게 되면 인공지능 관련 빅데이터들이 쌓이게 된다. 이러한 빅데이터들을 이용하기 위해 관련 서비스 업체들은 해당 클라우드 컴퓨팅 업체를 이용하게 될 것이고, 이러한 것들이 쌓이고, 반복되게 되면 자연스럽게 생태계 구축을 가능하게 할 것이다.

데이터 측면에서 보면 영국 경제주간지 ‘이코노미스트’는 데이터를 거머쥔 회사가 미래에 지배력이 증가할 것이으로 예측했다. 실제 구글, 애플, 페이스북, 아마존, 바이두, 알리바바, 텐센트 등 7곳을 유망기업으로 선정하였으나 우리나라의 삼성이나 IBM이 제외되었다는 것이 흥미롭다. 데이터를 수집하고 추출/정제하여 의미 있는 서비스를 만들어 새로운 경쟁력을 확보하는 것이 미래사회에서는 중요하다는 것이다. 데이터를 장악한 기업은 새로운 제품과 서비스 창출을 통해 경쟁력을 높일 수 있는 중요한 수단이라 할 수 있다[11].

글로벌 벤더들이 앞다투어 인공지능 클라우드 플랫폼을 서비스로 내놓는 것도 이러한 빅데이터를 인공지능에 활용할 수 있는 필요성 때문이라 할 수 있다. 머신러닝/딥러닝은 그 분야를 오래 활용한 사람들이 아니라면 접근의 어려움이 있는데, 이러한 부분을 해결하기 위해 최근 클라우드 컴퓨팅 환경을 IaaS 중심에서 PaaS 중심으로 이동하는 것도 인공지능 클라우드 컴퓨팅의 활성화를 위한 방안인 것이다.

국내의 경우 글로벌 업체보다 시작은 늦었지만 빠르게 인공지능 시장의 성장과 맞물려 클라우드에 대한 투자를 확대하고 있다.

SK는 IBM의 왓슨 시스템에 기반을 두고 클라우드 Z를 서비스하고 있고, 인공지능으로 서비스 확장을 위해 에이브릴을 선보이고, 중국 등으로 시장을 확대해 나가고 있다. 국내 최대 포털 업체인 네이버도 올해 4월 네이버 클라우드 플랫폼을 출시하면서 본격적인 클라우드 사업을 시작하였고, 클로바라는 인공지능 플랫폼을 기반으로 본격적인 인공지능 시장에 뛰어들었다. 네이버는 대용량의 데이터를 보유한 국내 최대 업체로 글로벌 시장과 대응할 수 있는 생태계 진입에 가장 가깝게 다가갈 수 있는 조건을 갖추었다 할 수 있다. 다음 카카오도 카카오브레인이라는 인공지능 전담 조직을 구성해 최근 ‘카카오 AI 보고서’를 작성하는 등 본격적으로 인공지능 클라우드 플랫폼 시장을 위한 시동을 걸고 있다.

그러나 여전히 국내는 인공지능을 위한 클라우드 컴퓨팅 인프라 자원의 부족으로 인해 국내 업체들이 해외 주요 기업 인프라를 활용해 자신들이 소유한 데이터를 분석하고 있다. 이는 향후 의료정보, 국방정보 등 민감한 정보에 대한 인공지능 분야에 대한 활용 측면에서 심각하게 고려해야 할 사항이다. 국내도 국가 차원에서의 인공지능을 위한 클라우드 컴퓨팅 환경과 빅데이터의 구축 및 효율적 활용을 위한 방안에 대해 구체적이고 체계적으로 진행할 필요가 있다.

용어해설

DevOps소프트웨어의 개발(Development)과 운영(Operations)의 합성어로서, 소프트웨어 개발자와 정보기술 전문가 간의 소통, 협업 및 통합을 강조하는 개발 환경이나 문화

Cloud Foundry오픈소스 기반의 PaaS 플랫폼

OpenStack클라우드 컴퓨팅 오픈소스 프로젝트

약어 정리

AMI

Amazon Machine Image

DSSTNE

Deep Scalable Sparse Tensor network Engine

FPGA

Field Programmable Gate Arrays

GPGPU

General-Purpose computing on Graphics Processing Units

IaaS

Infrastructure as a Service

NLU

Natural Language Understanding

NMT

Neural Machine Translation

PaaS

Platform as a Service

S3

Simple Storage Service

TPU

Tensor Processing Unit

References

[1] IBM, IBM 클라우드(Bluemix), Accessed July, 2017. https://www.ibm.com/cloud-computing/kr/ko/paas.html
[2] K. Abousedera, “IBM® Bluemix™ From Idea to Application(Platform as a Service),” May 2015, p. 21. https://developer.ibm.com/bluemix/wp-content/uploads/sites/20/2015/07/Bluemix_Whitepaper.pdf
[3] 조대엽 외, “빠르게 훑어보는 구글 클라우드 플랫폼,” 서울: 한빛미디어㈜, 2016. 8. 23.
[4] Google, Google Cloud Platform, Accessed July, 2017. https://cloud.google.com/docs/
[5] Microsoft, Microsoft Azure Machine Learning, Accessed July, 2017. https://azure.microsoft.com/ko-kr/services/machine-learning/
[6] AWS, Amazon Machine Learning, Accessed July, 2017. https://aws.amazon.com/ko/machine-learning/
[7] SK C&C, 인공지능 AIBRIL, Accessed July, 2017. https://www.aibril.com/web/main/getMain.do
[8] Naver, Naver Cloud Platform, Accessed July, 2017. https://www.ncloud.com/
[9] Naver, 네이버 개발자 센터, Accessed July, 2017. https://developers.naver.com/
[10] 김상헌, “네이버-라인, 인공지능 플랫폼 ‘클로바(Clova)’ 공개,” ITNews, 2017. 3. 2.
[11] 이완, “IT ‘7왕조 시대’…데이터 거머줘야 미래를 얻는다,” 한겨례, 2017. 6. 22.

(그림 1)

f001

IBM 블루믹스 아키텍처

(그림 2)

f002

구글 클라우드 서비스 포트폴리오 일부

(그림 3)

f003

마이크로소프트 머신러닝 스튜디오 기능

(그림 4)

f004

아마존 인공지능 빌딩 블록

(그림 5)

f005

IBM 블루믹스 아키텍처

(그림 6)

f006

클로바 아키텍처

(그림 7)

f007

카카오 AI 구조 및 에코시스템