국내외 빅데이터 표준화 현황 및 전망

Status and Prospects of Domestic and International Standardization Activities for Big Data

저자
하수욱, 이강찬, 인민교, 이승윤 / 서비스표준연구실
권호
30권 2호 (통권 152)
논문구분
생태계 확장형 ICT R&D동향 특집
페이지
32-39
발행일자
2015.04.01
DOI
10.22648/ETRI.2015.J.300204
초록
빅데이터는 기존의 전통적인 데이터 아키텍처에 비하여 대용량의 데이터 자원을 효과적으로 처리하기 위한 개념으로 사용되고 있다. 이러한 빅데이터 패러다임은 빠른 정보처리를 요구하는 수직적 확장성을 고려한 시스템 요구사항부터 다양한 데이터 자원들을 연결해주는 수평적 확장성을 동시에 포함하고 있다. 빅데이터 시장 또한 급격히 성장하고 있으며, 이와 관련된 국내외 표준화 전략 수립 및 표준 개발 활동이 증가하고 있는 추세이다. 본고에서는 빅데이터 참조 아키텍처에 대한 개발사례와 함께 ISO(International Organization for Standardization)/IEC(International Electrotechnical Commission) JTC 1(Joint Technical Committee 1), ITU-T(International Telecommunication Union-Telecommunications Standardization Sector) 등 국제 공적 표준화 기구 및 사실 표준화 기구들의 표준화 현황과 국내 표준화 활동 및 표준화 전략 개발 현황들을 요약 분석한다.
   6223 Downloaded 11981 Viewed
목록

Ⅰ. 서론

빅데이터에 대한 기술적 수요와 관심이 높아짐에 따라 이를 활용하기 위한 방법으로 다양한 솔루션 및 오픈소스들이 등장하고 있으며, 금융, 복지, 마케팅 등 다양한 분야에서 이를 활용하는 사례들이 등장하고 있다. 이와 함께 표준화 기구들은 각각의 도메인 영역에서 빅데이터를 정의하고, 이를 기존의 표준화 노력의 연장선상에서 도메인 내에서의 상호운용성을 이루기 위한 노력들을 진행하고 있다. 그럼에도 불구하고, 보다 상위 수준에서 서로 다른 빅데이터 시스템 간, 기존의 시스템과 빅데이터 시스템 간의 상호운용성은 여전히 초기단계라고 할 수 있으며, 2014년을 기점으로 국제 공적 표준화 기구인 ISO(International Organization for Standardization)/IEC(International Electrotechnical Commission) JTC 1(Joint Technical Committee 1)에서 빅데이터 표준화를 위한 작업 그룹(WG(Working Group) 9)이 신설됨으로써 개별적 도메인 수준이 아닌 보다 상위 레벨에서의 상호운용성 확보를 위한 표준화 초석이 마련되었다.

본고에서는 먼저 정보 유통 및 활용 관점에서의 빅데이터 생태계 모델에 대한 연구동향과 함께 2015년 현재까지 진행되어 온 빅데이터 관련 국내외 표준화 활동과 함께 향후 방향을 전망한다.

Ⅱ. 빅데이터 참조 아키텍처

일반적인 정보시스템에서와는 달리 빅데이터 환경에서 가장 중요한 요소는 데이터 그 자체로써 최초 생성 목적 이외의 용도로 데이터가 활용될 수 있음을 대전제로 하고 있다. 이로 인하여 데이터 생산과 소비 주체 및 데이터 자체를 중계하거나 또는 이를 분석하는 서비스 기능을 지원하는 주체들을 통해 생태계 모델이 구성되고 있다. 개별 주체들 사이에서도 서로 다른 생태계 모델을 통한 아키텍처들을 제안하고 있다.

공공부문의 경우 기존의 공공업무에 사용되던 데이터들을 일반에 공개함으로써 새로운 지식을 창출해내기 위한 기반 마련을 목표로, 데이터 유통 및 활용 관점에서 데이터 마켓 형태의 생태계 모델들이 제안되고 있으며, 이에 반해 민간 솔루션 사업자들은 기존의 데이터 스토리지 및 분석 플랫폼에 더하여 다양한 형태의 데이터들을 자사의 상품에 분석, 활용하기 위한 확장된 시스템 기능 중심의 아키텍처들을 제안하고 있다.

표준화 관점에서 특정 기술영역에 대한 참조 아키텍처의 정의는 표준화 대상 및 영역을 식별하기 위한 첫 번째 작업으로써 매우 중요한 의미를 가지며, 이를 통해 다양한 시장 구성원들이 공통의 언어로 표현된 참조 아키텍처를 공유함으로써 궁극적으로 상호운용성, 이식성, 재사용성 및 확장성을 위한 기본 패턴으로 활용될 수 있다.

(그림 1)은 기존의 빅데이터 아키텍처들이 공통적으로 제안하고 있는 공통적 요소들을 기반으로 정리된 아키텍처(안)를 보여주는 것으로써, 데이터 제공자(Data Provider), 데이터 중계자(Data Broker), 빅데이터 서비스 제공자(Big Data Service Provider), 빅데이터 소비자(Big Data Consumer)의 구성원과 각각의 하위 기능들을 정의하고 있다.

(그림 1)

빅데이터 참조 아키텍처[1]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_f001.jpg

상기 참조 아키텍처에서의 개별 구성원들은 물리적으로 동일하거나 또는 서로 다른 주체일 수 있으며, 각각의 역할은 다음과 같이 설명될 수 있다.

  • •  데이터 제공자

    데이터를 생산하고 이를 온라인상에서 전달할 수 있는 인터페이스를 제공하며, 데이터 중계자를 통해 데이터를 퍼블리싱(Publishing)

  • •  데이터 중계자

    온라인상의 각종 데이터들에 대한 접근 및 권한 정보 등을 관리/제공함으로써 데이터 제공자와 빅데이터 사용자를 연결(Binding)

  • •  빅데이터 서비스 제공자

    빅데이터 소비자의 요청에 따라 데이터를 검색, 처리, 정제하고 분석하여 그 결과를 리턴

  • •  빅데이터 소비자

    빅데이터 서비스 제공자를 통해 가용 자원을 검색하고 분석을 요청하며 그 결과를 이용

Ⅲ. 국제 빅데이터 표준화 동향

1. 공적 표준화 기구(ITU-T, ISO/IEC JTC 1)

ITU-T(International Telecommunication Union-Telecommunications Standardization Sector)는 '클라우드 컴퓨팅 기반의 빅데이터를 위한 요구사항 및 기능(Y.Bigdata-reqts)' 권고안을 2015년에 제정할 것을 목표로 개발 중에 있다[2]. 이 권고안은 빅데이터에 대한 전반적인 개념과 함께, 클라우드 환경에서 빅데이터를 지원하기 위한 기본 구조, 유즈케이스 및 이를 바탕으로한 요구사항들을 식별함으로써, 향후 클라우드 기반의 빅데이터 표준화를 위한 대상 항목들 도출하는 것을 목표로 한다. 현재 개발 중인 클라우드 기반의 빅데이터 생태계 모델은 2014년 제정된 ITU-T 권고안 Y.3502 'Information technology-Cloud computing-Reference architecture'[3]의 기본 구조를 수용하여, 클라우드 컴퓨팅 참조 아키텍처를 통해 제안된 역할(role)에 대한 빅데이터 서비스 관점에서 요구되는 보조 역할(sub-role)과 기능(activity)들을 식별하고 정의하는 단계로 개발이 진행되고 있다. 또한 빅데이터 표준화를 위한 로드맵 개발에 착수하였으며, 해당 문서의 작업 범위는 다음과 같다[4].

  • - 텔레커뮤니케이션 및 관련 산업계 관점에서의 빅데이터 표준화 범위 설정

  • - 빅데이터 표준화 동향 조사

  • - 관련 기술 영역에 대한 식별 및 우선순위 설정

  • - 표준화를 위한 로드맵 개발

이 외에도 멀티미디어에서의 빅데이터 분석, 빅데터에서의 사생활 보호를 위한 표준화 등의 활동이 진행되고 있다.

ISO/IEC JTC 1은 2013년 빅데이터 연구반(Study Group on Big Data)을 신설하여, JTC 1에서 추진해야 할 빅데이터 표준화 범위 및 대상 기술, 관련 표준화 단체 및 산하 연구그룹들 간의 관계 등을 식별하기 위한 보고서 개발을 완료하였으며(2014. 9.), 이를 기초로 빅데이터 표준화를 위한 작업반(WG 9 Big Data)을 신설하기로 합의하였다[5][6]. 또한 우리나라는 신규 표준화 항목으로써 빅데이터 정의 및 용어, 빅데이터 참조 아키텍처의 개발을 제안하였다.

SC(Standards Committee) 32(Data management and interchange)에서는 빅데이터와 관련하여 기존의 SQL을 확장하여 반실시간, 반구조화된 데이터(XML(Extensible Markup Language), JSON(Java Script Object Notation)) 및 다차원 배열 데이터에 대한 질의 언어에 대한 개발을 논의 중에 있다. 또한 ISO 11179 기반의 빅데이터 환경에서의 메타 데이터 활용을 위한 구현 모델에 대한 개발이 검토 단계에 있다. 이 외에도 빅데이터 보안, 시각화, 자원관리 등 다양한 표준화 이슈들이 산하 SC들을 통해 논의되고 있으며, 그 현황은 <표 1>과 같다.

<표 1>

ISO/IEC JTC 1 표준위원회별 빅데이터 관련 표준화 영역 및 대상 표준화 항목[5]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t001.jpg

*SQL(Structured Query Language)

*NoSQL(Not Only Structured Query Language)

*SQL/MM(SQL Multimedia)

*SOA(Service-Oriented Architecture)

2. 민간 표준화 기구

W3C는 웹에 대한 모든 표준 및 기술개발 등을 총괄하는 비영리 단체로 빅데이터 환경에서 데이터들 간의 의미적 상호운용성 및 자원의 링크, 웹 환경에서의 자료 구조 등에 대한 표준화들이 논의되고 있으며 이와 관련된 작업반은 RDF(Resource Description Framework), LDP(Linked Data Platform), Data on the Web Best Practices, GDL(Government Linked Data), CSV(Comma-Separated Values) on the Web 등이 존재한다. 또한 2012년 4월 데이터 처리를 위한 표준 구조 및 API(Application Programming Interface)의 개발을 목표로 빅데이터 커뮤니티 그룹을 설립하였으며[7], 2013년 하반기에는 웹에서의 데이터 처리를 위한 데이터 액티비티를 신설한 바 있다.

OASIS(Organization for the Advancement of Structured Information Standards)는 SGML(Standard Generalized Markup Language), XML 및 HTML (Hypertext Markup Language) 등과 같은 정보 형식에 있어 제품 독립적인 표준 채택을 촉진하기 위한 목적으로 설립된 세계적인 비영리 컨소시엄으로[8], 빅데이터와 관련하여 다음의 기술위원회들을 통해 표준화 방향 논의를 진행 중에 있다[9].

  • •  OASIS AMQP(Advanced Message Queuing Protocol) 기술위원회

    비즈니스 메시징을 위한 유비쿼터스 환경에서의 안전하고, 신뢰할 수 있는 개방형 인터넷 프로토콜의 정의

  • •  OASIS KVDB(Key-Value Database Application Interface) 기술위원회

    키-값(key-value) 모델 기반의 데이터베이스 시스템에서 데이터를 관리하고 접근하기 위한 개방형 응용 프로그램 인터페이스 정의

  • •  OASIS MQTT(Message Queuing Telemetry Transport) 기술위원회

    제한된 컴퓨팅 성능과 빈약한 네트워크 연결 환경에서의 동작을 고려한 대용량 메시지 프로토콜의 제공

  • •  OASIS XMILE(XML Interchange Language) for System Dynamics 기술위원회

    역학 모델 및 시뮬레이션 시스템의 상호운용을 위한 개방형 XML 프로토콜의 정의

이 외에도 공간정보분야의 사실 표준화 기구인 OGC(Open Geospatial Consortium)는 사용자들의 다양하고 방대한 공간정보 처리를 위한 빅데이터 분석 기능 활용 측면에서의 표준화를 위한 도메인 작업반(Big data DWG(Domain Working Group), 2014.)을, TPC (Transaction Processing Performance Council)는 빅데이터 시스템에 대한 벤치마킹을 위한 산업 표준의 개발을 위한 빅데이터 작업반(TPC-BDWG, 2014.)을 각각 신설하여 표준 개발을 시작하였다[10][11].

Ⅳ. 국내 빅데이터 표준화 동향

1. TTA 표준화 동향

한국정보통신기술협회(TTA: Telecommunication Technology Association)는 빅데이터 클라우드 컴퓨팅과 빅데이터 분야의 표준 개발을 위한 특별 기술위원회(STC(Special Technical Committee) 2)를 2014년 신설하고 그 산하에 클라우드 컴퓨팅 PG와 빅데이터 PG를 생성하여 관련 표준들을 개발 중에 있으며 2015년 현재 산학연 13개 기관의 전문가들이 참여하고 있다. <표 2>는 현재까지 개발 완료된 표준 및 진행 중인 표준화 항목들에 대한 목록이다.

<표 2>

TTA 단체표준 개발 현황[12][13]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t002.jpg

TTA에서는 표준화 활동과는 별개로 국내 정보통신분야의 시장, 기술, 표준화 현황을 종합적으로 파악하고 이를 통해 향후 전략적으로 추진해야 할 표준화 대상들을 도출하기 위하여 매년 ICT(Information & Communication Technology) 표준화 전략맵을 작성하고 있다. 빅데이터 분야는 콘텐츠 및 소프트웨어분야의 하위 항목인 클라우드/빅데이터분야에 기술되어 있으며, <표 3>은 이를 통해 도출된 표준화 대상 항목들을 요약한 것이다.

<표 3>

TTA 표준화 전략맵 2015 - 빅데이터 표준화 대상 항목[14]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t003.jpg

*SGBD(Study Group on Big Data)

2. 빅데이터 포럼

빅데이터 포럼은 빅데이터의 생산적 활용과 표준화를위하여 산업전문가들을 중심으로 설립된 단체로써, 2013년 표준 개발 분과를 설립하여 포럼 표준의 개발을 추진하고 있다. 현재 20개 기관, 40여 명의 전문가들이 포럼을 통하여 표준 개발에 참여하고 있으며 진행 중인 항목들은 <표 4>와 같다.

이 외에도 국가기술표준원과 한국표준협회(KSA: Korean Standards Association)의 표준 코디네이터 사업을 통해 차세대 컴퓨팅 분야의 하위 항목으로 빅데이터 표준화 로드맵이 작성 중에 있으며, 의료, 바이오분야 등 개별 서비스 도메인에서도 빅데이터 공유를 위한 표준화 필요성에 대한 논의가 시작되고 있다.

<표 4>

빅데이터 포럼 표준 개발 현황

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t004.jpg

Ⅴ. 결론

본고에서는 빅데이터 분야의 표준화 현황 분석을 위하여 빅데이터 참조 아키텍처에 대한 연구 현황과 함께 국제 및 국내 표준화기구들의 표준화 진행 현황 및 향후 표준화 대상 기술들에 대하여 살펴보았다. 빅데이터 분야는 바라보는 시각에 따라 기존 정보 시스템의 확장 측면에서는 대용량의 다양한 데이터들을 통합적으로 분석, 처리하기 위한 방법이며, 데이터의 공유 환경 측면에서는 SNS(Social Network Services), IoT(Internet of Thing), 웹 자원 등 온라인상의 접근 가능한 모든 정보들을 바탕으로 새로운 지식 서비스 창출을 지원하는 인프라 기술로 볼 수 있다.

국제 표준화 현황 역시 이러한 수직, 수평적 상호운용성을 고려한 두 가지 관점을 바탕으로 진행되고 있는데, 민간 표준화 기구들은 대용량 정보 저장, 분석, 처리를 위한 플랫폼 기술을 중심으로 기존의 표준을 확장하는 방향으로 진행되고 있으며, ITU-T, JTC 1 등 공적 표준화 기구의 경우에는 다양한 데이터들과 이들을 분석, 이용하는 환경에 대한 공동 활용 및 개인정보 보호 기술 등에 보다 초점을 맞추어 논의가 이루어지고 있다.

국내 표준화의 경우 빅데이터 처리를 위한 일부 요소 기술에 대한 표준화와 데이터 공유 기반 마련을 위한 표준화가 병행하여 기획되고 있는 형태로써, 빅데이터 참조 아키텍처 등 다른 표준들의 기반을 이루는 표준에 대한 개발과 함께 일부 표준들 간의 재정립이 필요할 것으로 판단된다.

향후 데이터 공유환경의 정착과 빅데이터 분야의 활성화를 위해서는 다른 어떤 기술분야보다 표준화를 통한 상호운용성의 확보가 요구되며, 우리나라 주도로 JTC 1 산하에 빅데이터 표준화 작업 그룹이 신설되는 등 국제표준화를 위한 기반이 확보되어 있는 만큼 이들을 적극 활용하여 표준 및 관련 특허 선점 등 국내 빅데이터 시장의 보호 및 신기술 개발 등의 대응 노력이 요구되는 시점이다.

용어해설

빅데이터(Big Data)디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기가 짧으며, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말함. 빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 생각과 의견까지 분석하고 예측할 수 있음.

클라우드 컴퓨팅(Cloud Computing)정보처리를 자신의 컴퓨터가 아닌 인터넷으로 연결된 다른 컴퓨터로 처리하는 기술을 말함. 빅데이터를 처리하기 위해서는 다수의 서버를 통한 분산처리가 필수적임. 분산처리는 클라우드의 핵심 기술이므로 빅데이터와 클라우드는 밀접한 관계를 맺고 있음.

약어 정리

AMQP

Advanced Message Queuing Protocol

API

Application Programming Interface

CSV

Comma-Separated Values

DWG

Domain Working Group

GDL

Government Linked Data

HTML

Hypertext Markup Language

ICT

Information & Communication Technology

IEC

International Electrotechnical Commission

IoT

Internet of Thing

ISO

International Organization for Standardization

ITU-T

International Telecommunication Union-Telecommunications Standardization Sector

JSON

Java Script Object Notation

JTC 1

Joint Technical Committee 1

KSA

Korean Standards Association

KVDB

Key-Value Application Interface

LDP

Linked Data Platform

MQTT

Message Queuing Telemetry Transport

NoSQL

Not Only Structured Query Language

OASIS

Organization for the Advancement of Structured Information Standards

OGC

Open Geospatial Consortium

RDF

Resource Description Framework

SC

Standards Committee

SGBD

Study Group on Big Data

SGML

Standard Generalized Markup Language

SNS

Social Network Services

SOA

Service-Oriented Architecture

SQL

Structured Query Language

SQL/MM

SQL Multimedia

STC

Special Technical Committee

TPC

Transaction Processing Performance Council

TTA

Telecommunication Technology Association

WG

Working Group

XMILE

XML Interchange Language

XML

Extensible Markup Language

[1] 

하수욱, 이승윤, 이강찬, “빅데이터 에코시스템 기반의 참조 아키텍처 개발,” 보안공학연구논문지, 제11권 제6호, 2014, pp. 511-522.

[2] 

ITU-T, “Output Draft Recommendation Y.BigData-reqts,” 2014. http://www.itu.int/md/T13-SG13-130628-TD-WP2-0094/en

[3] 

ITU-T, “Information Technology - Cloud Computing - Reference Architecture,” 2014. http://w ww.itu.int/rec/T-REC-Y.3502-201408-I

[4] 

ITU-T, SG13RGM C- 82, “Proposal for Initial Draft of Big Data Standardization Roadmap for ITU-T SG13,” 2014.

[5] 

ISO/IEC JTC 1, SGBD N0095, “Final SGBD Report to JTC 1,” 2014.

[6] 

ISO/IEC JTC 1, “Resolutions Adopted at the 29th Meeting of ISO/IEC JTC 1,” 2014.

[7] 

W3C - Big Data Community Group, http://www.w3.or g/community/bigdata

[8] 

Terms, http://www.terms.co.kr/OASIS.htm

[9] 

OASIS Committee Categories: Big Data, https://www. oasis-open.org/committees/tc_cat.php?cat=bigdata

[10] 

OGC Big Data DWG, http://www.opengeospatial.org/ projects/groups/bigdatadwg

[11] 

TPC-BD, http://www.tpc.org/tpcbd

[12] 

TTA 빅데이터 프로젝트그룹 표준 제정현황, http://com mittee.tta.or.kr/standard/standard.jsp?commit_code= SPG22&firstDepthCode=STC2&secondDepthCode=SPG22&thirdDepthCode=

[13] 

TTA 빅데이터 프로젝트그룹 표준 과제 현황, http://co mmittee.tta.or.kr/standard/status.jsp?commit_code= SPG22&firstDepthCode=STC2&secondDepthCode=SPG22&thirdDepthCode=

[14] 

TTA, “ICT 표준화 전략맵 Ver.2015. - 콘텐츠/SW 분야,” 2014. 12. http://www.tta.or.kr/data/reportlist.jsp? kind_num=3

(그림 1)

빅데이터 참조 아키텍처[1]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_f001.jpg
<표 1>

ISO/IEC JTC 1 표준위원회별 빅데이터 관련 표준화 영역 및 대상 표준화 항목[5]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t001.jpg

*SQL(Structured Query Language)

*NoSQL(Not Only Structured Query Language)

*SQL/MM(SQL Multimedia)

*SOA(Service-Oriented Architecture)

<표 2>

TTA 단체표준 개발 현황[12][13]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t002.jpg
<표 3>

TTA 표준화 전략맵 2015 - 빅데이터 표준화 대상 항목[14]

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t003.jpg

*SGBD(Study Group on Big Data)

<표 4>

빅데이터 포럼 표준 개발 현황

images_1/2015/v30n2/ETRI_J003_2015_v30n2_32_t004.jpg
Sign Up
전자통신동향분석 이메일 전자저널 구독을 원하시는 경우 정확한 이메일 주소를 입력하시기 바랍니다.