로봇 정밀조작 시뮬레이션 및 학습을 위한 가상환경 기술

Virtual Environment Technologies for Robotic Precision Manipulation Simulation and Learning

Electronics and Telecommunications Trends. Vol. 40, No. 3, June 2025, pp. 11-19

doi : http://dx.doi.org/10.22648/ETRI.2025.J.400302

이은서 (Lee E.S.)
손영성 (Son Y.S.)
이강우 (Lee K.W.)
손유호 (Son Y.H.)
한효녕 (Han H.N.)
손지연 (Son J.Y.)

* 이 연구는 2025년도 산업통상자원부 및 산업기술기획평가원(KEIT) 연구비 지원에 의한 연구임[RS-2024-00419641].

Translated Abstract

Robots are widely utilized in industrial settings for tasks such as assembly, handling, and welding. With the evolving industrial landscape, robots must flexibly adapt to task changes and unforeseen environmental variations. To address these challenges, researchers are shifting from programming robots for repetitive actions to enabling them to learn and adapt to diverse missions. Virtual environments have emerged as a solution to mitigate the cost and time constraints associated with the robot learning process. However, limitations such as inaccuracies in physics engines and discrepancies between virtual and real domains introduce sim-to-real gaps, which can result in significant financial losses due to equipment and product damage or even pose risks to human safety. Consequently, virtual training outcomes cannot be directly applied to real-world environments. This paper reviews the key challenges that virtual environment technologies must overcome for effective robot learning and summarizes the latest research trends in the field.

Keywords: AI, Learning, Multi-Modal, Robot, Sim-to-Real, Simulation, Virtual Environment

Ⅰ. 서론

1. 산업트렌드 변화와 로봇 활용의 증가

현대 산업환경에서는 소비자 요구의 다양성이 커지고 제품 생명 주기의 단축이 가속화되면서, 기존의 생산 방식에 근본적인 변화가 요구되고 있다. 과거에는 단일 제품을 대량 생산하는 전용 생산라인이 주를 이루었으나, 이제는 다양한 제품 모델을 유연하게 제조할 수 있는 생산 체계로의 전환이 필수 과제가 되고 있다.

이러한 유연 생산 체제에 대한 필요성이 증가함에 따라 산업 현장에서 로봇의 활용이 더욱 확대되고 있다. 로봇은 높은 정밀도와 유연성을 갖추고 있어 다양한 제품을 효율적으로 생산할 수 있는 장점이 있기 때문이다. 특히, 산업용 로봇은 조립, 핸들링, 용접과 같은 여러 제조 공정에서 폭넓게 사용되며, 생산 효율성과 품질 향상에 기여하고 있다.

2022년까지 전 세계적으로 설치된 산업용 로봇의 수는 약 400만 대에 이르며, 그림 1과 같이 연평균 성장률(CAGR)은 13%로 추정된다[1]. 이러한 지속적인 성장세는 제조업의 자동화 및 지능화가 빠르게 진행되고 있음을 보여주며, 향후 유연 생산을 위한 로봇 기술의 발전이 더욱 중요해질 것으로 전망된다.

그림 1

전 세계에 설치 및 운영 중인 산업용 로봇 현황 출처 Reprinted from International Federation of Robotics, “World Robotics 2023,” 2023. 9. https://ifr.org/img/worldrobotics/2023_WR_extended_version.pdf

2. 로봇 학습을 위한 가상환경의 필요성

산업 현장에서 유연 생산을 위해 로봇이 널리 활용되고 있지만, 로봇의 대부분은 여전히 변화하는 환경에 능동적으로 대응하지 못하고 정해진 동작을 반복하는 수준에 머물러 있다. 새로운 제품을 생산하거나 다른 작업을 수행하려면 로봇의 동작을 원하는 형태로 조정할 수 있는 전문가의 프로그래밍이 필수이다. 이는 그림 2와 같이 셋업 시간 증가로 이어져 공장의 가동률을 낮추고 생산성을 저하시킨다.

그림 2

산업 패러다임 전환이 생산성에 영향을 미치는 사례

셋업 시간을 단축하기 위한 해결책으로, 최소한의 교시로 다양한 작업을 자율적으로 수행할 수 있는 AI 기반 학습 기술이 활발히 연구되고 있다. 이를 구현하기 위해서는 로봇이 다양한 상황에서 안전하고 효율적으로 충분한 데이터를 확보하는 것이 필수적이다. 하지만 로봇 학습에는 수백만 회 이상의 동작 데이터가 필요하며, 재밍, 넘어짐과 같은 위험 요소를 포함한 다양한 환경에서의 데이터가 요구된다. 이러한 데이터를 실제 환경에서 수집하려면 막 대한 시간과 비용이 소요될 뿐만 아니라 안전상의 문제도 발생할 수 있다. 따라서, 현실에서 발생할 수 있는 리스크 없이 대량의 데이터를 확보할 수 있는 가상 시뮬레이션 환경의 활용이 필수적으로 요구되고 있다.

3. 로봇 가상환경의 한계와 해결과제

로봇 학습을 위한 대량의 데이터를 다양한 환경에서 효과적으로 확보하기 위해 가상 시뮬레이션 환경이 필수적인 역할을 하고 있지만, 현재의 가상 환경은 몇 가지 한계를 가지고 있으며, 주요 문제점은 세 가지로 구분될 수 있다.

첫 번째는 물리엔진의 기술적 한계이다. 로봇이 복잡한 작업을 수행할 때 작업물과의 다중 접촉이 필연적으로 발생하며, 이러한 접촉면에서의 상호작용은 로봇의 동작과 움직임에 결정적인 영향을 미친다. 그러나 기존 물리엔진은 이러한 다중 접촉을 신속하고 정밀하게 계산하는 데 있어 제약이 있으며, 이는 시뮬레이션 결과의 정확성을 저하시킨다.

두 번째는 실제 환경과 가상환경 간의 차이에서 발생하는 오차이다. 가상 시뮬레이션에서 생성된 학습 데이터가 현실을 완벽히 반영하지 못하는 경우가 많다. 예를 들어, 가상환경에서 렌더링된 이미지, 조명 조건, 표면 질감, 노이즈 등의 요소는 실제 환경과 차이를 보일 수 있으며, 이러한 차이로 인해 가상환경에서 학습된 결과가 현실에서 그대로 적용되지 않는 문제가 발생한다. 이와 같은 실-가상 오차는 가상환경의 신뢰도를 저하시키는 주요 원인 중 하나이다.

세 번째는 가상환경에서의 대규모 지도 학습 데이터 생성의 문제이다. Google의 RT-2, Meta의 RoboCat 등과 같은 대규모 지도 학습 기반의 인공지능 기술이 등장하면서 기존 강화 학습 대비 높은 범용성 및 적응성을 보이고 있지만, 현재 로봇 가상 시뮬레이션의 경우 사용자가 정의한 시나리오 내에서만 동작하기 때문에 생성할 수 있는 시나리오와 학습 데이터양에는 한계가 존재한다.

이상의 한계들을 극복하기 위해서는 보다 정교한 물리엔진, 현실과 유사한 데이터 생성 기술, 대규모 지도학습 자동 생성이 가능한 시뮬레이션 기술의 발전이 필수적이다.

Ⅱ. 고정밀 물리엔진 기술 연구 동향

1. 개요

컴퓨터 시뮬레이션에서 물체의 움직임과 충돌을 실제 물리 법칙에 따라 계산하여 가상환경에서 현실감 있는 동작을 구현하는 소프트웨어인 물리엔진은 접촉 조건 모델링 및 해결 과정에 있어 각각의 휴리스틱한 근사 방법론을 채택하고 있다. 이로 인해 비물리적 거동 현상이 발생할 수 있으며, 비물리적 거동 현상은 복잡한 형상 간 다수의 접촉이 발생하는 조작 작업에서 빈번하게 발생할 수 있어 로봇 정밀 조작 학습에 큰 방해가 될 수 있다.

현재 로봇 시뮬레이션을 위해 사용되는 Coppelia-Sim, PhysX 5, MuJoCo 등의 대표적인 상용 물리엔진조차도 복잡한 형상을 갖는 비볼록(Non-Convex) 물체 간의 접촉 감지나 물체 강성 모델링에서 제한적이거나 불안정한 성능을 보여주기 때문에 실제 환경과 일치하는 시뮬레이션 결과를 얻는 데 어려움이 크고 유연 케이블, 소프트 그리퍼 등 강체가 아닌 유연체를 다루는 경우에는 그 한계가 더욱 두드러진다.

2. 기술 동향

가. 강체 물리엔진

강체 물리엔진은 로봇의 정밀 조작 및 시뮬레이션에서 핵심적인 역할을 하며, 현재 주요 기업에서 다양한 접근 방식을 적용하고 있다. Google DeepMind는 다관절 로봇의 동역학 시뮬레이션을 위한 Mu-JoCo(Multi-Joint Dynamics with Contact)를 오픈소스로 운영하고 있다. 시뮬레이터에서 사용하는 접촉 모델, 솔버, 적분기 등의 다양한 옵션을 제공하고 있으며, 계산 속도를 향상시키기 위해 비선형 상보 조건(NCP: Nonlinear Complementarity Problem)으로 표현되는 접촉 조건을 부드러운 볼록 문제(Soft Convex Problem)로 근사하는 모델을 채택하고 있어, 비볼록하고 복잡한 형상에 대한 지원은 제한적이다.

NVIDIA는 실시간 3D 협업 메타버스 플랫폼인 Omniverse를 구성하는 로봇 시뮬레이터 Isaac Sim (그림 3)을 PhysX5 물리엔진을 기반으로 개발하였다. 구, 캡슐, 박스뿐만 아니라 삼각형 메시(Triangle Mesh), 부호 거리 함수(SDF: Signed Distance Function) 등 다양한 물체 형상에 대한 충돌 검사 및 동역학 시뮬레이션이 가능하다. GPU를 활용하여 다양한 환경에서의 시뮬레이션을 병렬적으로 수행할 수 있어 고속 연산이 가능하고 접촉 모델링 및 클러스터링에 다양한 근사/휴리스틱 모델을 적용하였다.

그림 3

PhysX5 물리엔진 기반 Issac Sim 화면 출처 Screenshot from NVIDIA Issac Sim.

물리엔진은 속도와 정확도 두 가지 개선이 동시에 이루어져야 하는데, 빠르고 정확한 접촉 감지, 접촉력 계산, 시뮬레이션 강건성과 안정성을 향상시킬 수 있는 기술들이 필요하다. 특히 접촉력 계산의 경우 조립 과정에 과도한 수의 접촉이 발생할 수 있고, 이는 시뮬레이션 시간을 비약적으로 증가시키고, 안정성을 떨어뜨리기 때문에 접촉점을 축소하는 과정이 필요하다. 서울대학교 이동준 교수 연구팀에서는 접촉점 축소 과정에 시뮬레이션과 실측 데이터를 학습하여 활용하는 인공지능 기술[2]과의 접목을 시도하고 있다.

나. 유연체 물리엔진

최근 로봇 공학에서는 단순한 강체 시뮬레이션을 넘어, 소프트 그리퍼(Soft Gripper), 하네스(Harness) 작업 등과 같이 유연한 소재를 활용한 조작 연구가 활발히 진행되고 있다. 유연체를 탄성 변형으로 고려한 물리엔진 기술은 강체 물리엔진과 마찬가지로 실시간성과 정확도 간의 트레이드오프 문제를 해결해야 한다.

현재 강체 기반 물리엔진에서 유연체를 다룰 수 있도록 확장하는 연구가 진행 중이며, 일부 엔진에서는 유한요소해석(FEM: Finite Element Method), Mass-Spring Model, Position-Based Dynamics 등의 기법을 적용하여 유연체의 물리적 특성을 시뮬레이션할 수 있도록 지원하고 있지만, 재료 비선형성(Material Nonlinearity)을 고려한 유연체 모델링은 아직 로보틱스 물리엔진에서는 구현 사례가 거의 없다.

Toyota에서는 로봇 공학용 모델 기반 설계 및 검증 라이브러리 Drake를 개발하였는데, MuJoCo와 유사하게 접촉 조건을 부드러운 볼록 문제로 근사하여 계산속도 및 솔버의 수렴성을 증대시켰고 물체의 탄성 변형에 의한 접촉력을 계산하는 유한요소해석(FEM) 결과를 근사하는 수탄성 접촉 모델을 통해 접촉이 발생한 두 물체 간 접촉력을 계산할 수 있게 하였다.

Ⅲ. 실-가상 오차 최소화 기술 연구 동향

1. 개요

최근 자율주행, 로봇 공학 등 첨단 기술 분야에서 시뮬레이터를 활용한 모델 학습과 실제 환경에의 적용 간의 격차, 즉 Simulation-to-Real(Sim2Real) 문제는 중요한 도전 과제로 대두되고 있다. 시뮬레이터는 안전하고 효율적인 실험 환경을 제공하지만, 가상환경에서 생성된 이미지, 영상 데이터는 실제 촬영된 데이터와 여러 측면에서 차이가 발생한다[3]. 이러한 차이는 조명, 카메라 특성, 텍스처, 노이즈 등 다양한 요인에서 기인하며, 이로 인해 시뮬레이터에서 학습한 모델이 실제 환경에서 기대한 성능을 내지 못하는 경우가 빈번하다[4].

Sim2Real 기술은 이러한 실-가상 간 오차를 최소화하여, 가상환경에서의 학습 결과를 실제 환경에 원활하게 적용할 수 있도록 하는 연구 분야이다[5]. 연구자들은 가상 데이터의 품질을 향상시키거나, 두 도메인 간의 분포 차이를 보완하는 다양한 기술을 개발하고 있다. 특히, 물리 기반 렌더링(Physically Based Rendering) 기술의 발전, 도메인 랜덤화(Domain Randomization) 및 도메인 적응(Domain Adaptation) 기법, 전이 학습(Transfer Learning)과 자가 지도 학습(Self-Supervised Learning) 등이 주요 기술 동향으로 자리 잡고 있다. 이러한 기술들은 안전성, 효율성 및 비용 절감 측면에서 실제 산업 적용의 가능성을 높이며, 향후 다양한 분야에서 Sim2Real 기술의 활용도가 더욱 확대될 것으로 기대된다.

2. 기술 동향

가. 시뮬레이터 정밀도 및 현실감 강화

시뮬레이터의 정밀도 향상은 가상환경에서 생성된 이미지 및 영상의 현실감을 강화하여 실제 환경과의 차이를 근본적으로 줄이는 데 중점을 둔다.

현대의 렌더링 엔진은 물리 기반 렌더링 기법을 적용하여, 광원, 재질, 반사, 그림자 등의 효과를 실제 물리 법칙에 기반해 정밀하게 구현한다[6]. 시뮬레이터는 고해상도 렌더링과 정밀 모델링을 통해 실제 객체의 조명 및 재질 특성을 재현함으로써 가상환경에서 획득한 데이터가 실제 촬영 데이터와 유사한 분포를 보이도록 하고 있다. 또한, 실시간 피드백 시스템이 도입되어 시뮬레이션 중 발생하는 미세 오차를 동적으로 보정하는 방안이 연구되고 있다. 이러한 접근법은 실제 환경에서의 테스트 결과와의 정합성을 높일 수 있다[7].

나. 도메인 랜덤화의 발전

도메인 랜덤화 기법은 시뮬레이터 내에서 조명, 색상, 카메라 각도, 날씨 등 다양한 변수들을 무작위로 변화시켜 모델이 여러 조건에 대해 강건한 특성을 학습하도록 유도하는 방법이다[8].

최근 연구에서는 단순한 무작위 변화에 머무르지 않고, 실제 환경에서 관측된 통계적 분포를 반영하는 파라미터 설정 방식이 도입되고 있다. 예컨대, 로봇 제어 분야에서는 작업 환경 내에서 물체의 크기, 질감, 배경 등을 실제 데이터 기반의 분포를 모사하여 다양하게 변화시키고, 이를 통해 모델의 견고한 성능을 확보한 사례가 보고된다. 이러한 방법은 실제 환경의 복잡성을 반영함과 동시에, 시뮬레이터에서 학습된 모델이 예기치 못한 상황에서도 안정적으로 동작할 수 있도록 돕는다[9].

다. 도메인 적응 및 통합적 접근

가상과 실제 데이터 간의 분포 차이를 보완하는 도메인 적응 기술은 Sim2Real 문제 해결에 핵심적인 역할을 수행한다[10]. 적대적 학습 기반의 접근법, 예를 들어 GAN(Generative Adversarial Networks)이나 CycleGAN을 활용한 스타일 전이 기법은 가상 데이터에 실제 환경의 특성을 반영하거나 두 도메인의 중간 특성 공간을 정렬하는 방식으로 구현된다. GAN이나 CycleGAN을 이용하여 시뮬레이터에서 생성된 이미지에 실제 환경의 텍스처와 색감을 반영한 후, 모델의 객체 인식 성능을 향상시킬 수 있다[11]. 또한, 다중 단계 학습 전략을 통해 초기에는 가상 데이터로 사전 학습을 수행한 후, 중간 과정에서 도메인 적응 모듈을 삽입하여 실제 데이터를 통한 미세 조정을 진행하는 통합적 접근법이 제안되고 있다. 이러한 융합적 접근은 다양한 실험 환경에서 Sim2Real Gap을 효과적으로 축소시키는 것으로 나타났다[12].

라. 전이 및 자가 지도 학습의 역할 강화

라벨링 비용과 데이터 수집의 한계로 인해 실제 데이터가 부족한 상황에서, 전이 학습과 자가 지도 학습 기법은 시뮬레이터에서 생성된 방대한 데이터를 실제 데이터와 결합하는 데 유용한 방법으로 주목받고 있다.

전이 학습은 대규모 시뮬레이션 데이터를 기반으로 사전 학습된 모델을 실제 환경에 맞게 미세 조정하는 방식으로, 자율주행 및 로봇 내비게이션 분야에서 제한된 실제 데이터만으로도 높은 성능을 달성할 수 있다. 또한, 자가 지도 학습은 라벨 없이도 데이터의 내재된 구조를 학습하도록 유도하여, 가상과 실제 도메인의 특성 차이를 자연스럽게 연결하는 역할을 한다. 최근 일부 연구에서는 전이 학습과 자가 지도 학습을 결합한 대조 학습 기법을 적용, 두 도메인 간의 특징 일관성을 확보하고 모델의 일반화 능력을 향상시킨 사례가 보고되고 있다[13,14].

현재 Sim2Real 실-가상 오차 최소화 기술은 개별 기법의 발전을 넘어 시뮬레이터 정밀도 향상, 도메인 랜덤화, 도메인 적응 및 전이‧자가 지도 학습 기법이 상호 보완적으로 결합되는 통합적 접근이 주목받고 있다. 다양한 연구 사례에서 볼 수 있듯이, 이러한 복합적 접근은 자율주행, 로봇 공학 등 실제 응용 분야에서 기존의 단일 기법보다 뛰어난 성능을 보이며, 향후 클라우드 기반 연산, 빅데이터 분석 및 최신 렌더링 기술과의 융합을 통해 Sim2Real Gap을 더욱 효과적으로 축소할 것으로 기대된다.

마. 멀티모달 데이터 수집 및 동기화

강화 학습이 주도하던 로봇 가상 학습 분야에서 Google의 RT-2, Meta의 RoboCat 등 대규모 데이터를 기반으로 한 지도 학습 기술이 등장하면서, 학습된 모델이 높은 범용성과 정확성을 동시에 제공할 수 있게 되었다. 그러나 연구자들은 이에 그치지 않고, 더 우수한 성능을 확보하기 위해 기존의 이미지 중심 학습을 넘어 언어, 촉각, 힘/토크 등의 멀티모달 데이터를 활용한 학습 기술을 연구하고 있다.

가상환경의 가상 센서들을 통해 생성되는 멀티모달 데이터의 정확도 평가 및 개선을 위해서는 로봇 및 관련 환경에 설치된 다양한 센서에서 생성한 데이터 시점이 어긋나지 않도록 시간 동기화가 필수적이다. 이를 위해 보통 하드웨어 기반과 소프트웨어 기반 기법이 병행된다.

하드웨어 기반 방식은 여러 센서에 동시에 트리거 신호를 보내거나 공통 클록(GPS 1PPS, PTP 등)을 활용하는 방법으로, 밀리초 이하 수준의 높은 정밀도를 확보할 수 있다. 카메라와 IMU 동시 샘플링, 자율주행차량에서의 레이더-비전 통합 등에 자주 사용된다. 그러나 이 방법은 활용 센서들이 물리적 다른 노드들로 분산되어 동작하는 경우 정밀한 시간 동기화(Time Synchronization) 기술을 필요로 한다.

반면 소프트웨어 기반 방식은 시스템 시계를 활용하여 각 데이터에 타임스탬프를 부여하여 함께 기록한 뒤, 후처리로 이를 활용하여 순서를 맞추거나 보간해 센서 퓨전을 수행하는 기법이다. 이 방법은 내부 처리지연 등에 따른 미세한 오차가 있는 한계를 갖지만 다음과 같은 장점을 갖는다.

첫째, ROS(Robot Operating System) 같은 프레임워크를 쓰면 하드웨어 기반 방식에 비해 간편하게 구현 가능하여 고정밀의 로봇 제어가 아닌 경우 효율적으로 활용 가능하다.

둘째, 센서 데이터 수집 단계에서 여러 센서 사이의 동기화 작업이 필요 없어 로봇에 주로 활용되는 모터, IMU, 촉각 센서 등과 같이 높은 주기를 갖는 센서 데이터 수집 부하를 낮출 수 있다.

셋째, 학습 과정에서 활용 목적에 따라 필요한 센서 종류를 선택하여 후처리로 시간 정렬을 통해 퓨전된 학습 데이터를 유연하게 생성할 수 있다. 이를 통해 다양한 조합의 학습 데이터를 구축하고 실험할 수 있는 환경을 제공하여 학습의 품질을 높일 수 있다.

넷째, 학습 과정에서 목표 센서 데이터 주기를 설정하고, 이 주기에 따라 저장된 멀티 모달 센서 데이터들을 정렬시킬 수 있어 필요에 따라 학습 품질을 조절할 수 있다. 이를 위해서는 학습 데이터의 보간 작업이나 학습 데이터 대푯값 선택과 같은 통계 기법이 필요하다.

이처럼 센서 데이터에 정확한 시간 정보를 부여해 놓으면, 영상-촉각-힘/토크 정보를 동일한 시간축으로 정렬할 수 있어 학습 데이터의 품질과 신뢰도를 높인다. 실제 산업 현장과 연구에서는 활용 목적과 정밀도 요구사항에 따라 이 두 방식을 적절히 결합하여 멀티모달 센서를 효율적으로 동기화한다.

Ⅳ. 학습데이터 자동 생성 기술 연구 동향

1. 개요

로봇의 동작 학습을 위한 가상환경 기술은 물리 시뮬레이션 기술에 생성형 AI 기술이 융합되며 성능의 향상을 보이고 있다. 시뮬레이션 기반 학습데이터 자동 생성 기술의 핵심은 PCG(Procedual Content Generation)와 생성형 AI의 연동, 멀티 모달 데이터 생성 프레임워크, 도메인 랜덤화를 통한 자동 최적화로서, 이러한 기술들이 기존의 시뮬레이터를 활용한 데이터 수집 한계를 극복하고 로봇 학습의 효율성을 혁신적으로 향상시키고 있다[15].

2. 기술 동향

가. PCG와 생성형 AI의 연동

게임 등의 그래픽 분야에서 주로 활용되던 PCG 기술이 로봇 학습 데이터 생성에 적용되고 있다. 전통적인 PCG 기술은 미리 정의된 규칙에 따라 무작위적으로 다양성을 확보하는 방식이었는데, 최근 강화학습을 기반으로 인간의 개입 없이 다양한 데이터를 생성하는 PCGRL(Procedual Content Generation via Reinforcement Learning) 방식이 제안되었다[16]. 이 방식이 시뮬레이터에 적용된다면, 시뮬레이터에서 로봇이 있는 환경을 다양하게 바꿀 수 있으며, 장애물과 객체의 구성을 바꾸고, 로봇의 동작 시 보상 함수를 활용하여 자율적인 동작을 수행하여 동작의 최적 궤적을 학습하는 것이 가능하다. 이러한 일련의 절차를 LLM(Large Language Model)을 활용하여 자연어로 시뮬레이션 환경을 설정하고 변경할 수 있으며, 로봇 동작의 다양한 시나리오를 구축할 수 있다. 또한, 로봇의 동작 성공 여부를 시뮬레이터에 추가적인 변경 없이 명세할 수 있다. 가상환경 기술 개발에서 물리 시뮬레이션에 생성형 AI 기술을 융합함으로써 학습 성능이 향상되고 있다.

나. 멀티 모달 데이터 생성 프레임워크

물리 시뮬레이터와 생성형 AI의 결합은 시각적, 기하학적, 동역학적 데이터를 동시에 생성하고 처리할 수 있는 혁신적인 체계로 발전하고 있다[17]. 예를 들어, 루시드심의 경우 사용자가 텍스트 프롬프트(예: 3개의 조명이 비추는 로봇 작업 환경)를 입력하면, 생성형 AI는 이를 바탕으로 3D 공간 내의 작업 환경과 로봇의 기하학적 속성(예: 높이, 경사도)뿐만 아니라 물리적 속성(예: 마찰계수, 탄성)을 세밀하게 매핑하고 그림자를 작업 환경에 나타내는 작업을 수행한다. 이러한 과정에서 AI는 자동으로 다양한 형태의 데이터(RGB-D 이미지, LiDAR 포인트 클라우드, 토크 센서 데이터)를 동기화하고 생성하여 현실적으로 Sim2Real을 구현한다. 또한, OpenAI의 Shap-E는 텍스트 기반의 3D 모델 생성 과정에서 메타데이터를 추가하는데, 여기에는 질감 특성이나 질량 분포와 같은 정보들이 포함된다. 이러한 메타데이터는 로봇의 그리퍼 제어 학습에 필수적인 다차원 데이터셋을 제공하며, 다양한 물리적 요소가 효과적으로 결합된 학습 환경을 구축할 수 있다. 이와 같은 다중 멀티 모달 데이터 생성 기법은 단일 소스에서 다양한 형태의 모달 데이터를 동시에 생성할 수 있게 함으로써 데이터 정합성 문제를 해결하고, 보다 정밀하고 일관된 결과를 도출할 수 있게 한다.

다. 도메인 랜덤화를 통한 자동 최적화

도메인 랜덤화는 학습 모델을 더 일반화하기 위해 시뮬레이션 환경을 무작위로 변화시키는 기법으로, PCG에서 이를 활용하여 시뮬레이션 환경을 자동으로 생성할 수 있다. PCG는 훈련 데이터의 끝없는 순열을 생성할 수 있지만, 균등 랜덤화(Uniform Randomization) 방식이 적용되기 때문에 학습 효율성이 떨어지고 난이도 조절이 어려운 단점이 있다. 특히, 정밀을 요하는 동작에 대한 특정 복잡한 케이스를 생성하지 못하는데, 이를 해결하기 위해 특수한 조건을 포함하는 가이드 형태의 도메인 랜덤화 기술이 도입되고 있다. 관련 기술 중 하나인 ADR(Automatic Domain Randomization)의 경우 로봇의 성능에 따라 무작위화 범위를 점진적으로 확장 가능하여 시뮬레이션 작업을 마스터함에 따라 더 어려운 변형 시나리오를 자동으로 생성할 수 있다[18].

이러한 자동 생성 데이터의 신뢰성을 확보하기 위한 검증 메커니즘도 진화하고 있다. 프랑스 INRIA 연구소는 생성된 시뮬레이션 데이터와 실제 데이터의 지형 그래프 토폴로지를 비교하는 새로운 메트릭을 개발했다. 이 메트릭은 지형의 연결성(Connectivity)과 관통성(Permeability)을 위상 데이터 분석(TDA) 기법을 통해 정량화하여, 두 도메인 간 구조적 유사도를 계산한다. 이 지표는 시뮬레이션 파라미터 튜닝에 피드백으로 활용되며, 실제 환경과 92%의 토폴로지 일치도를 달성한 경우에만 학습 데이터셋에 편입되도록 설계되었다[19].

Ⅴ. 결론

본고에서는 로봇 정밀조작 학습에 필요한 대량의 데이터를 다양하고 효과적으로 확보하기 위한 가상 시뮬레이션 기술의 중요성과 한계점 그리고 한계점 극복을 위해 수행되고 있는 연구 동향에 대해 분석하였다.

기존 물리엔진의 한계를 극복하기 위해 강체 및 유연체 솔버의 성능 향상을 위한 기술이 개발되고 있으며, 실시간성과 정확도 간의 트레이드오프 문제를 해결하기 위해 다양한 인공지능 기술과의 접목이 시도되고 있다. 실-가상 도메인 오차를 최소화하기 위한 Sim2Real 기술에 대한 연구도 활발히 진행되고 있는데, 가상환경과 실 환경 간의 정합성을 높이기 위한 물리 기반 렌더링 기법을 포함하여 도메인 랜덤화, 도메인 적응 및 전이 학습 기법이 연구되고 있다. 또한, 학습 데이터 자동 생성을 위해 PCG와 생성형 AI 기술이 결합되고 있으며, 멀티모달 데이터 생성 프레임워크 기술 등을 활용하여 기존의 시뮬레이터를 활용한 데이터 수집 한계를 극복하고 있다.

상기 기술한 다양한 로봇 가상환경 기술들은 로봇의 자율 학습이 더욱 정밀하고 효율적으로 이루어질 수 있도록 지원하여, 유연 생산 체계 실현 및 제조 자동화 수준 향상에 기여할 것으로 기대된다.

용어해설

시뮬레이션 실제 상황을 컴퓨터나 가상환경에서 모방하여 실험하거나 테스트하는 기술로, 현실에서 직접 수행하기 어려운 과정을 안전하고 효율적으로 재현하는 방법

물리엔진 컴퓨터 시뮬레이션에서 물체의 움직임과 충돌을 실제 물리 법칙에 따라 계산하여 가상환경에서 현실감 있는 동작을 구현하는 소프트웨어 기술

멀티모달 텍스트, 음성, 이미지, 영상 등 여러 유형의 데이터를 동시에 처리하고 통합하여 이해하는 기술

약어 정리

ADR

Automatic Domain Randomization

FEM

Finite Element Method

GAN

Generative Adversarial Networks

LLM

Large Language Model

NCP

Nonlinear Complementarity Problem

PCG

Procedual Content Generation

PCGRL

Procedual Content Generation via Reinforcement Learning

ROS

Robot Operating System

SDF

Signed Distance Function

Sim2Real

Simulation-to-Real

TDA

Topological Data Analysis

참고문헌

[1] International Federation of Robotics, "World Robotics 2023," 2023. 9. https://ifr.org/img/worldrobotics/2023_WR_extended_version.pdf

[2] M.S. Kim et al., "Data-Driven Contact Clustering for Robot Simulation," in Proc. Int. Conf. Robot. Autom., (Montreal, Canada), May. 2019, pp. 8278-8284.

[3] K. Bai et al., "Close the Sim2real Gap via Physically-based Structured Light Synthetic Data Simulation," in Proc. IEEE Int. Conf. Robot. Autom., (Yokohama, Japan), May. 2024, pp. 17035-17041.

[4] M, Khansari et al., "Practical Visual Deep Imitation Learning via Task-Level Domain Consistency," in Proc. IEEE Int. Conf. Robot. Autom., (London, UK), May. 2023, pp. 1837-1844.

[5] B.L. Semage, "Robust and Efficient Reinforcement Learning for Physics Tasks," Deakin University, 2023.

[6] T. Zhang et al., "Virtual Tools for Testing Autonomous Driving: A Survey and Benchmark of Simulators, Datasets, and Competitions," Electronics, vol. 13, no. 17, 2024.

[7] N. Ahmed et al., "A Systemic Survey of the Omniverse Platform and Its Applications in Data Generation, Simulation, and Metaverse," Front. Comput. Sci., vol. 6, 2024.

[8] J. Tobin et al., "Domain Randomization for Transferring Deep Neural Networks from Simulation to the Real World," in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., (Vancouver, BC, Canada), Sep. 2017, pp. 23-30.

[9] F. Muratore et al., " Data-Efficient Domain Randomization with Bayesian Optimization," IEEE Robot. Autom. Lett., vol. 6, no. 2, 2021, pp. 911-918.

[10] P. Dolatyabi et al., "Deep Learning for Traffic Scene Understanding: A Review," IEEE Access, vol. 13, 2025, pp. 13187-13237.

[11] S.S. Ulhas et al., "GAN-Based Domain Adaptation for Creating Digital Twins of Small-Scale Driving Testbeds: Opportunities and Challenges," in Proc. IEEE Intell. Veh. Symp., (Jeju Island, Rep. of Korea), Jun. 2024, pp. 137-143.

[12] W. Yu et al., "Boosting SAR Aircraft Detection Performance with Multi-Stage Domain Adaptation Training," Remote Sens., vol. 15, no. 18, 2023.

[13] F. Zhuang et al., "A Comprehensive Survey on Transfer Learning," Proc. IEEE, vol. 109, no. 1, 2020, pp. 43-76.

[14] X. Deng et al., "Self-Supervised 6D Object Pose Estimation for Robot Manipulation," in Proc. IEEE Int. Conf. Robot. Autom., May. 2020, pp. 3665-3671.

[15] A. Khalifa et al., "PCGRL: Procedual Content Generation via Reinforcement Learning," in Proc. AAAI Conf. Artif. Intell. Interact. Digit. Entertain., Oct. 2020, pp. 95-101.

[16] S. Risi and J. Togelius, "Increasing Generality in Machine Learning through Procedural Content Generation," Nat. Mach. Intell., 2020, pp. 428-436.

[17] A. Yu et al., "Learning Visual Parkour from Generated Images," in Proc. Conf. Robot. Learn., (Munich, Germany), Nov. 2024.

[18] A. Bucker et al., "Reshaping Robot Trajectories Using Natural Language Commands: A Study of Multi-Modal Data Alignment Using Transformers," in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., (Kyoto, Japan), Oct. 2022, pp. 978-984.

[19] M. Dennis et al., "Emergent Complexity and Zero-shot Transfer via Unsupervised Environment Design," in Proc. Int. Conf. Neural Inf. Process. Syst., (Vancouver, BC, Canada), Dec. 2020, pp. 13049-13061.

Article Information Continued

그림 1

그림 2

그림 3