리얼월드(RLWRLD)가 엔비디아의 로봇 AI 플랫폼을 활용해 고자유도 5지 로봇 손의 섬세한 조작 학습을 고도화하며 피지컬 AI 기술 경쟁력을 강화하고 있다. 리얼월드는 다양한 엔비디아 플랫폼을 기반으로 로봇 손 제어 모델의 안정성과 재현성을 높이고, 실제 산업 현장 적용 가능성을 끌어올리고 있다고 밝혔다.
로봇이 물체를 잡고 이동시키는 과정은 단순한 동작처럼 보이지만 실제로는 시각 인식과 상황 판단, 손가락의 미세한 힘 조절이 연속적으로 이뤄져야 한다. 특히 고자유도 5지 로봇 손은 관절 수가 많아 제어 난도가 높고, 정교한 학습 없이는 산업 현장에서 요구되는 수준의 조작 정확도를 구현하기 어렵다.
리얼월드는 이러한 한계를 극복하기 위해 자체 데이터 파이프라인을 기반으로 로봇 파운데이션 모델을 개발하고 있다. 엔비디아의 로봇 파운데이션 모델 ‘GR00T N1.5’를 토대로 5지 로봇 손에 최적화된 추가 학습을 적용하고 자체 개량한 모델과 병행해 벤치마킹을 진행 중이다. 이를 통해 빠른 파인 튜닝과 반복 실험이 가능해졌고 실제 환경에서 활용 가능한 학습 데이터를 효율적으로 축적하고 있다.
배재경 리얼월드 CTO는 “GR00T 기반의 추가 학습을 통해 고자유도 로봇 손 제어에 필요한 반복 실험 속도를 크게 높일 수 있었다”며 “데이터가 보강되고 학습이 최적화되면서 로봇 손의 조작 안정성이 현저히 개선됐다”고 설명했다.
이와 함께 리얼월드는 데이터 부족 문제를 해결하기 위해 가상 환경 기반 실험도 적극 병행하고 있다. 로봇 학습 파이프라인 구축 과정에서 엔비디아 아이작 심(Isaac Sim)과 아이작 랩(Isaac Lab)을 활용해 다양한 조작 시나리오를 가상 환경에서 검증하고 이를 실제 로봇 실험과 연계해 재현성과 안정성을 높이고 있다. 또한 엔비디아의 엣지 AI 플랫폼 ‘젯슨 토르(Jetson Thor)’에서 자체 개발 모델을 구동하는 테스트도 진행 중이며, 해당 내용은 CES 현장에서 공식적으로 공개됐다.
한편, 리얼월드는 올해 상반기 언어·비전 이해 성능을 고도화한 독자적인 VLA(Vision-Language-Action) 모델을 선보일 계획이다. 대규모 파라미터 기반으로 설계된 이 모델은 로봇이 언어 지시를 이해하고 시각 정보를 해석해 보다 정밀한 손 동작을 수행하도록 지원한다. 아울러 사람 수준의 손 조작 능력과 인지 능력을 기계에 구현하는 것을 목표로, 글로벌 산업 환경에서 활용 가능한 로봇 AI 기술 상용화를 추진하고 있다. 이번 엔비디아 플랫폼 활용은 로봇 손 조작 기술을 한 단계 끌어올리는 핵심 전환점이 될 것으로 평가된다.
오토메이션월드 김재황 기자 |







































/smartmap_2_21.png)
/smartmap_2_22.png)
/smartmap_2_23.png)
/smartmap_2_24.png)
/smartmap_2_25.png)
/smartmap_2_26.png)
/smartmap_2_27.jpg)