최근 물류 창고, 병원, 연구실에서 가장 빠르게 모습을 드러내고 있는 로봇이 바로 이동형 매니퓰레이터(Mobile Manipulator)예요. 바퀴나 다리로 자유롭게 이동하면서, 상부에 달린 로봇 팔로 물건을 집고 옮기는 형태죠. 고정형 산업용 로봇이 한자리에서 정해진 작업만 반복했다면, 이동형 매니퓰레이터는 환경을 직접 돌아다니며 사람처럼 다채로운 일을 처리해요. 그래서 Physical AI 시대를 여는 핵심 플랫폼으로 주목받고 있답니다. 이번 글에서는 Mobile Manipulator의 정의부터 구조, 핵심 기술, 활용 사례, 그리고 앞으로의 전망까지 차근차근 풀어볼게요.
Mobile Manipulator란 무엇일까요
Mobile Manipulator는 말 그대로 이동(Mobile)과 조작(Manipulation) 능력을 한 몸체에 결합한 로봇을 말해요. 자율주행이 가능한 모바일 베이스 위에 1개 또는 2개의 로봇 팔이 장착된 구조가 가장 흔하죠. 단순히 두 기능을 합쳤다는 의미를 넘어, 이동과 조작을 동시에 계획하고 제어한다는 점이 핵심이에요. 예를 들어 선반에서 박스를 꺼내려면 베이스의 위치, 팔의 자세, 그리퍼의 방향을 동시에 고려해야 하거든요.
고정형 로봇과의 차이
전통적인 산업용 로봇 팔은 컨베이어 옆에 고정되어, 미리 정해진 좌표에서만 작업해요. 작업 셀이 바뀌면 다시 설치하고 캘리브레이션해야 하죠. 반면 이동형 매니퓰레이터는 공간 자체가 작업장이 돼요. 창고 통로를 따라 이동하다가 특정 선반 앞에서 자세를 잡고 박스를 꺼내는 식이에요. 작업장의 레이아웃을 바꿔도 로봇이 스스로 대응할 수 있다는 점이 가장 큰 차별점이에요.
왜 지금 부상하고 있을까요
최근 몇 년 사이 LiDAR와 카메라 가격이 크게 떨어졌고, 임베디드 GPU 성능이 비약적으로 좋아졌어요. 여기에 비전 언어 행동 모델(VLA)이나 로봇 파운데이션 모델 같은 학습 기반 정책이 빠르게 발전하면서, 이동형 매니퓰레이터가 처리할 수 있는 작업의 폭이 넓어졌어요. 과거에는 연구실 데모 수준이었다면, 지금은 아마존, 보스턴 다이내믹스, 애자일 로보틱스 같은 기업이 실제 현장에 투입하고 있답니다.

이동형 매니퓰레이터의 구성 요소
한 대의 Mobile Manipulator는 크게 네 가지 서브시스템으로 이루어져 있어요. 모바일 베이스, 매니퓰레이터 암, 엔드 이펙터(그리퍼), 그리고 센서와 컴퓨팅 모듈이에요. 각 구성 요소가 유기적으로 맞물려야 부드러운 동작이 나와요.
모바일 베이스
가장 흔한 형태는 차륜형 베이스예요. 메카넘 휠을 쓰면 옆으로 게걸음 이동이 가능해서, 좁은 통로에서도 자세를 맞추기 쉬워요. 차륜형 외에 4족 보행 베이스도 점차 늘고 있어요. 보스턴 다이내믹스의 스팟 위에 팔을 얹은 형태가 대표적이죠. 계단이나 비정형 지형이 많은 건설 현장, 발전소 점검 같은 환경에서 강점을 보여요. 최근에는 휴머노이드 베이스가 등장하면서, 두 다리로 걷는 동시에 두 팔로 조작하는 풀바디 매니퓰레이터도 시제품이 쏟아지고 있어요.
매니퓰레이터 암과 그리퍼
로봇 팔은 보통 6자유도(6-DoF) 또는 7자유도(7-DoF) 구조를 채택해요. 자유도가 높을수록 같은 위치에 다양한 자세로 접근할 수 있어서, 좁은 공간에서 유리해요. 그리퍼는 작업 대상에 따라 평행 그리퍼, 진공 흡착식, 다지(多指) 그리퍼, 소프트 그리퍼 등이 쓰여요. 깨지기 쉬운 물체나 다양한 형태의 식품을 다룰 때는 부드럽고 변형 가능한 소프트 그리퍼가 점점 인기를 얻고 있답니다.
센서와 온보드 컴퓨터
주변을 인지하기 위해 LiDAR, 스테레오 카메라, RGB-D 카메라, IMU가 결합되어 있어요. 팔의 끝단(엔드 이펙터)에는 흔히 손목 카메라가 부착되어, 잡으려는 물체를 가까이서 확인하죠. 모든 센서 데이터를 실시간으로 처리하기 위해 NVIDIA Jetson Orin이나 x86 기반 산업용 PC가 탑재되고, 일부 상위 정책은 클라우드와 협력해 추론을 분담하기도 해요.
핵심 기술: 인지부터 제어까지
이동형 매니퓰레이터를 똑똑하게 만들기 위해서는 여러 영역의 기술이 동시에 맞물려야 해요. 단순히 잘 움직이는 것을 넘어, 환경을 이해하고 의도를 가지고 행동하는 능력이 필요하답니다.
SLAM과 자율주행
모바일 베이스가 길을 잃지 않으려면 자신의 위치를 정확히 알아야 해요. 이때 사용하는 핵심 기술이 동시적 위치 추정과 지도 작성(SLAM)이에요. LiDAR 기반 SLAM이 가장 안정적이지만, 최근에는 시각 정보만으로도 정밀한 지도를 만드는 비주얼 SLAM이 빠르게 발전하고 있어요. 그 위에 글로벌 플래너와 로컬 플래너가 협력해, 사람과 장애물을 피하며 목적지까지 부드럽게 이동해요.
모션 플래닝과 전신 제어
팔과 베이스를 따로 움직이면 동작이 매끄럽지 못해요. 그래서 최근 연구는 전신 제어(Whole Body Control)를 통해 베이스와 팔을 하나의 동역학 시스템으로 보고 동시에 최적화해요. 이렇게 하면 좁은 구역에서도 효율적인 자세 전환이 가능하답니다. 동작 생성에는 모델 예측 제어(MPC)와 샘플링 기반 최적화 같은 알고리즘이 자주 사용돼요.
지각과 학습 기반 정책
물체를 인식하고 잡는 능력은 딥러닝의 영역이에요. 6D 자세 추정, 그래스프 예측 네트워크, 분할(segmentation) 모델이 결합되어 다양한 물체를 다룰 수 있어요. 한 단계 더 나아간 흐름이 비전 언어 행동 모델(VLA)인데요. 자연어 명령과 카메라 이미지를 입력받아 곧바로 로봇 동작을 생성해요. OpenVLA, RT-2, Pi-Zero 같은 모델이 이 흐름을 주도하고 있어요. 자세한 기초 개념은 Wikipedia의 Mobile Manipulator 항목에서도 확인할 수 있어요.
주요 활용 사례
이동형 매니퓰레이터는 이미 우리 일상 근처에서 다양한 형태로 활약하고 있어요. 산업 현장은 물론, 의료와 가정용 영역까지 빠르게 확장되고 있답니다.
물류와 창고 자동화
아마존은 ‘Stretch’와 ‘Sequoia’를 비롯한 여러 모바일 매니퓰레이터를 도입해, 박스를 트럭에서 내리거나 컨테이너에 적재하는 작업을 자동화하고 있어요. 일본의 패스트 리테일링은 매장 보충 작업에 모바일 매니퓰레이터를 시범 운용 중이고, 국내 물류센터에서도 팔레트 단위 운반에 채택이 늘고 있어요. 핵심 가치는 마지막 1미터의 자동화예요. 컨베이어가 닿지 않는 구역, 사람만이 처리하던 영역까지 로봇이 채워가는 셈이죠.
의료와 헬스케어
병원 환경에서는 환자 응대, 약품 배송, 검체 운반에 모바일 매니퓰레이터가 활용돼요. 사람의 손이 부족한 야간이나 감염 위험이 높은 격리 병동에서 진가를 발휘해요. 또 재활 치료용 보조 로봇처럼 환자와 직접 상호작용하는 협동형 매니퓰레이터도 늘고 있어요.
가정과 서비스
1Xtechnologies의 NEO, Figure의 02, Apptronik의 Apollo 같은 휴머노이드 로봇은 모두 본질적으로 이동형 매니퓰레이터예요. 빨래를 개거나 식기를 정리하는 등 가정 내 잡무를 처리하려는 시도가 본격화되고 있죠. 한편 호텔이나 공항의 안내 로봇, 카페의 음료 서빙 로봇도 이동형 매니퓰레이터의 가벼운 변형이라고 볼 수 있어요.
도전 과제와 한계
장밋빛 전망만 있는 것은 아니에요. 이동형 매니퓰레이터가 진짜 일상에 녹아들기 위해 풀어야 할 숙제도 적지 않답니다.
안전과 사람과의 협업
로봇이 사람과 같은 공간을 공유하려면 무엇보다 안전 인증이 중요해요. ISO 10218, ISO/TS 15066 같은 협동 로봇 안전 표준을 충족하고, 충돌 시 즉시 정지하거나 힘을 분산하는 메커니즘이 필요해요. 또한 사람이 가까이 다가올 때 의도를 추론해 부드럽게 양보하는 사회적 내비게이션 기술도 발전이 더 필요해요.
전력과 가동 시간
모바일 베이스와 팔, 다양한 센서를 24시간 가동하려면 배터리 용량이 매우 중요해요. 현재 상용 모바일 매니퓰레이터의 가동 시간은 보통 4~8시간 수준이라, 충전 스테이션과의 자율 도킹 기술이 함께 발전하고 있어요. 일부 모델은 핫스왑 배터리 시스템을 채택해 가동률을 끌어올리기도 해요.
데이터 수집과 일반화
학습 기반 정책의 정확도는 데이터 양과 다양성에 크게 의존해요. 그래서 텔레오퍼레이션으로 사람이 직접 시연하거나, 시뮬레이션 데이터를 대규모로 만드는 방식이 함께 활용돼요. 다만 시뮬레이션과 실제 환경의 격차(sim-to-real gap)는 여전히 큰 숙제예요. 새로운 환경에서 첫날부터 잘 동작하도록 만드는 일반화 능력이 향후 연구의 가장 중요한 과제 중 하나라고 할 수 있어요.
전망: Physical AI와 이동형 매니퓰레이터
이동형 매니퓰레이터는 Physical AI의 가장 직관적인 형태예요. 지각-판단-행동-피드백의 루프가 물리 세계에서 실시간으로 돌아간다는 점에서 그렇죠. 앞으로 몇 년간은 두 가지 흐름이 두드러질 것으로 보여요.
풀스택 로봇 파운데이션 모델의 성숙
지금까지는 인지, 계획, 제어가 별도 모듈로 분리되어 있었는데, 점차 단일한 거대 모델이 모든 단계를 통합하는 추세예요. Nvidia GR00T처럼 휴머노이드 전용 파운데이션 모델, 또는 LeRobot 같은 오픈소스 생태계가 빠르게 자라고 있어요. 향후 2~3년 내에 일반인이 직접 사전 학습된 모델을 다운로드해 자신의 로봇에 올리는 시대가 올 수도 있답니다.
가격과 보급
현재 산업용 이동형 매니퓰레이터는 한 대에 수천만 원에서 억대 수준이지만, 양산이 본격화되면 수년 내에 가격이 크게 떨어질 거예요. 특히 휴머노이드 영역에서는 ‘iPhone 모먼트’에 비유될 만큼 폭발적인 보급이 예상되고 있어요. 가정용 로봇 비서, 소상공인용 서빙 로봇, 농가용 작업 로봇 등이 차례로 시장에 진입할 가능성이 높답니다.
결론
Mobile Manipulator는 단순한 자동화 기기를 넘어, 물리 세계에서 일하는 인공지능의 몸체로 진화하고 있어요. 모바일 베이스, 매니퓰레이터 암, 다양한 센서가 결합되고, 그 위에 SLAM, 전신 제어, 비전 언어 행동 모델 같은 첨단 기술이 얹어지면서 활용 영역이 빠르게 넓어지고 있죠. 물론 안전, 전력, 데이터 일반화 같은 과제가 남아 있지만, 그만큼 연구와 산업 양쪽에서 활발한 투자와 혁신이 이루어지고 있어요. 앞으로 몇 년간 이동형 매니퓰레이터의 발전을 지켜보면, 우리가 일하는 방식과 사는 풍경이 어떻게 달라질지 가장 빠르게 체감하게 될 거예요.