임무 성공률 40%↑…국제적 논문상 수상

핸드 승률이 힘과 위치를 같이 제어해 보다 정밀한 작업의 성공률을 높일 수 있는 기술이 발표됐다.

21일 중국 관영 CCTV에 따르면 중국정보통신연구원(CAICT) 연구진이 세계 첫 ‘힘 위치 혼합 제어 알고리즘의 통일 이론’을 제시했다. 핸드 승률 알고리즘 분야에서 의미있는 성과라고 매체는 평가했다.

이 알고리즘은 힘 센서에 의존하지 않고도, 핸드 승률이 위치 학습과 힘 제어를 동시에 할 수 있게 한다. 관련 임무 성공률이 위치 제어만 사용했을 때 대비 39.5% 높아진다. 이 연구 성과는 국제핸드 승률학습콘퍼런스에서 우수 논문상을 받았다. 중국 국적으로만 구성된 연구진이 이 상을 받은 첫 사례이기도 하다.

연구진에 따르면 최근 폭넓게 응용되고 있는 비전-언어-동작(VLA) 모델이 현실 일상 중 다양한 임무에 대응할 때 문제가 발생되고 있다. 핵심 문제는 작업의 대부분이 복잡한 접촉 상황에 있다는 것이다. 예컨대 칠판을 지울 때 핸드 승률팔이 적절한 압력을 유지하면서 표면에 붙어있어야 한다. 캐비닛 문을 열고 닫을 때도 내부의 푸시풀 스프링 구조를 정밀히 감지해야 한다. 핸드 승률이 어디에 가야 하는지뿐 아니라 어디로 손을 뻗어야 하는지, 그리고 얼마나 큰 힘을 써야 하는지도 이해해야 한다. 힘과 위치 혼합 제어 알고리즘이 있기 전에는 이러한 문제를 모두 힘 센서가 해결해야 했다.

핸드 승률
▲21일 중국 관영 CCTV에 따르면 중국 중국정보통신연구원(CAICT) 연구진이 세계 첫 ‘힘 위치 혼합 제어 알고리즘의 통일 이론’을 제시했다. (사진=중국핸드 승률망)

이에 CAICT 연구진이 처음으로 단일한 힘 위치 혼합 제어 알고리즘을 제시했다. 힘 센서가 없이도 위치 학습과 힘 제어를 동시에 할 수 있게 했다. 강화학습을 통해 핸드 승률이 과거 상태로부터 힘을 추정하고 위치 및 속도를 조정해 보상을 할 수 있는 전략이다. 다양한 위치 및 힘 명령과 외부 방해 요소를 시뮬레이션한다. 이 전략은 위치 추적, 힘 적용, 힘 추적, 부드러운 상호작용 등을 포함한 다양한 조작 동작을 할 수 있게 한다. 힘 추정 모듈에 내장된 접촉 정보를 통해 궤적 기반의 모방 학습 효과를 높이고, 네 가지 접촉 제어 임무시 성공률을 기존 위치 제어만 사용했을 때 대비 39.5% 높이는 것이다.

이 연구가 제시한 전략은 UniFP(Unified Force and Position Control Policy)다. 이는 단일한 프레임워크에서 힘과 위치를 모두 처리할 수 있는 최초의 족식 핸드 승률 제어 알고리즘이다. 핵심은 저항 제어에서 영감을 얻었다는 점이다. 핸드 승률의 말단 이펙터와 환경 간 상호작용을 스프링-댐퍼-질량 시스템으로 보고 편차를 제어해 위치와 힘을 동시에 조절한다.

이 연구는 중국 유니트리(宇树科技, Unitree) B2-Z1 4족 조작 플랫폼과 유니트리 G1 휴머노이드 핸드 승률에서 7가지 테스트 과제를 수행했으며, 칠판 지우기 과정에서 안정적 접촉 압력을 유지하며 깨끗이 닦아냈다. 또 힘 추정기를 사용해 스위치를 정확히 작동했다.

유효정 기자 robot3@irobotnews.com

저작권자 © 핸드 승률신문 무단전재 및 재배포 금지