- (초청 강연2)뉴로메카 박종훈 대표
#1 납땜 공정 실증
구멍 크기가 1mm보다 작고, 삽입해야 할 와이어는 비정형이다. 이 비정형 와이어 3개를 구멍에 정확하게 집어넣고 납땜까지 수행한다. 원격 조작 데이터를 3D 스페이스 마우스로 협동 콤프카지노 2대를 활용해 학습시킨 결과, 성공률 99% 이상을 달성했다. 와이어가 조금씩 뒤틀려 있더라도 구멍을 정확하게 찾아 삽입한다. 이 작업은 로보틱스 기술만으로는 도저히 할 수 없는 수준이다.
#2 컵 물 감지 및 수평 유지
컵을 집어서 올리라는 명령을 주면, 콤프카지노은 앞에 있는 물체 가운데 집을 수 있는 것과 올릴 수 있는 것을 스스로 판단해 작업을 수행한다. 처음에는 컵 안에 물이 없어 편하게 집는다. 여기에 물을 부으면 콤프카지노은 컵 안에 물이 찼다는 것을 인식하고, 이동 시 수평을 유지하면서 천천히 가야 한다는 것을 스스로 추론해 그에 맞게 작업을 수행한다. 이른바 어포던스(Affordance) 기반의 상황 인식이다.
박종훈 뉴로메카 대표가 1일 영상과 함께 공개해 큰 호응을 얻은 내용이다. 박 대표는 이날 콤프카지노신문이 수원컨벤션센터에서 개최한 ‘2026 반도체·전자제조공정콤프카지노 컨퍼런스’에서 ‘피지컬 AI, 제조업에 성공적으로 적용하기’를 주제로 강연에 나섰다.
뉴로메카는 상반기 중 양팔 휴머노이드 타입 최초로 안전 인증을 취득할 예정이다. 박 대표는 “인증이 완료되면 고정형과 이동형 두 가지 타입 모두 실제 중소 제조 현장에 투입이 가능해진다”며 “협동 콤프카지노 안전 인증이 없는 휴머노이드는 실제 생산 라인에 투입할 수 없다”고 소개했다.
강화학습과 모방학습 관련 작업을 누구나 수행할 수 있도록 만든 소프트웨어 플랫폼 ‘MIMICX’도 소개됐다. 박 대표는 “많은 디바이스, 콤프카지노, 센서들을 자동으로 연동할 수 있도록 설계돼 있어 이 플랫폼 하나면 데이터 수집부터 학습·추론까지 처리할 수 있다”며 “여기에 뉴로메카의 비전 파운데이션 모델(VisionX)을 더하면 세그멘테이션(영역 분할), 객체 추적, 포즈 추정(자세 인식), 이상 감지 등을 별도 개발 없이 바로 활용할 수 있다”고 강조했다.
◇ 협동콤프카지노에서 휴머노이드까지, 자동화의 진화
산업용 콤프카지노 자동화의 흐름은 ‘독립 환경의 산업용 콤프카지노 → 협동 환경의 협동콤프카지노 → 작업자 환경의 휴머노이드’로 정리된다. 1세대 협동콤프카지노은 충돌 안전 기능, 직접교시 방식을 도입해 콤프카지노 자동화의 대중화를 이끌었으며, 시스템 통합(SI)의 중요성을 부각시켰다. 자율이동형 양팔 휴머노이드는 머리(계획)·팔(작업)·손(조작)·다리(이동)의 통합 플랫폼으로 AI, 콤프카지노, SI 영역이 하나로 융합되는 구조다. 자동화 요구의 진화를 이끄는 핵심은 SI의 최소화이며, 생산성·안전·자율성을 동시에 확보해야 시장이 확장된다.
◇ 피지컬 AI 열풍, 산업 현장 적용은 ‘아직’
최근 콤프카지노 업계의 피지컬 AI 열풍에 대해서는 냉정한 시각이 필요하다. Figure AI, 1X, PI 등 글로벌 기업들의 화려한 시연에도 불구하고, 산업 현장에서 요구하는 안전 인증, 100㎛ 이하의 반복 정밀도, 99% 이상의 성공률을 충족하는 수준엔 미치지 못한다. 대부분의 공장은 여전히 안전 인증, 높은 반복 정밀도, 높은 성공률을 요구한다. 현재의 VLA 기술만으로는 이 세 가지를 동시에 충족하기 어렵다.
뉴로메카의 목표는 강화학습(RL)과 모델 기반 제어로 더 안전하고 스마트한 모션을 구현한다. 2세대 협동콤프카지노(15%), 시연 학습 기반의 새로운 정밀 스킬 개발(35%), 그리고 중요한 HW·SW 플랫폼과 SI 엔지니어링(50%)의 균형 잡힌 결합이다.
◇ AI와 로보틱스 융합한 2세대 협동콤프카지노
2세대 협동콤프카지노의 핵심은 기술 교시 기반 모방학습이다. 인간 시연 데이터를 수집해 AI가 실시간 경로를 생성하고, 이를 콤프카지노이 실행한다. 뉴로메카의 저수준 제어 알고리즘으로는 경로 보정, 순응 제어, 모션 생성, 기술 교시 알고리즘이 적용된다. 추가적인 힘·토크 센서 없이도 높은 위치 제어 정밀도와 외부 힘에 대한 순응이 동시에 가능하다.
충돌 예측 및 회피 분야에서는 시뮬레이션에서 실제 환경으로 전이하는 ‘심2리얼(Sim2Real)’ 강화학습 기반으로 3D 라이다 포인트클라우드를 활용한 실시간 충돌회피 경로 생성 기술이 적용된다. 제어 구조는 ‘희소 웨이포인트 → 충돌회피·모션 생성(~200Hz) → 모델 기반 제약 만족(~4,000Hz) → 관절 명령’의 계층적 구조로 이루어진다.
◇ 산업안전 보장하는 풀스택 4레벨 RFM 구조
산업 현장에 적합한 콤프카지노 지능 구조로 풀스택 4레벨 콤프카지노 파운데이션 모델(RFM)이 제안됐다. L1 척수반사 계층(4,000Hz)에서 안전 지능과 컴플라이언스 제어를, L2 정밀 작업 계층(~500Hz)에서 궤적 보정과 정밀 제어를, L3 일반화 계층(~200Hz)에서 자동 동작 시퀀스를, L4 전략 계층(2~5Hz)에서 목표 설정과 전략 수립을 각각 담당한다. 언어 명령에서 시작해 4개 계층을 거쳐 안전이 보장된 콤프카지노 행동으로 이어지는 이 구조가 산업용 피지컬 AI의 현실적 해답으로 제시됐다.
◇ 연구용부터 메디컬까지, 휴머노이드 라인업 공개
뉴로메카는 용도별 4종의 산업용 휴머노이드 플랫폼을 공개했다. 연구용 플랫폼인 ZEN, 서비스 자동화 실증을 목표로 한 NAMY, 제조·물류 자동화용 RAXIS, 수술 보조 작업을 위한 메디컬 휴머노이드 EIR 등이다. EIR은 미국 라스베이거스에서 열린 가전·IT 전시회인 CES 2025 출품해 호평받았다. 부산대병원에서 실증이 예정돼 있다. OEM과 파운드리 기반의 단계적 고도화를 통해 핵심 부품 설계 역량을 강화하고, RFM과 피지컬 AI 생태계로 확장하는 것이 목표다.
◇ 자체 비전 모델 VisionX와 스킬 파운데이션 구축
뉴로메카는 자체 비전 파운데이션 모델 ‘VisionX’를 개발했다. 오픈AI CLIP, 메타 DINO, SAM, 엔비디아 파운데이션포즈(FoundationPose) 등 주요 오픈소스 비전 파운데이션 모델(VFM)을 통합했다. 이를 통해 텍스트·이미지 프롬프트 기반 세그멘테이션, 객체 추적, 캘리브레이션, 포즈 추정 기능을 구현했다. 여기에 이상 감지를 결합한 클로즈드 루프 스킬 실행 구조로, 실패를 즉각 감지하고 복구하는 기능을 갖췄다. 실제 로보틱스에서는 성공률을 극대화하는 것보다 실패를 감지하고 복구하는 것이 더 중요하다는 점이 강조됐다. 이러한 스킬들은 ‘피지컬 스킬 파운데이션(PSF)’으로 통합된다. 제로샷 피킹, 삽입, 문 조작 등 재사용 가능하고 검증된 기술들이 축적되는 구조다.
◇ 납땜·파우더·용접...실증으로 성능 입증
실제 제조 현장에 적용한 피지컬 스킬 실증 사례도 소개됐다. 모터 납땜 공정에서는 1mm 수준의 홀에 케이블을 삽입하는 고정밀 작업에 트랜스포머 기반 모방학습(ACT)을 적용했다. 20분간의 원격 조작 데이터만으로 학습한 결과, 케이블 삽입 성공률 99.3%, 인두기 접근 성공률 99.0%를 달성했다. 이는 단순 모방학습(52.0%·80.0%, 이하 케이블 삽입 성공률·인두기 접근 성공률), VLA(28.6%, 82.3%), 기존 방식(64.0%, 65.6%) 대비 월등히 높은 수치다.
파우더 정밀 분주 공정에서는 분석적 모델 도출이 어려운 복잡한 동역학 특성에 대응해 자동화 대규모 데이터 수집과 모델 기반 강화학습을 결합했다. 참깨·소금·밀가루 모두 0.6~0.8g 오차 수준을 실현했다. 용접 공정에서는 부재 취부, 토치 핸들링, 위빙 수행, 전압·전류 조정, 슬래그 제거, 청소 등 6개 세부 스킬로 구성된 산업용 휴머노이드 용접 시스템을 선보였다.
◇현장 작업자도 쉽게 쓰는 모방학습 플랫폼 MIMICX
뉴로메카는 피지컬 AI 데이터 수집과 학습을 통합한 플랫폼 ‘MIMICX’를 공개했다. 협동콤프카지노 Indy, 양팔콤프카지노 Nuri, 이동콤프카지노 Moby 등 다양한 콤프카지노 플랫폼과 VR 컨트롤러, 깊이 인식 카레라인 ‘RealSense 카메라’, 다지형 콤프카지노 손(Inspire Hand) 등을 원클릭으로 연결해 데이터 수집부터 학습·추론까지 단일 환경에서 완결하는 구조다. SI 엔지니어나 현장 작업자도 쉽게 쓸 수 있는 올인원 데이터·학습 파이프라인을 지향한다.
◇롱테일 대응이 피지컬 AI 성공 관건
엔드-투-엔드 VLA의 구조적 병목으로는 데이터 병목, 일반화 갭, 안전·신뢰성, 블랙박스 행동이라는 네 가지가 지목됐다. 테슬라 완전자율주행(FSD) 기술이 700억 마일에서 1,000억 마일로 학습 데이터 목표를 상향한 사례를 들며 자율주행 수준의 방대한 데이터를 로보틱스에 그대로 적용할 수 있느냐는 근본적 질문도 제기됐다. 헤드 데이터만이 아니라 무수한 엣지 케이스, 즉 롱테일에 대응할 수 있는 구조를 갖추는 것이 피지컬 AI가 제조업에 성공적으로 안착하기 위한 진짜 과제로 강조됐다.
김준배 기자 kjb3156@naver.com
