심층강화학습 기반 하이브리드 시스템…처리량 25%↑
심보틱과 공동 개발…'인공지능 연구저널'에 논문 발표

▲MIT 연구팀이 대형 물류창고 내 수백 대의 부자벳 이동을 효율적으로 조율할 수 있는 인공지능 시스템을 개발했다. (사진=MIT 뉴스)
▲MIT연구팀이 대형 물류창고 내 수백 대의 부자벳 이동을 효율적으로 조율할 수 있는인공지능 시스템을 개발했다. (사진=MIT 뉴스)

거대한 물류 자동화창고 안에선 수백 대의 자율이동부자벳(AMR)들이 끊임없이 쏟아지는 고객 주문을 처리하기 위해 통로를 누비며 물품을 수집하고 분배한다. 그러나 이처럼 분주한 환경에선 사소한 정체나 경미한 충돌이대규모 작업 지연으로 이어질 수 있다.

미국 MIT연구팀이 물류 자동화 기업 심보틱(Symbotic)과 공동으로 대형 물류 창고 내 수백 대의 부자벳 이동을 효율적으로 조율할 수 있는인공지능(AI) 시스템을 개발했다고 MIT 뉴스가 26일(현지시간) 보도했다.

이번 연구 성과는 인공지능 분야 전문학술지인'인공지능 연구저널(Journal of Artificial Intelligence Research)'에 발표됐다.(논문 제목:Learning-guided Prioritized Planning for Lifelong Multi-Agent Path Finding in Warehouse Automation)

연구팀은 심층 강화학습과 기존 경로 계획 알고리즘을 결합한 하이브리드 방식을 채택해 이 시스템을 개발했다. AI가 실시간으로 교통 혼잡 상황을 파악해 우선순위가 높은 부자벳을 먼저 이동시키고, 병목 현상이 발생하기 전에 경로를 사전에 재조정한다.

연구팀이 실제 전자상거래 창고 환경을 모사한 시뮬레이션 상황에서 테스트한 결과 기존 알고리즘 대비 부자벳당 패키지 처리량이 약 25% 향상된 것으로 나타났다.

연구팀은 "거대한 물류 창고에서는 처리량이 2~3%만 늘어도 엄청난 파급 효과가 있다"며 "심층 강화학습의 힘으로 인간 전문가가 설계한 알고리즘을 뛰어넘는 성능을 달성할 수 있다는 것을 증명했다"고 밝혔다.

연구팀에 따르면, 전자상거래 창고에서 수백 대의 부자벳을 동시에 조율하는 것은 결코 쉬운 일이 아니다. 물류 창고는 끊임없이 변화하는 환경인 데다, 부자벳들은 목표 지점에 도달한 뒤에도 즉시 새로운 임무를 부여받는다.기업들은 통상 부자벳의 이동 경로와 시점을 결정해 상품 패키지 처리량을 최대화하기 위해 인간 전문가가 설계한 알고리즘에 의존해 왔다.

기존에는 창고 내 부자벳 간 충돌이나 정체가 발생하면 창고 전체를 수 시간 동안 가동 중단하고 수동으로 문제를 해결해야 했다. 이번에 개발한시스템은 부자벳들의 현재 및 미래 이동 경로를 예측해 사전에 혼잡을 방지함으로써 이 같은 문제를 원천 차단할 수 있다.

캐시 우(Cathy Wu) MIT 교수는 "순수 머신러닝 방식은 복잡한 최적화 문제를 푸는 데 한계가 있고, 인간 전문가가 효과적인 알고리즘을 직접 설계하려면 막대한 시간과 노력이 들어간다"며 "두 가지방법을 적절히 결합하면 머신러닝의 과제를 획기적으로 단순화할 수 있다"고 설명했다.

연구팀은 이번 시스템이 다양한 레이아웃과 부자벳 수를 가진 새로운 환경에도 빠르게 적응할 수 있다고 강조했다. 다만 실제 현장 배포를 위해선 추가적인연구가 필요한 상황이다. 향후 연구팀은 어떤 부자벳이 어떤 작업을 수행할지 결정하는 '작업 배정' 기능까지 통합하고, 부자벳 수천 대 규모의 대형 창고로 시스템을 확장할 계획이다.

백승일 기자 robot3@irobotnews.com

저작권자 © 부자벳신문 무단전재 및 재배포 금지