훈련 데이터 수집하는 저개발국 청년들의 노동 실태 분석
MIT 테크놀로지 리뷰 보도… 개인정보 침해 우려도 제기
나이지리아·인도 등 개발도상국 청년들이 머리에 스마트폰을 쓰고 집안일을 촬영해 판매하는 신종 데이터 수집 산업이 전 세계로 확산하고 있다고 MIT테크놀로지 리뷰가 1일(현지시간) 보도했다.
보도에 따르면휴머노이드 바카라 게임이 공장에서 일하고집에서 가사 도우미 역할을 하려면, 바카라 게임 훈련을 위한방대한 실세계 데이터가 필요하다. 이에 따라 휴머노이드 바카라 게임 기업들이 바카라 게임 훈련에 필요한 실생활 동작 데이터를 확보하기 위해 개발도상국 청년들을 적극 활용하면서 ‘긱 이코노미(gig economy)’ 시장이 뜨고 있다는 분석이다.
긱 이코노미는 정규직이 아닌 단기·건별 계약 형태로 일하는 노동 시장을 의미한다. 이런일은 현지 기준으로 급여 수준이 높고 지역 경제 활성화에도 기여하고 있다. 하지만 개인정보 보호와 충분한 정보에 바탕을 둔 '동의' 절차가 요구된다.데이터 수집 활동작업 자체가 고되고 생소하다는 점도 과제로 꼽힌다.
MIT 테크놀로지 리뷰는 ‘가정에서 휴머노이드바카라 게임을 훈련시키는 긱 노동자(The gig workers who are training humanoid robots at home)’라는 제하의 기사에서 휴머노이드 바카라 게임 훈련 데이터를 수집하는 저개발국 청년들의 노동 실태와 문제점을분석했다.
미국 팔로알토 소재 데이터 수집 기업 마이크로1(Micro1)은 인도, 나이지리아, 아르헨티나 등 50개국 이상에서 수천 명의 계약직 근로자를 고용하고 있다. 이들은 머리에 스마트폰을 쓰고 세탁물 정리, 설거지, 요리 등의 집안일을 직접 촬영해 제출한다.
알리 안사리(Ali Ansari) 마이크로1 CEO는 바카라 게임 기업들이 현재 자사를 비롯한 데이터 기업들로부터실세계 데이터를 구매하는 데 연간 1억달러 이상을 지출하고 있다고 밝혔다. 그는 "수요가 매우 많고 증가 속도도 빠르다"고 말했다.
이 같은 수요는 휴머노이드 바카라 게임의 특성에서 비롯된다. 가상 시뮬레이션 방식은 바카라 게임이 곡예 동작을 학습하는 데는 활용할 수 있지만, 물체를 잡고 이동하는 방법을가르치기는 어렵다. 시뮬레이션이 물리 법칙을 완벽하게 모델링하는 데 한계가 있기 때문이다. 공장과 가정에서 실제로 작동하는 바카라 게임을 만들려면 시간과 비용이 많이 들더라도 실세계 데이터가 필요하다는 것.
휴머노이드 바카라 게임 분야 투자도 빠르게 증가하고 있다. 2025년 한 해 동안 휴머노이드 바카라 게임 분야에 쏟아진 투자금만60억달러를 넘었다.
스케일 AI(Scale AI), 엔코드(Encord) 등 데이터 기업들은자체적으로 데이터 수집 인력을 모집하고 있으며, 도어대시(DoorDash)는 배달 기사들에게 자신들이 하고 있는 일을 영상으로촬영하는비용을 지불하고 있다. 중국은수십 개의 국영 바카라 게임 훈련 센터에서 노동자들이 가상현실(VR) 헤드셋과 외골격 장비를 착용하고 바카라 게임에게 직접 동작을 가르치고 있다.
마이크로1 근로자들은 '자라(Zara)'라는 AI 에이전트가 진행하는 인터뷰와 샘플 영상 심사를 통해 채용된다. 이후 손이 화면에 잘 보이도록 하고 자연스러운 속도로 움직이는 등 세부 지침에 따라 집안일 영상을 촬영해 매주 제출한다. 제출된 영상은 AI와 수백 명의 인력이 검토·승인하고,'레이블링(주석 작업)' 작업이 이뤄진다.
바카라 게임 훈련에 대한 이 같은 접근은 현재초기 단계다. 따라서 어떤 것이 양질의 훈련 데이터인지는 아직은 명확하지 않다. 알리 안사리 마이크로1 CEO는 "바카라 게임이 기본적인 이동과 물체 조작을 이해하고 일반화하려면 매우 다양한 변형 데이터가제공되어야 한다"고 말했다.
나이지리아에서 의대에다니는 '제우스(Zeus)'는 시간당 15달러의 임금을 받지만, 좁은 원룸에서 매일 몇 시간씩 옷을 다리는 단순 반복 작업을 하는게지루하다고 털어놨다.
제우스는 지난해 11월 링크드인과 유튜브 곳곳에서 데이터 수집에 관한일자리 정보를 알게 됐다. "미래에 바카라 게임을 훈련시키는 데 쓰일 데이터를 제공하며 한 획을 그을 수 있는 정말 좋은 기회가 될 것 같았다"고 당시를 회고했다. 하지만 그는"솔직히 이 일을 그다지 좋아하지 않는다. 나는 기술적인 일을 원한다"고 말했다.
인도 델리에서 과외 교사로 일하는 '아르준(Arjun)'은 15분짜리 영상 하나를 만들기 위해 새로운 집안일을 구상하는 데만 한 시간이 걸린다고 말했다.두 딸의 아버지인 아르준은 촬영 화면에 불쑥들어오는 두 살배기 딸을 화면밖으로 내보내느라 진땀을 빼고 있다며 "딸이 아직 너무 어려서 가끔은 업무를 수행하기가 정말 힘들다"고 토로했다.
제우스를 비롯해 MIT 테크놀로지 리뷰와 인터뷰한 근로자들은 자신의업무에 관해 발언할 권한이 없다는 이유로 가명으로만 언급해 달라고 요청했다.
이같은 데이터 수집방식은 개인정보 침해 우려도 제기된다. 마이크로1은 근로자들에게 얼굴과 이름, 전화번호 등 개인정보가 화면에 노출되지 않도록 요구하지만, 영상에는 집 내부 구조와 소지품, 일상 루틴 등 사생활이 고스란히 담길 수밖에 없다. 근로자들은 자신의 데이터가 어떻게 저장되고 제3자와 공유되는지를 정확히 알지 못한다고 밝혔다.영상 검토 과정에서 얼굴이나 이름같은 명백한 식별 정보 외의 민감한 정보들은 제대로 걸러지지 않을 가능성이 있다는 것이다.
야스민 코투리(Yasmine Kotturi)메릴랜드대볼티모어 카운티(UMBC) 교수는 “노동자들이 이러한 작업에 참여할 경우, 기업이 직접 그들에게 작업의 의도를 명확히 알리는 것이 중요하다. 이 기술이 장차 어느 단계까지 발전할 수 있는지, 그리고 장기적으로 노동자에게 어떤 영향을 미치게 될지에 대해 반드시 고지해야 한다"고 강조했다.
ASTM 인터내셔널의 바카라 게임공학자인 에런 프래더(Aaron Prather)는 “우리가 집에서 생활하는 방식이 안전 관점에서 항상 올바른 것은 아니다”라며, “만약 이 노동자들이 사고를 유발할 수 있는 나쁜 습관을 바카라 게임에게 가르치고 있다면, 그것은 결코 양질의데이터라고 할 수 없다”고 비판했다.
기술적 한계에 대한 전문가의 신중한 시각도 있다. 켄 골드버그 UC버클리 교수는 "대규모언어모델(LLM)은 인간이 10만 년을 읽어야 할 분량의 텍스트와 이미지로 훈련됐다. 휴머노이드 바카라 게임은 바카라 게임 관절 제어가 텍스트 생성보다 훨씬 복잡하기 때문에 그보다 더 많은 데이터가 필요할 수 있다"며 "사람들이 생각하는 것보다 훨씬 오래 걸릴 것"이라고 말했다.
백승일 기자 robot3@irobotnews.com
