Human Archive는 인도의 배달·홈서비스 워커에게 카메라가 달린 캡을 씌워 일상 노동의 1인칭 영상을 수집한다. 어제 Wing Venture Capital, NVP, Y Combinator, 그리고 OpenAI·Nvidia·Google·Meta의 엔젤들로부터 820만 달러를 모았고, 현장에 1,000대 이상의 헤드셋이 깔려 있다고 한다. 버클리와 스탠퍼드 출신 네 명이 세운 회사다. 호텔, 식당, 가사 서비스 현장이 그들의 데이터 광산이다.
흥미로운 건 결과물이 단순한 비디오가 아니라는 점이다. RGB-D 영상에 촉각 글러브의 힘 데이터, 풀바디 모캡, 손목과 가슴 카메라까지 시간축으로 동기화해 한 덩어리로 묶는다. iPhone에서 시작해 자체 캡, 7종 이상의 하드웨어 라인업, 50종 이상의 디바이스가 동시에 돌아간다. Wing VC 파트너는 “이 조합을 스케일로 동기화해 모은 곳이 사실상 없다”고 말한다. 피지컬 AI 모델이 ‘보는 것’에서 ‘만지는 것’으로 넘어갈 때 필요한 정확히 그 데이터셋이다.
수집 방식은 영리하면서도 불편하다. 홈서비스 앱에서 소비자는 두 가지 선택지를 받는다. 할인가에 촬영을 허용하거나, 정가에 비촬영. 서비스 분쟁이 잦은 시장이라 의외로 촬영 쪽 동의가 잘 나온다고 한다. 워커에게 돌아가는 보상은 시급 1달러. 경쟁사가 2.63~4.20달러를 준다는 Economic Times 보도가 있지만, “현지 밀착 운영이라 단가가 낮다”는 게 CEO의 설명이다. 학습 데이터 한 시간이 AI 랩에서 어떤 가격에 팔리는지를 떠올리면, 이 격차가 이 사업의 본질에 가깝다.
그래서 잡음도 크다. Urban Company CEO는 협업을 공개적으로 거절했고, Pronto와의 협의가 깨지자 공동창업자가 “Pronto 창업자가 나를 비웃으며 stupid라 했다”고 폭로했다 — Pronto는 부인했다. 더 무거운 건 규제다. 인도 전자정보기술부가 가사 노동자 대상 영상 수집의 동의 절차를 들여다보기 시작했다. 회사는 DPDP Act 준수, 얼굴 블러, 익명화를 내세우지만, 카메라를 머리에 쓴 사람이 자기 영상이 어디로 가서 무엇을 학습시키는지 어디까지 이해하고 서명하는지는 또 다른 문제다. 다음 12개월의 진짜 경쟁은 모델이 아니라, 이 데이터셋 위에 어떤 사회계약을 얹느냐에서 갈릴 가능성이 크다.