Human Archive: datos de trabajadores indios para entrenar robots

Human Archive: datos de trabajadores indios para entrenar robots

Una startup con sede en Silicon Valley ha recaudado 8,2 millones de dólares para capturar datos de trabajadores de la economía gig en India y venderlos a laboratorios de inteligencia artificial que entrenan robots físicos. El modelo levanta preguntas sobre compensación, privacidad y quién se beneficia realmente del trabajo humano digitalizado.

Gorras con cámara en hogares de Mumbai y Bangalore

Human Archive equipa a trabajadores del sector servicios con gorras especiales que incorporan cámaras. Estas capturan vídeo en primera persona, lo que en el sector se denomina datos egocéntricos, mientras el trabajador limpia, cocina o realiza tareas domésticas. El material se vende a laboratorios de IA para entrenar robots que ejecuten tareas físicas en el mundo real.

La startup opera con más de 1.000 auriculares activos desplegados en múltiples ubicaciones. Además de las gorras, utiliza guantes táctiles, trajes de captura de movimiento corporal completo y cámaras de muñeca para registrar fuerza, movimiento y profundidad de forma sincronizada.

Los datos resultantes combinan imagen RGB-D, es decir, color e información de profundidad en tiempo real, con retroalimentación de fuerza y captura de movimiento. Ningún otro operador del mercado ha logrado sincronizar todas estas fuentes a escala, según sus inversores.

8,2 millones de dólares y respaldo de Y Combinator, Wing VC y ex empleados de OpenAI

La ronda de financiación fue liderada por Wing Venture Capital y NVP Capital, con participación de Y Combinator. También entraron inversores ángeles procedentes de OpenAI, Nvidia, Google, Meta, Mercor y AfterQuery, además de investigadores de los laboratorios BAIR y SAIL de la Universidad de California en Berkeley y Stanford.

La empresa fue fundada por cuatro estudiantes universitarios: Samay Maini, Rushil Agarwal, Shloke Patel y Raj Patel, los dos últimos primos. Raj Patel ejerce como CEO. Los cuatro tienen trayectorias académicas en robótica, hardware y datos táctiles.

Zach DeWitt, socio de Wing VC, afirmó a TechCrunch que todos los grandes laboratorios y universidades del mundo están interesados en experimentar con los datos de Human Archive debido a la novedad de los sensores y la escala del conjunto de datos que la empresa publicará próximamente.

Un dólar por hora: la brecha entre lo que paga y lo que cobra el mercado

Human Archive abona a los trabajadores una tarifa base de un dólar por hora de participación en la recogida de datos egocéntricos. Según un informe del Economic Times citado en el artículo original, otras empresas del sector pagan entre 250 y 400 rupias por hora, equivalente a entre 2,63 y 4,20 dólares.

Raj Patel reconoció que sus competidores pagan más, pero argumentó que la presencia directa de Human Archive en India le permite mantener la compensación más baja. La startup defiende este modelo como una vía de acceso flexible a la economía de la IA para trabajadores con pocas alternativas formales.

DeWitt describió la red de Human Archive como un puente que financia medios de vida inmediatos mientras construye infraestructura para un futuro más seguro y productivo. Los críticos señalan que esa retórica no aborda la asimetría entre lo que cobra el trabajador y el valor que generan sus datos para compradores institucionales.

Rechazos públicos y una disputa abierta con las plataformas líderes

Human Archive intentó asociarse con las principales plataformas de servicios domésticos de India, entre ellas Urban Company, Pronto y Snabbit. Fue rechazada por varias de ellas. El CEO de Urban Company, Abhiraj Singh Bhal, declaró públicamente en X que su empresa no participaría en ese tipo de acuerdos.

Raj Patel respondió que Urban Company se vería obligada a reconsiderar su postura o perdería clientes frente a la competencia. El cofundador Rushil Agarwal fue más directo: publicó que la fundadora de Pronto, Anjali Sardana, se había reído de él y le había llamado estúpido cuando le planteó la idea de una colaboración de datos.

Pronto reconoció que hubo conversaciones pero confirmó que decidió no continuar. Snabbit, por su parte, mantuvo negociaciones iniciales con Human Archive antes de que el proyecto se cancelara. El episodio expuso las tensiones entre startups que ven el dato del trabajador como activo comercial y plataformas que priorizan su relación con los empleados.

Consentimiento de clientes y el escrutinio del Ministerio de Tecnología indio

El modelo de captación de datos funciona con un mecanismo de consentimiento en el punto de servicio. Cuando un trabajador llega al domicilio, la aplicación ofrece al cliente dos opciones: pagar el precio reducido a cambio de autorizar la grabación, o abonar la tarifa completa sin registro. Patel señaló que los clientes optan mayoritariamente por la versión grabada porque el vídeo sirve para resolver disputas sobre calidad del servicio.

Respecto a los trabajadores, Human Archive afirma que sus contratos cumplen la Ley de Protección de Datos Personales Digitales de India, conocida como DPDP Act, y que muestra avisos de privacidad con información sobre el propósito de la recogida y el tratamiento de los datos. La empresa asegura que todos los datos se anonimizan y que los rostros aparecen difuminados en las grabaciones.

Sin embargo, el artículo original reconoce que no está claro qué información reciben exactamente los trabajadores sobre el uso posterior de sus imágenes. La semana pasada, el medio indio Moneycontrol informó de que el Ministerio de Electrónica y Tecnología de la Información de India está investigando los mecanismos de consentimiento y las prácticas de recogida de datos de las startups que operan con trabajadores de servicios domésticos.

Por qué los laboratorios de IA pagan por datos de personas fregando suelos

El mercado de la inteligencia artificial física, denominado physical AI en el sector, atraviesa un cuello de botella concreto: la escasez de datos de alta calidad que muestren a humanos realizando tareas cotidianas en entornos reales. Los modelos de lenguaje se entrenaron con texto disponible en internet. Los robots no tienen un equivalente de esa escala para el movimiento físico.

Empresas como Figure, Physical Intelligence o 1X Technologies, todas ellas con financiación de cientos de millones de dólares, compiten por desarrollar robots humanoides capaces de trabajar en almacenes, fábricas y hogares. Para eso necesitan millones de horas de vídeo mostrando cómo un humano coge un vaso, dobla ropa o friega una sartén.

Human Archive apuesta por que la economía gig india, con sus millones de trabajadores de servicios a domicilio, representa la fuente más escalable y económica de ese tipo de datos. La combinación de sensores múltiples sincronizados, que ningún competidor ha replicado a escala según Wing VC, es su principal argumento diferenciador frente a otros recopiladores de datos egocéntricos.

Hardware propio: de iPhones improvisados a siete dispositivos simultáneos

El proceso de captación de datos de Human Archive ha evolucionado rápidamente desde sus inicios. La startup comenzó usando iPhones y montajes improvisados. Después desarrolló gorras y soportes propios. Actualmente cuenta con más de siete productos de hardware distintos que utiliza de forma intercambiable según la modalidad de datos que necesita capturar.

Raj Patel explicó en una entrevista que el reto técnico más complejo no fue fabricar los dispositivos sino sincronizar los datos procedentes de todas las fuentes distintas. La empresa ya tiene más de 50 dispositivos diferentes desplegados para recoger distintos tipos de datos de forma simultánea.

La startup también trabaja en el ajuste fino de modelos de IA con sus propios datos y los prueba en robots reales para evaluar la efectividad en tareas concretas. Esto le permite demostrar la calidad del conjunto de datos a compradores potenciales antes de que estos lo adquieran.

Expansión a Sudeste Asiático y primeros pasos en Estados Unidos

Human Archive opera principalmente en India pero ha comenzado a expandirse a países del Sudeste Asiático. En paralelo, está construyendo una plataforma abierta para que cualquier persona pueda participar en la recogida de datos y recibir una compensación económica.

En Estados Unidos, la empresa explora un modelo diferente: ofrecer servicios de limpieza o cocina a clientes a cambio de que los trabajadores participantes recojan datos durante la prestación del servicio. Estos programas se encuentran en fase piloto inicial y aún no han alcanzado escala operativa.

La combinación de expansión geográfica, plataforma abierta y pilotos en mercados de alto coste como el estadounidense define la hoja de ruta de corto plazo de la empresa. La capacidad de mantener costes bajos fuera de India mientras escala el volumen de datos será determinante para su viabilidad comercial.

Lo que viene

Human Archive prevé publicar próximamente un conjunto de datos a gran escala procedente de sus sensores sincronizados, según confirmó Zach DeWitt de Wing VC. Varios laboratorios universitarios y empresas de IA de primer nivel ya han expresado interés en ejecutar experimentos con ese material antes de su lanzamiento oficial.

El Ministerio de Electrónica indio tiene abierta una investigación sobre las prácticas de consentimiento del sector. El resultado de ese proceso regulatorio determinará si el modelo de Human Archive puede operar sin modificaciones o si deberá revisar sus contratos con trabajadores y plataformas asociadas. La empresa tiene actualmente más de 1.000 auriculares activos y 50 dispositivos de captura desplegados: esa infraestructura ya existente le da una ventaja operativa concreta frente a nuevos entrantes mientras el marco legal se define.

Imagen ilustrativa generada con inteligencia artificial.

Edición con asistencia de herramientas de IA bajo supervisión editorial. Cómo trabajamos.

IBERIA

IBERIA

IBERIA es la redacción de LaPrensaIA. Cubrimos la actualidad de la inteligencia artificial con criterio propio: tecnología, empresas y sociedad. Cada artículo es producido por agentes de IA y revisado por su editor humano.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *