🧠 Los agentes de IA fracasan en el trabajo autónomo: solo completan el 3% de las tareas reales

🧠 Los agentes de IA fracasan en el trabajo autónomo: solo completan el 3% de las tareas reales

Durante meses se ha hablado del fin del trabajo humano. Los titulares prometían que los agentes de inteligencia artificial serían capaces de programar, diseñar, escribir y hasta gestionar empresas por sí solos. Pero un nuevo estudio acaba de poner un freno a ese entusiasmo: incluso los mejores agentes de IA actuales son prácticamente inútiles en el trabajo freelance real.


💼 El experimento que mide la “inteligencia laboral” de la IA

El Índice de Trabajo Remoto, desarrollado por investigadores de Scale AI y el Centro para la Seguridad de la IA (CAIS), evaluó a los modelos más avanzados en una serie de simulaciones de trabajo autónomo.

El resultado: los agentes solo completaron menos del 3% de las tareas, ganando 1.810 dólares de un total posible de 143.991.

Las pruebas incluyeron encargos reales de plataformas como Upwork, con trabajos de diseño gráfico, edición de video, desarrollo de videojuegos, tareas administrativas y análisis de datos. Cada agente recibió la descripción del trabajo, los archivos necesarios y un ejemplo humano terminado.

Los resultados fueron los siguientes:

Ranking Modelo Empresa Desempeño aproximado
1️⃣ Manus Startup china Manus Mejor rendimiento general
2️⃣ Grok xAI (Elon Musk) Rendimiento moderado
3️⃣ Claude Anthropic Correcto en tareas lógicas
4️⃣ ChatGPT OpenAI Aceptable en redacción y análisis
5️⃣ Gemini Google Inconsistente

📊 La realidad frente a las expectativas

“Espero que esto dé una impresión mucho más precisa de lo que está ocurriendo con las capacidades de la IA”,
Dan Hendrycks, director del CAIS.

Hendrycks señala que, aunque algunos agentes han mejorado notablemente en tareas como codificación o matemáticas, siguen siendo incapaces de ejecutar flujos de trabajo complejos que requieren varios pasos, memoria a largo plazo o aprendizaje en tiempo real.

“No pueden adquirir habilidades en el trabajo como los humanos”, concluye.

El contraste es evidente frente a las promesas recientes. En marzo, Dario Amodei, CEO de Anthropic, llegó a afirmar que el 90% del trabajo de codificación se automatizaría en cuestión de meses.


💻 IA sí, pero como herramienta

El estudio de Scale AI y CAIS no busca desacreditar la tecnología, sino poner los pies en la tierra.
Los investigadores reconocen que muchos trabajadores autónomos ya usan la IA como asistente complementario —para generar ideas, automatizar tareas repetitivas o mejorar la productividad—, pero no como sustituto completo.

“La mayoría de debates sobre la IA y el empleo han sido teóricos. Este es el primer intento serio de medir lo que realmente puede hacer”,
Bing Liu, director de investigación en Scale AI.

En ese sentido, el nuevo índice ofrece una visión más realista que el GDPval, el indicador económico presentado por OpenAI, que sugería que modelos como GPT-5 ya se acercan a las capacidades humanas en más de 200 tareas de oficina.


⚠️ Despidos masivos y percepciones erróneas

Mientras tanto, la narrativa pública va en dirección opuesta.
Esta misma semana, Amazon anunció la eliminación de 14.000 puestos de trabajo, atribuyendo parte de la medida al auge de la inteligencia artificial generativa.

“Esta generación de IA es la tecnología más transformadora desde internet”,
escribió Beth Galetti, vicepresidenta sénior de Experiencia de las Personas y Tecnología de Amazon.

Sin embargo, si el Índice de Trabajo Remoto es una referencia válida, es poco probable que las máquinas ocupen pronto esos puestos vacantes. Los agentes actuales carecen de la autonomía, la adaptabilidad y el juicio humano necesarios para desempeñar trabajos reales.


🔭 Más cerca del asistente que del sustituto

El entusiasmo por la automatización masiva parece haber sobrestimado el estado real de la IA.
Sí, las máquinas ya escriben textos, analizan datos y generan imágenes impresionantes, pero no entienden contextos, no recuerdan errores pasados ni saben improvisar.

Por ahora, los agentes de IA son herramientas valiosas, no reemplazos laborales. Y mientras el hype continúa, el trabajo humano sigue siendo —al menos por un tiempo— la inteligencia más confiable que tenemos.

Previous Post
Next Post