Anthropic presenta una forma más fina de medir cómo la IA se usa en el mundo real: el Economic Index con cinco "economic primitives" que actúan como bloques básicos para seguir el impacto económico de Claude. ¿La IA hace a las personas más rápidas en el trabajo? ¿Qué tareas favorece más? ¿Podría cambiar la naturaleza de los oficios? Este informe técnico (muestra de noviembre 2025) intenta responder eso con datos y un enfoque reproducible.
Qué son las "economic primitives" y por qué importan
Anthropic define cinco primitives: task complexity, skill level, purpose (trabajo, educación, personal), AI autonomy y success. Cada conversación en la muestra fue evaluada por Claude mismo para extraer estas medidas.
- Task complexity: estimada por el tiempo humano necesario para completar la tarea sin IA y por si la conversación agrupa subtareas.
- Skill level: años de educación necesarios para entender la entrada y la respuesta.
- Purpose: distingue usos profesionales, educativos o personales.
- AI autonomy: cuánto se delega a Claude (desde colaboración hasta delegación completa).
- Success: evaluación de si Claude completó la tarea correctamente.
Estas primitives funcionan como indicadores líderes: permiten ver no solo cuántas veces se usa IA, sino qué tipo de tareas, con qué éxito y qué implicaciones laborales podrían surgir.
Metodología en breve (técnico pero claro)
Anthropic analiza 1 millón de conversaciones de Claude.ai (Free, Pro, Max) y 1 millón de transcripciones del tráfico de su API 1P. El análisis preserva la privacidad y usa Claude Sonnet 4.5 como el modelo predominante en la muestra de noviembre 2025.
Importante: no es un experimento controlado con un conjunto fijo de tareas. Los datos reflejan lo que los usuarios llevaron a Claude, lo que introduce sesgos de selección (usuarios eligen tareas que creen que funcionarán). También los usuarios pueden dividir tareas complejas en pasos, lo que crea bucles de retroalimentación que mejoran el rendimiento efectivo.
Resultados clave: tareas, éxito y velocidad
¿Qué tareas acelera más Claude? Sorprendentemente, las más complejas. Anthropic mide complejidad en años de escolaridad estimados: tareas que requieren nivel de bachillerato (12 años) muestran un speedup de ~9x en Claude.ai; tareas de nivel universitario (16 años) muestran un speedup de ~12x. En la API, la aceleración fue aún mayor.
¿Y la confiabilidad? No todas las tareas complejas se completan con la misma frecuencia: Claude tiene éxito en tareas de nivel universitario ~66% de las veces versus ~70% en tareas por debajo de secundaria. Ajustar los ahorros por la probabilidad de éxito reduce pero no elimina el efecto: los mayores beneficios de velocidad permanecen asociados a tareas con mayor capital humano.
Comparación con METR: mientras METR sugiere 50% de éxito en tareas de ~2 horas para Claude Sonnet 4.5, Anthropic observa 50% en ~3.5 horas en su API y ~19 horas en la muestra de Claude.ai. ¿Por qué tanta diferencia? Metodologías distintas: METR usa un conjunto fijo de tareas, Anthropic observa tareas reales donde los usuarios descomponen problemas y seleccionan tareas con mejor probabilidad de éxito.
Resultado práctico: los horizontes temporales efectivos de la IA (cuánto tiempo puede sostenerse en una tarea) dependen tanto de la prueba de benchmark como de cómo los usuarios interactúan en el mundo real.
Países y usos: educación, trabajo y ocio
El patrón global es consistente con una curva de adopción: países con mayor PIB per cápita usan Claude más para trabajo y ocio, mientras que países con menor ingreso lo usan más para educación. Esto coincide con hallazgos de Microsoft y guía iniciativas como la colaboración de Anthropic con Rwanda y ALX para llevar alfabetización y acceso prolongado a Claude Pro.
Ocupaciones: cobertura, contenido y riesgo de deskilling
Anthropic mide cobertura de tareas (qué fracción de tareas de un oficio se hace en Claude) y una versión ajustada por éxito y duración. Resultado: algunos oficios (ej. operadores de entrada de datos y radiólogos) están más afectados de lo que su cobertura bruta sugeriría; otros (profesores, desarrolladores de software) están menos afectados tras ajustar por éxito.
Además, las tareas que Claude cubre tienden a requerir más educación: promedio de 14.4 años frente a 13.2 años de la economía. Esto indica que, por ahora, Claude complementa o sustituye preferentemente componentes de mayor calificación dentro de ciertos trabajos.
- Ejemplos potenciales de impacto: técnicos en redacción técnica, agentes de viajes y profesores podrían ver cambios en la composición de sus tareas.
Anthropic calcula un efecto de deskilling como un primer orden si las tareas cubiertas se retiraran: en promedio desplazarían tareas de mayor escolaridad. No es una predicción definitiva del mercado laboral: las dinámicas laborales y la evolución de las tecnologías pueden alterar estos efectos.
Impacto agregado en productividad
En trabajos anteriores, Anthropic estimó que la adopción amplia de IA podría aumentar el crecimiento de la productividad laboral de EE. UU. en 1.8 puntos porcentuales anuales durante diez años. Reaplicando su modelo con las primitives y ajustando por éxito, la estimación cae:
- Para Claude.ai: ~1.2 puntos porcentuales por año (tras ajustar por tasa de éxito).
- Para la API (tareas más desafiantes): ~1.0 punto porcentual por año.
Incluso 1 punto porcentual adicional anual es relevante: devolvería la productividad a ritmos de finales de los 90 y comienzos de 2000. Y si los modelos se vuelven mucho más poderosos o las empresas adoptan prácticas más sofisticadas, los números podrían subir.
Tendencias y actualizaciones operativas
Anthropic confirma tres tendencias observadas en 2025:
- Concentración: pocas tareas concentran una porción significativa del uso (top 10 = 24% en noviembre 2025).
- Dominio de tareas computacionales y matemáticas: alrededor de 1/3 de conversaciones en Claude.ai y casi la mitad del tráfico de API.
- Patrón de interacción: la augmentación supera ligeramente a la automatización en Claude.ai (52% vs 45%), aunque la automatización ha ido subiendo lentamente a lo largo del año.
Además, la adopción dentro de EE. UU. se ha vuelto más distribuida entre estados; si continúa así, la proyección del modelo sugiere una igualación geográfica en 2 a 5 años.
Qué significa esto para investigadores, empresas y políticas
- Para investigadores: estas primitives son herramientas para preguntas más complejas sobre sustitución/complemento, dinamismo de tareas y efectos distributivos.
- Para empresas: medir no solo cuánto usan IA, sino qué hacen, con qué autonomía y con qué éxito, es clave para construir adopciones seguras y productivas.
- Para políticas públicas: los datos ofrecen señales sobre dónde intervenir (educación, reconversión, acceso equitativo).
Puntos técnicos a considerar
- La medición de complejidad incluye
tiempo humano estimado,tiempo con IAy si hay múltiples sub-tareas en una conversación. - Skill level se estima en años de educación a partir de prompts y respuestas.
- AI autonomy se mide a lo largo de una escala desde colaboración activa hasta delegación completa.
- Task success es la evaluación de si Claude completó la tarea; esa probabilidad alimenta las estimaciones macroeconómicas.
Reflexión final
Anthropic no solo entrega números: entrega un marco replicable para seguir cómo la IA cambia tareas y trabajos en el mundo real. Las primitives convierten observaciones de uso en señales accionables: nos dicen dónde la IA acelera trabajo, dónde falla y qué tipos de trabajadores podrían verse más afectados temprano.
¿La conclusión? La adopción de IA sigue siendo desigual y concentrada, pero con signos claros de expansión hacia tareas más complejas y usos empresariales. Si sigues de cerca estas primitives, podrás anticipar mejor oportunidades y riesgos en tu sector.
Fuente original
https://www.anthropic.com/research/economic-index-primitives
