En agosto de 2024 Anthropic hizo algo divertido y revelador: puso a equipos de empleados a trabajar con un robodog para recuperar una pelota de playa. Un equipo usó el modelo Claude; el otro solo internet y su ingenio. Ahora, en la fase dos, volvieron con Claude Opus 4.7 para ver cuánto habían cambiado las cosas. ¿El resultado? Los modelos avanzaron rápido, y las implicaciones son interesantes y prácticas.
Qué hizo el experimento (Phase Two)
La versión original pedía a los participantes que completaran varios pasos: operar el robodog con el controlador del fabricante, conectarse a video y lidar, escribir y ejecutar un programa para control manual, monitorear la trayectoria del robot, detectar la pelota y finalmente lograr la recuperación autónoma.
En la actualización autónoma no pidieron que el modelo usara un controlador físico. En su lugar ejecutaron tres pruebas de Opus 4.7 en Claude Code con adaptive thinking y el parámetro de esfuerzo al máximo. El rol humano quedó limitado a enchufar la laptop, introducir el prompt inicial, aprobar los comandos y permitir que el modelo pase al siguiente paso.
