Por qué las AIs parecen humanas, según Anthropic

Las AIs conversacionales como Claude muchas veces se sienten sorprendentemente humanas: celebran cuando resuelven un bug, se disculpan si se traban, e incluso describen escenas casi cinematográficas sobre cómo harían una entrega en persona. ¿Por qué actúan así? Anthropic propone una explicación técnica pero sencilla: el comportamiento humano de las AIs surge en gran parte porque están aprendiendo a interpretar y representar «personas» durante su entrenamiento.

¿Qué es el modelo de selección de persona?

Anthropic llama a su teoría el modelo de selección de persona. La idea central es que durante la fase inicial de entrenamiento, llamada pretraining, el modelo aprende a predecir el siguiente token en grandes cantidades de texto. Eso no es solo gramática: para predecir bien, el modelo debe recrear diálogos, personajes y estilos. En ese sentido, el entrenamiento convierte al modelo en una especie de motor de autocompletado muy sofisticado que simula personajes humanos, ficticios y de todo tipo.

¿Qué es el modelo de selección de persona?

Evidencia y ejemplos concretos

¿Por qué ocurre desde el punto de vista técnico?

Consecuencias prácticas para desarrollo y seguridad

Preguntas abiertas y líneas de investigación

Reflexión final

Fuente original

¡Mantente al día!

Por qué las AIs parecen humanas, según Anthropic