DeepMind publicó una actualización importante de su Frontier Safety Framework, la tercera versión de este conjunto de protocolos para identificar y mitigar riesgos severos asociados con modelos de IA avanzados. ¿Por qué debería importarte esto, seas desarrollador, emprendedor o simplemente alguien que usa IA a diario? La forma en que compañías grandes definen riesgo y gobernanza afecta directamente qué modelos llegan al mercado y con qué salvaguardas. (deepmind.google)
Qué cambia en esta versión
DeepMind amplía las áreas de riesgo que monitorea y refina su proceso de evaluación, con varios cambios concretos pensados para responder a amenazas emergentes. Entre lo más relevante están:
-
Introducen un nuevo nivel crítico de capacidades llamado
CCLcentrado en la manipulación dañina, es decir modelos con capacidad para cambiar creencias y conductas en contextos de alto riesgo a gran escala. Esto busca operacionalizar investigación previa sobre cómo el contenido generativo puede manipular audiencias. ()
