Imagina miles de horas de grabaciones en un bosque, un manglar o un arrecife: pajaritos, ranas, ballenas, y el ruido de motores en el fondo. ¿Quién tiene tiempo para escucharlo todo? Ahí entra la IA: escuchar por nosotros, pero con criterio científico.
Qué es Perch y por qué importa
Perch
es un modelo de inteligencia artificial creado para analizar grabaciones de sonido de la naturaleza (bioacústica) y ayudar a los conservacionistas a identificar especies, contar individuos y detectar señales de salud o amenaza en un ecosistema. DeepMind publicó una actualización del modelo el 7 de agosto de 2025 y la puso disponible como código abierto para la comunidad científica. (deepmind.google)
Perch fue entrenado con casi el doble de datos que la versión anterior, incluyendo aves, mamíferos, anfibios y también ruidos antropogénicos (por ejemplo, motores o actividad humana). Eso le permite adaptarse mejor a entornos complejos —incluso bajo el agua, como en arrecifes de coral— y disenterrar escenas acústicas densas en miles o millones de horas de audio. (deepmind.google)
Casos reales: cómo ya está ayudando
-
Desde su lanzamiento en 2023, la versión anterior de Perch fue descargada más de 250.000 veces y se integró en herramientas como BirdNet Analyzer, usadas por biólogos alrededor del mundo. (deepmind.google)
-
En Australia, Perch apoyó descubrimientos de nuevas poblaciones —por ejemplo, ayudó en la detección de la esquiva Plains Wanderer— y facilitó la construcción de clasificadores para especies locales. (deepmind.google)
-
En Hawaiʻi, investigadores del LOHE Bioacoustics Lab utilizaron Perch para monitorear honeycreepers y encontraron sonidos objetivo casi 50 veces más rápido que con métodos tradicionales, lo que liberó tiempo para trabajo de campo y conservación directa. (deepmind.google)
"Perch ayudó a encontrar honeycreeper sounds nearly 50x faster than their usual methods." (DeepMind). (deepmind.google)
Si te preguntas qué significa eso en la práctica: detectar más rápido implica respuestas más tempranas a amenazas (enfermedades, invasiones, pérdida de hábitat) y menos horas humanas dedicadas a revisar grabaciones manualmente.
¿Cómo funciona Perch, explicado sencillo?
Perch usa una combinación de embeddings
(representaciones numéricas del sonido), búsqueda por vectores (vector search
) y aprendizaje activo. Eso significa que, dado un ejemplo de sonido (p. ej. el canto de una cría), el modelo busca sonidos similares en la base de datos y permite a un experto marcar rápidamente qué es relevante.
Esa receta —que los autores llaman agile modeling
— permite crear clasificadores de alta calidad incluso cuando hay pocos ejemplos etiquetados: según el equipo, es posible tener un clasificador funcional en menos de una hora para sonidos específicos. Además, DeepMind puso a disposición los códigos y los artículos técnicos para que otros puedan reproducir y mejorar el enfoque. (deepmind.google)
Riesgos, límites y buenas prácticas
La IA no es una varita mágica: puede equivocarse, confundir especies con sonidos parecidos o verse afectada por sesgos en los datos de entrenamiento. Por eso la versión abierta de Perch se concibe como una herramienta para apoyar a expertos, no para reemplazarlos. La colaboración local (científicos, guardaparques, comunidades) sigue siendo clave para validar resultados y adaptar modelos a contextos específicos. (deepmind.google)
También hay consideraciones de privacidad y uso: grabar ecosistemas a gran escala puede capturar conversaciones humanas o actividades sensibles; los proyectos responsables deben aplicar filtros y políticas claras sobre manejo de datos.
¿Qué puedes hacer si te interesa ayudar o probarlo?
-
Descargar el modelo y herramientas desde Kaggle y el repositorio abierto para experimentar: puedes generar un clasificador para tu región o especie de interés. (deepmind.google)
-
Contribuir con grabaciones a repositorios públicos (por ejemplo, Xeno-Canto o iNaturalist) para mejorar la cobertura y reducir sesgos en el entrenamiento. (deepmind.google)
-
Si eres científico o trabajas en conservación, integrar
vector search
y aprendizaje activo en tus flujos de trabajo puede acelerar drásticamente el análisis sin necesidad de etiquetar enormes volúmenes de datos.
Cierre: la IA como herramienta para escuchar mejor
Perch no salva especies por sí sola, pero ofrece una palanca poderosa: reducir horas de revisión, ampliar el alcance geográfico del monitoreo y permitir respuestas más rápidas. ¿No es tranquilizador pensar que la misma tecnología que usamos para recomponer canciones o mejorar asistentes de voz ahora puede ayudarnos a escuchar y proteger el coro de la Tierra? La clave estará en usar estas herramientas con criterio, transparencia y la experiencia de las comunidades que conocen esos ecosistemas.
Más información y recursos: descarga el modelo en Kaggle o revisa los artículos técnicos vinculados por el equipo de Perch. (deepmind.google)