OlmoEarth llega como una familia de modelos fundacionales abiertos diseñada para convertir señales satelitales crudas en inteligencia operativa útil y escalable. ¿Te interesa cómo pasar de imágenes y radares a mapas de cultivos, alertas de incendios o detección de barcos con modelos que puedas ajustar sin ser un experto en IA? Esto es lo que hace OlmoEarth y por qué importa.
Qué es OlmoEarth y por qué destaca
OlmoEarth es una familia de modelos fundacionales multimodales para observación terrestre, entrenada con grandes volúmenes de datos satelitales. Viene en cuatro tamaños con la misma arquitectura y enfoque de entrenamiento:
- OlmoEarth-v1-Nano (~1.4M parámetros) y OlmoEarth-v1-Tiny (~6.2M): inferencia rápida y económica a escala.
- OlmoEarth-v1-Base (~90M): equilibrio entre precisión y velocidad para la mayoría de casos.
- OlmoEarth-v1-Large (~300M): mejor rendimiento en tareas complejas.
Además del código y los pesos, Ai2 publica el stack de investigación, entrenamiento y evaluación como artefactos abiertos, y ofrece la OlmoEarth Platform para facilitar despliegues y personalizaciones.
Arquitectura y enfoque técnico
OlmoEarth es esencialmente un vision transformer adaptado a series temporales y datos multimodales de la Tierra. En lugar de procesar solo imágenes estáticas, el modelo trabaja con secuencias mensuales de parches satelitales y convierte cada porción en un token que incorpora ubicación, momento y tipo de sensor.
- Modalidades: imágenes ópticas, radar y mapas contextuales (por ejemplo OpenStreetMap, cobertura de suelo, altura del dosel).
- Pretraining: enmascaramiento de partes de imágenes (masked modeling) para que el modelo aprenda a reconstruir o predecir lo oculto a partir del contexto visible. Esto es self-supervised learning combinado con aprendizaje débil usando las capas de mapas.
- Tokenización: cada token representa un patch con metadatos de tiempo y sensor, lo que permite razonar simultáneamente sobre espacio, tiempo y modalidad.
Explicado con menos tecnicismos: el modelo aprende a completar imágenes faltantes y a usar mapas auxiliares como pistas. Así obtiene representaciones robustas que sirven para muchas tareas sin tener que entrenar desde cero cada vez.
Datos y escala
- Tamaño del dataset de preentrenamiento: aproximadamente 10 terabytes, millones de muestras a una resolución uniforme de 10 metros/píxel.
- Temporalidad: hasta 12 timestamps mensuales por muestra, aunque el sistema tolera timesteps y modalidades faltantes (muy común en datos satelitales reales).
Esta flexibilidad es clave: OlmoEarth maneja datos incompletos y condiciones reales sin romper el pipeline.
Evaluación y comparativas
OlmoEarth fue probado con métodos estándar de evaluación: kNN, linear probing (LP) y supervised fine-tuning (SFT). Los resultados muestran rendimiento líder en:
- Clasificación de escenas y parches
- Segmentación semántica
- Detección de objetos y de cambios
- Regresión sobre series temporales (por ejemplo humedad viva del combustible)
Comparado con modelos recientes de investigación industrial y académica —Meta DINOv3, IBM/NASA Prithvi, IBM Terramind, CROMA, Panopticon, así como modelos previos de Ai2 como Satlas y Galileo— OlmoEarth logra mejor desempeño en muchos benchmarks. Frente a Google DeepMind AlphaEarth Foundations (AEF), OlmoEarth produjo embeddings competitivos y, tras fine-tuning, superó a AEF de forma sustancial en las tareas probadas.
Esto subraya la ventaja de contar con una plataforma que haga accesible el fine-tuning y la personalización de modelos.
Aplicaciones prácticas y despliegue
OlmoEarth no es solo un paper: ya se usa en desafíos reales.
- Agricultura y seguridad alimentaria: mapeo de tipo de cultivo para pequeños agricultores en África subsahariana, apoyando intervenciones más precisas.
- Evaluación de riesgo de incendios: mejores estimaciones de humedad del combustible vivo, lo que mejora mapas de riesgo y decisiones operativas.
- Detección de objetos y embarcaciones: menor tasa de falsos positivos y negativos en óptico y radar, útil para vigilancia marítima y pesca ilegal.
- Mapeo de cobertura y ecosistemas: ayuda a priorizar encuestas de campo y distribuir fondos de restauración con mayor confianza.
¿Por qué importa esto operativo? Porque OlmoEarth ofrece precisión competitiva sin requerir modelos gigantescos: menos costo de inferencia, capacidad de re-ejecutar análisis con frecuencia y posibilidad de mejora continua.
Cómo se usa en la práctica (flujos comunes)
- Extracción de embeddings: para búsquedas rápidas y pipelines de detección con
kNN. - Linear probing: evaluar la utilidad inmediata de las representaciones para una tarea con etiquetas limitadas.
- Fine-tuning supervisado: adaptar el modelo a una región, sensor o tarea específica para maximizar rendimiento.
- Plataforma OlmoEarth: integra adquisición de datos, etiquetado, fine-tuning y despliegue en producción sin necesidad de construir toda la infraestructura desde cero.
Además, Ya se lanzan modelos fine-tuned listos para tareas como clasificación de manglares, mapeo de cultivo y clasificación de combustible forestal, desarrollados con socios regionales para facilitar la adaptación a nuevas áreas.
Qué sigue y colaboradores
La próxima generación de OlmoEarth ampliará modalidades (por ejemplo datos meteorológicos) y sectores como respuesta humanitaria. Ai2 agradece a colaboraciones clave: Amazon Conservation, African Wildlife Foundation, CGIAR/IFPRI, Global Mangrove Watch, Global Ecosystem Atlas, ITC University of Twente, NASA JPL y NASA Harvest.
¿Quieres usarlo mañana? Puedes registrarte para recibir actualizaciones, acceso de socios y explorar el Viewer con muestras de salidas del modelo.
Reflexión final
OlmoEarth muestra una tendencia clara: los modelos fundacionales para observación terrestre dejan de ser experimentos de laboratorio y se convierten en herramientas operativas. ¿El cambio más importante? La combinación de preentrenamiento multimodal, fine-tuning accesible y tamaños de modelo eficientes permite llevar IA a problemas reales sin una necesidad prohibitiva de recursos.
