Hugging Face lanzó una actualización importante de AI Sheets: ahora la herramienta trabaja con imágenes dentro de la hoja de cálculo, permitiéndote extraer texto, transformar y generar imágenes sin escribir código. ¿Te imaginas convertir un montón de fotos o recibos en una tabla lista para análisis con unos clics? (huggingface.co)
Qué trae la actualización
La idea es sencilla y poderosa: combinar columnas de texto y columnas de imagen en un mismo flujo de trabajo. Con esta versión puedes:
- Describir y categorizar fotos automáticamente, generar captions y etiquetas.
- Extraer datos estructurados de documentos y recibos: nombre del comercio, fecha, totales y más.
- Generar imágenes desde texto y editar imágenes existentes directamente en la hoja.
- Iterar con prompts, corregir salidas manualmente y usar el gesto de thumbs-up para enseñar al modelo.
Estas funciones se apoyan en los miles de modelos abiertos disponibles vía Inference Providers, por lo que puedes probar distintos trade offs entre velocidad y precisión. (huggingface.co)
Cómo funciona en la práctica
Subes una carpeta de fotos o arrastras imágenes a la app. Cada imagen aparece como una celda; sobre cualquier columna puedes aplicar una "AI action": extraer texto, preguntar a la imagen, detectar objetos, colorizar o editar. Los resultados llegan como nuevas columnas que puedes limpiar, transformar y exportar.
Piensa en esto como una hoja de cálculo que además tiene funciones de visión por computador y generación visual integradas en la interfaz que ya conoces. (huggingface.co)
Un prompt y un modelo por acción
Cada acción se define con un prompt y un modelo. Puedes usar plantillas prediseñadas o escribir prompts personalizados como Extract the merchant name, date, total amount, and expense category from this receipt y obtener un CSV o Parquet listo para tu workflow.
Ejemplos prácticos
-
Recibos de viaje: subes fotos, ejecutas la plantilla de extracción y obtienes una tabla con comercio, fecha, total y categoría. Corriges manualmente los errores y regeneras las filas restantes para mejorar la consistencia. (huggingface.co)
-
Calendario de redes: tienes títulos y descripciones en una hoja, creas una columna de imagen con el prompt
Generate an appetizing food photo for: {{title}}. Style: bright, overhead shot, natural lighting.y luego aplicas una segunda acción para ajustar el fondo o el estilo. Todo el calendario vive en un mismo lugar.
Modelos y precisión
AI Sheets usa modelos de visión y multimodales. El ejemplo del equipo muestra Qwen/Qwen2.5-VL-7B-Instruct como modelo por defecto y compara resultados con un modelo de razonamiento más grande Qwen/Qwen3-VL-235B-A22B-Reasoning para casos complejos. En la comparación se notan diferencias sutiles como una temperatura o un ingrediente faltante, lo que te recuerda que elegir modelo importa según la tarea. (huggingface.co)
Empezar y exportar
Puedes probar AI Sheets sin instalar nada en el Space público o clonar el repo y correrlo localmente. El proyecto es open source y está en GitHub si quieres revisar el código o desplegarlo en tu infraestructura. Si lo corres local o a escala, la recomendación es usar las opciones PRO para mayor cuota de inferencia. (huggingface.co)
¿Por qué importa esto para ti?
Porque baja la barrera entre imágenes y datos accionables. Si trabajas con inventarios, facturas, archivos históricos, catálogos o contenido para redes, pasar de imagen a tabla ya no es un proceso manual y fragmentado. Es una pregunta simple: ¿prefieres seguir etiquetando a mano o transformar ese trabajo en un pipeline reproducible?
Si te interesa probarlo, puedes empezar subiendo un pequeño conjunto de fotos y jugando con prompts para ver cómo cambia la calidad según el modelo y las instrucciones. La curva de aprendizaje es sobre prompts, no sobre infraestructura.
