Google amplía la herramienta File Search del API de Gemini para que ya no sea solo texto: ahora procesa imágenes y texto juntos, permite etiquetas personalizadas y añade citas de página para comprobar de dónde viene cada respuesta. ¿El resultado? Sistemas RAG más útiles, rápidos y verificables, tanto en prototipos como en producción.
Qué cambia
La novedad principal es que File Search se vuelve multimodal. Eso significa que, además de indexar texto, entiende datos visuales gracias al modelo Gemini Embedding 2. Tu aplicación puede buscar dentro de archivos combinando descripciones en lenguaje natural con contenido visual.
También puedes adjuntar metadata personalizada a cada archivo en forma de pares clave-valor. Piensa en etiquetas como departamento: Legal o estado: Final. Al filtrar por esas etiquetas, reduces el ruido y haces las búsquedas más precisas y rápidas.
