Transformers.js en extensiones Chrome bajo Manifest V3

Mientras reconstruías la arquitectura del asistente Gemma 4 para navegador, seguro te preguntaste: ¿dónde corro el modelo, cómo manejo el estado y qué pasa si el service worker se suspende? Esta guía técnica te explica la receta práctica para ejecutar inferencia local con Transformers.js dentro de una extensión Chrome bajo Manifest V3, usando la extensión publicada como mapa de implementación.

Arquitectura general

La división de responsabilidades es la base del proyecto. En public/manifest.json se definen tres puntos de entrada claros:

background.service_worker -> archivo compilado background.js (control y modelos)
side_panel.default_path -> sidebar.html (UI de chat persistente)
content_scripts[] -> content.js (puente con la página web)

La regla de diseño: deja la orquestación pesada en el background y mantiene la UI y los content scripts ligeros. Con eso ganas: una sola instancia de modelo por extensión, menos consumo de memoria y límites de seguridad bien respetados.

Arquitectura general

¿Quién hace qué?

Mensajería y contratos entre runtimes

Modelos, pipelines y ejecución en Transformers.js

Herramientas y llamadas de función desde el modelo

Ciclo de vida de modelos y resiliencia MV3

Estado y almacenamiento local

Permisos y privacidad

Build y despliegue

Patrones y variaciones prácticas

Recomendaciones finales para desarrolladores

Fuente original

¡Mantente al día!

Transformers.js en extensiones Chrome bajo Manifest V3