Gemini 3.5 Flash: inteligencia frontera para agentes y código

Gemini 3.5 Flash llega con una velocidad cuatro veces superior a la de otros modelos frontera y supera en benchmarks clave de código y agentes a su propio predecesor, el Gemini 3.1 Pro. Google lo despliega hoy para miles de millones de usuarios, desarrolladores y empresas.

76,2% en Terminal-Bench 2.1: los números que definen el salto generacional

Gemini 3.5 Flash no llega con promesas genéricas. Google DeepMind publica cifras concretas que sitúan al modelo por encima de Gemini 3.1 Pro en los benchmarks más exigentes para agentes y código.

En Terminal-Bench 2.1, el nuevo modelo alcanza un 76,2%. En GDPval-AA obtiene 1.656 puntos Elo. En MCP Atlas registra un 83,6%. Son los tres indicadores que Google usa para medir capacidad agéntica real, no rendimiento en laboratorio.

En comprensión multimodal, 3.5 Flash logra un 84,2% en CharXiv Reasoning, el benchmark especializado en razonamiento visual sobre gráficas científicas. Esa combinación de velocidad, código y multimodalidad es lo que distingue esta entrega de actualizaciones anteriores.

Cuatro veces más rápido que la competencia frontera: qué significa en producción

La métrica de velocidad es quizás la más relevante para equipos de desarrollo. Medido en tokens de salida por segundo, 3.5 Flash genera a cuatro veces la velocidad de otros modelos frontera comparables. Google lo sitúa en el cuadrante superior derecho del índice de Artificial Analysis, que cruza inteligencia y velocidad.

En la práctica, eso significa que tareas que un desarrollador resolvía en días, o que un auditor completaba en semanas, ahora pueden ejecutarse en una fracción de ese tiempo. Google añade que el coste es inferior a la mitad del de otros modelos frontera equivalentes.

Para empresas que facturan por llamadas a API o que necesitan procesar grandes volúmenes de documentos en tiempo real, ese diferencial de coste y latencia tiene impacto directo en la cuenta de resultados.

El motor detrás de los agentes: Antigravity y la arquitectura de subagentes

El modelo no opera solo. Google lo acopla con Antigravity, su plataforma de desarrollo centrada en agentes, anteriormente conocida en algunos contextos como Project Mariner. La combinación permite desplegar subagentes colaborativos que trabajan en paralelo sobre tareas complejas.

Los casos de uso documentados por Google incluyen renombrar y categorizar activos no estructurados de forma automática, transformar bases de código heredadas a Next.js, y desarrollar videojuegos completos en seis horas usando dos agentes: uno que construye y otro que juega en un bucle de automejora.

Ese último ejemplo no es trivial. Sintetizar el artículo académico de AlphaZero y traducirlo a código funcional en seis horas representa un salto cualitativo en lo que los agentes de IA pueden entregar sin intervención humana continua.

Shopify, Macquarie Bank y Salesforce: los primeros resultados empresariales verificables

Google no publica solo benchmarks propios. Tres socios empresariales de primer nivel ya reportan resultados concretos con 3.5 Flash en producción.

Shopify ejecuta subagentes en paralelo para analizar datos complejos a largo plazo y generar previsiones de crecimiento de comerciantes a escala global. Macquarie Bank está pilotando el modelo para acelerar el proceso de incorporación de clientes, razonando sobre documentos de más de cien páginas con baja latencia.

Salesforce integra 3.5 Flash en Agentforce para automatizar tareas empresariales complejas mediante múltiples subagentes que retienen contexto y ejecutan llamadas a herramientas en múltiples turnos. Es una de las integraciones más significativas dado el peso de Salesforce en la gestión de relaciones con clientes a nivel corporativo.

Ramp y Xero: automatización fiscal y contable para pequeñas empresas

Más allá de los grandes bancos y plataformas de comercio electrónico, dos empresas de software financiero ilustran el alcance del modelo en procesos administrativos cotidianos.

Ramp usa 3.5 Flash para mejorar el reconocimiento óptico de caracteres en facturas complejas, combinando comprensión multimodal con razonamiento sobre patrones históricos. El objetivo es reducir errores en la conciliación de gastos corporativos.

Xero despliega agentes para gestionar flujos de trabajo de varias semanas de forma autónoma, incluyendo la identificación de proveedores y la recopilación de información para formularios fiscales 1099 en Estados Unidos. Para pequeñas empresas sin departamento contable propio, ese tipo de automatización elimina horas de trabajo administrativo repetitivo.

Gemini Spark: el agente personal que opera las 24 horas bajo supervisión del usuario

El anuncio de hoy incluye un producto dirigido al usuario final que merece atención separada. Gemini Spark es el agente personal de Google, construido sobre 3.5 Flash, y opera de forma continua para gestionar la vida digital del usuario bajo su dirección explícita.

Google inicia hoy el despliegue para testers de confianza. La beta llegará a suscriptores de Google AI Ultra en Estados Unidos la semana próxima. El modelo es ya el predeterminado en la aplicación Gemini y en el modo IA de Google Search a nivel global.

Koray Kavukcuoglu, director de tecnología de Google DeepMind y arquitecto jefe de IA de Google, lidera junto a Jeff Dean, científico jefe de Google DeepMind, y Oriol Vinyals, vicepresidente de Google DeepMind, el equipo que firma este lanzamiento. La presencia de Noam Shazeer, también vicepresidente de Google DeepMind y uno de los autores originales del artículo Attention Is All You Need que dio origen a los transformers modernos, subraya el peso técnico del proyecto.

Databricks y el diagnóstico de datos en tiempo real

Databricks, la plataforma de datos y análisis usada por miles de equipos de ingeniería, también figura entre los primeros adoptantes. Su caso de uso es específico: flujos de trabajo agénticos que monitorizan y recuperan información en tiempo real, razonan sobre conjuntos de datos masivos, diagnostican problemas e identifican soluciones para científicos de datos.

En entornos donde los pipelines de datos fallan silenciosamente y los equipos tardan horas en identificar la causa raíz, un agente que diagnostica y propone soluciones en tiempo real representa una reducción directa del tiempo medio de resolución de incidencias.

Es el tipo de caso de uso que no aparece en los benchmarks académicos pero que define la adopción real del modelo en entornos de producción exigentes.

Seguridad frontera: interpretabilidad interna antes de responder

Google indica que 3.5 Flash fue desarrollado conforme a su Frontier Safety Framework. Las mejoras de seguridad incluyen salvaguardas reforzadas en ciberseguridad y en materiales CBRN, el acrónimo que agrupa amenazas químicas, biológicas, radiológicas y nucleares.

La novedad técnica más relevante en este apartado es el uso de herramientas de interpretabilidad que examinan el razonamiento interno del modelo antes de que emita una respuesta. Eso reduce tanto la generación de contenido dañino como los rechazos erróneos de consultas legítimas, uno de los problemas más frecuentes en modelos de seguridad estricta.

La combinación de mayor capacidad agéntica con salvaguardas más sofisticadas responde a una tensión real: cuanto más autónomo es un agente, mayor es el riesgo de que ejecute acciones no deseadas. Google apuesta por la supervisión humana explícita como mecanismo de control primario.

Dónde está disponible y a qué precio relativo

La disponibilidad es inmediata y amplia. 3.5 Flash está accesible hoy a través de Google Antigravity, la API de Gemini en Google AI Studio y Android Studio, Gemini Enterprise Agent Platform y Gemini Enterprise. También está disponible para el público general en la aplicación Gemini y en el modo IA de Search.

Google no publica precios concretos en el anuncio, pero sí afirma que el coste es inferior a la mitad del de otros modelos frontera comparables. Para desarrolladores que trabajan con la API de Gemini, eso se traduce en un menor coste por tarea completada, especialmente en flujos de trabajo agénticos de larga duración que consumen muchos tokens.

El modelo se posiciona, por tanto, no como alternativa de bajo coste con capacidades reducidas, sino como modelo frontera con precio competitivo. Es una distinción importante frente a modelos como GPT-4o mini o Claude Haiku, que sacrifican rendimiento por precio.

Lo que viene

Google ya trabaja en Gemini 3.5 Pro, el modelo de mayor capacidad de la familia. Según el anuncio, ya se usa internamente y el despliegue externo está previsto para el mes próximo. No hay cifras públicas sobre su rendimiento todavía.

El calendario es relevante. Google I/O 2026 es el escenario de este anuncio, lo que significa que el ecosistema de desarrolladores recibe hoy acceso directo a 3.5 Flash con documentación y herramientas completas. Los equipos que quieran integrar el modelo en sus productos pueden comenzar desde AI Studio sin lista de espera.

Para las empresas que evalúan plataformas agénticas en 2026, el dato accionable es claro: 3.5 Flash está disponible hoy, cuesta menos de la mitad que los modelos frontera alternativos, y ya tiene casos de uso documentados en banca, fintech, contabilidad y análisis de datos a escala global.

Imagen ilustrativa generada con inteligencia artificial.

Edición con asistencia de herramientas de IA bajo supervisión editorial. Cómo trabajamos.

Fermín Sánchez

Fermín Sánchez es el responsable editorial de LaPrensaIA, diario de divulgación sobre inteligencia artificial. Cubrimos la actualidad de la IA con criterio propio —tecnología, empresas y sociedad— de forma clara para el público no técnico. Cada artículo se elabora con la asistencia tecnológica de Iberia y se revisa antes de publicarse. Más sobre cómo trabajamos →