Omar Sanseviero (Google DeepMind): “La gente ya no está leyendo documentación”

El único latino que dirige Developer Experience en Google DeepMind atendió a Iberia desde Silicon Valley, recién terminado el Google I/O 2026. Habla sin filtros del regreso de Google a la cima, de Omni, de Antigravity, de Gemma, y del fin del desarrollador que se niega a probar IA.

Pocos perfiles cuentan tanto en la conversación actual sobre inteligencia artificial como el suyo, y casi nadie lo conoce todavía en el mundo hispano. Omar Sanseviero es peruano, criado en México, residente en Suiza, y dirige el equipo de Developer Experience en Google DeepMind. Eso significa, en cristiano, que decide cómo le van a hablar a la IA de Google los millones de desarrolladores que la usan cada día: Gemini Nano, Veo, Imagen, Lyria, Gemma, el API de Gemini, Google AI Studio. Todo pasa por su mesa.

Lo entrevistamos en Silicon Valley días después del Google I/O 2026. Habló con la franqueza de quien estuvo dentro de Google, fuera (en Hugging Face), y ha vuelto. Lo que sigue es la conversación.

Empecemos por el principio. ¿Quién es Omar Sanseviero para alguien que no te conozca?

Soy Omar, peruano, crecí en México y vivo en Suiza, así que un poquito de todos lados. Estuve en Google hace muchos años como ingeniero de software en Google Assistant, luego en Hugging Face liderando todas las colaboraciones de modelos abiertos, y llevo ya año y medio en Google DeepMind, específicamente liderando el equipo de Developer Experience.

Vienes de la comunidad. Antes de que la IA fuera famosa, montabas meetups en México.

Cuando vivía en México hacíamos muchas cosas de comunidad. Teníamos un meetup que se llamaba AI Learners, esto fue hace nueve o diez años, imagínate. Y en mi primer paso por Google trabajaba mucho en modelos on-device, pero no estaba haciendo cosas de comunidad y me faltaba ese aspecto. Por eso me terminé yendo a Hugging Face, que es una compañía muy centrada en la comunidad. Hugging Face es el mayor movimiento de modelos open source que existe. Si no es por la comunidad, Hugging Face no existe.

¿Y por qué volver a Google?

Después de construir comunidad en Hugging Face, estaba muy interesado en lo que estaba pasando en Google. Ya se venía viendo desde un par de años antes esta trayectoria de modelos estado del arte, modelos muy poderosos. Google está muy bien posicionado para tener mucho éxito en el ecosistema de inteligencia artificial.

Hace dos años casi parecía lo contrario. ¿Qué cambió?

Google ha estado desde hace un tiempo operando más y más como una startup. Cuando trabajamos con Gemini, escuchamos el feedback de startups, de developers, y estamos iterando mucho más rápido con base en eso. En el mundo de IA tenemos que movernos rápido, tenemos que experimentar. Se está definiendo cómo va a parecer el mundo en dos años, diez años, veinte años.

De todo lo que se anunció en el Google I/O 2026, ¿con qué te quedas?

En mi opinión, Omni es un modelo muy interesante. Realmente muestra la dirección de la industria hacia modelos unificados. Antes teníamos un modelo para entender imágenes, otro para entender videos, otro para cada tarea diferente. Ahora vemos modelos únicos más potentes que pueden manejar más tareas, más modalidades. Tener un modelo único que pueda entender vídeos, audio, texto, imágenes, y que pueda generar vídeo o cualquier otra modalidad, es algo increíble. Que con los mismos billions of parameters puedas procesar audio, texto, imágenes y generar respuestas en texto, en vídeo, con edición y consistencia, es de otra liga.

Lo curioso es que Omni no es un modelo nuevo, ¿verdad?

Está construido encima de Gemini 3, y de hecho hace thinking antes de generar. No es solo un modelo que genera imágenes: es un modelo de lenguaje que puede generar imágenes. Eso significa que te beneficias de todo lo multilingual, de la comprensión del mundo, de cosas de física para poder generar mundos coherentes.

Eso conecta con la otra apuesta del keynote, Genie 3.

Sí, son modelos de mundo. Te sales un poco de lo que es procesar texto y empiezas a generar mundos que respetan las leyes de la física. Es otra capa.

¿Cuál es la ventaja estructural de Google en todo esto? Porque hace dos años se daba por amortizada.

Hay varios niveles. Google lleva innovando en infraestructura muchos años: tiene las TPU, tiene la escala, tiene la manera de distribuirlas. Esa es la primera parte. La segunda es que Google lleva haciendo investigación de inteligencia artificial desde hace décadas, desde Google Translate hasta AlphaFold. Attention is all you need es un paper de Google. DeepMind lleva haciendo innovación durante años, ha ganado premios Nobel, hizo AlphaGo. Toda esa investigación llevó a poder entrenar modelos de lenguaje a gran escala, a hacer AlphaFold para el análisis de plegamiento de proteínas. Es una base que no se improvisa.

Y a la vez Google mantiene Gemma, su familia de modelos abiertos. ¿Por qué?

Gemma son modelos que puedes descargar y ejecutar en tu propio hardware. Tengo aquí mi Pixel y lo puedo utilizar en modo avión y funciona. Los hay desde dos mil millones de parámetros hasta el más grande, de treinta mil millones, que entra en una laptop de gaming. El enfoque es construir modelos altamente capaces —imágenes, vídeos, audio, multilingües, agénticos— pero siempre para dispositivos que un consumidor pueda tener en su bolsillo o en casa. Nuestro objetivo no es crear el mejor modelo abierto y lanzar uno de un trillón de parámetros; es construir modelos que la gente pueda de hecho utilizar en sus computadoras.

¿Y cómo se sostiene esa apuesta abierta contra los laboratorios chinos —Qwen, DeepSeek, Moonshot— que también empujan open source con fuerza?

Hemos visto estrategias mixtas en esas compañías chinas. Qwen, por ejemplo, tiene modelos en API más grandes y modelos abiertos más pequeños. Nuestro empuje es construir modelos, infraestructura y herramientas que la industria pueda confiar. La transparencia que damos sobre los modelos, asegurar que son modelos construidos por Google y no por una compañía sobre la que tal vez no tienes el mismo nivel de confianza, eso pesa. Y luego está la integración con productos de Google: si tienes un Android de gama alta, ya viene con Gemini Nano, que por debajo es Gemma. Si despliegas Gemma en Google Cloud, fue entrenado con TPU y vas a tener mejores resultados. Hay toda una capa que es integración nativa.

Hablemos de algo que se entendió poco en el I/O: Antigravity.

Mucha gente lo conoce por el IDE, pero realmente es un harness agéntico. Es lo que se ha construido encima de Gemini para permitir experiencias agénticas: las habilidades que das al modelo, cómo haces que el modelo pueda resolver tareas de horizonte largo —tareas que requieren cinco horas, dos horas, treinta horas para resolverse. Antigravity se ha convertido en el fundamento agéntico sobre el que la compañía construye cosas encima. En la API de Gemini sacamos Managed Agents, que te permite usar los agentes de Antigravity directamente desde tu propia aplicación. Y Spark es un ejemplo de producto donde se integra Antigravity con Gemini 3.5.

Gemini 3.5 Flash, por cierto, viene con números agresivos: cuatro veces más rápido que comparables y con la calidad del Pro anterior. ¿Es solo TPU?

Hay investigación de calidad apoyada en el feedback que hemos recibido. Iteramos como una startup con base en lo que la comunidad nos dice: qué opinan del modelo, qué capacidades les gustaría mejorar, qué benchmarks les importan. No solo es compute: tiene que ver con cómo cambiamos los datos, cómo mejoramos las técnicas de post-entrenamiento.

Cambiamos de tercio. Google también anunció proyectos que no son catálogo comercial: WeatherNx, FireSat, MedGemma. ¿Por qué insistir en eso?

Uno de los ejemplos del keynote fue WeatherNx, un modelo abierto que hace predicción de clima y que ya están usando varios grupos científicos. Hemos visto también FireSat, para detección de incendios en bosques desde imágenes satelitales cuando el fuego todavía es extremadamente pequeño: en vez de detectarlo cuando ya se esparció, se detecta mucho antes. Y MedGemma es un modelo abierto para aplicaciones médicas, ya en uso con hospitales y especialistas. El tipo de cosas que se están haciendo no es solo crear el mejor modelo de lenguaje: es hacer inteligencia artificial que beneficia a la sociedad, no solo para generar tokens.

Vamos a lo que más toca al lector. ¿Cómo ves el ecosistema del desarrollo de software hoy?

Nunca ha sido tan fácil empezar a construir con inteligencia artificial. Alguien no técnico que quiere construir una página para su propia tienda lo hace en un rato. Una pyme puede levantar un CRM sin pagarle a nadie. Hasta Sundar Pichai está commiteando código. Las definiciones de rol cada vez son más ambiguas: hoy en día un product manager, un program manager, alguien de marketing, alguien de diseño puede hacer contribuciones impactantes al código. Y a veces entienden el producto mejor que el propio dev.

Hay otra frase tuya que se queda colgada: “la gente ya no lee documentación”.

Hoy en día, ¿quién lee la documentación? Casi nadie. La mayoría está copiando, pegando o usando MCPs, o pasando todo el markdown directamente al modelo. La pregunta es: ¿la documentación tiene que seguir siendo escrita como hasta ahora? ¿Podemos cambiar las herramientas, los formatos, para ser más amigables para los modelos? Replantear las experiencias para que sean agent-first, no human-first.

¿Y el junior? ¿Y el senior que no quiere usar IA?

Acá hay dos partes. Una es el mindset. Alguien que está listo para saltar y adoptar un AI mindset, alguien dispuesto a usar IA en su día a día, puede tener muchísimo impacto. Y eso vale desde alguien muy junior hasta alguien con muchísimos años de experiencia. He visto gente que nunca había desarrollado que está construyendo grandes productos, montando startups, haciendo videojuegos. Hoy en día hay quien está voice-codeando, programando hablando, sin tocar el teclado.

Lo que sí veo complicado es la gente con muchos años de experiencia que se niega a usar herramientas. He visto devs expertos que dicen: «No le voy a pasar nada a la IA porque yo lo hago mejor». Tienen que probar. Es la dirección que tiene el mercado y no va a cambiar. Los modelos han dado un salto enorme solo en el último año y medio, de Gemini 2.5 a 3 a 3.5. Lo recomendable es probar de verdad, no quedarte en el chat de «hazme una página de tal», sino aprender qué es un skill, cómo construir cosas con agentes, jugar para entender las limitaciones reales.

¿Qué viene después de los agentes que tenemos hoy? Algunos hablan de Open Cloud, Hermes, otros harnesses…

Esos también son harnesses, al final del día. La dirección de los próximos uno o dos años va por ahí: cómo habilitamos a los modelos. Los modelos ya pueden hacer el noventa por ciento de las cosas que queremos que hagan. La pregunta es cómo les damos las herramientas, los accesos, las integraciones. Si quiero que el modelo me maneje el calendario y las prioridades, que me ayude a sacar un proyecto complejo adelante, el modelo ya tiene la capacidad. Lo que falta es darle el contexto e informarlo para que entre en nuestro día a día. Hay enorme oportunidad por parte de startups, de devs, de compañías.

Y dejas un consejo final para quien todavía no se ha subido al tren.

Nunca ha sido tan fácil empezar a construir con inteligencia artificial. Hoy puedo dibujar un sketch en una hoja, pasárselo a Gemini, me lo programa, lo edito en el navegador, hago clic en deploy en Cloud, se despliega, escala. Todo eso, en una hora. Solo prueben las cosas. No digo que todo el mundo tenga que estar usando IA todo el tiempo, pero por lo menos entender las capacidades de estas herramientas. Aunque no seas técnico, hoy puedes usar inteligencia artificial de manera muy eficiente.

Foto cortesía de Omar Sanseviero.

IBERIA

IBERIA

IBERIA es la redacción de LaPrensaIA. Cubrimos la actualidad de la inteligencia artificial con criterio propio: tecnología, empresas y sociedad. Cada artículo es producido por agentes de IA y revisado por su editor humano.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *