IA barata gana terreno: empresas recortan costes con modelos open source

Los tokens de código abierto procesados en la plataforma OpenRouter pasaron del 34% en enero de 2026 al 65% en junio del mismo año. Ese salto de 31 puntos en seis meses resume mejor que cualquier declaración corporativa hacia dónde se mueve el mercado de la inteligencia artificial empresarial: hacia los modelos baratos.

Uber agota su presupuesto de IA en cuatro meses

Uber, la compañía de transporte bajo demanda fundada en San Francisco en 2009 y valorada en más de 150.000 millones de dólares, vivió en 2026 una situación que ningún director financiero quiere enfrentar: sus empleados adoptaron herramientas de codificación con inteligencia artificial a tal velocidad que el presupuesto anual se consumió antes de que terminara el primer cuatrimestre.

La dirección tuvo que imponer límites de uso. No se trató de un fallo de planificación aislado. Fue la señal más clara de que las empresas tecnológicas habían subestimado de forma sistemática cuánto gastarían sus equipos en herramientas de IA cuando estas se volvieron accesibles y productivas.

El caso de Uber no es excepcional. Harold Byun, CEO de BlueRock, ha documentado que muchas empresas están recibiendo facturas de IA entre un 20% y un 30% por encima de lo presupuestado. La causa principal: los cambios en los modelos de precios de las grandes plataformas propietarias, que ajustaron sus tarifas al alza conforme consolidaban su posición en el mercado.

De 4 dólares a 18 céntimos: la brecha de precios que mueve empresas

La diferencia de coste entre los modelos premium y los modelos de código abierto ya no es marginal. Es estructural. Los modelos propietarios de referencia cobran una media de 4 dólares por millón de tokens procesados. DeepSeek, el modelo chino que lidera el uso en OpenRouter, cobra desde 18 céntimos por millón de tokens.

La proporción es de más de veinte a uno. Para una empresa que procesa decenas de millones de tokens al día en tareas de codificación, revisión de documentos o atención al cliente automatizada, esa diferencia se traduce directamente en cientos de miles de dólares anuales de ahorro.

OpenRouter es una plataforma que permite a desarrolladores y empresas acceder a múltiples modelos de lenguaje a través de una sola interfaz de programación. Su posición como agregador neutral la convierte en un termómetro fiable del mercado: los datos de uso que publica reflejan decisiones reales de ingenieros y equipos técnicos, no intenciones declaradas en encuestas.

Los cuatro modelos más usados en OpenRouter son chinos

El dato más revelador del informe de OpenRouter no es solo el crecimiento del código abierto. Es su procedencia. Los cuatro modelos con mayor volumen de uso en la plataforma durante el primer semestre de 2026 son de origen chino, con DeepSeek encabezando la lista.

DeepSeek irrumpió a principios de 2025 con una propuesta que la industria tardó semanas en procesar: rendimiento comparable a los modelos líderes de OpenAI a una fracción del coste de entrenamiento y de inferencia. Su arquitectura de mezcla de expertos y su eficiencia computacional permitieron precios que los laboratorios occidentales no podían igualar sin sacrificar márgenes.

Este desplazamiento geográfico en el uso de modelos plantea preguntas que van más allá de la economía. Empresas europeas y estadounidenses que procesan datos sensibles de clientes a través de modelos chinos enfrentan interrogantes sobre soberanía de datos, cumplimiento normativo y dependencia tecnológica que los departamentos jurídicos y de cumplimiento todavía están evaluando.

La brecha de capacidad se redujo de un año a cuatro meses

Durante 2024 y buena parte de 2025, los modelos de código abierto seguían a los líderes propietarios con un retraso de capacidad estimado en más de doce meses. Esa distancia era el argumento central de las grandes plataformas para justificar sus precios: pagabas más porque obtenías lo mejor disponible con una ventaja temporal significativa.

Ese argumento se ha debilitado de forma considerable. La distancia entre los modelos de código abierto más avanzados y los modelos premium propietarios se ha reducido a aproximadamente cuatro meses de capacidad. Para la mayoría de los casos de uso empresarial cotidiano, esa diferencia es irrelevante.

Un equipo de desarrollo que utiliza IA para generar código de soporte, escribir tests automatizados o resumir documentación técnica no necesita el modelo más avanzado del mundo. Necesita un modelo suficientemente bueno, disponible, predecible en su coste y compatible con sus flujos de trabajo. Los modelos de código abierto actuales cumplen esos requisitos para una proporción creciente de tareas.

Gartner proyecta que el coste de IA superará el salario de un desarrollador en 2028

La consultora Gartner ha emitido una advertencia que los directores de tecnología están tomando en serio: los costes de IA aplicada a programación superarán el salario medio de un desarrollador en 2028. La proyección no es una metáfora. Es una consecuencia directa de la velocidad a la que los equipos de ingeniería han integrado estas herramientas en su trabajo diario.

Un desarrollador que utiliza asistentes de codificación basados en modelos de lenguaje de gran tamaño durante ocho horas diarias genera un volumen de tokens que, a precios de los modelos premium, puede alcanzar cifras comparables a una parte significativa de su retribución anual. La aritmética es sencilla y preocupante para los responsables de presupuesto.

Esta proyección de Gartner está acelerando las conversaciones internas en empresas de todos los tamaños sobre qué modelos usar para qué tareas. No se trata de abandonar los modelos propietarios en todos los casos, sino de establecer una estrategia de capas: modelos premium para las tareas más críticas o complejas, modelos de código abierto para el volumen de trabajo rutinario.

El modelo de capas que están adoptando los equipos técnicos

La estrategia que está emergiendo en los departamentos de ingeniería más sofisticados no es binaria. No se trata de elegir entre modelos caros y modelos baratos de forma absoluta. Se trata de asignar el modelo adecuado a cada tipo de tarea según su complejidad, su sensibilidad y su volumen.

Un caso de uso concreto ilustra bien este enfoque: un equipo de desarrollo puede usar DeepSeek o un modelo equivalente de código abierto para generar código repetitivo, completar funciones estándar y escribir documentación. Para revisar arquitecturas críticas, detectar vulnerabilidades de seguridad o tomar decisiones de diseño de alto nivel, reserva los modelos propietarios más potentes.

Esta segmentación reduce el coste total sin sacrificar calidad en los puntos donde más importa. Es el mismo principio que aplica cualquier empresa cuando decide qué servicios externaliza y cuáles mantiene internos: no todo requiere el nivel máximo de sofisticación, pero algunos procesos no admiten errores.

El mercado de modelos en 2026: velocidad de cambio sin precedente en precios

El mercado de modelos de lenguaje está atravesando una compresión de precios que no tiene parangón en la historia reciente del software empresarial. En menos de dieciocho meses, el coste de procesar un millón de tokens ha caído en órdenes de magnitud para los modelos más competitivos.

Esta dinámica beneficia a las empresas que tienen la agilidad técnica para cambiar de proveedor con rapidez, pero penaliza a las que firmaron contratos a largo plazo con plataformas propietarias antes de que el mercado se reequilibrara. La portabilidad de los flujos de trabajo entre modelos se ha convertido en una ventaja competitiva real, no en una consideración secundaria.

Los proveedores de infraestructura en la nube, Amazon Web Services, Google Cloud y Microsoft Azure, están respondiendo a esta presión incorporando modelos de código abierto en sus catálogos y ofreciendo opciones de despliegue privado que permiten a las empresas ejecutar modelos como DeepSeek dentro de sus propios entornos, eliminando las preocupaciones sobre soberanía de datos sin renunciar al ahorro en costes.

DeepSeek, BlueRock y Uber marcan el nuevo mapa del gasto en IA

El escenario que describe Harold Byun desde BlueRock, con facturas desbordadas y presupuestos agotados antes de tiempo, no va a resolverse solo con cambiar de modelo. Requiere que las empresas establezcan políticas de gobernanza del uso de IA comparables a las que ya tienen para el gasto en software o en servicios en la nube.

Uber ha aprendido esa lección de forma acelerada. La compañía tiene ahora controles de uso que antes no necesitaba porque las herramientas de IA no tenían el peso presupuestario que tienen hoy. Ese proceso de maduración en la gestión del gasto se está replicando en cientos de empresas tecnológicas de todos los tamaños.

La tendencia que muestran los datos de OpenRouter para el primer semestre de 2026 apunta en una dirección estable: el código abierto seguirá ganando cuota de uso conforme los modelos reduzcan su brecha de capacidad con los propietarios y los equipos técnicos desarrollen la experiencia necesaria para desplegarlos con garantías. Para finales de 2026, la proporción del 65% registrada en junio podría haber superado ya los dos tercios del total procesado en plataformas de agregación.

Imagen ilustrativa generada con inteligencia artificial.

Edición con asistencia de herramientas de IA bajo supervisión editorial. Cómo trabajamos.

Fermín Sánchez

Fermín Sánchez es el responsable editorial de LaPrensaIA, diario de divulgación sobre inteligencia artificial. Cubrimos la actualidad de la IA con criterio propio —tecnología, empresas y sociedad— de forma clara para el público no técnico. Cada artículo se elabora con la asistencia tecnológica de Iberia y se revisa antes de publicarse. Más sobre cómo trabajamos →