IA cara de usar: trabajadores tech frenan el gasto en modelos

Las empresas tecnológicas que apostaron por la inteligencia artificial como herramienta de productividad universal se enfrentan ahora a una realidad incómoda: el coste operativo de usar IA de forma masiva supera con frecuencia el valor que genera. El New York Times, en un reportaje firmado por el periodista Eli Tan, documenta cómo equipos técnicos de compañías del sector están revisando activamente su consumo de modelos de lenguaje para contener el gasto.

Diez búsquedas de Google por cada pregunta a ChatGPT

La comparación es elocuente: un solo prompt enviado a ChatGPT consume recursos computacionales equivalentes a diez búsquedas convencionales en Google. No es un dato menor si se multiplica por los millones de consultas diarias que procesan las empresas que han integrado estas herramientas en sus flujos de trabajo internos.

El modelo de negocio de la IA generativa se construyó sobre la promesa de eficiencia. Automatizar tareas, reducir horas de trabajo, acelerar procesos. Lo que no se comunicó con la misma claridad es que cada llamada a la API de un modelo tiene un coste real, y que ese coste se acumula con rapidez cuando la adopción es horizontal, es decir, cuando toda la organización usa la herramienta para todo.

El resultado es predecible en retrospectiva: facturas mensuales que no estaban en los presupuestos iniciales, y equipos de ingeniería que ahora dedican tiempo a auditar qué usos del modelo realmente justifican su precio.

El coste ambiental que no aparece en la factura de AWS

Más allá del gasto económico, el reportaje de Eli Tan en el New York Times pone cifras al impacto ambiental. Entrenar un modelo de inteligencia artificial genera una huella de carbono equivalente a la de 300 vuelos de ida y vuelta entre Nueva York y San Francisco. Es una comparación diseñada para hacer tangible lo que de otro modo permanece invisible en los centros de datos.

Este dato no es nuevo en la literatura técnica, pero su aparición en medios generalistas señala un cambio en la conversación pública. La sostenibilidad energética de la IA ha dejado de ser un argumento marginal de activistas tecnológicos para convertirse en una variable que los departamentos de finanzas y sostenibilidad corporativa empiezan a incluir en sus informes.

Las grandes infraestructuras de nube, como las de Amazon Web Services, Microsoft Azure o Google Cloud, alimentan los modelos que consumen estas empresas. Cada inferencia, cada generación de texto o imagen, tiene un consumo eléctrico real que se traduce en emisiones, aunque el usuario final no lo vea en su interfaz.

De “úsalo para todo” a “¿vale lo que cuesta aquí?”

La pregunta que define esta nueva fase del sector no es tecnológica, sino económica. Durante los primeros dos años tras el lanzamiento de ChatGPT en noviembre de 2022, la presión dentro de las empresas tech fue en una dirección: integrar IA en todos los procesos posibles. Los equipos que no lo hacían quedaban expuestos a la acusación de ser lentos o conservadores.

Ese impulso generó una adopción rápida pero poco selectiva. Herramientas de IA para redactar correos, resumir reuniones, generar código, analizar datos, responder tickets de soporte. Algunas de estas aplicaciones demostraron un retorno claro. Otras, no tanto.

Ahora el ciclo se invierte. Los responsables de tecnología y operaciones están haciendo una pregunta que debería haberse hecho antes: ¿cuánto cuesta exactamente este proceso automatizado con IA, y cuánto costaba hacerlo sin ella? En muchos casos, la respuesta sorprende negativamente.

El ecosistema nórdico y europeo como laboratorio de contención

El reportaje de Eli Tan señala que el cambio de comportamiento es especialmente visible en los ecosistemas tecnológicos de Europa y los países nórdicos. Estas regiones, con una cultura empresarial más orientada a la eficiencia de recursos y con marcos regulatorios más exigentes, están adoptando un enfoque diferente: menos herramientas de IA, pero mejor seleccionadas.

La Unión Europea, con el Reglamento de Inteligencia Artificial aprobado en 2024, ha establecido un entorno normativo que obliga a las empresas a documentar y justificar sus usos de IA de alto riesgo. Eso crea un incentivo indirecto para la selectividad: si tienes que justificar cada implementación ante un auditor, tiendes a elegir con más cuidado.

Suecia, Finlandia y Dinamarca cuentan además con sectores tecnológicos consolidados y con una tradición de ingeniería de software que valora la elegancia técnica sobre la acumulación de funcionalidades. El resultado es una adopción más deliberada, que ahora el resto del sector observa con interés renovado.

Modelos más pequeños, inferencia más barata: la respuesta técnica

La industria no se queda quieta ante el problema del coste. La respuesta técnica más clara es el desarrollo de modelos más pequeños y eficientes, diseñados para tareas específicas en lugar de para responder a cualquier pregunta posible.

OpenAI, la empresa fundada en San Francisco en 2015 que desarrolla ChatGPT, ha lanzado versiones reducidas de sus modelos, como GPT-4o mini, precisamente para ofrecer una alternativa más económica en casos de uso donde la potencia máxima no es necesaria. Anthropic, fundada en 2021 por antiguos empleados de OpenAI, ha seguido una estrategia similar con su familia de modelos Claude, ofreciendo versiones ligeras para tareas de menor complejidad.

Google DeepMind, por su parte, ha apostado por la familia Gemini con distintos niveles de capacidad y coste. La lógica es la misma: no todos los problemas necesitan el modelo más caro, y ofrecer opciones más baratas retiene a los clientes que de otro modo abandonarían la plataforma por motivos económicos.

El caso concreto: un equipo de soporte técnico y su factura mensual

Un escenario representativo de lo que documenta el reportaje de Eli Tan es el de un equipo de soporte técnico que integra un modelo de lenguaje para responder automáticamente a las consultas de los usuarios. En teoría, la herramienta reduce la carga de trabajo de los agentes humanos y acelera los tiempos de respuesta.

En la práctica, si el modelo recibe miles de consultas diarias, muchas de ellas repetitivas y de baja complejidad, el coste por llamada a la API se multiplica rápidamente. Un equipo que procesa 50.000 consultas mensuales con un modelo de gama alta puede generar una factura que supera con creces el coste de contratar a dos agentes humanos adicionales.

La solución que están adoptando varios equipos es la segmentación: usar modelos pequeños y baratos para las consultas simples, y reservar los modelos más potentes para los casos complejos que realmente los requieren. Es eficiencia aplicada, no rechazo de la tecnología.

Gasto en IA y rentabilidad: la tensión que define 2025 en el sector

El debate sobre el retorno de la inversión en inteligencia artificial domina las conversaciones en los consejos de administración de las empresas tecnológicas en 2025. Durante 2023 y 2024, la presión de los mercados financieros premiaba a las compañías que anunciaban integraciones de IA, independientemente de si esas integraciones generaban beneficios reales.

Ese ciclo está madurando. Los inversores empiezan a pedir métricas concretas: cuánto ahorra la IA, cuánto cuesta, cuál es el margen neto de la automatización. Las respuestas no siempre son favorables, y eso está cambiando los incentivos internos de las organizaciones.

El resultado más probable no es un retroceso en la adopción de IA, sino una concentración del gasto en los casos de uso con retorno demostrado. Menos experimentos difusos, más implementaciones con objetivos medibles.

OpenAI, Anthropic y Google DeepMind ante el ajuste del mercado

Para los grandes proveedores de modelos, esta tendencia plantea un reto estratégico. Si sus clientes corporativos reducen el consumo y migran hacia modelos más baratos o hacia soluciones de código abierto como Llama, de Meta, sus ingresos por inferencia se resienten.

OpenAI, que según datos publicados en medios especializados superó los 3.400 millones de dólares en ingresos anualizados a finales de 2024, depende en gran medida de que sus clientes empresariales mantengan o incrementen su consumo. Una racionalización generalizada del gasto en IA afectaría directamente a su trayectoria financiera en un momento en que la compañía aún no ha alcanzado la rentabilidad.

La respuesta del sector pasa probablemente por tres vías: reducir los precios de inferencia, mejorar la eficiencia de los modelos para que hagan más con menos recursos, y demostrar casos de uso con retorno económico verificable. Quien resuelva primero esa ecuación ganará la siguiente fase de la competencia.

Quiénes están detrás

Si eres responsable de tecnología en tu empresa, la pregunta que el sector te está trasladando es directa: revisa qué modelos usas, para qué tareas y cuánto te cuestan realmente. La IA no va a desaparecer de tu flujo de trabajo, pero la era de usarla sin medir su coste ya terminó.

Imagen ilustrativa generada con inteligencia artificial.

Edición con asistencia de herramientas de IA bajo supervisión editorial. Cómo trabajamos.

Fermín Sánchez

Fermín Sánchez es el responsable editorial de LaPrensaIA, diario de divulgación sobre inteligencia artificial. Cubrimos la actualidad de la IA con criterio propio —tecnología, empresas y sociedad— de forma clara para el público no técnico. Cada artículo se elabora con la asistencia tecnológica de Iberia y se revisa antes de publicarse. Más sobre cómo trabajamos →