Andrej Karpathy ficha por Anthropic: qué significa para Claude

Andrej Karpathy abandona su etapa independiente para sumarse a Anthropic como especialista en preentrenamiento, el proceso que determina qué sabe un modelo de lenguaje antes de llegar al usuario. El movimiento reordena el tablero entre los grandes laboratorios de inteligencia artificial en un momento de competencia técnica sin tregua.

El hombre que ayudó a construir lo que ahora compite contra él

Andrej Karpathy es cofundador de OpenAI, la empresa que creó ChatGPT y que hoy lidera el mercado de asistentes de inteligencia artificial. Después de esa etapa fundacional, Tesla lo contrató para dirigir su división de IA, donde lideró el desarrollo del sistema de conducción autónoma Autopilot.

Su trayectoria lo convierte en uno de los ingenieros con mayor capital técnico y reputacional del sector. No es un ejecutivo de gestión: es alguien que ha diseñado sistemas de aprendizaje automático desde los cimientos, con experiencia directa en dos de las organizaciones más influyentes del campo.

Ahora ese perfil aterriza en Anthropic, la empresa fundada por Dario Amodei y Daniela Amodei, exdirectivos de OpenAI que dejaron esa compañía en 2021 para construir un laboratorio con un enfoque distinto en seguridad y alineación de modelos.

Qué es el preentrenamiento y por qué es el núcleo de todo

El preentrenamiento es la fase en la que un modelo de lenguaje aprende a partir de cantidades masivas de texto. Es el proceso que determina el vocabulario, la capacidad de razonamiento, el conocimiento del mundo y los límites de lo que el modelo puede hacer. Todo lo que viene después, el ajuste fino, la alineación con instrucciones humanas, depende de la calidad de esta base.

Karpathy trabajará específicamente en esta fase para los modelos de Claude, la familia de asistentes de Anthropic. Eso significa que su influencia no será superficial ni de imagen: estará en el lugar donde se toman las decisiones técnicas que más peso tienen sobre el comportamiento final del modelo.

En el sector, el preentrenamiento es también el proceso más costoso y más difícil de escalar. Requiere decisiones sobre arquitectura, datos de entrenamiento, hiperparámetros y eficiencia computacional que definen la competitividad del modelo durante años.

El juicio entre Musk y Altman como telón de fondo

El nombre de Karpathy no ha estado ausente de la conversación pública en las últimas semanas. Según el contenido original de esta noticia, su nombre salió a relucir varias veces durante el juicio entre Elon Musk y Sam Altman, que concluyó el lunes anterior al anuncio de su incorporación a Anthropic.

Ese litigio enfrentó a dos de los fundadores originales de OpenAI en una disputa sobre el rumbo de la organización y su transformación de entidad sin ánimo de lucro a empresa con fines comerciales. Karpathy, como cofundador, era una figura relevante en ese relato histórico.

Su fichaje por Anthropic llega, por tanto, en un momento de máxima visibilidad pública para él y para el ecosistema de laboratorios de IA de primera línea. El calendario no parece casual.

Lo que gana Anthropic en términos técnicos y simbólicos

Anthropic ha construido su reputación sobre dos pilares: la calidad técnica de Claude y un discurso diferenciador en torno a la seguridad de la IA. Sus modelos han ganado terreno en el mercado empresarial, especialmente en sectores como el legal, el médico y el de desarrollo de software.

Incorporar a Karpathy refuerza ambos pilares. En lo técnico, suma a alguien con experiencia directa en preentrenamiento a escala, algo que muy pocos ingenieros en el mundo pueden acreditar con proyectos reales de esa envergadura. En lo simbólico, es un mensaje claro al mercado: Anthropic compite por el mejor talento disponible, no solo por financiación.

La competencia con OpenAI, Google DeepMind y Meta AI se libra cada vez más en este terreno, el del talento senior con capacidad de tomar decisiones arquitectónicas. Un ingeniero de ese nivel no replica lo que ya existe: define qué viene después.

El patrón de movilidad del talento en los laboratorios de élite

El movimiento de Karpathy forma parte de una tendencia estructural en el sector. Los ingenieros que estuvieron en los orígenes de OpenAI se han dispersado por el ecosistema y han fundado o reforzado varios de los laboratorios más relevantes del momento.

Los propios Amodei, que dirigen Anthropic, son el ejemplo más conocido. Ilya Sutskever, otro cofundador de OpenAI, abandonó la empresa en 2024 para fundar Safe Superintelligence. John Schulman, uno de los creadores de ChatGPT, también dejó OpenAI ese mismo año para incorporarse a Anthropic, aunque posteriormente anunció su salida para centrarse en investigación independiente.

La fuente original de esta noticia no ofrece cifras sobre compensación económica ni sobre el tamaño del equipo al que se incorpora Karpathy en Anthropic. Tampoco hay datos sobre inversión adicional vinculada a este fichaje. Lo que sí está documentado es el patrón: el talento fundacional de OpenAI está redistribuyéndose por el sector, y Anthropic ha sido uno de los principales destinos.

Por qué este movimiento importa más allá del nombre

El mercado de modelos de lenguaje avanzados está en una fase en la que las diferencias entre los productos líderes son cada vez más pequeñas y más difíciles de comunicar al usuario final. Claude, GPT-4o, Gemini y Llama compiten en benchmarks técnicos con resultados que varían según la tarea evaluada.

En ese contexto, las decisiones de preentrenamiento son las que pueden generar ventajas duraderas. No se trata de añadir una función nueva o de mejorar la interfaz: se trata de construir una base más sólida que se traduzca en mejor razonamiento, menos alucinaciones y mayor fiabilidad en tareas complejas.

Karpathy lleva años investigando y divulgando sobre estos fundamentos. Su canal de YouTube, con millones de seguidores, ha explicado a una generación de ingenieros cómo funcionan las redes neuronales desde dentro. Eso también es capital: sabe cómo construir equipos que entiendan lo que están haciendo.

Lo que está en juego para ti

Si usas Claude en tu trabajo, ya sea como herramienta de escritura, de análisis de documentos o integrado en algún flujo de desarrollo de software, el impacto de este fichaje no lo verás mañana. El preentrenamiento tarda meses en completarse y los resultados se materializan en versiones futuras del modelo.

Pero la dirección es relevante. Anthropic está apostando por reforzar la capa más profunda de su tecnología en un momento en que la competencia entre laboratorios se mide en fracciones de rendimiento. Cuando los mejores ingenieros del mundo se mueven, los modelos que usas cambian de velocidad de mejora.

La pregunta que queda abierta es si un solo fichaje, por brillante que sea el perfil, puede inclinar una carrera tecnológica que se libra con miles de ingenieros, miles de millones en infraestructura y decisiones estratégicas que van mucho más allá de una persona. ¿Cambia realmente la calidad de los modelos que usas cuando se mueve alguien como Karpathy, o el resultado depende de variables que ningún individuo controla del todo?

Imagen ilustrativa generada con inteligencia artificial.

Edición con asistencia de herramientas de IA bajo supervisión editorial. Cómo trabajamos.

Fermín Sánchez

Fermín Sánchez es el responsable editorial de LaPrensaIA, diario de divulgación sobre inteligencia artificial. Cubrimos la actualidad de la IA con criterio propio —tecnología, empresas y sociedad— de forma clara para el público no técnico. Cada artículo se elabora con la asistencia tecnológica de Iberia y se revisa antes de publicarse. Más sobre cómo trabajamos →