
Me ocuparé de DeepSeek en un momento, pero primero quiero hacer algunos anuncios.
La Conferencia del Inversor Intelectual
La Conferencia del Inversor Intelectual (anteriormente conocida como VALUEx Vail) se celebrará del 11 al 13 de junio en Vail. Lo único que ha cambiado es el nombre. Sigue siendo un evento sin ánimo de lucro para compartir conocimientos con un máximo de 40 asistentes, diseñado para que los inversores en valor se reúnan en la maravillosa Vail e intercambien ideas. Puede solicitar su participación y ver presentaciones anteriores en
https://conference.investor.fm/
IMA busca un ingeniero de IA
IMA busca incorporar a nuestro equipo a un experto en IA. No estamos 100 % seguros de las habilidades exactas que buscamos, pero idealmente queremos a alguien con una sólida formación en ingeniería/IA que también tenga una leve obsesión por la inversión en valor (no es necesario que sea un experto en inversiones). Si conoces a alguien que esté interesado, reenvíale este enlace.
DeepSeek rompe el paradigma de la IA
He recibido correos electrónicos de lectores que me preguntan qué pienso de DeepSeek. Tengo que empezar con dos advertencias. La primera, la de siempre: soy un inversor de valor generalista, no un especialista en tecnología (la semana pasada estuve analizando un banco y una petrolera), así que mi conocimiento de los modelos de IA es superficial. La segunda, y más inusual, es que aún no tenemos todos los datos.
Pero esta historia podría representar un cambio radical tanto en la IA como en la geopolítica. Esto es lo que sabemos:
DeepSeek, una empresa emergente china de un año de antigüedad que surgió de un fondo de inversión libre, ha creado un modelo de lenguaje extenso (LLM) totalmente funcional que funciona a la par que los últimos modelos de IA. Esta parte de la historia ha sido verificada por la industria: DeepSeek ha sido probado y comparado con otros modelos de lenguaje grandes (LLM) de primer nivel. Yo mismo he estado jugando con DeepSeek durante los últimos días, y los resultados que arrojó fueron muy similares a los producidos por ChatGPT y Perplexity, solo que más rápidos.
Esto por sí solo es impresionante, especialmente teniendo en cuenta que hace solo seis meses, Eric Schmidt (exdirector general de Google, y ciertamente no un generalista) sugirió que China estaba dos o tres años por detrás de Estados Unidos en IA.
Pero aquí está la parte realmente impactante, y sin verificar: DeepSeek afirma que entrenaron su modelo por solo 5,6 millones de dólares, mientras que sus homólogos estadounidenses han gastado, según se informa, cientos de millones o incluso miles de millones de dólares. Eso es de 20 a 200 veces menos.
Las implicaciones, si son ciertas, son asombrosas. A pesar de los controles de exportación del gobierno de EE. UU. sobre los chips de IA a China, DeepSeek supuestamente entrenó su LLM en chips de generaciones anteriores, utilizando una pequeña fracción de la potencia informática y la electricidad que tienen sus competidores occidentales. Mientras todo el mundo asumía que el futuro de la IA estaba en chips más rápidos y mejores, donde la única opción real es Nvidia o Nvidia, esta empresa hasta ahora desconocida ha logrado casi la paridad con sus homólogos estadounidenses nadando en dinero y centros de datos llenos de los últimos chips de Nvidia. DeepSeek (supuestamente) tenía enormes limitaciones informáticas y, por lo tanto, tuvo que utilizar una lógica diferente, volviéndose más eficiente con un hardware deficiente para lograr un resultado similar. En otras palabras, esta empresa emergente, en su búsqueda por crear un mejor «cerebro» de IA, utilizó cerebros donde todos los demás se centraban en la fuerza bruta: literalmente enseñó a la IA a razonar.
Participa en el concurso de perritos calientes
A los estadounidenses les encanta la comida basura y los deportes, así que permítanme explicarlo con una analogía entre la comida y el deporte. El Concurso Internacional de Comida de Perros Calientes de Nathan's Famous afirma que su origen data de 1916 (aunque esto podría ser en parte una leyenda). En la década de 1970, cuando comenzaron los registros oficiales, los competidores ganadores comían una media de unos 15 perros calientes. Esto aumentó gradualmente hasta unos 25, hasta que Takeru Kobayashi llegó de Japón en 2001 y rompió el paradigma al consumir 50 perritos calientes, algo que se consideraba imposible. Su secreto no era un apetito prodigioso, sino su metodología única; separó los perritos calientes de los panecillos y los mojó en agua, reinventando por completo el enfoque.
Unos años más tarde llegó Joey Chestnut, que se basó en la innovación de Kobayashi para superar el récord de 70 perritos calientes y llegar hasta los 83. Una vez que Kobayashi rompió el paradigma, los límites percibidos se desvanecieron, obligando a todos a replantearse sus métodos. Joey Chestnut aprovechó la oportunidad.
DeepSeek puede ser el Kobayashi de la IA, impulsando a toda la industria a una era de innovación al estilo de Joey Chestnut. Si las afirmaciones sobre el uso de chips más antiguos y el gasto drásticamente menor son precisas, podríamos ver a las empresas de IA alejarse de la búsqueda obstinada de una mayor capacidad de cálculo y orientarse hacia un mejor diseño de modelos.
Nunca pensé que estaría citando a los estoicos para explicar la futura demanda de chips GPU, pero Epicteto dijo: «La felicidad no viene de querer más, sino de querer lo que tienes». Hace dos milenios, ciertamente no estaba hablando de GPU, pero bien podría haberlo hecho. ChatGPT, Perplexity y Gemini de Google tendrán que replantearse su ansia de más capacidad de computación y ver si pueden conseguir más con querer (usar) lo que tienen.
Si no lo hacen, serán devorados por cientos de nuevas empresas emergentes, corporaciones y probablemente gobiernos que entren en el espacio. Cuando empiezas a escribir miles de millones con una «M», reduces drásticamente las barreras de entrada.
Hasta la llegada de DeepSeek, se suponía que la IA estaba al alcance de unas pocas empresas extremadamente bien financiadas (las «Magníficas») y equipadas con los últimos chips de Nvidia. Puede que DeepSeek también haya roto ese paradigma.
El enigma de Nvidia
El impacto en Nvidia no está claro. Por un lado, el éxito de DeepSeek podría disminuir la demanda de sus chips y hacer que sus márgenes vuelvan a la tierra, ya que las empresas se dan cuenta de que un futuro más brillante para la IA podría no consistir simplemente en conectar más procesadores Nvidia, sino en hacer que los modelos funcionen de forma más eficiente. DeepSeek puede haber reducido la urgencia de construir más centros de datos y, por lo tanto, haber reducido la demanda de chips Nvidia.
Por otro lado (estoy siendo un economista con dos brazos aquí), la reducción de las barreras de entrada dará lugar a más participantes y a una mayor demanda global de GPU. Además, DeepSeek afirma que, debido a que su modelo es más eficiente, el coste de la inferencia (ejecución del modelo) es una fracción del coste de ejecutar ChatGPT y requiere mucha menos memoria, lo que podría acelerar la adopción de la IA y, por tanto, impulsar una mayor demanda de GPU. Así que esto podría ser una buena noticia para Nvidia, dependiendo de cómo se resuelva.
Mi opinión sobre Nvidia no ha cambiado sustancialmente: es solo cuestión de tiempo que Meta, Google, Tesla, Microsoft y un montón de startups mercantilicen las GPU y bajen los precios.
Del mismo modo, una mayor competencia significa que es probable que los propios LLM se conviertan en productos básicos (eso es lo que hace la competencia) y la valoración de ChatGPT podría ser una víctima obvia.
Ondas de choque geopolíticas
Las consecuencias geopolíticas son enormes. Los controles de exportación pueden haber estimulado inadvertidamente la innovación, y es posible que no sean tan eficaces en el futuro. Puede que EE. UU. no tenga el control de la IA que muchos creían que tenía, y los países a los que no les caemos muy bien tendrán su propia IA.
Nos hemos consolado durante mucho tiempo, después de deslocalizar la fabricación a China, diciendo que somos la cuna de la innovación, pero la IA podría inclinar la balanza en una dirección que no nos favorece.
Permítanme ponerles un ejemplo. En una entrevista concedida recientemente al Wall Street Journal, el jefe de producto de OpenAI reveló que varias versiones de ChatGPT participaron en concursos de programación de forma anónima. De los aproximadamente 28 millones de programadores de todo el mundo, estos primeros modelos se situaron entre el 2 y el 3 % de los mejores. ChatGPT-o1 (el último lanzamiento público) se situó entre los 1000 primeros, y ChatGPT-o3 (que saldrá en unos meses) está entre los 175 primeros. ¡Eso es el 0,000625 % de los mejores! Si fuera un compositor, ChatGPT-o3 sería Mozart.
He oído que un gran desarrollador es 10 veces más valioso que uno bueno, tal vez incluso 100 veces más valioso que uno promedio. Mi objetivo es estar más o menos en lo cierto. Un joven de 19 años en Bangalore o Iowa que descubrió la programación hace unos meses ahora puede codificar como Mozart usando el último ChatGPT. Imagínese a todos los jóvenes, después de unos pocos videos de YouTube, codificando a este nivel. La brecha de conocimientos y experiencia se está reduciendo rápidamente.
Soy muy consciente de que estoy generalizando drásticamente (no puedo insistir lo suficiente en esto), pero la cuestión es que el camino desde aprender a programar hasta convertirse en el «Mozart de la programación» se ha reducido de décadas a meses, y el número de Mozarts ha crecido exponencialmente. Si tuviera empresas de software, me pondría un poco más nervioso: el foso de muchas de ellas se ha llenado de IA.
Adaptarse, cambiar de opinión y mantener las ideas como tesis que deben validarse o invalidarse, no como parte de su identidad, son increíblemente importantes en la inversión (y en la vida en general). Se vuelven aún más cruciales en la era de la IA, ya que nos encontramos entrando en una realidad de ciencia ficción más rápido de lo que jamás imaginamos. DeepSeek puede ser ese catalizador, obligando a inversores y tecnólogos por igual a cuestionar suposiciones de larga data y reevaluar el panorama competitivo en tiempo real.
Artículo disponible en inglés aquí.
Vitaliy Katsenelson es el director ejecutivo de IMA, una firma de inversión de valor ubicada en Denver, Estados Unidos. Ha escrito dos libros sobre inversiones, que fueron publicados por John Wiley & Sons y que se han traducido a ocho idiomas. Soul in the Game: The Art of a Meaningful Life (Harriman House, 2022) es su primer libro que no trata solo de inversiones. Puedes obtener capítulos bonus inéditos enviando tu recibo de compra a bonus@soulinthegame.net.