Publicado hace 3 meses

DeepSeek, la Inteligencia Artificial china que desafía a ChatGPT y conmociona al mundo tecnológico

Un modelo chino de inteligencia artificial sorprendentemente eficiente y poderoso ha irrumpido en el sector tecnológico. Se llama DeepSeek R1 y está inquietando a Wall Street.

El nuevo modelo de IA fue desarrollado por DeepSeek, una empresa emergente que nació hace apenas un año y que de alguna manera ha logrado un avance que el famoso inversor en tecnología Marc Andreessen ha llamado “el momento Sputnik de la IA”: R1 puede igualar casi las capacidades de sus rivales mucho más famosos, como GPT-4 de OpenAI, Llama de Meta y Gemini de Google, pero a una fracción del costo.

La empresa dijo que había gastado solo US$ 5,6 millones en impulsar su modelo básico de IA, en comparación con los cientos de millones, si no miles de millones de dólares, que las empresas estadounidenses gastan en sus tecnologías de inteligencia artificial.

Esto resulta aún más impactante si se tiene en cuenta que Estados Unidos ha trabajado durante años para restringir el suministro de chips de IA de alta potencia a China, alegando preocupaciones de seguridad nacional. Eso significa que DeepSeek supuestamente fue capaz de lograr su modelo de bajo costo en chips de IA relativamente poco potentes.

¿Qué es DeepSeek?
La empresa, fundada a finales de 2023 por el gestor de fondos de cobertura chino Liang Wenfeng, es una de las muchas empresas emergentes que han surgido en los últimos años en busca de grandes inversiones para subirse a la ola masiva de IA que ha llevado a la industria tecnológica a nuevas alturas.

Liang se ha convertido en el Sam Altman de China, un evangelista de la tecnología de IA y la inversión en nuevas investigaciones. Su fondo de cobertura, High-Flyer, se enfoca en el desarrollo de la inteligencia artificial.

Al igual que otras empresas emergentes de IA, como Anthropic y Perplexity, DeepSeek lanzó varios modelos de IA competitivos durante el año pasado que han captado cierta atención del sector. Con su modelo V3, la empresa ha ganado algo de notoriedad, aunque sus restricciones de contenido en torno a temas delicados sobre el gobierno chino y su liderazgo han suscitado dudas sobre su viabilidad como competidor en la industria, según informó el diario The Wall Street Journal.

Pero el modelo R1, que pareció surgir de la nada cuando se reveló a finales del año pasado, se lanzó la semana pasada y ganó una atención significativa esta semana cuando la compañía reveló al diario The Wall Street Journal su costo de operación sorprendentemente bajo. Y es de código abierto, lo que significa que otras empresas pueden probar y construir sobre el modelo para mejorarlo.

La aplicación DeepSeek ha subido en las listas de la App Store, superando a ChatGPT el lunes, y se ha descargado casi 2 millones de veces.

¿Por qué es tan importante DeepSeek?
La IA es una tecnología que consume mucha energía y tiene un alto costo, tanto que los líderes tecnológicos más poderosos de Estados Unidos están comprando empresas de energía nuclear para proporcionar la electricidad necesaria para sus modelos de IA.

La semana pasada, Meta dijo que gastaría más de US$ 65.000 millones este año en el desarrollo de IA. Sam Altman, CEO de OpenAI, dijo el año pasado que la industria de la IA necesitaría billones de dólares en inversión para apoyar el desarrollo de los chips de alta demanda necesarios para alimentar los centros de datos que consumen mucha electricidad y que ejecutan los complejos modelos del sector.

Así que la idea de que se puedan lograr capacidades similares a las de los modelos de IA más potentes de Estados Unidos por una fracción tan pequeña del costo —y en chips menos capaces— representa un cambio radical en la comprensión de la industria sobre cuánta inversión se necesita en IA.

La tecnología tiene muchos escépticos y opositores, pero sus defensores prometen un futuro brillante: la IA hará avanzar la economía mundial hacia una nueva era, argumentan, haciendo el trabajo más eficiente y abriendo nuevas capacidades en múltiples industrias que allanarán el camino para nuevas investigaciones y desarrollos.

Andreessen, partidario de Trump y cofundador de la empresa de capital riesgo de Silicon Valley Andreessen Horowitz, calificó a DeepSeek como “uno de los avances más asombrosos e impresionantes que he visto en mi vida”, en una publicación en X.

Si ese poder potencialmente capaz de cambiar el mundo puede lograrse a un costo significativamente reducido, se abren nuevas posibilidades y amenazas para el planeta.

¿Qué significa esto para Estados Unidos?
Estados Unidos pensó que podría imponer su dominio en una tecnología clave que cree que ayudará a reforzar su seguridad nacional.

Apenas una semana antes de dejar el cargo, el expresidente Joe Biden duplicó las restricciones a la exportación de chips de computadora con IA para evitar que rivales como China accedan a la tecnología avanzada.

Pero DeepSeek ha puesto en duda esa idea y ha amenazado el aura de invencibilidad que rodea a la industria tecnológica estadounidense. Puede que Estados Unidos se haya ganado algo de tiempo con las restricciones a la exportación de chips, pero su ventaja en IA se ha reducido drásticamente a pesar de esas medidas.

DeepSeek puede demostrar que bloquear el acceso a una tecnología clave no significa necesariamente que Estados Unidos vaya a ganar. Ese es un mensaje importante para el presidente Donald Trump y su política aislacionista de “Estados Unidos primero”.

Wall Street se alarmó por el desarrollo. Las acciones estadounidenses estaban preparadas para una fuerte venta masiva el lunes por la mañana. Nvidia, el principal proveedor de chips de IA, cuyas acciones se duplicaron con creces en cada uno de los dos últimos años, cayó un 12 % en las operaciones previas a la comercialización. Meta y Alphabet, la empresa matriz de Google, también cayeron bruscamente, al igual que Marvell, Broadcom, Palantir, Oracle y muchos otros gigantes tecnológicos.

¿Estamos realmente seguros de que esto es importante?
La industria está tomando la palabra de la empresa de que el costo fue tan bajo. Nadie lo discute realmente, pero el pánico del mercado depende de la veracidad de una sola empresa relativamente desconocida. En particular, la empresa no dijo cuánto costó entrenar a su modelo, dejando de lado los costos de investigación y desarrollo, potencialmente caros. (Aun así, probablemente no gastó miles de millones de dólares).

También es demasiado pronto para hacer de lado la innovación y el liderazgo tecnológico estadounidense. Un logro, aunque asombroso, puede no ser suficiente para contrarrestar años de progreso en el liderazgo estadounidense en inteligencia artificial. Y es poco probable que los clientes se pasen en masa a una empresa emergente china.

“El lanzamiento del modelo DeepSeek está llevando a los inversores a cuestionar el liderazgo que tienen las empresas estadounidenses y cuánto se está gastando y si ese gasto generará beneficios (o un gasto excesivo)”, dijo Keith Lerner, analista de Truist. “En última instancia, nuestra opinión es que el gasto necesario en datos y similares en IA será significativo, y las empresas estadounidenses seguirán siendo líderes”.

Aunque el ahorro de costos puede ser significativo, el modelo R1 es un competidor de ChatGPT, un modelo de lenguaje amplio centrado en el consumidor. Aún no ha demostrado que pueda manejar algunas de las capacidades de IA ambiciosas para industrias que, por ahora, aún requieren enormes inversiones en infraestructura.

“Gracias a su gran talento y su base de capital, Estados Unidos sigue siendo el ‘terreno de juego’ más prometedor desde el que esperamos ver el surgimiento de la primera IA que se mejore a sí misma”, dijo Giuseppe Sette, presidente de la empresa de investigación de mercado de IA Reflexivity.

Más Noticias

24 de enero de 2022

DeepSeek, la Inteligencia Artificial china que desafía a ChatGPT y conmociona al mundo tecnológico

Según un estudio, 1 de cada 8 personas tendrá bitcoin y criptomonedas este año

Cómo es la innovadora tecnología que desarrolla el INTI en Mendoza para deshidratar alimentos

Con tecnología, mejoran el balizamiento del Puerto La Plata de la mano de la UNLP

Se viene el 4º Congreso Internacional de Industria 4.0