La startup china DeepSeek ha desarrollado un modelo de inteligencia artificial, DeepSeek-R1, que compite directamente con los sistemas más avanzados de OpenAI en tareas de razonamiento complejo, como la resolución de problemas matemáticos, químicos y de programación. Según un estudio publicado en la revista Nature, este algoritmo alcanza una precisión del 97% en pruebas de matemáticas y supera al 96% de los humanos en desafíos de codificación, posicionándose como una alternativa más económica y accesible frente a soluciones como OpenAI o1.
DeepSeek-R1 utiliza “cadenas de pensamiento” que imitan el razonamiento humano, entrenadas mediante técnicas de aprendizaje de refuerzo. Además, emplea una arquitectura de “mezcla de expertos”, que le permite seleccionar las redes de procesamiento adecuadas para cada tarea. Este enfoque ha reducido drásticamente los costos de entrenamiento a aproximadamente 6 millones de dólares, una fracción de los más de 60 millones que Meta invirtió en su modelo Llama 3.1. Como resultado, el acceso a DeepSeek-R1 es significativamente más económico, costando una trigésima parte que OpenAI o1.
Mario Krenn, del Instituto Max Planck, destaca que este ahorro podría impulsar la adopción del modelo chino: “Un experimento que costaba más de 300 libras con OpenAI o1, ahora puede realizarse por menos de 10 dólares”. DeepSeek-R1 se distribuye bajo una licencia “open-weight”, lo que permite a los investigadores acceder a sus procesos de razonamiento y reutilizarlo sin restricciones, aunque sus datos de entrenamiento no están disponibles.
El desarrollo de DeepSeek-R1 es aún más notable considerando las tensiones tecnológicas entre China y Estados Unidos. A pesar de los controles de exportación impuestos por EE.UU. para limitar el acceso a chips y modelos de IA, China ha demostrado que la eficiencia en el uso de recursos puede superar las limitaciones de escala. François Chollet, creador de Keras, resalta que este logro subraya la importancia de la innovación sobre la capacidad de cómputo.
Alvin Wang Graylin, de HTC, advierte que la ventaja tecnológica de EE.UU. se está reduciendo y sugiere que ambos países deberían colaborar en lugar de competir en una “carrera armamentista” de IA. DeepSeek-R1 no solo representa un avance técnico, sino también un llamado a la cooperación global en el desarrollo de inteligencia artificial.