El modelo de IA sorprendentemente asequible de Deepseek desafía a los gigantes de la industria. Si bien cuenta con solo un costo previo a la capacitación de $ 6 millones para su modelo V3 Deepseek, un aspecto más cercano revela una inversión mucho más sustancial.
Imagen: Ensigame.com
Deepseek V3 aprovecha tecnologías innovadoras: Predicción de token múltiple (MTP) para una mayor precisión y eficiencia; Mezcla de expertos (MOE) , utilizando 256 redes neuronales (ocho activadas por token); y Atención latente de múltiples cabezas (MLA) para mejorar la extracción de información. Estos avances contribuyen a su rendimiento competitivo.
Imagen: Ensigame.com
Sin embargo, el semianálisis expuso el uso de Deepseek de aproximadamente 50,000 GPU Nvidia Hopper, una inversión significativa por un total de aproximadamente $ 1.6 mil millones en servidores y $ 944 millones en costos operativos. Esto contradice el reclamo inicial de $ 6 millones, que solo refleja los gastos de GPU previos al entrenamiento. El verdadero costo abarca investigación, refinamiento, procesamiento de datos e infraestructura.
Imagen: Ensigame.com
La estructura única de Deepseek, como subsidiaria del fondo de cobertura de alto flyer, permite la agilidad y la rápida innovación. Poseer sus centros de datos proporciona un control total sobre la optimización. Su sustancial inversión en talento, con algunos investigadores ganando más de $ 1.3 millones anuales, subraya aún más su compromiso.
Imagen: Ensigame.com
Si bien la narrativa "económica" de Deepseek está posiblemente inflada, su éxito destaca el potencial de las compañías de IA independientes bien financiadas. La inversión total superior a $ 500 millones, combinada con avances técnicos y un equipo fuerte, es el verdadero impulsor de su éxito. El contraste con los costos de los competidores, como el costo de capacitación de $ 100 millones de ChatGPT4 versus los $ 5 millones de Deepseek para R1, sigue siendo marcado. En última instancia, la historia de Deepseek demuestra que si bien la inversión significativa es una gestión y innovación de recursos eficientes cruciales, aún puede producir resultados competitivos.