Il modello AI sorprendentemente conveniente di Deepseek sfida i giganti del settore. Pur vantando un costo di pre-allenamento di soli 6 milioni di dollari per il suo modello DeepSeek V3, uno sguardo più attento rivela un investimento molto più sostanziale.
Immagine: Ensigame.com
DeepSeek V3 sfrutta le tecnologie innovative: Previsione multi-token (MTP) per una maggiore precisione ed efficienza; Mixture di esperti (MOE) , utilizzando 256 reti neurali (otto attivate per token); e Attenzione latente multi-testa (MLA) per una migliore estrazione di informazioni. Questi progressi contribuiscono alla sua performance competitiva.
Immagine: Ensigame.com
Tuttavia, la semianalisi ha esposto l'uso da parte di DeepSeek di circa 50.000 GPU Nvidia Hopper - un investimento significativo per un totale di circa $ 1,6 miliardi di server e $ 944 milioni in costi operativi. Ciò contraddice il reclamo iniziale di $ 6 milioni, che riflette solo le spese GPU pre-allenamento. Il vero costo comprende ricerca, perfezionamento, elaborazione dei dati e infrastrutture.
Immagine: Ensigame.com
La struttura unica di Deepseek, come consociata di hedge fund ad alto frigio, consente l'agilità e la rapida innovazione. Possedere i suoi data center fornisce il pieno controllo sull'ottimizzazione. Il suo sostanziale investimento nel talento, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, sottolinea ulteriormente il suo impegno.
Immagine: Ensigame.com
Mentre la narrazione "economica" di Deepseek è probabilmente gonfiata, il suo successo evidenzia il potenziale di società di intelligenza artificiale indipendenti ben finanziate. L'investimento totale superiore a $ 500 milioni, combinato con scoperte tecniche e una squadra forte, è il vero pilota del suo successo. Il contrasto con i costi dei concorrenti, come il costo di allenamento di $ 100 milioni di CHATGPT4 rispetto a $ 5 milioni di Deepseek per R1, rimane forte. In definitiva, la storia di Deepseek dimostra che mentre un investimento significativo è cruciale, la gestione e l'innovazione delle risorse efficienti possono ancora produrre risultati competitivi.