首頁 新聞 DeepSeek的成本:AI突破不像所認為的那樣負擔得起

DeepSeek的成本:AI突破不像所認為的那樣負擔得起

by Ethan Feb 21,2025

DeepSeek令人驚訝的負擔得起的AI模型挑戰了行業巨頭。雖然其DeepSeek V3型號僅具有600萬美元的預培訓成本,但仔細觀察表明,投資更加巨大。

DeepSeek Test圖像:ensigame.com

DeepSeek V3利用創新技術:多token預測(MTP),以提高準確性和效率; 專家(MOE)的混合物,利用256個神經網絡(八個激活的令牌); 多頭潛在注意(MLA),以改善信息提取。這些進步有助於其競爭性能。

DeepSeek V3圖像:ensigame.com

但是,半分析暴露了DeepSeek的使用約50,000個NVIDIA HOPPER GPU,這是一項巨大的投資,總計約16億美元的服務器和9.44億美元的運營成本。這與最初的600萬美元索賠相矛盾,這僅反映了培訓前的GPU支出。真正的成本包括研究,改進,數據處理和基礎架構。

DeepSeek圖像:ensigame.com

DeepSeek作為高飛行對衝基金的子公司的獨特結構允許敏捷性和快速創新。擁有其數據中心提供了對優化的完全控製。它對人才的大量投資,一些研究人員每年收入超過130萬美元,這進一步強調了其承諾。

DeepSeek圖像:ensigame.com

盡管DeepSeek的“預算友好”敘述可以說是誇大的,但其成功卻凸顯了資金充足的獨立AI公司的潛力。總投資超過5億美元,再加上技術突破和強大的團隊,是其成功的真正驅動力。與競爭對手的成本相比,例如Chatgpt4的1億美元培訓成本與DeepSeek的R1相比,這仍然是鮮明的。最終,DeepSeek的故事表明,盡管大量投資是至關重要的,有效的資源管理和創新仍然可以產生競爭成果。