Deepseek yang menghairankan model AI yang berpatutan mencabar gergasi industri. Walaupun mempunyai kos pra-latihan hanya $ 6 juta untuk model DeepSeek V3, penampilan yang lebih dekat mendedahkan pelaburan yang jauh lebih besar.
imej: ensigame.com
DeepSeek V3 memanfaatkan teknologi inovatif: Ramalan Multi-Token (MTP) Untuk ketepatan dan kecekapan yang dipertingkatkan; Campuran Pakar (MOE) , menggunakan 256 rangkaian saraf (lapan diaktifkan setiap token); dan Perhatian Laten Multi-Head (MLA) untuk pengekstrakan maklumat yang lebih baik. Kemajuan ini menyumbang kepada prestasi kompetitifnya.
imej: ensigame.com
Walau bagaimanapun, semianalisis mendedahkan penggunaan DeepSeek kira -kira 50,000 NVIDIA Hopper GPU - pelaburan yang signifikan berjumlah kira -kira $ 1.6 bilion dalam pelayan dan $ 944 juta dalam kos operasi. Ini bertentangan dengan tuntutan awal $ 6 juta, yang hanya mencerminkan perbelanjaan GPU pra-latihan. Kos sebenar merangkumi penyelidikan, penghalusan, pemprosesan data, dan infrastruktur.
imej: ensigame.com
Struktur unik DeepSeek, sebagai anak syarikat dana lindung nilai tinggi, membolehkan ketangkasan dan inovasi pesat. Memiliki pusat datanya memberikan kawalan penuh ke atas pengoptimuman. Pelaburannya yang besar dalam bakat, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setiap tahun, terus menggariskan komitmennya.
imej: ensigame.com
Walaupun naratif "mesra bajet" Deepseek boleh dikatakan melambung, kejayaannya menyoroti potensi syarikat AI bebas yang dibiayai dengan baik. Jumlah pelaburan melebihi $ 500 juta, digabungkan dengan kejayaan teknikal dan pasukan yang kuat, adalah pemacu kejayaan yang benar. Berbeza dengan kos pesaing, seperti kos latihan $ 100 juta ChatGPT4 berbanding $ 5 juta DeepSeek untuk R1, tetap tegas. Pada akhirnya, cerita DeepSeek menunjukkan bahawa walaupun pelaburan yang signifikan adalah penting, pengurusan sumber dan inovasi yang cekap masih dapat menghasilkan hasil yang kompetitif.