Deepseek'in şaşırtıcı derecede uygun AI modeli endüstri devlerine meydan okuyor. Deepseek V3 modeli için sadece 6 milyon dolarlık eğitim öncesi maliyetle övünürken, daha yakından bakıldığında çok daha önemli bir yatırım ortaya koyuyor.
%İmgp%resim: ensigame.com
Deepseek V3 Yenilikçi Teknolojilerden yararlanır: Çoklu Tokul Tahmin (MTP) Geliştirilmiş doğruluk ve verimlilik için; 256 sinir ağı (jeton başına sekiz etkinleştirilmiş) kullanarak uzmanların (MOE) karışımı; ve Geliştirilmiş bilgi ekstraksiyonu için çok başlı gizli dikkat (MLA) . Bu gelişmeler rekabetçi performansına katkıda bulunur.
%İmgp%resim: ensigame.com
Bununla birlikte, Semianalysis Deepseek'in yaklaşık 50.000 NVIDIA Hopper GPU'larını kullanmasını engelledi - sunucularda yaklaşık 1,6 milyar dolar ve operasyonel maliyetler 944 milyon dolarlık önemli bir yatırım. Bu, sadece eğitim öncesi GPU masraflarını yansıtan ilk 6 milyon dolarlık iddiayla çelişiyor. Gerçek maliyet araştırma, arıtma, veri işleme ve altyapıyı kapsar.
%İmgp%resim: ensigame.com
Deepseek'in High Flyer Hedge Fonu'nun bir yan kuruluşu olarak benzersiz yapısı, çeviklik ve hızlı inovasyona izin verir. Veri merkezlerine sahip olmak, optimizasyon üzerinde tam kontrol sağlar. Bazı araştırmacılar yılda 1,3 milyon doların üzerinde kazanan yeteneklere önemli yatırımı, taahhüdünün altını çiziyor.
%İmgp%resim: ensigame.com
Deepseek'in "bütçe dostu" anlatısı tartışmalı olarak şişirilirken, başarısı iyi finanse edilen bağımsız AI şirketlerinin potansiyelini vurgulamaktadır. 500 milyon doları aşan toplam yatırım, teknik atılımlar ve güçlü bir ekiple birleştiğinde, başarısının gerçek itici gücüdür. CHATGPT4'ün Deepseek'in R1 için 5 milyon $ 'a karşı 100 milyon dolarlık eğitim maliyeti gibi rakiplerin maliyetleri ile kontrast sade. Nihayetinde, Deepseek'in hikayesi, önemli yatırımların çok önemli olsa da, verimli kaynak yönetimi ve yeniliğinin hala rekabetçi sonuçlar verebileceğini göstermektedir.