Китайський ШІ-стартап DeepSeek витратив близько $1,6 млрд на навчання великої мовної моделі зі здатністю мислення R1, хоча раніше повідомлялося всього про $6 млн.
Про це йдеться у звіті від SemiAnalysis.
За повідомленнями, вартість навчання DeepSeek-R1 стала однією з ключових тем обговорення стосовно китайського стартапу, оскільки його розробникам вдалося досягти рівня OpenAI при значно менших витратах. Незважаючи на різні попередні припущення, аналітики SemiAnalysis зазначають, що DeepSeek використовує приблизно 50 тисяч ШІ-чипів Hopper від NVIDIA та очікує на постачання ще 10 тисяч.
Через експортні обмеження США для Китаю DeepSeek застосовує не лише чипи H100, які до виходу BlackWell вважалися найкращими у галузі, а й менш продуктивні H800, спеціально створені для китайського ринку H20, а також A100.
Найбільшу частку серед наявних чипів у стартапа складають H20 – приблизно 30 тисяч з урахуванням додаткових замовлень. Крім того, компанія має по 10 тисяч H100, H800 і A100.