DeepSeek V4 Pro: 1.6T модель на Huawei, но кто будет покупать?
Очередной день — очередной гигантский релиз AI-модели. На этот раз отличился DeepSeek, представив свои V4 Pro и V4 Flash. Их новый трюк: отказ от NVIDIA в пользу чипов Huawei Ascend. Интригует, но вызывает глубокий скепсис.
⚡ Key Takeaways
- DeepSeek выпустил модели V4 Pro (1.6T параметров) и V4 Flash (284B параметров) с контекстным окном в 1 млн токенов. 𝕏
- Модели разработаны для работы на чипах Huawei Ascend, что свидетельствует об отходе от аппаратного обеспечения NVIDIA из-за геополитических факторов. 𝕏
- Технические достижения в области Compressed Sparse Attention (CSA) и Heavily Compressed Attention (HCA) приписываются улучшенной эффективности и снижению потребления памяти. 𝕏
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by Latent Space