🔬 AI Research

DeepSeek V4 Pro: 1.6T модель на Huawei, но кто будет покупать?

Очередной день — очередной гигантский релиз AI-модели. На этот раз отличился DeepSeek, представив свои V4 Pro и V4 Flash. Их новый трюк: отказ от NVIDIA в пользу чипов Huawei Ascend. Интригует, но вызывает глубокий скепсис.

Стойка с серверами и светящимися индикаторами, символизирующая передовое AI-оборудование.

⚡ Key Takeaways

  • DeepSeek выпустил модели V4 Pro (1.6T параметров) и V4 Flash (284B параметров) с контекстным окном в 1 млн токенов. 𝕏
  • Модели разработаны для работы на чипах Huawei Ascend, что свидетельствует об отходе от аппаратного обеспечения NVIDIA из-за геополитических факторов. 𝕏
  • Технические достижения в области Compressed Sparse Attention (CSA) и Heavily Compressed Attention (HCA) приписываются улучшенной эффективности и снижению потребления памяти. 𝕏
Elena Vasquez
Written by

Elena Vasquez

Technology writer focused on AI tools, developer productivity, and the ethics of automation.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Latent Space

Stay in the loop

The week's most important stories from The AI Catchup, delivered once a week.