🔬 AI Research

DeepSeek V4 Pro:1.6兆パラメータモデル、Huaweiで動くが、誰が買う?

また一日、また一つ巨大AIモデルがドカンと発表された。今回はDeepSeekだ。V4 ProとV4 Flashモデルをリリースし、新たな仕掛けがある。NVIDIAを捨て、HuaweiのAscendチップに乗り換えるというのだ。興味深い、そして極めて懐疑的にならざるを得ない。

先進的なAIハードウェアを表す、光るサーバーラック。

⚡ Key Takeaways

  • DeepSeekが100万トークンコンテキストウィンドウを持つV4 Pro(1.6兆パラメータ)とV4 Flash(2840億パラメータ)モデルを発表した。 𝕏
  • 地政学的な要因により、NVIDIAハードウェアからの脱却を目指し、Huawei Ascendチップでの実行を想定したモデルとなっている。 𝕏
  • Compressed Sparse Attention (CSA) および Heavily Compressed Attention (HCA) における技術的進歩により、効率向上とメモリ使用量削減が実現されたとされている。 𝕏
Elena Vasquez
Written by

Elena Vasquez

Technology writer focused on AI tools, developer productivity, and the ethics of automation.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Latent Space

Stay in the loop

The week's most important stories from The AI Catchup, delivered once a week.