DeepSeek-R1在公布新模型「MODEL1」时迎来了发布一周年。

By: theblockbeats.news|2026/01/21 09:00:24
0
分享
copy

BlockBeats 消息,1 月 21 日,据量子位报道,DeepSeek-R1 发布一周年之际对新模型「MODEL1」进行了曝光。DeepSeek 在 GitHub 更新 FlashMLA 代码,横跨 114 个文件中有 28 处提到 MODEL1,与 V32 作为不同的模型出现。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新的架构。代码中的具体差异体现在 KV 缓存布局、稀疏性处理和 FP8 解码方面,在内存优化上有多处不同。

猜你喜歡

熱門幣種

最新加密貨幣要聞

閱讀更多