À l'occasion du premier anniversaire de DeepSeek-R1, un nouveau modèle "MODEL1" est révélé

By: theblockbeats.news|2026/03/30 06:37:11
0
Partager
copy

Actualités BlockBeats, 21 janvier : Selon QuantumBit, DeepSeek-R1 a révélé son nouveau modèle "MODEL1" pour son premier anniversaire. DeepSeek a mis à jour le code FlashMLA sur GitHub, avec 28 mentions de MODEL1 dans 114 fichiers, apparaissant comme un modèle distinct de V32. V32 étant connu comme étant DeepSeek-V3.2, MODEL1 est probablement une nouvelle architecture. Les différences spécifiques dans le code se reflètent dans la disposition du cache KV, la gestion de la sparsité et le décodage FP8, montrant plusieurs différences dans l'optimisation de la mémoire.

Prix de --

--

Vous pourriez aussi aimer