DeepSeek發(fā)布梁文鋒署名新論文 開源相關記憶模塊Engram
2026-01-13 09:12   
來源: 云財經   
影響力評估指數(shù):17.05  
云財經訊,DeepSeek于12日晚發(fā)布新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度)。該論文為北京大學與DeepSeek共同完成,合著作者署名中出現(xiàn)梁文鋒。論文提出條件記憶(conditional memory),通過引入可擴展的查找記憶結構,在等參數(shù)、等算力條件下顯著提升模型在知識調用、推理、代碼、數(shù)學等任務上的表現(xiàn)。同時,DeepSeek開源相關記憶模塊Engram。
| 新聞標題 | 時間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 熵基科技子公司公布新專利,可通過腦波數(shù)據(jù)確定情緒 | 今天 11:09 | 云財經 |
|
| 伊朗塔斯尼姆通訊社指責美國查封其網絡域名 | 今天 04:51 | 云財經 |
|
| 如果首相高市早苗在選舉中取得決定性勝利,日元可能走軟 | 01-12 23:03 | 云財經 |
|
| 固高科技:公司不涉及與微納星空建立戰(zhàn)略合作關系等事項 | 01-12 22:05 | 云財經 |
|
| 2025年盧旺達咖啡出口收入創(chuàng)新高 | 01-11 15:11 | 云財經 |
|
| 阿根廷中部森林火災蔓延 過火面積逾5500公頃 | 01-11 08:24 | 云財經 |
|