討論區 - DeepSeek梁文鋒論文曝新技術:突破GPU記憶體限制實現參數擴展

1月12日,DeepSeek創始人梁文鋒與北大研究人員發表論文,提出Engram條件記憶技術,可突破GPU記憶體限制,提升大模型長上下文處理效率,270億參數模型驗證有效。外界猜測其春節前將發布新模型,此前其低成本模型已在新興市場普及,微軟總裁坦言美國AI公司面臨其競爭壓力。

作者: 藍莓日報
首次發佈時間 : 更新時間 :

討論區

0則評論

暫時沒有資料


讀者評論

暫時沒有資料