29/06/2026 11:25
【AI】DeepSeek發布梁文鋒署名新論文,介紹推理加速框架DSpark
DeepSeek團隊聯合北京大學於27日發布論文《DSpark:基於置信度調度的推測解碼與半自回歸生成》,DeepSeek創始人梁文鋒位列作者名單。這是繼6月中旬完成500億元人民幣融資後,DeepSeek首次開源新成果。
論文介紹了其推理加速框架DSpark,旨在解決大語言模型在高並發場景下的推理效率瓶頸。該框架採用半自回歸生成架構,融合高吞吐並行生成與輕量級串行校驗,並引入置信度調度驗證機制,可根據系統負載動態調整驗證長度。實測數據顯示,部署於DeepSeek-V4線上服務後,單用戶生成速度提升60%-85%,高並發場景下有效吞吐量翻4倍。
在論文中,團隊開源了DSpark模型權重,並同步發布了面向推測解碼、由算法驅動的訓練代碼倉庫DeepSpec。
《經濟通通訊社29日專訊》
論文介紹了其推理加速框架DSpark,旨在解決大語言模型在高並發場景下的推理效率瓶頸。該框架採用半自回歸生成架構,融合高吞吐並行生成與輕量級串行校驗,並引入置信度調度驗證機制,可根據系統負載動態調整驗證長度。實測數據顯示,部署於DeepSeek-V4線上服務後,單用戶生成速度提升60%-85%,高並發場景下有效吞吐量翻4倍。
在論文中,團隊開源了DSpark模型權重,並同步發布了面向推測解碼、由算法驅動的訓練代碼倉庫DeepSpec。
《經濟通通訊社29日專訊》














