字節跳動發布形式化數學推理專用模型Seed Prover 1.5 - etnet 經濟通 Mobile|香港新聞財經資訊和生活平台

24/12/2025 13:38

【ＡＩ】字節跳動發布形式化數學推理專用模型Seed Prover 1.5

　　字節跳動Seed團隊宣布推出形式化數學推理專用模型Seed Prover 1.5。據介紹，相比上一代模型，Seed Prover 1.5在16.5小時內，針對IMO 2025的前5道題目生成了完整可編譯驗證的Lean證明代碼，換算成績為35/42，達到此前IMO評分標準的金牌分數線。

　　針對北美本科級別數學競賽Putnam，Seed Prover 1.5用時9小時，對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。在更系統的評估中，該模型在完整的Putnam歷史評估集上解決了88%的問題，在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上，分別解決了80%和33%的問題，刷新了形式化數學推理模型在這幾個評測集上的SOTA表現。

　　目前，Seed Prover 1.5的技術報告已對外公開，後續將開放API，邀請感興趣的數學和AI研究者體驗該模型。
《經濟通通訊社24日專訊》

獨家優惠【etnet x 環球海產】用戶專享全場95折，特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】，選購五星級酒店級海鮮► 立即瀏覽

【ＡＩ】字節跳動發布形式化數學推理專用模型Seed Prover 1.5

【ＡＩ】中興通訊：已收到部分大模型廠合作邀約，相關溝通正在… 24/12/2025 17:01

【ＡＩ】深勢科技完成超８億元人民幣Ｃ輪融資 24/12/2025 11:58

其他ＡＩ

【ＡＩ】國家網信辦加強管理ＡＩ擬人化互動服務，８活動不得進行 29/12/2025 09:09

【ＡＩ】工信部人形機器人與具身智能標準化技術委員會成立 29/12/2025 09:09

【ＡＩ】豆神教育推出1999元學伴機器人，首批500台1小時內售罄 29/12/2025 08:55

【ＡＩ】春晚ＡＩ冠名落定：火山引擎將登台、豆包亦參與 23/12/2025 17:22

【ＡＩ】記者起訴AI公司未經授權使用其作品，xAI首次被列為被告 23/12/2025 13:19