24/12/2025 13:38
【AI】字節跳動發布形式化數學推理專用模型Seed Prover 1.5
字節跳動Seed團隊宣布推出形式化數學推理專用模型Seed Prover 1.5。據介紹,相比上一代模型,Seed Prover 1.5在16.5小時內,針對IMO 2025的前5道題目生成了完整可編譯驗證的Lean證明代碼,換算成績為35/42,達到此前IMO評分標準的金牌分數線。
針對北美本科級別數學競賽Putnam,Seed Prover 1.5用時9小時,對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。在更系統的評估中,該模型在完整的Putnam歷史評估集上解決了88%的問題,在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上,分別解決了80%和33%的問題,刷新了形式化數學推理模型在這幾個評測集上的SOTA表現。
目前,Seed Prover 1.5的技術報告已對外公開,後續將開放API,邀請感興趣的數學和AI研究者體驗該模型。
《經濟通通訊社24日專訊》
針對北美本科級別數學競賽Putnam,Seed Prover 1.5用時9小時,對12道Putnam 2025賽題中的11道生成了可編譯驗證的Lean代碼。在更系統的評估中,該模型在完整的Putnam歷史評估集上解決了88%的問題,在代表碩士數學難度的Fate-H和代表博士生數學難度的Fate-X評估集上,分別解決了80%和33%的問題,刷新了形式化數學推理模型在這幾個評測集上的SOTA表現。
目前,Seed Prover 1.5的技術報告已對外公開,後續將開放API,邀請感興趣的數學和AI研究者體驗該模型。
《經濟通通訊社24日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
【AI】中興通訊:已收到部分大模型廠合作邀約,相關溝通正在… 24/12/2025 17:01
-
下一篇
【AI】深勢科技完成超8億元人民幣C輪融資 24/12/2025 11:58
-
【AI】國家網信辦加強管理AI擬人化互動服務,8活動不得進行 29/12/2025 09:09
-
【AI】工信部人形機器人與具身智能標準化技術委員會成立 29/12/2025 09:09
-
【AI】豆神教育推出1999元學伴機器人,首批500台1小時內售罄 29/12/2025 08:55
-
【AI】春晚AI冠名落定:火山引擎將登台、豆包亦參與 23/12/2025 17:22
-
【AI】記者起訴AI公司未經授權使用其作品,xAI首次被列為被告 23/12/2025 13:19