• 恒指
  • 25,855
  • +219
  •  大市成交 1,998億
  • 期指(夜)
  • 25,915
  • -10
  • 高水60
  • 國指
  • 8,991
  • +99
  • 紅籌
  • 4,046
  • +26
  • 科指
  • 5,578
  • +95
  • 上證
  • 3,965
  • 0
  •  成交 8,875億
21/10/2025 09:21

【AI】美團LongCat團隊發布並開源VitaBench大模型評測基準

  美團LongCat團隊20日正式發布當前高度貼近真實生活場景、面向複雜問題的大模型智能體評測基準--VitaBench(Versatile Interactive Tasks Benchmark),並已全面開源。

  據官方介紹,VitaBench以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景為典型載體,構建了包含66個工具的交互式評測環境,並進行了跨場景的綜合任務設計。例如,在旅遊規劃任務中,要求智能體通過思考、調用工具和用戶交互,完整執行從買好票到訂好餐廳的終端狀態。
《經濟通通訊社21日專訊》

【你點睇?】市民質疑當局准南下粵車採用「黑玻璃」屬雙重標準,運輸署指短暫逗留車輛不適用本地要求,你是否認同運輸署說法?► 立即投票

備註︰

即時報價更新時間為 30/12/2025 17:59

港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站

權證
即時報價
全文搜索
Search
最近搜看
回顧25 展望26
大國博弈
More
Share