• 恒指
  • 25,801
  • -53
  •  大市成交 13億
  • 期指
  • 25,813
  • -112
  • 高水12
  • 國指
  • 8,970
  • -21
  • 紅籌
  • 4,045
  • -1
  • 科指
  • 5,566
  • -12
  • 上證
  • 3,965
  • 0
  •  成交 0億
21/10/2025 09:21

【AI】美團LongCat團隊發布並開源VitaBench大模型評測基準

  美團LongCat團隊20日正式發布當前高度貼近真實生活場景、面向複雜問題的大模型智能體評測基準--VitaBench(Versatile Interactive Tasks Benchmark),並已全面開源。

  據官方介紹,VitaBench以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景為典型載體,構建了包含66個工具的交互式評測環境,並進行了跨場景的綜合任務設計。例如,在旅遊規劃任務中,要求智能體通過思考、調用工具和用戶交互,完整執行從買好票到訂好餐廳的終端狀態。
《經濟通通訊社21日專訊》

【你點睇?】本港2025年本港復甦緩慢,經濟受到衝擊,亦發生多宗社會重大事件。你點睇2025年的香港?展望2026年,你最期待哪方面?► 立即投票

備註︰

即時報價更新時間為 31/12/2025 09:23

港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站

權證
即時報價
全文搜索
Search
最近搜看
回顧25 展望26
大國博弈
More
Share