證券時報
2025-03-22 08:20
3月21日深夜,騰訊混元宣布,正式推出自研深度思考模型混元T1正式版。
在體現推理模型基礎能力的常見benchmark上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得87.2分,僅次于o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1的成績也達到業界領先推理模型的水平。
此前,騰訊宣布,混元大模型首次登上 Chatbot Arena 榜單,躋身全球 Top 15。用戶在該平臺上以匿名方式與多個模型互動,投票決定何種模型更佳,從而根據分數生成排行榜。這種測評也被看成是大模型直接 PK 的競技場,簡單直接。
去年 9 月 5 日,騰訊發布了新一代大模型混元 Turbo,采用 MoE 架構,比上一代產品推理效率提升 100%,推理成本降低 50%。
在本月 1 日發布的騰訊元寶電腦版 App 中則是內置了混元和 DeepSeek 兩種模型,支持雙模切換。
部分內容綜合自:騰訊等