腾讯混元自研深度思考模型 T1 发布：吐字快、能秒回，擅长超长文处理

作者：灵犀软件园时间：2025-03-23 13:50:16

本站 3 月 21 日消息，本站从腾讯混元微信公众号获悉，今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。

据官方介绍，「T1」吐字快、能秒回，还擅长超长文处理，是腾讯自研的强推理模型。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元 T1 正式版进一步提升了推理能力。

在体现推理模型基础能力的常见 benchmark 上，如大语言模型评估增强数据集 MMLU-PRO 中，混元 T1 取得 87.2 分，仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中，混元 T1 的成绩也达到业界领先推理模型的水平。

「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。

注：表格中，其它模型的评测指标来自官方评测结果，官方评测结果中没有的部分来自混元内部评测平台结果

官方称，混元 T1 正式版沿用了混元 Turbo S 的创新架构，采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度，减少了 KV-Cache 的内存占用，从而显著降低了训练和推理成本。

官方还称，混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力，混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时，混合 Mamba 架构针对长序列处理进行了专项优化，通过高效的计算方式，在确保长文本信息捕捉能力的同时大幅降低资源消耗，在相近的激活参数量下，实现了解码速度提升 2 倍。

腾讯混元 T1 目前已经上线：https://llm.hunyuan.tencent.com/#/chat/ hy-t1

API 使用方面，混元 T1 已在腾讯云官网上线，输入价格为每百万 tokens 1 元，输出价格为每百万 tokens 4 元。

首批获准开展路测：小马智行取得卢森堡 Robotaxi 测试许可
本站 4 月 3 日消息，小马智行今日宣布获得由卢森堡交通与公共工程部（Luxembourg s Ministry of Mobility and Public Works）颁发的 Robotaxi

阅读详情
任天堂解释 Switch 2 为何不继续用 OLED 屏幕而是回归 LCD：技术已取得许多进步
本站 4 月 3 日消息，任天堂 Switch 2 配备了一块 7 9 英寸的广色域 LCD 显示屏，支持 1920x1080 分辨率及 120Hz 刷新率，而且还支持 HDR10 和最高 120Hz

阅读详情
原神欧洛伦天赋加点推荐原神欧洛伦天赋加点攻略
原神欧洛伦天赋加点推荐原神欧洛伦天赋加点攻略

阅读详情
无尽梦回开局角色怎么选择无尽梦回开局角色选择推荐
无尽梦回开局角色怎么选择无尽梦回开局角色选择推荐

阅读详情
iOS 版 UU 加速棒计划与 Switch 2 同期发售
本站 4 月 3 日消息，网易 UU 加速器官方微博今日发文宣布，iOS 版 UU 加速棒计划与 Switch2 同期发售（安卓版已开售）。据介绍，网易 UU 加速棒适配大部分 Type-C 接口设备

阅读详情
王者荣耀kpl年度总决赛赛程 2024王者荣耀kpl年度总决赛赛程介绍
王者荣耀kpl年度总决赛赛程 2024王者荣耀kpl年度总决赛赛程介绍

阅读详情

腾讯混元自研深度思考模型 T1 发布：吐字快、能秒回，擅长超长文处理

相关文章

热门影评