腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理
作者:灵犀软件园时间:2025-03-23 13:50:16
本站 3 月 21 日消息,本站从腾讯混元微信公众号获悉,今日腾讯混元正式推出自研深度思考模型混元 T1 正式版。
据官方介绍,「T1」吐字快、能秒回,还擅长超长文处理,是腾讯自研的强推理模型。通过大规模强化学习,并结合数学、逻辑推理、科学和代码等理科难题的专项优化,混元 T1 正式版进一步提升了推理能力。
在体现推理模型基础能力的常见 benchmark 上,如大语言模型评估增强数据集 MMLU-PRO 中,混元 T1 取得 87.2 分,仅次于 o1。在 CEval、AIME、Zebra Logic 等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元 T1 的成绩也达到业界领先推理模型的水平。
「T1」还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。
官方称,混元 T1 正式版沿用了混元 Turbo S 的创新架构,采用 Hybrid-Mamba-Transformer 融合模式。这是工业界首次将混合 Mamba 架构无损应用于超大型推理模型。这一架构有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 的内存占用,从而显著降低了训练和推理成本。
官方还称,混元 T1 在超长文本推理领域也展现出独特优势。基于出色的长文捕捉能力,混元 T1 能有效解决长文推理中常见的上下文丢失和长距离信息依赖问题。同时,混合 Mamba 架构针对长序列处理进行了专项优化,通过高效的计算方式,在确保长文本信息捕捉能力的同时大幅降低资源消耗,在相近的激活参数量下,实现了解码速度提升 2 倍。
腾讯混元 T1 目前已经上线:https://llm.hunyuan.tencent.com/#/chat/ hy-t1
API 使用方面,混元 T1 已在腾讯云官网上线,输入价格为每百万 tokens 1 元,输出价格为每百万 tokens 4 元。
相关文章
-
首批获准开展路测:小马智行取得卢森堡 Robotaxi 测试许可
本站 4 月 3 日消息,小马智行今日宣布获得由卢森堡交通与公共工程部(Luxembourg s Ministry of Mobility and Public Works)颁发的 Robotaxi
-
任天堂解释 Switch 2 为何不继续用 OLED 屏幕而是回归 LCD:技术已取得许多进步
本站 4 月 3 日消息,任天堂 Switch 2 配备了一块 7 9 英寸的广色域 LCD 显示屏,支持 1920x1080 分辨率及 120Hz 刷新率,而且还支持 HDR10 和最高 120Hz
-
-
-
iOS 版 UU 加速棒计划与 Switch 2 同期发售
本站 4 月 3 日消息,网易 UU 加速器官方微博今日发文宣布,iOS 版 UU 加速棒计划与 Switch2 同期发售(安卓版已开售)。据介绍,网易 UU 加速棒适配大部分 Type-C 接口设备
-