BBIN·宝盈集团(中国)有限公司官网

日本LL和XL是一个码吗给大模型装上「思维分段引擎」：浙大InftyThink解锁无限深度推理

2026-06-12 07:37:06 来源：李杨

字号：默认大超大 | 打印 |

如今的大模型在长上下文推理中也面临同样的困境，随着推理长度增加而指数级增长的计算成本，以及由于长度受限而被迫中断推理过程。为了解决上述问题，浙江大学联合北京大学的研究团队从人类“分段思考+归纳总结”的智慧中汲取灵感，创新性地提出了大模型的推理新范式——InftyThink。 InftyThink将传统单一连续推理拆分为多个短片段，并在片段之间引入用于衔接的推理内容总结，从而突破了推理长度的限制，实现了理论上无限制的推理深度，并同时维持了较高的生成吞吐。 InftyThink将传统一次性完成的长推理拆分为多次短推理，每次短推理生成有限长度的推理内容，并配套生成一段精炼总结，作为下一阶段推理的上下文信息输入。这种方式模拟了人类逐步归纳总结的认知过程，使模型能在保持上下文连贯的同时进行无限深度的推理，解决了传统长推理在上下文长度和计算复杂度上的限制。 InftyThink不依赖于模型结构上的调整，而是通过重构训练数据为多轮推理格式来实现其范式，使其能与现有的预训练模型、微调、强化学习流程无缝结合，具备良好的工程可落地性。一句话概括就是，InftyThink像是给大模型装上了一个“思维管理器”，使其高效地进行无限制深度推理，大幅降低计算成本，更加高效智能。研究团队提供了一种可以将传统推理范式的数据重构为InftyThink范式的方法，帮助研究者们直接将已有的推理数据无缝迁移到InftyThink范式，主要包括如下几个步骤：由于InftyThink将模型的单次推理限制在一个较小的窗口，针对现有的长推理数据，首先需要使用分段算法将原始长推理过程按语义边界划分为若干子推理段。论文中使用强大的通用大模型为每段推理生成简洁、全面的总结（文中使用Llama3-70B-Instruct），作为下一轮次生成的上下文信息，保障多次短推理之间的衔接与信息的连续性。文中所提出的方法在为一段推理片段生成总结时，会将当前推理片段及其之前的所有推理片段输入给通用大模型，使生成的总结能够包含历史推理的全部总结信息。论文将每条原始推理数据重构为多个训练样本，每条训练样本的输入为问题和上一次推理所生成的总结，输出为该轮次的推理内容和配套的简要总结。研究团队在多个基座模型上进行了InftyThink范式数据的微调训练，并同时在多个标准推理评测基准上上进行了广泛的实验评估。拓展了模型的推理深度，在不增加额外算力需求的前提下，显著提高了模型性能，如Qwen2.5-Math-7B基座模型训练后，相对传统的推理范式在AIME24基准上的性能提升高达13%通过多次迭代式的短推理，显著降低了推理的计算复杂度，提高了模型生成的吞吐量，例如在Qwen2.5-Math-7B基座模型训练后，相对传统的推理范式，模型生成吞吐从2.36K Token/s提升到2.67K Token/s在不同架构和规模的基座模型上展现出一致稳定的提升，研究团队在Qwen2.5-Math-1.5B、Qwen2.5-Math-7B、Qwen2.5-14B、Qwen2.5-32B和Meta-Llama-3.1-8B上的实验结果呈现了高度一致的性能提升表现，证明了所提出方法的广泛适用性和鲁棒性。具体来看，InftyThink通过有效总结和短片段推理，实现了更灵活、更深度的推理能力，这在小规模模型上的表现尤其显著，为未来小模型的高效能推理应用提供了全新的解决方案。

日本LL和XL是一个码吗

                                日本LL和XL是一个码吗Suleyman认为，推理模型与编码模型结合，将成为下一阶段AI智能体（Agent）发展的关键。他说，“思考（thinking）+ 编程（coding）”能力组合，可以帮助微软构建真正的Agent系统——能够自主完成任务的智能体。特别是当AI推理需要跨区域调度算力时，网络的稳定性、低时延和高带宽就显得尤为关键。如果把云厂商的大模型想象成“发电厂”，那么，运营商就相当于覆盖全国的“电网”。发电厂发电能力可以很强，但把电送到千家万户，靠的是电网。日本LL和XL是一个码吗破罐破摔(N)作者:白云间第三、泛化迁移问题：当前具身操作模型的泛化性和迁移性仍处于很初级的阶段，距离可以跨任务、跨本体泛化迁移的通用操作能力还有着很大的差距，“换场景就失灵”就像一个魔咒，阻碍着具身操作模型的落地应用。从整体竞争版图来看，欧洲仍是冠军最大产地。法国、西班牙、英格兰、德国、葡萄牙五大豪门阵容齐整，新生代球星全面成熟，夺冠实力不容小觑。南美方面，卫冕冠军阿根廷与五星巴西继续占据第一梯队，统治力依然在线。值得关注的是，日本、摩洛哥等亚非球队近年来技战术体系日趋完善，已具备正面硬撼传统强队的底气，全球足球竞争格局的差距正在实质性收窄。
                            

                                20260612 ? 日本LL和XL是一个码吗过去三年，大模型竞争主导了人工智能产业的发展方向。但随着模型能力逐渐趋同，行业竞争的焦点正从“谁拥有最强模型”转向“谁能够构建最强AI生态”。韩剧《要先接吻吗》 前锋（5人）：阿里·阿利普尔（波斯波利斯）、丹尼斯·埃克特（标准列日）、阿米尔侯赛因·侯赛因扎德（大不里士拖拉机）、梅赫迪·塔雷米（奥林匹亚科斯）、沙赫里亚尔·莫汉卢（卡尔巴联合）
                            

日本LL和XL是一个码吗

? 张帅记者魏晓飞摄

                                20260612 ? 日本LL和XL是一个码吗老百姓的生活质量也是直线下降。工资涨幅永远赶不上物价，美国人的储蓄率降到了历史新低，欧洲人更是开始节衣缩食。下馆子的次数也比之前明显减少。《穿越兽世巨棒凶猛NPC龙族》2018年底，郑州锦谋通过股权受让的方式进入到锦艺新材的股东名单中的，斯时，其以850万元的代价获得了锦艺新材12.14%的股份，成为了锦艺新材第三大股东，此时，锦艺新材的第一大股东即为陈锦魁个人独资控制的企业广州锦族，第二大股东则为陈锦魁个人。
                            

日本LL和XL是一个码吗

? 李孟勋记者庹晓彬摄

                            ? 未来，在社会生产场景中，模型有望通过预测沙尘颗粒的粒径、荷电特性及沉降速度，指导输电塔运维，避免大面积停电；结合作物生长模型，提示调整农作物灌溉时间，推动从灾后补救到灾前调控的转变；在山火防控中提前预警，帮助群众转移，减少灾害损失。可见，“沙尘大模型”关乎的不只是沙尘，更能为多场景的风险预判与决策提供科学支撑。《入睡指南》BY卡比丘
                        

【我要推荐】更多推荐：记者：曼联完成今夏首签埃德松，还将引进1至2名中场

扫一扫在手机打开当前页

中国政府网 | 关于本网 | 网站声明 | 联系 bbin平台官网 | 网站纠错

主办单位：日本LL和XL是一个码吗　运行维护单位：中国政府网运行中心

版权所有：中国政府网　中文域名：中国政府网.政务

网站标识码bm58232452　京ICP备05070218号　京公网安备11010202000001号

国务院客户端

国务院客户端小程序

中国政府网微博、微信

主办单位：中国政府网　运行维护单位：中国政府网运行中心

版权所有：中国政府网　中文域名：中国政府网.政务

网站标识码bm58232452

京ICP备05070218号　京公网安备11010202000001号

网站地图XML