<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/">
    <channel>
        <title>机器之心公众号 - SupSub</title>
        <link>https://supsub.net/feed/public/58f382c9/rss</link>
        <description>专业的人工智能媒体和产业服务平台</description>
        <lastBuildDate>Tue, 19 May 2026 12:59:18 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>https://github.com/jpmonette/feed</generator>
        <language>zh</language>
        <image>
            <title>机器之心公众号 - SupSub</title>
            <url>http://wx.qlogo.cn/mmhead/Q3auHgzwzM75UiawQgcdqOcmtYS7Jibug9J7dskxkNicGiadtdKl7mLyiaw/0</url>
            <link>https://supsub.net/feed/public/58f382c9/rss</link>
        </image>
        <copyright>Copyright © 2026 SupSub.net Inc</copyright>
        <item>
            <title><![CDATA[HyperEyes：从「搜得更深」到「搜得更宽」，并行多模态搜索智能体的效率革命]]></title>
            <link>https://mp.weixin.qq.com/s/l_q517WQOL2cbwoEPo4Y5w</link>
            <guid isPermaLink="false">23b043563cf70c0d370242db3fd33c4a</guid>
            <pubDate>Tue, 19 May 2026 09:42:52 GMT</pubDate>
            <description><![CDATA[小红书研究团队提出HyperEyes，一种全新的并行多模态搜索智能体架构，突破传统串行‘裁剪-再搜索’模式的效率瓶颈。通过统一定位与搜索动作空间、构建3万条并行搜索训练数据、以及双粒度效率感知强化学习（TRACE+OPD）机制，HyperEyes实现单轮并发检索多个实体，显著降低工具调用次数并提升准确率。在自建IMEB基准和多项主流测试中，其30B版本准确率超越同级SOTA模型9.9%，效率提升超5倍，且对噪声干扰更具鲁棒性。研究首次将搜索效率纳入核心评估维度，推动多模态智能体从‘搜得更深’向‘搜得更宽’演进。]]></description>
            <content:encoded><![CDATA[小红书研究团队提出HyperEyes，一种全新的并行多模态搜索智能体架构，突破传统串行‘裁剪-再搜索’模式的效率瓶颈。通过统一定位与搜索动作空间、构建3万条并行搜索训练数据、以及双粒度效率感知强化学习（TRACE+OPD）机制，HyperEyes实现单轮并发检索多个实体，显著降低工具调用次数并提升准确率。在自建IMEB基准和多项主流测试中，其30B版本准确率超越同级SOTA模型9.9%，效率提升超5倍，且对噪声干扰更具鲁棒性。研究首次将搜索效率纳入核心评估维度，推动多模态智能体从‘搜得更深’向‘搜得更宽’演进。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqFeCVIZfBnpniaoFY8doscBXmoQYnutiaKA74yD3du9AOmIqPAn9pxDx3jxcBcacmFiamDdicrNIaRsic9icRCVkuW75rncibu7LMNEug/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqFeCVIZfBnpniaoFY8doscBXmoQYnutiaKA74yD3du9AOmIqPAn9pxDx3jxcBcacmFiamDdicrNIaRsic9icRCVkuW75rncibu7LMNEug/0"/>
            <tag>多模态搜索</tag>
            <tag>并行处理</tag>
            <tag>强化学习</tag>
            <tag>效率优化</tag>
            <tag>智能体架构</tag>
            <keyword>HyperEyes</keyword>
            <keyword>并行多模态搜索</keyword>
            <keyword>效率感知强化学习</keyword>
            <keyword>IMEB基准</keyword>
            <keyword>双粒度奖励</keyword>
            <keyword>多实体定位</keyword>
            <keyword>智能体架构</keyword>
            <keyword>机器之心</keyword>
        </item>
        <item>
            <title><![CDATA[H100去哪儿了？]]></title>
            <link>https://mp.weixin.qq.com/s/q3QAVSUnOZU9T1JRyr0rrg</link>
            <guid isPermaLink="false">f9c1986fd3c849c0043841eb29182d32</guid>
            <pubDate>Tue, 19 May 2026 09:42:52 GMT</pubDate>
            <description><![CDATA[文章深入分析了2026年全球AI算力危机的根源与影响，指出H100等GPU供应短缺并非单纯芯片产能不足，而是由HBM内存与CoWoS先进封装产能瓶颈、超大规模云厂商提前锁定产能、以及AI需求爆炸式增长共同导致的结构性危机。学术界与中小团队面临高昂成本与获取门槛，消费级GPU减产、内存涨价已波及普通用户。尽管台积电与SK海力士正扩产，但供需失衡预计将持续数年。文章强调，算力正成为AI时代的战略资源，而真正的瓶颈已从芯片转向封装、内存与基础设施。]]></description>
            <content:encoded><![CDATA[文章深入分析了2026年全球AI算力危机的根源与影响，指出H100等GPU供应短缺并非单纯芯片产能不足，而是由HBM内存与CoWoS先进封装产能瓶颈、超大规模云厂商提前锁定产能、以及AI需求爆炸式增长共同导致的结构性危机。学术界与中小团队面临高昂成本与获取门槛，消费级GPU减产、内存涨价已波及普通用户。尽管台积电与SK海力士正扩产，但供需失衡预计将持续数年。文章强调，算力正成为AI时代的战略资源，而真正的瓶颈已从芯片转向封装、内存与基础设施。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqEjIWaAbftJaSjKcSpGjTiahTyXFV8KktIJGIXAMs2Ribb6iaU102VoxkG2Y9VKiaKywXGTJR0xlKo326kbO1ictAXKXsoTRX4pGRSU/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqEjIWaAbftJaSjKcSpGjTiahTyXFV8KktIJGIXAMs2Ribb6iaU102VoxkG2Y9VKiaKywXGTJR0xlKo326kbO1ictAXKXsoTRX4pGRSU/0"/>
            <tag>人工智能</tag>
            <tag>算力短缺</tag>
            <tag>芯片供应链</tag>
            <tag>先进封装</tag>
            <tag>高带宽内存</tag>
            <keyword>H100</keyword>
            <keyword> 算力危机</keyword>
            <keyword> HBM</keyword>
            <keyword> CoWoS封装</keyword>
            <keyword> 英伟达</keyword>
            <keyword> GPU短缺</keyword>
            <keyword> AI基础设施</keyword>
            <keyword> 黑色威尔架构</keyword>
            <keyword> 算力瓶颈</keyword>
            <keyword> Jevons悖论</keyword>
        </item>
        <item>
            <title><![CDATA[DeepMind华人研究员Lun Wang离职，「评估」成制约模型能力飞跃的瓶颈]]></title>
            <link>https://mp.weixin.qq.com/s/jPobUMGRo19_v4dPtYk1Xg</link>
            <guid isPermaLink="false">6d00da6a48331e37e99d2517cabf1637</guid>
            <pubDate>Tue, 19 May 2026 07:19:29 GMT</pubDate>
            <description><![CDATA[谷歌DeepMind研究员Lun Wang离职后发文指出，当前AI评估体系存在根本性缺陷：它只能评估已有模型，却无法预测即将出现的质变能力（如涌现能力、grokking）。他强调，制约AI下一步突破的瓶颈不是数据或架构，而是评估本身。现有基准测试多为静态、被动响应，无法捕捉模型行为的非线性跃迁。他呼吁构建‘自我进化的评估系统’，通过寻找序参量、监控元信号、开展评估红队对抗等方式，使评估体系能主动预测并适应模型的演化。该观点引发业界对评估基础设施重构的广泛讨论，被视为AI安全与规模化发展的关键议题。]]></description>
            <content:encoded><![CDATA[谷歌DeepMind研究员Lun Wang离职后发文指出，当前AI评估体系存在根本性缺陷：它只能评估已有模型，却无法预测即将出现的质变能力（如涌现能力、grokking）。他强调，制约AI下一步突破的瓶颈不是数据或架构，而是评估本身。现有基准测试多为静态、被动响应，无法捕捉模型行为的非线性跃迁。他呼吁构建‘自我进化的评估系统’，通过寻找序参量、监控元信号、开展评估红队对抗等方式，使评估体系能主动预测并适应模型的演化。该观点引发业界对评估基础设施重构的广泛讨论，被视为AI安全与规模化发展的关键议题。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqHEzzOMZ0dgqiaRCA6Ksfxsqp1mnq2ArTJRx1bhpRfmWgftQzAYsvL5KGAA0uYq1nR0Inxy1ghBZoxIrrRibGVRuLHud90UXvkZw/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqHEzzOMZ0dgqiaRCA6Ksfxsqp1mnq2ArTJRx1bhpRfmWgftQzAYsvL5KGAA0uYq1nR0Inxy1ghBZoxIrrRibGVRuLHud90UXvkZw/0"/>
            <tag>人工智能</tag>
            <tag>大语言模型</tag>
            <tag>模型评估</tag>
            <tag>涌现能力</tag>
            <tag>自我进化系统</tag>
            <keyword>AI评估</keyword>
            <keyword> 涌现能力</keyword>
            <keyword> 自我进化评估</keyword>
            <keyword> 序参量</keyword>
            <keyword> 评估红队对抗</keyword>
            <keyword> LLM</keyword>
            <keyword> 模型相变</keyword>
            <keyword> 评估瓶颈</keyword>
            <keyword> Lun Wang</keyword>
            <keyword> Goodhart定律</keyword>
        </item>
        <item>
            <title><![CDATA[10万token自然语言推理，让30B-A3B模型站上奥赛金牌线]]></title>
            <link>https://mp.weixin.qq.com/s/YdhuVt-aszWvaMBbgys_Mg</link>
            <guid isPermaLink="false">deb4a3422945a0dfefbb83210563ff4f</guid>
            <pubDate>Tue, 19 May 2026 07:19:29 GMT</pubDate>
            <description><![CDATA[上海人工智能实验室等机构的研究团队提出了一种名为SU-01的30B-A3B规模推理模型，无需外部工具或代码执行，仅通过统一的监督微调、两阶段强化学习和推理时多轮‘生成-验证-修正’机制，在IMO、USAMO、IPhO等高难度数学与物理奥赛中达到金牌水平。该模型在USAMO 2026 P3等人类平均分仅0.01分的难题上取得满分，推理过程中单次生成长度可达10万词元以上，证明小规模模型通过结构化训练与推理扩展，也能实现媲美顶尖人类选手的长程科学推理能力，为高效、可验证的科学AI系统提供了新路径。]]></description>
            <content:encoded><![CDATA[上海人工智能实验室等机构的研究团队提出了一种名为SU-01的30B-A3B规模推理模型，无需外部工具或代码执行，仅通过统一的监督微调、两阶段强化学习和推理时多轮‘生成-验证-修正’机制，在IMO、USAMO、IPhO等高难度数学与物理奥赛中达到金牌水平。该模型在USAMO 2026 P3等人类平均分仅0.01分的难题上取得满分，推理过程中单次生成长度可达10万词元以上，证明小规模模型通过结构化训练与推理扩展，也能实现媲美顶尖人类选手的长程科学推理能力，为高效、可验证的科学AI系统提供了新路径。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqGE3QLaWaYurYrlZ9e7w72XWNfzbh0azLgVzeMWg5xG3OcHibmyL9UXJtYJ1chCib9aws7rOSIibjSQ4CTnraRuRcADNEGkp9XVrQ/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqGE3QLaWaYurYrlZ9e7w72XWNfzbh0azLgVzeMWg5xG3OcHibmyL9UXJtYJ1chCib9aws7rOSIibjSQ4CTnraRuRcADNEGkp9XVrQ/0"/>
            <tag>人工智能</tag>
            <tag>深度学习</tag>
            <tag>自然语言推理</tag>
            <tag>强化学习</tag>
            <tag>科学计算</tag>
            <keyword>SU-01</keyword>
            <keyword>奥赛级推理</keyword>
            <keyword>上海人工智能实验室</keyword>
            <keyword>自然语言推理</keyword>
            <keyword>强化学习</keyword>
            <keyword>推理阶段扩展</keyword>
            <keyword>30B-A3B</keyword>
            <keyword>数学奥林匹克</keyword>
            <keyword>物理奥林匹克</keyword>
            <keyword>证明生成</keyword>
        </item>
        <item>
            <title><![CDATA[LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4]]></title>
            <link>https://mp.weixin.qq.com/s/wRtvQK0P0o4cvVTlRq0LXA</link>
            <guid isPermaLink="false">9fa3efae2c1e01673dfbfc8a9e97d180</guid>
            <pubDate>Tue, 19 May 2026 04:00:09 GMT</pubDate>
            <description><![CDATA[本文系统梳理了2026年前后大语言模型在长上下文推理场景下的架构优化趋势，重点分析了Gemma 4、Laguna XS.2、ZAYA1-8B和DeepSeek V4等模型的创新设计。核心方向包括：跨层KV共享与逐层嵌入（PLE）降低显存开销、分层注意力预算分配平衡效率与性能、压缩卷积注意力（CCA）在潜在空间中执行高效注意力计算，以及DeepSeek提出的流形约束超连接（mHC）与压缩稀疏注意力（CSA/HCA）协同优化长序列推理效率。这些技术不再依赖单纯扩大模型规模，而是通过结构级创新，在保持甚至提升模型能力的同时，显著降低计算与存储成本，标志着LLM架构正从通用设计向高效、定向化演进。]]></description>
            <content:encoded><![CDATA[本文系统梳理了2026年前后大语言模型在长上下文推理场景下的架构优化趋势，重点分析了Gemma 4、Laguna XS.2、ZAYA1-8B和DeepSeek V4等模型的创新设计。核心方向包括：跨层KV共享与逐层嵌入（PLE）降低显存开销、分层注意力预算分配平衡效率与性能、压缩卷积注意力（CCA）在潜在空间中执行高效注意力计算，以及DeepSeek提出的流形约束超连接（mHC）与压缩稀疏注意力（CSA/HCA）协同优化长序列推理效率。这些技术不再依赖单纯扩大模型规模，而是通过结构级创新，在保持甚至提升模型能力的同时，显著降低计算与存储成本，标志着LLM架构正从通用设计向高效、定向化演进。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqE8Kia1zeyUvlpHn5mgXyAjibp5WBfpYJWnCxrzMamYjrr86wo2UYicyuwRuicjblbv2vFxt008WiaYsYS7Cd89oBjPC4QnvNrynt0A/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqE8Kia1zeyUvlpHn5mgXyAjibp5WBfpYJWnCxrzMamYjrr86wo2UYicyuwRuicjblbv2vFxt008WiaYsYS7Cd89oBjPC4QnvNrynt0A/0"/>
            <tag>大语言模型</tag>
            <tag>注意力机制</tag>
            <tag>长上下文优化</tag>
            <tag>混合专家架构</tag>
            <tag>计算效率优化</tag>
            <keyword>长上下文推理</keyword>
            <keyword>KV缓存优化</keyword>
            <keyword>分组查询注意力</keyword>
            <keyword>Gemma 4</keyword>
            <keyword>DeepSeek V4</keyword>
            <keyword>压缩卷积注意力</keyword>
            <keyword>逐层嵌入</keyword>
            <keyword>混合专家架构</keyword>
            <keyword>Transformer架构演进</keyword>
        </item>
        <item>
            <title><![CDATA[从卖token到卖结果，这些公司开始让AI背KPI了]]></title>
            <link>https://mp.weixin.qq.com/s/4BO2pbJnqazdLFehEWCFOQ</link>
            <guid isPermaLink="false">8ea7bcf528678793fb90e00046fd5c55</guid>
            <pubDate>Tue, 19 May 2026 04:00:09 GMT</pubDate>
            <description><![CDATA[文章探讨了AI落地过程中企业过度关注调用量等过程指标、忽视真实业务价值的困境，并提出‘结果即服务’（RaaS）模式作为解决方案。硅谷的Sierra与国内的零犀科技率先实践RaaS，通过按实际业务成果（如客户满意度、保险成交额）收费，倒逼AI系统从工具转向自主交付结果的数字劳动力。两家公司均构建了超越基础大模型的执行、记忆与评估体系，尤其零犀通过因果推理、反事实分析和销售专家经验AI化，解决了销售场景中数据稀疏与归因复杂等难题。RaaS不仅重塑AI定价逻辑，更构建了难以被模型迭代颠覆的护城河，推动AI价值从‘使用量’回归到‘产出力’，预示着AI革命从工具层向应用层的深层演进。]]></description>
            <content:encoded><![CDATA[文章探讨了AI落地过程中企业过度关注调用量等过程指标、忽视真实业务价值的困境，并提出‘结果即服务’（RaaS）模式作为解决方案。硅谷的Sierra与国内的零犀科技率先实践RaaS，通过按实际业务成果（如客户满意度、保险成交额）收费，倒逼AI系统从工具转向自主交付结果的数字劳动力。两家公司均构建了超越基础大模型的执行、记忆与评估体系，尤其零犀通过因果推理、反事实分析和销售专家经验AI化，解决了销售场景中数据稀疏与归因复杂等难题。RaaS不仅重塑AI定价逻辑，更构建了难以被模型迭代颠覆的护城河，推动AI价值从‘使用量’回归到‘产出力’，预示着AI革命从工具层向应用层的深层演进。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqFKYFGDYOLG2fKkyicCygo1TmxtcPGiaFFnZDgcGzE1cvCvBP4VAFrGa9gDeQFtEPMibWoQ1XoVxDAHQsleoMcAqlMVh8buNcWPZk/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqFKYFGDYOLG2fKkyicCygo1TmxtcPGiaFFnZDgcGzE1cvCvBP4VAFrGa9gDeQFtEPMibWoQ1XoVxDAHQsleoMcAqlMVh8buNcWPZk/0"/>
            <tag>人工智能</tag>
            <tag>结果导向服务</tag>
            <tag>自动化决策</tag>
            <tag>因果推理</tag>
            <tag>AI商业化模式</tag>
            <keyword>RaaS</keyword>
            <keyword> 结果即服务</keyword>
            <keyword> 零犀科技</keyword>
            <keyword> Sierra</keyword>
            <keyword> AI商业化</keyword>
            <keyword> AI KPI</keyword>
            <keyword> token滥用</keyword>
            <keyword> 业务结果导向</keyword>
            <keyword> 因果推理</keyword>
            <keyword> AI销售代理</keyword>
        </item>
        <item>
            <title><![CDATA[ICML 2026 | 突破3DGS光度多义性瓶颈：北航/新国立提出AmbiSuR，重塑高保真3D几何重建]]></title>
            <link>https://mp.weixin.qq.com/s/jiqj2afGW40LWolVmO9-TA</link>
            <guid isPermaLink="false">87d42eb417b0dba4fd845bc9df9d41b7</guid>
            <pubDate>Tue, 19 May 2026 04:00:09 GMT</pubDate>
            <description><![CDATA[本文介绍了由北京航空航天大学与新加坡国立大学团队提出的AmbiSuR框架，旨在解决3D高斯泼溅（3DGS）在表面重建中因光度多义性导致的几何失真问题。该方法首次将球谐函数（SH）作为多义性自指示器，结合高斯基元截断与光线-颜色一致性约束，实现对冗余基元和几何重叠的精准抑制。实验表明，AmbiSuR在DTU、Tanks and Temples等主流数据集上均达到SOTA性能，显著提升重建精度与细节还原能力，且兼容单目与多视角先验，具有高度通用性。论文已被ICML 2026接收，代码已开源。]]></description>
            <content:encoded><![CDATA[本文介绍了由北京航空航天大学与新加坡国立大学团队提出的AmbiSuR框架，旨在解决3D高斯泼溅（3DGS）在表面重建中因光度多义性导致的几何失真问题。该方法首次将球谐函数（SH）作为多义性自指示器，结合高斯基元截断与光线-颜色一致性约束，实现对冗余基元和几何重叠的精准抑制。实验表明，AmbiSuR在DTU、Tanks and Temples等主流数据集上均达到SOTA性能，显著提升重建精度与细节还原能力，且兼容单目与多视角先验，具有高度通用性。论文已被ICML 2026接收，代码已开源。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqHicwSiatY60X68nCWeYACQBib0RMDTYt2e12kEElibWZ5icoqsIg62mKlIicz2JViaoFAuLd8txObwyy4wKibHbyeMRngJibs4y6f2ZxeE/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqHicwSiatY60X68nCWeYACQBib0RMDTYt2e12kEElibWZ5icoqsIg62mKlIicz2JViaoFAuLd8txObwyy4wKibHbyeMRngJibs4y6f2ZxeE/0"/>
            <tag>三维视觉</tag>
            <tag>神经渲染</tag>
            <tag>高斯泼溅</tag>
            <tag>表面重建</tag>
            <tag>光度多义性</tag>
            <keyword>3D高斯泼溅</keyword>
            <keyword> 光度多义性</keyword>
            <keyword> 球谐函数</keyword>
            <keyword> 表面重建</keyword>
            <keyword> AmbiSuR</keyword>
            <keyword> 神经渲染</keyword>
            <keyword> 球谐函数多义性指示器</keyword>
            <keyword> 3DGS</keyword>
            <keyword> ICML 2026</keyword>
        </item>
        <item>
            <title><![CDATA[1/10成本、Opus 4.7级表现，Cursor甩出了性价比之王Composer 2.5]]></title>
            <link>https://mp.weixin.qq.com/s/XPvT-SPC5-UOTlnXHhpukA</link>
            <guid isPermaLink="false">6cdcf542df58602f68e6e89e48d7c44f</guid>
            <pubDate>Mon, 18 May 2026 23:31:21 GMT</pubDate>
            <description><![CDATA[Cursor 推出新一代AI代码助手模型Composer 2.5，以1/10的成本实现接近Claude Opus 4.7和GPT-5.5的性能，尤其在长期任务处理和复杂指令遵循上表现卓越。该模型基于月之暗面Kimi K2.5开源检查点，通过精准文本反馈强化学习、25倍规模的合成数据训练及创新的分片Muon与双网格HSDP优化技术实现性能跃升。其定价极具竞争力，且未来将与SpaceXAI合作，利用Colossus 2百万H100算力训练更大模型。马斯克公开推荐该模型，引发广泛关注。同时，Cursor强调其在强化学习和成本效率上的突破，标志着AI代码助手进入高效智能新阶段。]]></description>
            <content:encoded><![CDATA[Cursor 推出新一代AI代码助手模型Composer 2.5，以1/10的成本实现接近Claude Opus 4.7和GPT-5.5的性能，尤其在长期任务处理和复杂指令遵循上表现卓越。该模型基于月之暗面Kimi K2.5开源检查点，通过精准文本反馈强化学习、25倍规模的合成数据训练及创新的分片Muon与双网格HSDP优化技术实现性能跃升。其定价极具竞争力，且未来将与SpaceXAI合作，利用Colossus 2百万H100算力训练更大模型。马斯克公开推荐该模型，引发广泛关注。同时，Cursor强调其在强化学习和成本效率上的突破，标志着AI代码助手进入高效智能新阶段。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqH8kzzyB1bhDGQ18cZBKXyvPa9XxsayltuibsibiaphDnecjK7iaicMlAfIKKlev2kCq3xkE3jbMWr7ogib6hB5TcXBTCXa7oIMfMc5w/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqH8kzzyB1bhDGQ18cZBKXyvPa9XxsayltuibsibiaphDnecjK7iaicMlAfIKKlev2kCq3xkE3jbMWr7ogib6hB5TcXBTCXa7oIMfMc5w/0"/>
            <tag>人工智能</tag>
            <tag>深度学习</tag>
            <tag>强化学习</tag>
            <tag>大模型优化</tag>
            <tag>模型训练技术</tag>
            <keyword>Composer 2.5</keyword>
            <keyword> Cursor</keyword>
            <keyword> AI代码助手</keyword>
            <keyword> 强化学习</keyword>
            <keyword> 成本效率</keyword>
            <keyword> Kimi K2.5</keyword>
            <keyword> SpaceXAI</keyword>
            <keyword> Colossus 2</keyword>
            <keyword> 合成数据</keyword>
            <keyword> 文本反馈</keyword>
        </item>
        <item>
            <title><![CDATA[ICML 2026｜告别「单线程」思维，智能体进化出了原生的并行推理大脑]]></title>
            <link>https://mp.weixin.qq.com/s/liJD5FDI1_CbK7ZNVkpuwg</link>
            <guid isPermaLink="false">564b2bf0dd2f0231498211c970787c23</guid>
            <pubDate>Mon, 18 May 2026 23:31:21 GMT</pubDate>
            <description><![CDATA[北京通用人工智能研究院（BIGAI）语言交互实验室提出原生并行推理器（NPR），通过三阶段训练范式（格式学习、自蒸馏、并行强化学习）使大语言模型无需依赖外部教师模型，即可内化并行推理能力。NPR突破传统链式思维的局限，支持多路径并行探索与聚合，显著提升复杂推理任务的准确率与效率，在8个推理基准上平均提升8.9%，推理速度达串行解码的4.6倍。关键技术包括并行注意力掩码、KV Cache重用和并行感知强化学习（PAPO），并实现100%并行触发率，超越现有方法如Multiverse。该工作标志着并行推理从工程技巧向模型原生认知能力的跃迁，为构建更通用、可扩展的智能体提供新路径。]]></description>
            <content:encoded><![CDATA[北京通用人工智能研究院（BIGAI）语言交互实验室提出原生并行推理器（NPR），通过三阶段训练范式（格式学习、自蒸馏、并行强化学习）使大语言模型无需依赖外部教师模型，即可内化并行推理能力。NPR突破传统链式思维的局限，支持多路径并行探索与聚合，显著提升复杂推理任务的准确率与效率，在8个推理基准上平均提升8.9%，推理速度达串行解码的4.6倍。关键技术包括并行注意力掩码、KV Cache重用和并行感知强化学习（PAPO），并实现100%并行触发率，超越现有方法如Multiverse。该工作标志着并行推理从工程技巧向模型原生认知能力的跃迁，为构建更通用、可扩展的智能体提供新路径。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqEvPdmHH9NEVgI3dV0ZSnkb6vOzXQDFk5QQZbP6ibsM4YD7OHicib2EMB0DJRsckWXQWsuF6E16wqzq2YWFqAibcPIQibpnpUk208tw/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqEvPdmHH9NEVgI3dV0ZSnkb6vOzXQDFk5QQZbP6ibsM4YD7OHicib2EMB0DJRsckWXQWsuF6E16wqzq2YWFqAibcPIQibpnpUk208tw/0"/>
            <tag>人工智能</tag>
            <tag>大语言模型</tag>
            <tag>并行推理</tag>
            <tag>强化学习</tag>
            <tag>自蒸馏</tag>
            <keyword>原生并行推理器</keyword>
            <keyword>NPR</keyword>
            <keyword>北京通用人工智能研究院</keyword>
            <keyword>自蒸馏</keyword>
            <keyword>并行强化学习</keyword>
            <keyword>并行推理</keyword>
            <keyword>大语言模型</keyword>
            <keyword>推理效率</keyword>
            <keyword>多路径探索</keyword>
            <keyword>PAPO</keyword>
        </item>
        <item>
            <title><![CDATA[ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考]]></title>
            <link>https://mp.weixin.qq.com/s/aFc3zQKXhA1GFUNwYstfng</link>
            <guid isPermaLink="false">14141e3d621f401bba497e4fa140c42a</guid>
            <pubDate>Mon, 18 May 2026 09:53:56 GMT</pubDate>
            <description><![CDATA[本文提出了一种名为Heima的高效多模态大模型推理框架，通过将冗长的显式Chain-of-Thought（CoT）推理过程压缩为少量隐式thinking tokens，显著降低推理延迟与计算成本，同时保留模型的推理能力。该方法采用渐进式蒸馏训练策略，并设计了基于语言模型的解释器（interpreter）以重建和验证隐式推理过程。实验表明，Heima在多个多模态基准上大幅减少生成token数量，准确率接近或超越传统CoT方法，并通过解释器实现了隐式思考的可分析性。该研究为大模型在效率与可解释性之间提供了新平衡，推动了隐式推理与高效多模态系统的发展。]]></description>
            <content:encoded><![CDATA[本文提出了一种名为Heima的高效多模态大模型推理框架，通过将冗长的显式Chain-of-Thought（CoT）推理过程压缩为少量隐式thinking tokens，显著降低推理延迟与计算成本，同时保留模型的推理能力。该方法采用渐进式蒸馏训练策略，并设计了基于语言模型的解释器（interpreter）以重建和验证隐式推理过程。实验表明，Heima在多个多模态基准上大幅减少生成token数量，准确率接近或超越传统CoT方法，并通过解释器实现了隐式思考的可分析性。该研究为大模型在效率与可解释性之间提供了新平衡，推动了隐式推理与高效多模态系统的发展。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqHibGliaW8AeTbggogibuFD8Cd1IOePkiciaUYpMrpgVd04iaeV4YTv0skjXJOm1nHM30CREGib43iaeQxyTAqtc7dDkAL8FswHdtia6TW0/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqHibGliaW8AeTbggogibuFD8Cd1IOePkiciaUYpMrpgVd04iaeV4YTv0skjXJOm1nHM30CREGib43iaeQxyTAqtc7dDkAL8FswHdtia6TW0/0"/>
            <tag>大语言模型</tag>
            <tag>多模态学习</tag>
            <tag>推理优化</tag>
            <tag>隐式推理</tag>
            <tag>高效计算</tag>
            <keyword>Heima</keyword>
            <keyword> Chain-of-Thought</keyword>
            <keyword> 隐式推理</keyword>
            <keyword> 多模态大模型</keyword>
            <keyword> thinking tokens</keyword>
            <keyword> 推理压缩</keyword>
            <keyword> 解释器</keyword>
            <keyword> ICML 2026</keyword>
            <keyword> 效率优化</keyword>
            <keyword> 可解释性</keyword>
        </item>
        <item>
            <title><![CDATA[王云鹤眼中的Harness：复杂优化问题，AGI灵魂争夺之战]]></title>
            <link>https://mp.weixin.qq.com/s/Jxf4hqDNiVeB8C0KqJCNFA</link>
            <guid isPermaLink="false">f7a6437c6ce2d40d996e29a1da843714</guid>
            <pubDate>Mon, 18 May 2026 09:53:56 GMT</pubDate>
            <description><![CDATA[本文探讨了人工智能领域中Agent的本质与演进路径，提出Agent并非单纯的大模型（Base Model），而是由大模型与Harness层共同构成的系统。作者王云鹤强调，Harness（包括prompt优化、工具调用、记忆、安全机制等）是释放模型潜力的关键，其复杂性堪比系统工程。随着多模型协同、任务冲突与复杂场景需求的出现，Harness不仅不会被模型取代，反而会持续进化，甚至反哺模型训练。文章进一步提出，未来AGI的突破可能在于模型参数与Harness参数的联合优化，引发关于AI‘灵魂’归属的深层思考——智能的核心究竟在模型本身，还是在驾驭它的Harness系统中。]]></description>
            <content:encoded><![CDATA[本文探讨了人工智能领域中Agent的本质与演进路径，提出Agent并非单纯的大模型（Base Model），而是由大模型与Harness层共同构成的系统。作者王云鹤强调，Harness（包括prompt优化、工具调用、记忆、安全机制等）是释放模型潜力的关键，其复杂性堪比系统工程。随着多模型协同、任务冲突与复杂场景需求的出现，Harness不仅不会被模型取代，反而会持续进化，甚至反哺模型训练。文章进一步提出，未来AGI的突破可能在于模型参数与Harness参数的联合优化，引发关于AI‘灵魂’归属的深层思考——智能的核心究竟在模型本身，还是在驾驭它的Harness系统中。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqFEPe9pWjjRdGcLRDibFIhM6jyaeq9JlfWXF2qSBHIH2V3bRCqfF50Ck9fxYJficas5zmkaiazcbmiaX372UhCokXg2AyhRojZFDvw/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqFEPe9pWjjRdGcLRDibFIhM6jyaeq9JlfWXF2qSBHIH2V3bRCqfF50Ck9fxYJficas5zmkaiazcbmiaX372UhCokXg2AyhRojZFDvw/0"/>
            <tag>人工智能</tag>
            <tag>大语言模型</tag>
            <tag>智能体</tag>
            <tag>系统工程</tag>
            <tag>优化算法</tag>
            <keyword>Agent</keyword>
            <keyword> Harness Engineering</keyword>
            <keyword> 大模型</keyword>
            <keyword> 模型协同</keyword>
            <keyword> AgentOS</keyword>
            <keyword> 优化问题</keyword>
            <keyword> AI灵魂</keyword>
            <keyword> 多模型</keyword>
            <keyword> 工具调用</keyword>
            <keyword> 基础模型</keyword>
        </item>
        <item>
            <title><![CDATA[ICML 2026 ｜让大模型边想边说：这篇文章把「何时开口」变成可学习策略]]></title>
            <link>https://mp.weixin.qq.com/s/2alWxJBySk4z4DWTA_QN4g</link>
            <guid isPermaLink="false">f6f956c4c48abba8e22900148bf44001</guid>
            <pubDate>Mon, 18 May 2026 06:31:13 GMT</pubDate>
            <description><![CDATA[本文介绍了一项名为Side-by-Side（SxS）Interleaved Reasoning的创新方法，旨在解决大语言模型在推理过程中面临的‘沉默税’问题——即用户在等待模型输出时经历的长时间无内容延迟。传统模型在单一流式生成中将推理与披露绑定，导致要么等待过久，要么过早输出错误内容。SxS方法通过在自回归生成中引入‘思考’（think）与‘披露’（speak）两种交替动作，使模型能基于当前推理进展有选择地披露已支持的答案片段，从而在不牺牲准确率的前提下显著缩短用户感知的响应延迟。研究在Qwen3等模型上验证了该方法在数学与科学推理任务中的有效性，并通过SFT+RL训练流程确保模型既掌握披露节奏，又保持推理能力。该工作将流式交互从工程层面提升至模型学习层面，为AI交互体验提供了可优化、可评测的新范式。]]></description>
            <content:encoded><![CDATA[本文介绍了一项名为Side-by-Side（SxS）Interleaved Reasoning的创新方法，旨在解决大语言模型在推理过程中面临的‘沉默税’问题——即用户在等待模型输出时经历的长时间无内容延迟。传统模型在单一流式生成中将推理与披露绑定，导致要么等待过久，要么过早输出错误内容。SxS方法通过在自回归生成中引入‘思考’（think）与‘披露’（speak）两种交替动作，使模型能基于当前推理进展有选择地披露已支持的答案片段，从而在不牺牲准确率的前提下显著缩短用户感知的响应延迟。研究在Qwen3等模型上验证了该方法在数学与科学推理任务中的有效性，并通过SFT+RL训练流程确保模型既掌握披露节奏，又保持推理能力。该工作将流式交互从工程层面提升至模型学习层面，为AI交互体验提供了可优化、可评测的新范式。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqFEvafV2Licjwml27FxzaW82vJxR83QKumEqfsibekyhxQjRzBmVMqtva7XjicFOMuibnSZLHVHqWvibPDNz0mxpaKO5emGwN9z5WQY/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqFEvafV2Licjwml27FxzaW82vJxR83QKumEqfsibekyhxQjRzBmVMqtva7XjicFOMuibnSZLHVHqWvibPDNz0mxpaKO5emGwN9z5WQY/0"/>
            <tag>大语言模型</tag>
            <tag>推理优化</tag>
            <tag>流式交互</tag>
            <tag>强化学习</tag>
            <tag>自回归生成</tag>
            <keyword>SxS交错推理</keyword>
            <keyword>沉默税</keyword>
            <keyword>大语言模型</keyword>
            <keyword>流式推理</keyword>
            <keyword>披露策略</keyword>
            <keyword>强化学习</keyword>
            <keyword>推理延迟</keyword>
            <keyword>ACM/ICML</keyword>
            <keyword>机器之心</keyword>
        </item>
        <item>
            <title><![CDATA[断崖第一！深度机智Z-WM再夺WorldArena冠军]]></title>
            <link>https://mp.weixin.qq.com/s/hU5yohoaWKqOPWcSJD4YDA</link>
            <guid isPermaLink="false">1c43c580235eae7cb62656f7336abb72</guid>
            <pubDate>Mon, 18 May 2026 06:31:13 GMT</pubDate>
            <description><![CDATA[深度机智（DeepCybo）是一家专注于具身通用智能（E-AGI）的公司，成立于2025年5月，一年内通过构建以人类第一视角数据为核心的完整技术体系，实现突破性进展。其核心创新包括：首创ICDC情境数采体系构建DeepAct数据集，发布零真机轨迹预训练的PhysBrain基座模型，研发世界模型Z-WM与策略系统STARRY，并在WorldArena Track2数据引擎赛道以88.5分断崖夺冠，证明其生成数据可有效提升机器人任务成功率。该公司主张“先理解世界，再驱动行动”，通过物理常识建模、空间推理、多模态融合与拟人硬件Prime系统，形成从数据到行动的全栈闭环，引领具身智能从‘数据量竞争’转向‘数据质量与物理一致性’的新范式。]]></description>
            <content:encoded><![CDATA[深度机智（DeepCybo）是一家专注于具身通用智能（E-AGI）的公司，成立于2025年5月，一年内通过构建以人类第一视角数据为核心的完整技术体系，实现突破性进展。其核心创新包括：首创ICDC情境数采体系构建DeepAct数据集，发布零真机轨迹预训练的PhysBrain基座模型，研发世界模型Z-WM与策略系统STARRY，并在WorldArena Track2数据引擎赛道以88.5分断崖夺冠，证明其生成数据可有效提升机器人任务成功率。该公司主张“先理解世界，再驱动行动”，通过物理常识建模、空间推理、多模态融合与拟人硬件Prime系统，形成从数据到行动的全栈闭环，引领具身智能从‘数据量竞争’转向‘数据质量与物理一致性’的新范式。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqFkgZa4LrAD6pK7Lfibs3N6CweKL5GgVN8CghqGQhic8mASEUvISpuvKsnWDKB0icPuxXtSREzAaYCrL7rkZ8F163QI5OYLpAic8zA/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqFkgZa4LrAD6pK7Lfibs3N6CweKL5GgVN8CghqGQhic8mASEUvISpuvKsnWDKB0icPuxXtSREzAaYCrL7rkZ8F163QI5OYLpAic8zA/0"/>
            <tag>人工智能</tag>
            <tag>具身智能</tag>
            <tag>世界模型</tag>
            <tag>数据驱动学习</tag>
            <tag>物理常识建模</tag>
            <keyword>深度机智</keyword>
            <keyword> 具身通用智能</keyword>
            <keyword> 人类第一视角</keyword>
            <keyword> WorldArena</keyword>
            <keyword> Z-WM</keyword>
            <keyword> PhysBrain</keyword>
            <keyword> 数据引擎</keyword>
            <keyword> 物理常识</keyword>
            <keyword> 世界模型</keyword>
            <keyword> 情境数采</keyword>
        </item>
        <item>
            <title><![CDATA[「虾马」之后，openJiuwen社区发布JiuwenSwarm，引领蜂群智能体新架构，开启「养蜂」时代]]></title>
            <link>https://mp.weixin.qq.com/s/2TbMQqpAP60vS0D88C8nlQ</link>
            <guid isPermaLink="false">61ac3f31c549cdc990a6be78132d495d</guid>
            <pubDate>Mon, 18 May 2026 04:47:44 GMT</pubDate>
            <description><![CDATA[华为支持的开源AI Agent平台openJiuwen发布并开源了蜂群智能体JiuwenSwarm，提出并落地了‘协同工程’（Coordination Engineering）新范式，推动AI从单智能体向群体智能演进。该系统通过Agent Swarm实现多智能体自主分工与动态协作，Swarm Skills封装团队协作经验，Swarm Skills Hub构建共享生态，并通过自演进飞轮实现持续优化。支持人类以HOTS（指挥）或HITS（沉浸参与）模式协同，已在医疗、教育、编程、游戏等领域验证显著效果。结合底层openJiuwen Harness的高性能执行能力，JiuwenSwarm在PinchBench等评测中表现领先，整体实现可跑、可复用、可共建的开源群体智能框架，开启AI时代的‘养蜂’新范式。]]></description>
            <content:encoded><![CDATA[华为支持的开源AI Agent平台openJiuwen发布并开源了蜂群智能体JiuwenSwarm，提出并落地了‘协同工程’（Coordination Engineering）新范式，推动AI从单智能体向群体智能演进。该系统通过Agent Swarm实现多智能体自主分工与动态协作，Swarm Skills封装团队协作经验，Swarm Skills Hub构建共享生态，并通过自演进飞轮实现持续优化。支持人类以HOTS（指挥）或HITS（沉浸参与）模式协同，已在医疗、教育、编程、游戏等领域验证显著效果。结合底层openJiuwen Harness的高性能执行能力，JiuwenSwarm在PinchBench等评测中表现领先，整体实现可跑、可复用、可共建的开源群体智能框架，开启AI时代的‘养蜂’新范式。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqHJl6hrBfiad4STgODlwdSstSYFkc0PWiaksXksWPAQx2WblBZFiaibZpKcicPJlt9U7XXOib7z25MH8V0RaV3aibNofiak3IxCwdl87wY/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqHJl6hrBfiad4STgODlwdSstSYFkc0PWiaksXksWPAQx2WblBZFiaibZpKcicPJlt9U7XXOib7z25MH8V0RaV3aibNofiak3IxCwdl87wY/0"/>
            <tag>人工智能</tag>
            <tag>群体智能</tag>
            <tag>多智能体协同</tag>
            <tag>协同工程</tag>
            <tag>自演进系统</tag>
            <keyword>JiuwenSwarm</keyword>
            <keyword> 协同工程</keyword>
            <keyword> 群体智能</keyword>
            <keyword> openJiuwen</keyword>
            <keyword> Swarm Skills</keyword>
            <keyword> HOTS</keyword>
            <keyword> HITS</keyword>
            <keyword> 多智能体协作</keyword>
            <keyword> 自演进</keyword>
            <keyword> 华为</keyword>
        </item>
        <item>
            <title><![CDATA[消费级具身智能跨越式新品：算力提升1000倍，对标英伟达Jetson Thor芯片，成本仅1/10！]]></title>
            <link>https://mp.weixin.qq.com/s/Oh02TutOXOAQgoMJj8lPww</link>
            <guid isPermaLink="false">46103cd36b749b401d88e4628b8efe5d</guid>
            <pubDate>Mon, 18 May 2026 04:47:44 GMT</pubDate>
            <description><![CDATA[蔚蓝科技发布新一代仿生机器狗BabyAlpha A3，通过自研的6芯片混合异构计算架构，实现算力提升千倍、端侧大模型运行能力突破，成本仅为英伟达方案的1/10。其感知系统超越人类，配备6600万像素视觉、360°环视空间建模与12麦3D立体听觉，首次在消费级产品中实现全自主智能导航与安全交互。产品不依赖外部标签，数据本地处理，隐私安全，已累计售出2.5万台，真实家庭使用超9.5亿分钟，标志着消费级具身智能从概念走向落地。该技术路径突破国外芯片封锁，具备向数据中心扩展的通用潜力，被视为AI机器人进入家庭的关键转折点。]]></description>
            <content:encoded><![CDATA[蔚蓝科技发布新一代仿生机器狗BabyAlpha A3，通过自研的6芯片混合异构计算架构，实现算力提升千倍、端侧大模型运行能力突破，成本仅为英伟达方案的1/10。其感知系统超越人类，配备6600万像素视觉、360°环视空间建模与12麦3D立体听觉，首次在消费级产品中实现全自主智能导航与安全交互。产品不依赖外部标签，数据本地处理，隐私安全，已累计售出2.5万台，真实家庭使用超9.5亿分钟，标志着消费级具身智能从概念走向落地。该技术路径突破国外芯片封锁，具备向数据中心扩展的通用潜力，被视为AI机器人进入家庭的关键转折点。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqEWxJ5IeIdt61PZicjXZYfZMQcELtkMBycVy22EVZN1OSKJgial2mqiavPgMgias8c1kjkvgZyjn6eRk4SH19CqpseCAwhC9GelpCA/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqEWxJ5IeIdt61PZicjXZYfZMQcELtkMBycVy22EVZN1OSKJgial2mqiavPgMgias8c1kjkvgZyjn6eRk4SH19CqpseCAwhC9GelpCA/0"/>
            <tag>具身智能</tag>
            <tag>边缘计算</tag>
            <tag>异构计算</tag>
            <tag>端侧大模型</tag>
            <tag>感知系统</tag>
            <keyword>BabyAlpha A3</keyword>
            <keyword> 蔚蓝科技</keyword>
            <keyword> 混合异构计算</keyword>
            <keyword> 端侧大模型</keyword>
            <keyword> 具身智能</keyword>
            <keyword> 感知系统</keyword>
            <keyword> 消费级机器人</keyword>
            <keyword> 国产算力</keyword>
        </item>
        <item>
            <title><![CDATA[ICML 2026 | 华为GTS提出AI训练数据新方法，Amazon/Google作者团队「光速跟进」：难度自适应训练正在成为新范式]]></title>
            <link>https://mp.weixin.qq.com/s/KR0aKOy84Yot-CqgrxW2Bg</link>
            <guid isPermaLink="false">d041eac8c67a8085fe27c614d4478d97</guid>
            <pubDate>Mon, 18 May 2026 04:47:44 GMT</pubDate>
            <description><![CDATA[华为GTS AI数据团队提出EDCO（基于熵的动态课程编排）方法，用于领域大模型微调，通过推理熵动态选择当前最困惑、最有学习价值的样本，替代传统静态课程策略。该方法在通信、医疗、法律等高质量数据稀缺的垂直领域显著提升模型性能，结合前缀熵估计与快速问答提示，大幅降低计算开销。EDCO被ICML 2026接收，实验表明其在SFT与RLFT范式下均优于随机采样、困惑度排序等基线，实现训练效率与效果的双重优化，标志着数据选择从工程细节上升为核心算法问题。]]></description>
            <content:encoded><![CDATA[华为GTS AI数据团队提出EDCO（基于熵的动态课程编排）方法，用于领域大模型微调，通过推理熵动态选择当前最困惑、最有学习价值的样本，替代传统静态课程策略。该方法在通信、医疗、法律等高质量数据稀缺的垂直领域显著提升模型性能，结合前缀熵估计与快速问答提示，大幅降低计算开销。EDCO被ICML 2026接收，实验表明其在SFT与RLFT范式下均优于随机采样、困惑度排序等基线，实现训练效率与效果的双重优化，标志着数据选择从工程细节上升为核心算法问题。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqFxu8FZFvicSylGya0H1pvzLSWjE8P6CVQoXs9A5xK5cpSzMO3ibGIAKbI2gFQ1HGUYeWldrSbCy4BJgUtOmX3nJbXmZdOKcrZu4/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqFxu8FZFvicSylGya0H1pvzLSWjE8P6CVQoXs9A5xK5cpSzMO3ibGIAKbI2gFQ1HGUYeWldrSbCy4BJgUtOmX3nJbXmZdOKcrZu4/0"/>
            <tag>大语言模型</tag>
            <tag>课程学习</tag>
            <tag>动态训练</tag>
            <tag>推理熵</tag>
            <tag>领域微调</tag>
            <keyword>EDCO</keyword>
            <keyword> 动态课程编排</keyword>
            <keyword> 推理熵</keyword>
            <keyword> 领域大模型微调</keyword>
            <keyword> 华为GTS</keyword>
            <keyword> 数据选择</keyword>
            <keyword> SFT</keyword>
            <keyword> RLFT</keyword>
            <keyword> 前缀熵估计</keyword>
            <keyword> ICML 2026</keyword>
        </item>
        <item>
            <title><![CDATA[LLM助力突破尘封60年数学猜想！北大王立威团队大幅刷新斯坦纳比下界]]></title>
            <link>https://mp.weixin.qq.com/s/wouVCk7pIbRfME-E0QQmfQ</link>
            <guid isPermaLink="false">387e94804ea08cfc1b6696cca44ad151</guid>
            <pubDate>Mon, 18 May 2026 03:42:31 GMT</pubDate>
            <description><![CDATA[北京大学王立威团队联合多位学者，首次利用大语言模型（LLM）在数学猜想研究中取得突破性进展，将困扰学界近60年的Gilbert-Pollak猜想（斯坦纳比）下界从0.824提升至0.8559，逼近理论最优值0.866。研究创新性地构建了“验证函数+奖励模型+瓶颈引导”的迭代框架，让LLM通过生成结构化数学引理（如四点斯坦纳树引理）并结合Mathematica自动验证，实现可扩展、可信赖的证明辅助。该成果被ICML 2026接收，代码开源，并获陶哲轩收录于组合数学常数列表，标志着LLM在严谨数学证明中从辅助短证明迈向研究级问题的重大跨越。]]></description>
            <content:encoded><![CDATA[北京大学王立威团队联合多位学者，首次利用大语言模型（LLM）在数学猜想研究中取得突破性进展，将困扰学界近60年的Gilbert-Pollak猜想（斯坦纳比）下界从0.824提升至0.8559，逼近理论最优值0.866。研究创新性地构建了“验证函数+奖励模型+瓶颈引导”的迭代框架，让LLM通过生成结构化数学引理（如四点斯坦纳树引理）并结合Mathematica自动验证，实现可扩展、可信赖的证明辅助。该成果被ICML 2026接收，代码开源，并获陶哲轩收录于组合数学常数列表，标志着LLM在严谨数学证明中从辅助短证明迈向研究级问题的重大跨越。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqFzBjxh9jRkGENq4TbqGwaIMsDbsx2MJB135YwFnWgOx4evNQH1d82bHbUh63pMVeZoV2Q3Q1p3oibmdqMZciavlY4nKT5lYeO9U/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqFzBjxh9jRkGENq4TbqGwaIMsDbsx2MJB135YwFnWgOx4evNQH1d82bHbUh63pMVeZoV2Q3Q1p3oibmdqMZciavlY4nKT5lYeO9U/0"/>
            <tag>大语言模型</tag>
            <tag>数学证明</tag>
            <tag>组合优化</tag>
            <tag>自动推理</tag>
            <tag>验证函数</tag>
            <keyword>Gilbert-Pollak猜想</keyword>
            <keyword> 斯坦纳比</keyword>
            <keyword> 大语言模型</keyword>
            <keyword> 数学证明</keyword>
            <keyword> LLM辅助数学</keyword>
            <keyword> 北京大学</keyword>
            <keyword> 王立威</keyword>
            <keyword> ICML 2026</keyword>
            <keyword> 验证函数</keyword>
            <keyword> 瓶颈引导</keyword>
        </item>
        <item>
            <title><![CDATA[大神李沐回归B站「做了个实时数字人」，直言「水平吊打我自己」]]></title>
            <link>https://mp.weixin.qq.com/s/UzXWBhTZZbkB6Q7wiOfKlw</link>
            <guid isPermaLink="false">7f013785bff4bbc4c1a3026d5bc501b5</guid>
            <pubDate>Mon, 18 May 2026 03:42:31 GMT</pubDate>
            <description><![CDATA[机器之心报道，知名AI教育者李沐回归并发布其创业公司BosonAI的最新成果——Higgs Avatar v1，一款仅需单张静态图片即可生成实时、高保真、低延迟数字人形象的AI模型。该模型支持语音驱动的唇形、表情与头部动作同步，单张H100 GPU可并发8路对话，成本极低，适用于客服、教育、虚拟助手等场景。Higgs Avatar v1与Higgs Audio构成BosonAI的双引擎系统，强调全栈自研以解决语音与视觉脱节问题。目前产品进入内测，将集成于Boson Presence平台，并同步预告CVPR 2026北京峰会。]]></description>
            <content:encoded><![CDATA[机器之心报道，知名AI教育者李沐回归并发布其创业公司BosonAI的最新成果——Higgs Avatar v1，一款仅需单张静态图片即可生成实时、高保真、低延迟数字人形象的AI模型。该模型支持语音驱动的唇形、表情与头部动作同步，单张H100 GPU可并发8路对话，成本极低，适用于客服、教育、虚拟助手等场景。Higgs Avatar v1与Higgs Audio构成BosonAI的双引擎系统，强调全栈自研以解决语音与视觉脱节问题。目前产品进入内测，将集成于Boson Presence平台，并同步预告CVPR 2026北京峰会。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqFMoSHsrVwKjJK24lx0uHvmQEw3UzfLgicPalcwy6xvpicOVSu2EsialEPnv32tWLFuWUviaje0o5pZqUSQQonXEdfQGicicXny1ufUM/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqFMoSHsrVwKjJK24lx0uHvmQEw3UzfLgicPalcwy6xvpicOVSu2EsialEPnv32tWLFuWUviaje0o5pZqUSQQonXEdfQGicicXny1ufUM/0"/>
            <tag>人工智能</tag>
            <tag>实时数字人</tag>
            <tag>语音交互</tag>
            <tag>端到端模型</tag>
            <tag>视觉与语音同步</tag>
            <keyword>Higgs Avatar v1</keyword>
            <keyword>BosonAI</keyword>
            <keyword>李沐</keyword>
            <keyword>实时数字人</keyword>
            <keyword>AI语音交互</keyword>
            <keyword>全栈自研</keyword>
            <keyword>H100 GPU</keyword>
            <keyword>CVPR 2026</keyword>
        </item>
        <item>
            <title><![CDATA[CVPR 2026 Oral | 清华+阿里发布ViT³：解锁「视觉TTT」新架构，突破Transformer复杂度瓶颈]]></title>
            <link>https://mp.weixin.qq.com/s/yJDuMj9gY6JLQtjng2p_FQ</link>
            <guid isPermaLink="false">b02096b219d9c613da962da8b5fb43be</guid>
            <pubDate>Sun, 17 May 2026 06:31:57 GMT</pubDate>
            <description><![CDATA[本文由清华大学韩东辰博士生与黄高副教授团队提出ViT³，一种面向视觉任务的纯测试时训练（Test-Time Training, TTT）架构，旨在解决Transformer序列建模中计算复杂度随序列长度平方增长的问题。研究系统分析了TTT在视觉领域的设计空间，总结出六条关键设计原则，包括使用点积损失、全批量训练、高学习率（1.0）、扩大内部模型容量、避免过深结构以及采用卷积作为内部模型。基于这些原则构建的ViT³模型在图像分类、目标检测、图像生成等任务上超越现有线性复杂度模型，同时显著降低显存占用与推理延迟，为高效视觉序列建模提供了新范式与坚实基线。]]></description>
            <content:encoded><![CDATA[本文由清华大学韩东辰博士生与黄高副教授团队提出ViT³，一种面向视觉任务的纯测试时训练（Test-Time Training, TTT）架构，旨在解决Transformer序列建模中计算复杂度随序列长度平方增长的问题。研究系统分析了TTT在视觉领域的设计空间，总结出六条关键设计原则，包括使用点积损失、全批量训练、高学习率（1.0）、扩大内部模型容量、避免过深结构以及采用卷积作为内部模型。基于这些原则构建的ViT³模型在图像分类、目标检测、图像生成等任务上超越现有线性复杂度模型，同时显著降低显存占用与推理延迟，为高效视觉序列建模提供了新范式与坚实基线。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/sz_mmbiz_jpg/5L8bhP5dIqGAxK5kia1Se5ZprNPwFmicEbnFI1Kryxapq5xYIQdibkBqia3fudiaSKrTgoGv6jZFRZRp1NH9bwM6UiaicKHaCU3UF1ZZHzEaEhplNk/0" length="0" type="image//sz_mmbiz_jpg/5L8bhP5dIqGAxK5kia1Se5ZprNPwFmicEbnFI1Kryxapq5xYIQdibkBqia3fudiaSKrTgoGv6jZFRZRp1NH9bwM6UiaicKHaCU3UF1ZZHzEaEhplNk/0"/>
            <tag>序列建模</tag>
            <tag>测试时训练</tag>
            <tag>视觉Transformer</tag>
            <tag>线性复杂度模型</tag>
            <tag>深度学习</tag>
            <keyword>测试时训练</keyword>
            <keyword> ViT³</keyword>
            <keyword> 序列建模</keyword>
            <keyword> 视觉Transformer</keyword>
            <keyword> 线性复杂度</keyword>
            <keyword> 卷积内部模型</keyword>
            <keyword> 深度学习</keyword>
            <keyword> 黄高</keyword>
            <keyword> 韩东辰</keyword>
            <keyword> 机器之心</keyword>
        </item>
        <item>
            <title><![CDATA[大语言模型为什么能像人一样说话和思考？]]></title>
            <link>https://mp.weixin.qq.com/s/aYxniqYNTcWyihYxAruLWQ</link>
            <guid isPermaLink="false">486e41aeb3555e96e467348345332151</guid>
            <pubDate>Sun, 17 May 2026 06:31:57 GMT</pubDate>
            <description><![CDATA[本文由字节跳动的李航、张少华、林苑撰写，系统探讨了大语言模型（LLM）的语言与推理能力及其工作机制。文章指出，LLM通过下一词元预测学习语言的高阶模式，而非仅表面统计规律；其能力源于Transformer架构、强化学习策略与大规模数据的系统整合。作者提出功能词元假说，揭示功能词（如标点、冠词）在记忆存储与检索中的核心作用，并结合稀疏自编码器（SAE）与跨层转码器（CLT）等可解释性工具，解析了特征叠加、稀疏激活与跨层回路等内部机制。文章还对比了LLM与人类认知的异同，认为LLM在语言与推理上已接近人类水平，但缺乏具身认知、意识与严谨逻辑推理能力，幻觉问题源于统计学习本质。研究为理解LLM的‘思考’提供了理论框架与实证路径。]]></description>
            <content:encoded><![CDATA[本文由字节跳动的李航、张少华、林苑撰写，系统探讨了大语言模型（LLM）的语言与推理能力及其工作机制。文章指出，LLM通过下一词元预测学习语言的高阶模式，而非仅表面统计规律；其能力源于Transformer架构、强化学习策略与大规模数据的系统整合。作者提出功能词元假说，揭示功能词（如标点、冠词）在记忆存储与检索中的核心作用，并结合稀疏自编码器（SAE）与跨层转码器（CLT）等可解释性工具，解析了特征叠加、稀疏激活与跨层回路等内部机制。文章还对比了LLM与人类认知的异同，认为LLM在语言与推理上已接近人类水平，但缺乏具身认知、意识与严谨逻辑推理能力，幻觉问题源于统计学习本质。研究为理解LLM的‘思考’提供了理论框架与实证路径。]]></content:encoded>
            <author>机器之心</author>
            <enclosure url="https://mmbiz.qpic.cn/mmbiz_jpg/5L8bhP5dIqFxsdpnxSbS66LicOu37NZbVv3YtbhHJiaR1DPGHicjHiapINgcic6Z4PlZ8fljULfZ3ED83D47hwLetaQ3W6BIibLNQMeWsLK2icfXIg/0" length="0" type="image//mmbiz_jpg/5L8bhP5dIqFxsdpnxSbS66LicOu37NZbVv3YtbhHJiaR1DPGHicjHiapINgcic6Z4PlZ8fljULfZ3ED83D47hwLetaQ3W6BIibLNQMeWsLK2icfXIg/0"/>
            <tag>大语言模型</tag>
            <tag>深度学习</tag>
            <tag>神经网络</tag>
            <tag>可解释性人工智能</tag>
            <tag>特征表示</tag>
            <keyword>大语言模型</keyword>
            <keyword> LLM工作机制</keyword>
            <keyword> 功能词元假说</keyword>
            <keyword> 稀疏自编码器</keyword>
            <keyword> 跨层转码器</keyword>
            <keyword> 特征叠加</keyword>
            <keyword> 可解释性AI</keyword>
            <keyword> 机器之心</keyword>
            <keyword> 李航</keyword>
            <keyword> 张少华</keyword>
        </item>
    </channel>
</rss>