今日聚焦两个方向:AI 编程领域,Anthropic 联合创始人首次给出 RSI(递归自我改进)落地时间表,DeepSeek 开源推理加速框架大幅降低 Coding Agent 使用成本;具身智能方面,深度机智与 Generalist AI 同日传出巨额融资信号,物理 AI 基础设施之争进入白热化阶段。
Anthropic 联合创始人 Jack Clark:2028 年底 RSI 成真概率 60%
Anthropic 联合创始人 Jack Clark 在 Aspen Institute 活动上给出明确时间表:到 2028 年底之前,递归自我改进(Recursive Self-Improvement, RSI)很可能成真——AI 将自主发明并构建比自己更强的下一代模型,整个过程无人类研究员参与。Clark 将置信度明确打在 60%,并描绘了具体画面:Claude 10 将是这一节点的产物。
值得关注的原因:这是 AI 行业核心人物首次将 RSI 从哲学讨论和 PR 辞令切换为具体路线图。如果 60% 的概率成真,意味着未来 3 年内 AI 编程 Agent 将从"辅助人类写代码"进化到"自主设计并构建更好的 AI",对软件开发范式的冲击将是根本性的。同期英伟达与剑桥大学联合发布的"红皇后哥德尔机"论文,已在工程层面为 RSI 提供了可训练的实现路径。
来源:36氪
DeepSeek 开源 DSpark 推测解码框架,单用户推理速度提升 85%
DeepSeek 开源推测解码框架 DSpark 与配套训练框架 DeepSpec,由创始人梁文锋署名、联合北京大学完成。技术核心是半自回归生成与置信度调度验证:用轻量草稿模型并行生成候选 token,再由目标模型批量校验,对极可能被驳回的尾部 token 提前剪枝。对比生产基线 MTP-1,DSpark 在保持整体吞吐不变的前提下,将单用户生成速度提升 60%-85%,并避免了高并发下的吞吐率大幅滑坡。
值得关注的原因:推理速度是 AI Coding Agent 的核心瓶颈之一——Coding Agent 往往需要多轮迭代、长上下文推理,延迟直接影响开发体验。DSpark 以无额外硬件成本的方式将速度提升近一倍,对 Claude Code、Codex 等 Agent 产品的响应效率有直接改善意义。同时,这也是 DeepSeek 在 510 亿巨额融资后的首个重量级开源动作。
来源:36氪
深度机智完成新一轮数亿元融资,物理 AI 基座模型持续获投
北京中关村学院与中关村人工智能研究院联合孵化的深度机智(Deepcybo)宣布完成新一轮数亿元融资,由国寿长三角科创基金领投,普华资本、诚通科创基金等跟投。这是该公司近两个月内的第二轮数亿元融资。深度机智聚焦物理 AI 全栈技术,已建设数十万小时级 DeepAct 多模态人类第一视角数据集,发布了 PhysBrain 1.0 具身通用智能基座模型,并推出了 Prime 系列拟人体机器人产品线。
值得关注的原因:深度机智代表了一条独特的具身智能技术路线——"人类学习"范式,即通过人类第一视角数据直接训练机器人执行任务,而非依赖仿真环境或预编程。公司近期已验证了纯人类操作数据直驱机器人完成新任务的可行性,这比美国 Generalist AI 的 GEN-1 早一周发布。中关村体系孵化首个具身智能企业的身份,也意味着国家队在该领域的战略布局。
来源:网易科技、DoNews
Generalist AI 获 4 亿美元融资,打造通用机器人智能平台
由前 Google DeepMind 和 Boston Dynamics 工程师创立的 Generalist AI 完成 4 亿美元融资,估值达 20 亿美元,投资方包括 NVIDIA、Fei-Fei Li、Jeff Bezos 等。公司定位为构建面向所有机器人形态的通用智能平台——"Physical AGI",即一套能理解物理世界并在各类机器人本体上运行的基座模型。此前,Generalist AI 总融资已超过 7 亿美元。
值得关注的原因:Generalist AI 代表了具身智能领域的"平台化"路线——不是造机器人,而是为所有机器人提供通用大脑。NVIDIA 的投资意味着硬件巨头正在为下一波机器人计算需求铺路,而 Fei-Fei Li 的站台则连接了学术前沿与产业落地。4 亿美元的单笔融资在具身智能赛道属于第一梯队,与国内深度机智的"人类学习"路线形成中美两条并行路径的竞争格局。
来源:Robotics 24/7、The Robot Report
Semgrep 安全基准测试:GLM-5.2 首次正面击败 Claude
代码安全平台 Semgrep 发布详细测试报告:在其自研的 IDOR(不安全直接对象引用)基准上,智谱 GLM-5.2 以 39% F1 得分击败了 Claude。这是国产开源权重模型首次在严肃安全基准上对闭源前沿模型形成明确领先。Semgrep 给文章起的标题 "We have Mythos at home" 暗指此前被业内视为网络安全领域王者的 Anthropic Mythos 系列。
值得关注的原因:安全基准不同于通用编程基准——它要求模型具备深层代码理解能力,能发现逻辑漏洞而非简单的语法错误。GLM-5.2 在安全领域的突破,意味着国产开源模型在 AI Coding 的高价值细分场景中已具备与闭源前沿模型正面竞争的能力。结合 Anthropic 同日向美国参议院指控阿里 Qwen 蒸馏 Claude 的事件,中美 AI Coding 模型的竞争已从技术层面上升到叙事权与规则制定权的争夺。
来源:Semgrep Blog、量子位
本页的评论功能已关闭