我是Matt Burns,Insight Media Group的首席内容官。每周,我都会整理最重要的AI动态,解析这些发展对正在使用这项技术的个人和组织意味着什么。核心观点很简单:学会使用AI的从业者将定义下一个行业时代,而这份通讯的目的就是帮助你成为其中之一。
快讯:Forward Deployed Engineer学习路线图现已在Roadmap.sh正式上线。FDE正迅速成为科技领域最热门的岗位之一,我们火速制作了一份循序渐进的指南,帮助你快速掌握相关技能。
极简智能体NanoClaw的开发者加夫列尔·科恩(Gavriel Cohen)发现,自己的代码出现在OpenClaw项目中,既未注明出处,也未获得本人授权。他选择公开退出该项目,大卫·伊斯特曼(David Eastman)在The New Stack上发表的报道因此成为本周我们旗下各平台阅读量最高的文章,领先优势相当悬殊。
我的判断是:我们在尚未建立完善问责机制的前提下,就赋予了编程智能体高度自主权。而自主权并非遥远的未来,它已经切实存在于当下。Anthropic于周四发布的递归自我改进报告指出,Claude现在编写的代码已超过该公司合并代码总量的80%。上周我曾提出,Token极限化时代可能正走向终结,Token管控将成为新的核心能力。在成本管控方面,至少已经有了一些工具:据Paul Sawers报道,Cursor在同一周内削减了价格并增加了企业支出控制功能,而GitHub切换为Token计费模式却导致部分用户账单飙升。
Token的支出正在被纳入管控,但信任感不会像产品功能一样被设计出来,用户正在重新夺回对信任的主导权。
深度解析
在我看来,OpenClaw与科恩事件与其说是一桩丑闻,不如说是一次预演。OpenClaw的核心吸引力在于其开放性——可以自由运行、分叉,并与任意AI模型配合使用。也正是这种开放性,使得一位普通开发者的代码在毫不知情的情况下被吸纳进智能体,而没有任何人能说清楚是谁放进去的、何时放入的、依据什么条款放入的。科恩的回应之所以意义重大,在于他没有提出版权投诉,没有发起拉取请求,也没有提出和解要求。他只是看了看这个自己在不知不觉中帮助构建的工具,判断没有人能为它所吸收的内容负责,然后选择离开。这篇报道之所以迅速走红,是因为成千上万的开发者突然开始好奇:OpenClaw是否也在使用他们的代码?
更深层的结构性问题同样值得关注。达里尔·K·塔夫特(Darryl K. Taft)报道了Aikido Security的调查发现:被赋予依赖项自主管理权限的AI编程智能体,正在安装一些无人负责的软件包。"没有任何问责机制"这个标题并非夸大其词,而是对当前软件供应链现状的准确描述。这两个事件都没有说智能体本身不好用——智能体运行完全正常,它们正在按照设计初衷行事,也就是自主运作,但所处的生态系统还没有决定由谁来承担后果。
Linux之父林纳斯·托瓦兹(Linus Torvalds)本周也面临类似的问题。据B. Cameron Gain报道,托瓦兹对"99%的代码都是AI写的"这一说法表达了强烈愤慨,这篇报道随即被广泛转载。托瓦兹并非反对AI,他的怒火指向的是一种抹去了"人在回路中"这一事实的叙事方式。他所批评的这种趋势是真实存在的:Anthropic本周披露,其工程师目前的代码产出量是两年前的8倍,而其中一名员工已经五个月没有亲手写过一行代码了。
生成出来的代码,与真正意义上"被人创作"的代码,是两回事。署名权是产生责任的根源:它意味着有人能够说清楚这段代码做什么、为什么存在、出了问题谁来修。如今AI已经拥有了自主权,问责机制必须尽快跟上。
JetBrains正在将其Mellum2模型推向Claude Code无法涉足的领域。该公司已将这一编程模型开源,这意味着它可以在本地运行,直接对接不能流出企业内部的代码库——那些出于法律合规或常识判断而无法上传至第三方云端的代码。JetBrains没有声称Mellum2在智能程度上超越了Claude,他们卖的是截然不同的东西:一个可供检查、可在自有硬件上运行、并且有人能为其负责的模型。这是将问责能力作为产品特性来呈现的做法,我认为这一判断相当正确。JetBrains将自己定位为AI编程工具市场中最后一家主要的独立开发工具公司,而这个市场正日益与模型实验室和超大规模云服务商深度绑定。
谷歌本周则走向了另一个方向——将免费用户、Pro用户和Ultra用户从开源的Gemini CLI迁移到闭源的Antigravity CLI。就在OpenClaw突破30万Star的几天后,谷歌同步推出了Spark,一款闭源智能体,也是对这款最受欢迎的开源智能体的直接回应。然而经历了加夫列尔·科恩事件的风波之后,向早期采用者推销一款闭源智能体,恐怕比谷歌预想的要难得多。
深层警示
Anthropic本周发布了一份重要报告。"当AI开始构建自身"是该公司对自身自动化进程的公开总结,其中包含了一些令人震惊的坦诚披露。
根据这份报告,Claude已经完成了研究工作的前两个层级:执行任务和设计方案。第三个层级是选择研究问题,而Claude也已开始涉足这一领域。Anthropic的基准测试揭示了一项令人瞠目结舌却又相当原始的数据:在让模型训练代码运行得更快这项测试中,Claude仅用一年时间便从约3倍提速跃升至约52倍。而完成同样任务,一名经验丰富的人类工程师通常需要四到八小时,才能实现4倍的提速效果。此外,当Anthropic对真实研究过程中出现失误的会话进行复盘时,其最强模型在11月能以51%的概率选出比研究人员更优的下一步操作,到4月这一比例已上升至64%。判断力曾被认为是人类难以被超越的核心优势,而如今这一优势正在逐步消退。
报告中内部员工的发言读来像是一场互助会式的倾诉:有员工坦言,在心情好的日子里,"我忍不住觉得自己做什么都无关紧要";而在心情差的时候则感叹,"我已经不知道自己最近在干什么了"。从"创作者"到"审阅者"的角色转变正在实时发生,这一过程似乎正在给相关从业者带来真实的心理压力。
值得关注的是,报告称Anthropic愿意放缓甚至暂停前沿模型的研发——前提是其他实验室也同步这样做,并且能够得到切实验证。这个提议听起来难以落地。验证本身几乎无法实现,而当前有数以万亿美元计的资金正在推动AI以最快的速度发展。
这份报告指向了本周所有事件共同汇聚的同一个结论:人类很快将停止编写代码,转而专注于审阅代码,而人工审阅将成为制约AI发展速度的瓶颈。突然之间,最稀缺的资源不再是算力,而是那个能够承担责任的人类。
但企业究竟能在多久之内容忍人类成为进步的障碍?
在我看来,在可预见的未来,人类必须持续参与整个流程。但这个"参与方式"本身将会改变。AI在代码审阅方面将持续进步,工具和防护机制也会不断完善。那些急于加速的企业会尝试将审阅环节也自动化,用智能体来检查智能体,这种方式有些时候会奏效,有些时候则不然。
真正无法被自动化的,是那个为最终结果负责的人。
这是隐藏在所有这些事件之中的职业建议:在接下来几年胜出的开发者,不会是用AI生成代码最多的那些人,而是那些签名认可本身具有分量的人。
智能体最先获得了自主权,而问责,仍然是人类的职责。
Q&A
Q1:OpenClaw擅自使用他人代码事件的核心问题是什么?
A:OpenClaw事件的核心不在于简单的版权纠纷,而在于AI智能体生态中问责机制的系统性缺失。开发者科恩的代码被纳入OpenClaw,却没有任何人能说清楚是谁放进去的、何时放入的、基于什么条款。科恩没有走法律途径,而是直接公开退出项目,原因正是他判断这个系统中根本没有可以为此负责的人。这一事件引发了大量开发者对自身代码是否同样被使用的担忧。
Q2:Anthropic报告中关于Claude自主编程的数据有多惊人?
A:根据Anthropic发布的报告,Claude目前编写的代码已超过该公司合并代码总量的80%。在让模型训练代码提速的测试中,Claude在一年内从约3倍提速跃升至约52倍,而完成同类任务,经验丰富的人类工程师通常需要四到八小时才能实现4倍提速。此外,在对真实研究失误会话进行复盘时,Claude选出更优操作步骤的准确率从11月的51%上升到4月的64%,显示其判断能力也在快速逼近人类水平。
Q3:JetBrains开源Mellum2模型的意义是什么?
A:JetBrains开源Mellum2的核心意义不在于模型性能超越Claude,而在于它提供了一种"可问责"的替代方案。Mellum2支持本地运行,可直接对接因法律合规或安全原因不能上传至第三方云端的企业级代码库。JetBrains将"可检查、可在自有硬件上部署、有人为其负责"作为产品的核心卖点,在当前AI编程工具市场日益向大型模型实验室和超大规模云服务商集中的背景下,这一定位具有重要的差异化价值。
配资平台提示:文章来自网络,不代表本站观点。