Anthropic AI编码工具Claude Code源代码意外泄露引发网络疯传狂欢

人工智能公司Anthropic的AI编码工具Claude Code的源代码于3月31日意外泄露,引发了科技界的广泛关注。安全研究员Chaofan Shou在发现这一事件后立即向外界披露。此次泄露并非Anthropic近期唯一的安全疏忽,此前几天,该公司还曾不慎公开了近3000份文件,其中包括一个名为Mythos/Capybara的强大模型细节。Anthropic方面已证实了此次泄露,并将其定性为“人为错误导致的发布打包问题”,而非外部入侵造成的安全漏洞。
Anthropic发言人通过电子邮件回应称:“今天早些时候,Claude Code的一个版本中包含了一些内部源代码。”该发言人同时强调,此次事件“不涉及或暴露任何敏感的客户数据或凭证。”公司表示正在采取措施,以防止此类事件再次发生。
此次泄露的Claude Code源代码包含了约1900个TypeScript文件,总计超过512,000行代码,其中包括了完整的斜杠命令库和内置工具等核心内容。根据GitHub上传的暴露源代码显示,泄露的根本原因在于Claude Code的npm包中包含了一个引用未混淆TypeScript源代码的地图文件。这个地图文件进而指向了Anthropic的Cloudflare R2存储桶上的一个zip压缩包,Chaofan Shou和其他人得以从中下载并解压获取全部内容。
软件工程师Gabriel Anhaia深入分析了此次泄露的代码,并指出这为所有开发者敲响了警钟。Anhaia在其对Claude Code泄露事件的分析中写道:“package.json中一个配置错误的.npmignore或files字段就可能暴露一切。”这一说法强调了构建管道中微小配置失误可能带来的巨大风险。
泄露事件发生后,Claude Code的源代码库在网络上迅速传播,引发了大规模的复制(forking)。在发布24小时内,其源代码库便在GitHub上被超过41,500次复制,随后这一数字迅速攀升,超过60,000人一夜之间“复制”了该代码。有网友对此评论称:“继OpenClaw之后,又诞生了一个历史上增长最快的star的仓库。”
地图文件(map files)通常用于调试混淆或捆绑的代码,对于生产环境而言并非必需,因此发布地图文件通常是不被提倡的做法。正如此次事件所展示的,它们可以轻易地被用来暴露原始源代码,因为它们本身就是原始代码的参考文档。尽管如此,Claude Code的源代码并非完全神秘,此前它已被逆向工程过。此次暴露提供了一个“新鲜迭代”的视角,但并非揭露了一个此前完全保密的技术。
值得一提的是,此次泄露是Anthropic在几天内的第二次安全疏忽。此前,该公司曾不慎公开了近3000份文件,其中一份泄露的草稿博客文章详细描述了一个名为Mythos或Capybara的强大模型,该模型据称带来了前所未有的网络安全风险。Roy Paz表示,此次错误“看起来是‘人为错误’,因为有人走了捷径,绕过了正常的发布安全措施。”
Anthropic发言人在声明中再次强调:“不涉及或暴露任何敏感的客户数据或凭证。这是一个由人为错误导致的发布打包问题,而非安全漏洞。我们正在推出措施以防止这种情况再次发生。”Anthropic试图通过DMCA版权投诉,直接阻止所有分享其源代码的链接,以遏制代码的进一步传播。然而,这一尝试在很大程度上被一个关键人物的行动所抵消。
安全专家Chaofan Shou的一篇帖子瞬间引爆了整个硅谷,吸引了超过2200万人观看,甚至连埃隆·马斯克也关注着事态的发展。泄露者Sigrid Jin(instructkr)在得知源代码泄露后,于3月31日凌晨4点被大量信息唤醒。Sigrid Jin回忆道:“3月31日凌晨4点,我的手机被信息轰炸,直接把我吵醒了。”他透露,在韩国的女友甚至非常担心他会因为电脑上持有这份代码而被Anthropic起诉。

在Anthropic试图通过DMCA投诉阻止传播后,Sigrid Jin迅速采取行动,在极短时间内完成了一次罕见的“代码替换操作”。他利用AI辅助工作流“oh-my-codex”,在黎明前用Python从头重写了Claude的核心逻辑,随后又用Rust进行了重构。最终形成的名为“claw-code”的Python重写版本(https://github.com/instructkr/claw-code),符合“clean-room design”标准,完美复制了Claude Code的AI代理框架架构,并且不包含任何Anthropic的专有源代码。这意味着Anthropic先前的版权投诉在“claw-code”面前立即失效。
尽管GitHub迅速采取行动,屏蔽了所有涉及原始TypeScript代码的页面,但大量原始源代码的复制(forks)和镜像仍然在网络上流传,供有兴趣的人检查。此次泄露为CCLeaks的运营者提供了一个有用的比较点和更新来源,或许随着人们深入挖掘这些暴露的代码,一些新的秘密将会浮出水面。Harness Engineering也因此成为硅谷的热门词汇,该领域专门研究AI代理系统如何连接各种工具、协调任务并管理运行时上下文。
Anthropic公司表示,他们正在积极推出新的措施,以防止未来再次发生类似的发布打包问题。Anthropic并未就其是否会要求人们删除其暴露源代码的存储库发表任何进一步评论。
评论
加入讨论
请登录后发表评论
还没有评论
登录成为第一个评论的人。