常用: 学生 教职工 校友 OA系统 邮件系统 VPN系统 图书馆 智慧门户 EN
首页 独赢盘 滚球app中国官网下载入口 用12条文定将AI造作率镌汰4倍!

滚球app中国官网下载入口 用12条文定将AI造作率镌汰4倍!

发布时间:2026-05-26 来源:独赢盘 作者:admin 浏览:168

滚球app中国官网下载入口 用12条文定将AI造作率镌汰4倍!

——本文在顶级大神Andrej Karpathy 广为流传的 AI 编码端正基础上进行了彭胀,引入了 8 条特等准则,旨在大幅镌汰 Claude 在处理复杂、多形貌 Agent 任务时的造作率。

4 条 CLAUDE.md 端正将 Claude 出错率从 41% 降至 11%——历经 30 个代码库,我又补充了 8 条

过程 6 周、覆盖 30 个代码库的实测,将出错率从 41% 压缩到 3%。以下是好意思满的 12 条文定、每一条背后的着实告诫,以及原始 4 条文定悄然失效的 4 个场景。

布景

2026 年 1 月底,Andrej Karpathy 公开悔悟 Claude 写代码的三大恶疾:缄默作念出造不实设、过度复杂化、以及误伤不该动的代码。

Forrest Chang 读完帖子后,把这些悔悟索要成 4 条行径端正,打包进一个 CLAUDE.md 文献并发布到 GitHub。第一天就得益了 5,828 个 Star,两周内被保藏 6 万次,当今已纵容 12 万 Star——2026 年增长最快的单文献仓库。

我在 30 个代码库上实测了 6 周。

4 条文定照实灵验。在它们能覆盖的场景里,原先约 40% 的出错率降到了 3% 以下。但这套模板是为建造 1 月份的代码编写问题而生的。

2026 年 5 月的 Claude Code 生态已天地之别——Agent 彼此插手、Hook 级联触发、妙技加载冲突、跨会话多形貌使命流断链。

于是我特等补充了 8 条文定。下文将逐个拆解:好意思满的 12 条 CLAUDE.md、每条文定背后的世代相承,以及原始 Karpathy 模板悄然失效的 4 个盲区。

若是只想平直复制使用,好意思满文献在文末。

为什么值得势爱

CLAUDE.md 是通盘 AI 编程器用链中被严重低估的一个文献。大大批开辟者要么:

把它当成偏好垃圾桶,堆到 4,000+ Token,遵命率跌至 30%;

透彻跳过,每次手动领导——Token 虚耗 5 倍,会话间毫无一致性;

复制一个模板就放着岂论。能用两周,然后随代码库变化偷偷失效。

Anthropic 官方文档明确诠释:CLAUDE.md 是建议性的,Claude 的遵命率约为 80%。跨越 200 行后,遵命率会急剧下落,因为报复端正被销亡在杂音里。

Karpathy 的模板用一个文献、65 行、4 条文定处理了这个问题。这是下限。

上限还更高。再加 8 条文定,覆盖的就不仅仅 Karpathy 那时悔悟的代码编写问题,还包括那时还不存在的 Agent 编排问题。

原始 4 条文定

端正 1 — 先想明晰再脱手 不作念隐性假定。把假定说出来。点明衡量采用。遭遇不细主意先问,而不是猜。有更浅易的决策时主动冷落。

端正 2 — 浅易优先 用最少的代码处理问题。不加投契性功能。单次使用的代码不要搞空洞。若是一个资深工程师会说"过度打算"——就简化。

端正 3 — 精确更正 只动必须动的处所。不要"顺遂优化"左近代码、凝视或形貌。不重构莫得问题的东西。保捏现存作风。

端正 4 — 方针导向现实 界说到手程序。轮回直到考据通过。不要告诉 Claude 该走哪些形貌,告诉它到手是什么神色,让它我方迭代。

这四条关闭了约 40% 的失控场景。剩下约 60% 藏鄙人面的盲区里。

我补充的 8 条文定(特出原因)

每一条齐源于 Karpathy 那 4 条不够用的着及时刻。

端正 5 — 不要让模子作念非说话使命

Karpathy 的端正对此只字未提。当模子被拿来决定"该不该重试 API 调用"、"如何路由音信"、"何时升级处理",截止是每周给出不同决定——用 $0.003/Token 的价钱买了一堆当场 if-else。

触发时刻: 调用 Claude 来"判断 503 要不要重试"的代码运行简易了两周,然后驱动抽风——因为模子驱动把恳求体作为决策高低文来读,重试政策变得透彻当场。

端正 6 — 缔造硬性 Token 预算,莫得例外

莫得预算的 CLAUDE.md 是一张空缺支票。每个轮回齐可能螺旋成 5 万 Token 的高低文垃圾场。模子不会自动停。

触发时刻: 一次调试会话跑了 90 分钟。模子兴盛地在销亡份 8KB 报错信息上反复迭代,逐遗健无私方一经试过哪些建造决策。到终末,它在建议我 40 条音信前就隔断过的修法。Token 预算会在第 12 分钟就把它掐死。

端正 7 — 显式暴露冲突,不要取均值

现代码库里两个部分存在不合,买球投注平台app中国官方下载Claude 会试图双方齐夤缘。截止是一团不连贯的东西。

触发时刻: 代码库里并存两套造作处理模式——一套是 async/await 配显式 try/catch,另一套用全局 error boundary。Claude 写的新代码两套齐用了。双重造作处理器。我花了 30 分钟才搞暴露为什么造作会被吞掉两次。

端正 8 — 先读再写

Karpathy 的"精确更正"告诉 Claude 不要碰左近代码,但莫得告诉 Claude 先默契左近代码。莫得这条,Claude 写的新代码会和 30 行外的现存代码打架。

触发时刻: Claude 在一个现存的同名函数掌握又加了一个一模不异的函数——因为它根蒂没读掌握的代码。两个函数作念的是销亡件事。新的因为 import 端正优预知效了,而旧的才是 6 个月以来的巨擘起原。

端正 9 — 测试不可或缺,但测试自己不是方针

Karpathy 的方针导向现实暗含了"测试通过"作为到手程序。但在现实中,Claude 会把"测试通过"作为独一方针,写出能让浅层测试通过、却把其他一切搞坏的代码。

触发时刻: Claude 为一个鉴权函数写了 12 个测试,沿路通过。鉴权在分娩环境是坏的。那些测试仅仅在考据函数"复返了某个东西",而不是"复返了正确的东西"——函数靠复返一个常量就过了总计测试。

端正 10 — 万古操作需要查验点

Karpathy 的模板假定的是一次性交互。着实的 Claude Code 使命是多形貌的——跨 20 个文献的重构、在一个会话里构立功能、跨多个提交调试。莫得查验点,一次误操作会让总计进程付之东流。

触发时刻: 一次 6 步重构在第 4 步出了问题。等我发现的时候,Claude 一经在造作景况上赓续完成了第 5、6 步。把这团乱麻理明晰花的时分,比从新重来还要长。查验点会在第 4 步就拿获问题。

端正 11 — 商定优于更动

在一个有锻真金不怕火模式的代码库里,Claude 心爱引入我方的作风。即使它的方式"更好",两种模式并存带来的危害也跨越任何一种单独存在。

触发时刻: Claude 在一个全是 Class 组件的代码库里引入了 React Hooks。功能上是对的,但也把代码库的测试模式搞坏了——那套测试假定了 componentDidMount 的存在。花了半天时分删掉重写。

端正 12 — 失败要高声,不可偷偷

最贵的 Claude 失败,是那些看起来到手了的失败。函数"运行平素"但复返了造作数据。移动"完成"但跳过了 30 笔纪录。测试"通过"但断言自己便是错的。

触发时刻: Claude 说数据库移动"已到手完成"。实质上它偷偷跳过了 14% 触发拘谨冲突的纪录。跳过行径被写进了日记,但莫得浮出水面。11 天后报表驱动出现特别,滚球app中国官网下载入口才发现问题。

数据截止

在 30 个代码库上跟踪销亡组 50 个代表性任务,历时 6 周,三种建设对比:

建设

出错率

端正遵命率

无 CLAUDE.md

41%

Karpathy 原始 4 条

11%

78%

好意思满 12 条

3%

76%

出错率 = 任务需要修订或重写才智合适意图。计入:缄默作念造不实设、过度工程化、误伤代码、静默失败、违抗商定、冲突取均值、遗漏查验点。

遵命率 = Claude 在端正适用时,有明确现实该端正的比例。

特真谛的论断不是从 41% 降到 3% 这个大标题,而是:从 4 条彭胀到 12 条,遵命率险些莫得损耗(78% → 76%),出错率却又下落了 8 个百分点。新端正覆盖的是原有 4 条未波及的失败模式,二者不争销亡块正式力预算。

Karpathy 模板的 4 个隐性失效场景

即使不增多新端正,原始 4 条模板在以下情况也不够用:

1. 万古分运行的 Agent 任务 Karpathy 的端正针对的是 Claude 写代码的斯须。对 Claude 运行多形貌 Pipeline 时发生的事情只字未提。莫得预算端正,莫得查验点端正,莫得"高声报错"端正。Pipeline 会偷偷跑偏。

2. 多代码库一致性 "匹配现存作风"假定只消一种作风。在包含 12 个劳动的 Monorepo 里,Claude 必须遴荐用哪种作风。原始端正莫得告诉它该怎样选——它会当场选,能够取均值。

3. 测试质料 方针导向现实把"测试通过"当成到手。但莫得说测试必须是特真谛的。截止是测了个孑然,但 Claude 对此充满信心。

4. 分娩代码 vs 原型代码 销亡套保护分娩代码免于过度工程化的端正,也会把那些合理需要 100 行投契性脚手架来探索标的的原型搞坏。Karpathy 的"浅易优先"在早期探索阶段会误触发。

什么没用

在细目这 12 条之前,我尝试过:

从社区搬来的端正:大大批要么是换了说法的 Karpathy 原版,要么是不可泛化的界限特定例则("永久使用 Tailwind 类")。全删了。

跨越 12 条:测到 18 条。遵命率从 76% 跌到 52%。200 行天花板是着实存在的。超事后 Claude 驱动模式匹配到"端正存在",而不是信得过读端正。

依赖可能不存在的器用的端正:"永久使用 eslint"在 eslint 未装配时静默失败。改为与才略无关的表述:"匹配代码库强制现实的作风"。

在 CLAUDE.md 里用例子代替端正:例子比端正重得多。三个例子铺张的高低文很是于约 10 条文定,况且 Claude 会对例子过拟合。端正是空洞的,例子是具体的,用端正。

"要留神"/"厚爱念念考"/"信得过专注":纯杂音。遵命率跌到 30%,因为这些要求无法被测试。改成具体的高歌式表述("显式诠释假定")。

告诉 Claude 要阐扬得"像资深工程师":没用。Claude 一经合计我方是资深的。差距在于"想"和"作念"之间。高歌式端正能弥合这个差距,身份领导莫得这个着力。

好意思满 12 条 CLAUDE.md(可平直复制)

# CLAUDE.md — 行径公约

## 端正 1:先想明晰再脱手

在写代码之前,显式诠释你作念出的假定。点明衡量采用。遭遇不细主意,先问而不是猜。

若是存在更浅易的决策,主动冷落。

## 端正 2:浅易优先

用能处理问题的最少代码。不加投契性功能。单次使用的代码不要搞空洞。

若是资深工程师会说"过度打算"——就简化。

## 端正 3:精确更正

只动必须动的处所。不要"顺遂优化"左近代码、凝视或形貌。

不重构莫得问题的东西。保捏现存代码作风。

B体育官方网站首页入口

## 端正 4:方针导向现实

驱动前界说到手程序。轮回现实直到考据通过。

告诉我到手是什么神色,而不是该走哪些形貌。

## 端正 5:说话使命归模子,细目性使命归代码

重试逻辑、路由端正、升级条目——用代码完了,不要让模子在运行时动态决定。

## 端正 6:硬性 Token 预算

每次会话最多 X 次器用调用 / Y 个 Token(字据样子填写具体数字)。

到达预算上限时停驻来,讲演进程,恭候指示。不要赓续螺旋下去。

## 端正 7:显式暴露冲突

若是代码库的两个部分彼此矛盾——模式、商定、造作处理——在赓续之前先指出来。

不要双方齐夤缘或取均值,这会产生不连贯的代码。

## 端正 8:先读再写

在向文献添加代码之前,先读销亡文献里左近的代码。

在跨文献引入内容之前,先了解它的商定。不要在没读过掌握代码的情况下添加函数。

## 端正 9:写特真谛的测试

测试要考据正确的行径,而不仅仅考据函数"复返了某个东西"。

断言必须有可能失败。到手程序是"测试能拿获着实的 bug",而不是"测试通过了"。

## 端正 10:多形貌任务需要查验点

在跨越 3 步的任务里,每完成一个逻辑阶段就停驻来考据景况,然后再赓续。

不要在未资格证的景况表层叠后续形貌。

## 端正 11:商定优于更动

使用代码库里已有的模式、库和作风,即使你知说念更好的决策。

有更好决策的话,先指出来,等证明再引入,不要平直就用。

## 端正 12:失败要高声

若是操作失败、跳过了纪录、遭遇了造作——把它浮出来,不要偷偷纪录后赓续。

"部分到手"等同于失败。把它作为失败来讲演。

装配次第:

# 1. 将 Karpathy 的 4 条文定基线追加到你的 CLAUDE.md

curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md

# 2. 将本文中的端正 5-12 粘贴到底下

保存在代码库根目次。在 12 条文定下方添加样子专属端正(时候栈、测试高歌、造作模式)。沿路加起来不要跨越 200 行,超事后遵命率会权臣下落。

心智模子

CLAUDE.md 不是愿望清单,而是一份行径公约——用来关闭你亲眼见过的具体失败模式。

每一条文定齐应该能回报:这条文定能正式什么造作?

原始 4 条正式的是经典失败模式: 隐性假定、过度工程化、误伤代码、到手程序磨蹭。它们是地基,不要跳过。

新增 8 条正式的是进化出来的失败模式: 莫得预算的 Agent 轮回、莫得查验点的多形貌任务、测了孑然的测试、静默到手诡秘的静默失败。它们是补丁。

实质着力因东说念主而异。若是你不跑多形貌 Pipeline,端正 10 对你没用。若是你的代码库只消一种经 Lint 强制现实的作风,端正 11 便是饱和的。读完这 12 条,留住能映射到你着实犯过的造作的那些,删掉其余的。

结 语

Karpathy 2026 年 1 月的帖子不外是一次吐槽。Forrest Chang 把它形成了 4 条文定。12 万开辟者给这个截止点了 Star。他们中的大大批今天仍在跑 4 条文定。

模子进化了,生态变了。多形貌 Agent、Hook 级联、妙技加载、多代码库使命——这些在 Karpathy 写帖子时齐不存在。4 条文定无法搪塞这些场景。它们莫得错,仅仅不好意思满。

8 条新端正。6 周、30 个代码库的测试。出错率从 41% 降至 3%滚球app中国官网下载入口。