#Karpathy
这个主题在过往早报中的出现记录。深度条目直达研究报告,其余条目回到当日 edition。
Karpathy 的 CLAUDE.md 登 GitHub 趋势榜,号称把 AI 编码准确率 65%→94%
据 @anyelimarillo(218 赞),Karpathy 的 CLAUDE.md 登 GitHub 趋势榜 #1,号称超 22 万 star、仅 65 行,把 AI 编码准确率从 65% 提到 94%。四条规则:编码前先思考(暴露假设/不确定就问/绝不猜测)、简单优先(最少代码/不要没人要的抽象)、外科手术式改动(不动无关代码/每行可追溯需求)、目标导向执行(模糊指令转可验证成功标准)。
这四条规则本身是扎实的工程纪律(本质是『想清楚再写、改动最小化、结果可验证』),但围绕它的两个数字需要打大折扣:『22 万 star』对一个 65 行配置文件几乎肯定是被误传或夸大——更可能是某仓库总 star 或榜单排名被张冠李戴;『65%→94%』没有公开评测口径,无法证伪也无从复现。真正可带走的是规则本身:在 self-improving loop 和 coding agent 普及的当下,把人类工程纪律编码进 agent 的 context 文件,与本期 loop engineering、skills as dotfiles 是同一潮流的两面——agent 行为质量越来越取决于你给它配的规则与上下文,而非模型本身。
Claude Tag 延续:Karpathy 定性『LLM 交互第三代范式』
Claude Tag(6-23 发布,06-28 已深度跟进)本期为延续。新增解读视角:Karpathy 称其为 LLM 交互第三次重大重新设计——第一代访问的网站(ChatGPT 网页)、第二代下载的 App(Codex/Claude 桌面/Cursor)、第三代持久存在、异步运行、拥有组织级工具与上下文、嵌入工作流的实体。@GergelyOrosz 澄清重点不在 Slack,而在云端 AI 接入公司全部内部系统后『just works』。
Karpathy 的『三代』框架给 Claude Tag 提供了比产品功能本身更有解释力的叙事:真正突破不是『Agent 进了 Slack』,而是『一个接入企业全量内部系统、持久异步、可被任何人 @ 的云端实体』。但叙事兑现的唯一标准是集成做到开箱即用——这正是最大难题。把这条与本期 loop engineering 主题并看,2026 年 agent 的两条主线正在合流:交互范式从『单次调用』走向『常驻 loop 实体』,构建范式从『写 prompt』走向『写驱动模型的 loop』。