最新一期第 8 期 · 共 16 条信号

2026年6月29日

周一 · 过去 24 小时的 AI 世界

三道墙同时砌起:Google 限 Meta 用 Gemini、HBM 涨价逼近算力天花板、self-improving loops 成 Anthropic 内部 agent 主流

过去 24 小时 OpenAI/Anthropic 官博零重磅,GPT-5.6 与 Claude Tag 进入余热期。当日真正的主线不在模型本身,而在三道正在砌起的『墙』:Google 据 FT 报道限制 Meta 使用 Gemini,把 API 条款变成竞争武器;投行 Jefferies 警告 HBM/内存 Q3 涨 50%、Q4 再涨 40%,可能逼停 AI 数据中心建设;Anthropic 内部 >90% 工程师已用 self-improving loops 构建 agent,『loop engineering』从热词走向方法论。模型发布暂缓,但围绕 AI 的竞争壁垒、物理供给与方法论正在加速成型。

本期判断

模型发布暂缓,但围绕 AI 的三道墙正加速成型:Google 把模型访问条款做成对竞争对手的杠杆,预示 AI 上层竞争进入『条款战』;HBM/内存涨价逼近物理供给墙,可能反转云厂商 capex 增速;而 Anthropic 内部 >90% 工程师转向 self-improving loops,标记 agent 构建范式从『写 prompt』迁移到『写驱动模型的 loop』。今天真正改变的不是又出了一个新模型——当模型迭代本身进入平台期,竞争重心正从『谁的模型更强』下沉到『模型之外』的三层:谁能用条款卡住对手的供给、谁先被物理资源卡住自己的扩张、谁改了造 agent 的方法。模型层暂缓,供给战、物理战与方法论战才刚开局。

4深度报告

12快讯新闻

14推特讨论

本期速览

Google 据 FT/CNBC 限制 Meta 使用 Gemini,平台方把模型访问条款做成竞争武器(HN 135 分)——首次被曝纯商业动机的平台 gating

投行 Jefferies 警告 2026 Q3 内存涨 50%、Q4 再涨 40%、2028 前难缓解,可能逼停云厂商 AI 数据中心建设(经 KOL 转述,待原始报告核实)

Anthropic Managed Agents Lead 透露:内部 >90% 工程师已用 self-improving loops 构建 agent,4-6 个月达 100%,loop 可跑数小时不花数百美元

rasbt 教程(2037 赞):开源权重 + Claude Code/Codex harness 搭 100% 本地 coding agent,附 RAM/速度/tool-calling 选型清单

现实检验三连:Brown 教授揭露大规模 AI 考试作弊(HN 125)、AI 时代软件工程反思长文(80 分),与前两期 Ford 返聘老质检员共同勾勒 AI 落地落差

Deep Dives

本期重点 · 深度报告

4 篇深度调研,点进去看完整分析与多源交叉验证

头条重要度 5/5

Google 据 FT 限制 Meta 用 Gemini:平台首次被曝以模型供给给竞对设墙,机制却陷『条款 gating vs 算力配额』之争

FT 称 Google 以 API 条款限制 Meta 用 Gemini,HN 社区质疑实为算力配额;Google 服务条款早有『不得开发 ML 模型』禁令,让竞争 gating 合同层面可执行。

阅读深度报告 →

来源: CNBC/Financial Times:Google limits Meta's use of its Gemini AI models, FT reports(2026-06-28)↗HackerNews 讨论帖:Google limits Meta's use of its Gemini AI models(item 48707103,137 分 / 65 评论)↗Google 生成式 AI 附加服务条款(Generative AI Additional Terms)↗

行业动态重要度 4/5

Jefferies 预警内存 Q3 涨 50%、Q4 再涨 40%:HBM 挤压效应下,AI 数据中心是被逼停还是被自研芯片对冲

Jefferies(据单一 X 转述)预警内存 Q3 涨 50%、Q4 涨 40%;机制是 HBM 与普通 DRAM 抢晶圆(约 3:1);对冲牌已出——OpenAI 9 个月流片 Jalapeño。数字存疑、趋势可信。

阅读深度报告 →

来源: OpenAI 官方博客:OpenAI and Broadcom unveil LLM-optimized inference chip(Jalapeño,2026-06-24)↗X 用户 @Rocky_Bitcoin:转述 Jefferies 内存涨价预警(Q3 +50%、Q4 +40%、2028 前难缓解)↗X 用户 @Rocky_Bitcoin:MRVL'1GB 当 3.6GB'、美光-苹果内存争议(前一日推文)↗

行业动态重要度 4/5

rasbt 实操：开源权重 + Claude Code/Codex harness 搭 100% 本地 coding agent，附四点选型清单

rasbt 实操教程：Ollama + 开源权重 + Claude Code/Codex harness 搭 100% 本地 coding agent；Qwen3.6 35B 本地约 40 tok/s、5 题任务包 5/5；harness 可任意切换、非原生有时更好。

阅读深度报告 →

来源: rasbt《Using Local Coding Agents》（Ahead of AI，2026-06-27）↗X @rasbt：用开源权重模型搭 100% 本地 coding agent 教程（推文）↗rasbt《Components of A Coding Agent》（Ahead of AI，2026-04-04，本系列前作）↗

观点观察重要度 3/5

'Loop engineering' 走热:Anthropic 内部 >90% 工程师已用 self-improving loops 造 agent

>90% 工程师用 self-improving loops 造 agent——单一信源、关键词未定义;但 OpenAI 一手数据显示 agent 跑几小时已是常态。

阅读深度报告 →

来源: X @0xCodez:Anthropic Managed Agents Lead 播客转述(>90% 工程师用 self-improving loops)↗X @OkhayIea:Loop engineering 综述(能跑 ≠ 会学习)↗X @369Serena:写作六步 Loop 实操↗

Key Numbers

>90% Anthropic 内部工程师使用 self-improving loops 占比 Anthropic Managed Agents Lead 在 40 分钟播客透露,4-6 个月达 100%;loop 可运行数小时不花掉数百美元。经 KOL 转述

+50% 2026 Q3 内存价格涨幅 Jefferies 预警 Q3 +50%、Q4 再 +40%、2028 前难缓解;经 KOL 转述,待原始报告核实。HBM 为 AI 训练/推理关键瓶颈供给

100% 本地运行 rasbt 本地 coding agent 运行方式开源权重模型接入本地 coding harness,推文 2037 赞;与 06-28『开源追平闭源 3-6 个月』判断互为印证

HN 135 分 Google 限制 Meta 使用 Gemini FT 报道(经 CNBC 转载),Google 以 API 条款限制直接竞争对手;首次被曝纯商业动机的平台 gating

125 分 Brown AI 考试作弊 HN 热度 Brown 教授公开谴责考试大规模 AI 作弊,警告学术诚信告急;El País 报道

359★ video-production-skills GitHub 星标可复用 AI 视频生产技能库,覆盖创作/复刻/动效/片头/QA;agent skills 从编码扩展到多模态生产

Briefs

快讯 · 看标题就懂

12 条次要信号,附早报判断与原始链接

模型发布重要度 3/5 高置信官方源

GPT-5.6 三档预览:进入余热期,无新官方动态

OpenAI GPT-5.6 Sol/Terra/Luna 三档预览(6-26 发布)进入第三天余热期,本期无新官方发布或 benchmark 更新。三档定价 Sol $5/$30、Terra $2.50/$15、Luna $1/$6,Terra 对标上代 GPT-5.5 便宜 2 倍,Sol 在 Terminal-Bench 2.1 自报 SOTA,广泛开放待『未来数周』。

Why

维持主线连续性:GPT-5.6 仍是当前最受关注的前沿发布,但已进入等外部验证阶段,无需再开全量深度页。

Impact

对开发者:短期仍无法接入,只能等广泛开放;对竞争格局:三档定价重排单位智能价格梯度的影响要等真实负载验证。

Numbers

$5/$30 · $2.50/$15 · $1/$6 三档定价(每百万 token,输入/输出)

早报判断

连续三天跟进后,本期没有新进展值得再开深度页——这正是增量追踪规则的典型场景。值得继续盯的不是厂商自报 benchmark,而是两个外部可验证信号:Terra『对标上代、便宜 2 倍』在开发者真实负载上能否复现,以及『未来数周』广泛开放的确切时点。在此之前,GPT-5.6 仍是『报备政府的小范围预览』,对绝大多数开发者还摸不到。

接下来看：Terminal-Bench 公开榜单 Sol 名次与第三方复现 / '未来数周'广泛开放的确切时点

#OpenAI #GPT-5.6 #Sol #Terra

OpenAI 官方博客:Previewing GPT-5.6 Sol↗

产品上新重要度 3/5 高置信官方源

Claude Tag 延续:Karpathy 定性『LLM 交互第三代范式』

Claude Tag(6-23 发布,06-28 已深度跟进)本期为延续。新增解读视角:Karpathy 称其为 LLM 交互第三次重大重新设计——第一代访问的网站(ChatGPT 网页)、第二代下载的 App(Codex/Claude 桌面/Cursor)、第三代持久存在、异步运行、拥有组织级工具与上下文、嵌入工作流的实体。@GergelyOrosz 澄清重点不在 Slack,而在云端 AI 接入公司全部内部系统后『just works』。

Why

Karpathy 的『第三代』定性把 Claude Tag 从功能更新提升为交互范式判断,值得作为解读视角留存,无需再开全量深度页。

Impact

对企业:常驻异步 agent 若兑现,天花板从『程序员』扩到『在 Slack 上班的所有人』;对竞品:差异化在集成深度而非入口。

早报判断

Karpathy 的『三代』框架给 Claude Tag 提供了比产品功能本身更有解释力的叙事:真正突破不是『Agent 进了 Slack』,而是『一个接入企业全量内部系统、持久异步、可被任何人 @ 的云端实体』。但叙事兑现的唯一标准是集成做到开箱即用——这正是最大难题。把这条与本期 loop engineering 主题并看,2026 年 agent 的两条主线正在合流:交互范式从『单次调用』走向『常驻 loop 实体』,构建范式从『写 prompt』走向『写驱动模型的 loop』。

#Anthropic #Claude Tag #Karpathy #agent 范式

Anthropic 官方博客:Introducing Claude Tag↗ X @dotey:Karpathy 第三代范式解读 + GergelyOrosz 澄清↗

行业动态重要度 3/5 中置信已核验

agent skills 从编码扩展到多模态:视频/动作技能库本周密集上新

继 06-28『agent skill 包成新 dotfiles』后,本周 GitHub 新增多个把 agent skills 推向多模态生产的仓库:Pluviobyte/video-production-skills(359★,可复用 AI 视频生产技能库,覆盖创作/复刻/动效/片头/QA)、iart-ai/motion-skills(222★,50 个开源技能教 coding agent 做动效/动画/视频)、Johell1NS/browser-search(188★,agent 网页搜索技能,用 SearXNG+反幻觉设计)。

Why

agent skills 范式从编码向多模态生产扩展,是 skill 生态走向通用化的关键信号,值得单独追踪。

Impact

对创意/内容生产团队:可复用 agent 技能包降低视频/动效生产门槛;对 skill 生态:多模态 skill 成为新增长方向,跨平台兼容是关键。

Numbers

359★ video-production-skills

222★ motion-skills

早报判断

这是 06-28『skills as dotfiles』趋势的具体延伸,但方向值得单独点出:agent skills 正从纯编码扩展到视频/动效/网页检索等 multimodal 生产场景。意味着『给 agent 配技能包』这套范式不限于写代码——任何可标准化、可封装的生产流程都在被拆成可复用 skill。video-production-skills 和 motion-skills 同时冒头,说明创意生产侧的 agent 化正在形成第一批可移植能力包;但 star 数仍是热度而非质量背书,跨平台兼容与真实产出质量待验证。

接下来看：video/motion skills 在 Claude Code/Codex/Cursor 外的兼容 / 第三方真实产出案例

#agent skills #视频 #动效 #multimodal

GitHub:Pluviobyte/video-production-skills↗ GitHub:iart-ai/motion-skills↗ GitHub:Johell1NS/browser-search(agent 网页搜索技能)↗

行业动态重要度 3/5 高置信已核验

Brown 大学教授公开揭露大规模 AI 考试作弊,称学术诚信告急

据 El País 报道(HN 125 分),Brown 大学一位教授公开谴责考试中出现大规模 AI 作弊,警告学术诚信面临风险。这是近一轮高校 AI 作弊争议中又一具体案例,与多所大学重新设计考核方式、引入 AI 检测的趋势并行。

Why

把 AI 作弊从个案推向学术诚信结构性问题,反映教育评估体系正被 AI 倒逼重构。

Impact

对高校:考核方式向过程性/口试/AI-resilient 重构;对教育科技:AI 检测与防作弊需求上升;对学生:公平性焦虑加剧。

Numbers

125 分 Brown AI 作弊 HN 热度

早报判断

这是 AI 能力外溢到高利害现实场景的又一信号——当 LLM 能轻松通过考试,评估体系本身而非学生成了被考验的对象。Brown 案例的真正价值不在个案,而在它把一个结构性矛盾摆上台面:考核若继续以『可被 AI 完成的任务』为载体,就等于在奖励作弊;而转向口试/过程性评估又面临规模化成本。这与本期『AI 落地落差』叙事(Ford 返聘、软件工程反思)同源:AI 在哪些场景真正顶用、在哪些场景制造新问题,正成为各行业必须直面的分界线。

接下来看：Brown 后续处理与校方政策 / 其他高校是否跟进公开揭露

#AI 教育 #学术诚信 #Brown #作弊

El País:AI fraud at Brown University↗

行业动态重要度 3/5 高置信官方源

三星电子为员工部署 ChatGPT 和 Codex,大型制造企业 AI 工具规模化落地

据 OpenAI 官博(6-21),三星电子为员工部署 ChatGPT 和 Codex,成为大型制造企业规模化采用 AI 编程/办公工具的又一标志案例。继三星此前内部 AI 工具泄密争议后,此次转向与 OpenAI 的官方企业级部署。

Why

标志 AI 工具从互联网公司向大型制造企业规模化扩散,企业级合规治理成采购关键。

Impact

对实体产业:AI 编程/办公工具规模化落地样板;对 OpenAI:企业版图扩向非科技巨头;对企业 IT:数据合规与权限治理需求上升。

早报判断

三星这类传统制造巨头正式部署 ChatGPT/Codex,是 AI 工具从互联网公司向实体产业扩散的关键信号——也意味着企业级数据合规、权限治理成为采购决定因素(三星早年正是因内部 AI 泄密禁用过生成式 AI)。它和本期制造业 n8n+PLC 落地、Ford 质检落差放在一起看,呈现实体产业 AI 化的两面:一边是办公/编程工具规模化铺开,一边是核心生产环节 AI 仍需人类兜底。对 OpenAI,三星是其企业版图向非科技大客户扩张的弹药。

#三星 #OpenAI #ChatGPT #Codex

OpenAI 官方博客:三星电子部署 ChatGPT 和 Codex↗

观点观察重要度 2/5 中置信已核验

长文反思:AI 时代的软件工程,哪些被改变、哪些没有

一篇 HN 80 分长文《Reflections on software engineering in the age of AI》系统反思 AI 对软件工程的实际影响,讨论哪些实践被真正改变、哪些被高估,引发从业者讨论。

Why

为 coding agent 乐观叙事提供冷静对冲,推动从业者区分 AI 的能力扩张与本质改变。

Impact

对工程团队:避免盲目 agent 化,保留人类判断权重;对工具厂商:理解 AI 的真实边界有助产品定位与预期管理。

早报判断

在 coding agent 单边乐观叙事(65% 代码由 AI 生成、self-improving loop 普及)密集出现的一周,这类冷静长文是必要的对冲。它的价值不在给出结论,而在强迫从业者区分『AI 能做的』与『AI 改变了本质的』——前者正在快速扩张,后者往往被高估。把它和 Ford 返聘、Brown 作弊并看,一条暗线浮现:AI 的真实落地是高度场景依赖的,在质检、考核、复杂工程判断等场景,人类经验权重正在被重新发现而非淘汰。

#软件工程 #AI 反思 #观点 #coding agent

adiamond.me:Reflections on software engineering in the age of AI↗

观点观察重要度 2/5 低置信发展中

Karpathy 的 CLAUDE.md 登 GitHub 趋势榜,号称把 AI 编码准确率 65%→94%

据 @anyelimarillo(218 赞),Karpathy 的 CLAUDE.md 登 GitHub 趋势榜 #1,号称超 22 万 star、仅 65 行,把 AI 编码准确率从 65% 提到 94%。四条规则:编码前先思考(暴露假设/不确定就问/绝不猜测)、简单优先(最少代码/不要没人要的抽象)、外科手术式改动(不动无关代码/每行可追溯需求)、目标导向执行(模糊指令转可验证成功标准)。

Why

规则本身有工程价值,但 star 与准确率数字需重度核实,是 AI 传播中数字被放大的典型样本。

Impact

对开发者:四条规则可即用以约束 agent 行为;对舆论:提醒对 viral AI 数字保持核实习惯。

Numbers

65%→94% Karpathy CLAUDE.md 准确率提升(号称)

早报判断

这四条规则本身是扎实的工程纪律(本质是『想清楚再写、改动最小化、结果可验证』),但围绕它的两个数字需要打大折扣:『22 万 star』对一个 65 行配置文件几乎肯定是被误传或夸大——更可能是某仓库总 star 或榜单排名被张冠李戴;『65%→94%』没有公开评测口径,无法证伪也无从复现。真正可带走的是规则本身:在 self-improving loop 和 coding agent 普及的当下,把人类工程纪律编码进 agent 的 context 文件,与本期 loop engineering、skills as dotfiles 是同一潮流的两面——agent 行为质量越来越取决于你给它配的规则与上下文,而非模型本身。

接下来看：22 万 star 与 65%→94% 的真实出处与口径 / 四条规则在真实项目的效果是否可复现

#Karpathy #CLAUDE.md #coding agent #context 工程

X @anyelimarillo:Karpathy CLAUDE.md 登 GitHub 趋势榜↗

产品上新重要度 2/5 中置信已核验

Firecrawl 开源 Open Lovable:丢网站链接秒生成还原版 React 应用

Firecrawl 团队开源 Open Lovable(GitHub 24k+★,推文 723 赞),丢入想复刻的网站链接几秒生成高度还原的 React 版本,布局/样式/交互贴近原站。支持多模型(OpenAI/Anthropic/Gemini/Grok)切换、基于 Firecrawl 抓取页面结构、本地调试部署、E2B 沙盒,MIT 协议。

Why

网站→React 代码生成品类开源化,降低前端复刻/原型门槛,是 coding agent 向前端生产侧的延伸。

Impact

对前端开发者:快速原型/迁移工具;对闭源竞品(Lovable/Bolt):开源版挤压定价空间;对 Firecrawl:开源引流反哺其抓取 API。

Numbers

24k+★ Firecrawl Open Lovable 星标

早报判断

这是『网站→可用前端代码』品类开源化的标志:此前 Lovable/Bolt 等闭源产品已验证需求,Open Lovable 把它做成可自托管、可换模型的 MIT 开源版,降低复刻/二次开发门槛。真正价值不在『克隆』本身,而在把 Firecrawl 的结构化抓取与多模型代码生成串成一条本地可控的流水线——对需要快速搭原型或迁移前端的团队是实用工具。但『高度还原』在复杂交互/动态站点上仍有限度,24k star 是热度而非对所有站点都成立。

接下来看：复杂动态站点的还原质量 / 社区二次开发与模型适配

#Firecrawl #Open Lovable #开源 #前端

X @Jolyne_AI:Firecrawl 开源 Open Lovable 介绍↗

行业动态重要度 2/5 中置信发展中

实操方案:n8n+Modbus 接 PLC 做设备告警,Dify 知识库做故障 RAG

据 @better_christal(212 赞),一套制造业 AI 落地方案:n8n 装 Modbus 节点接 PLC 设备读温度/压力/振动→阈值告警→飞书机器人推送;再加 Dify 知识库做故障编码→处理建议 RAG;打包 docker-compose 私有化部署。报价 5-10 万/项目 + 1000 元/月维护。

Why

给出制造业 AI 落地的可复制开源配方,揭示瓶颈在 OT/IT 打通的人才而非模型。

Impact

对集成商:可复制的私有化部署方案;对制造业:低门槛设备告警+故障 RAG;反映实体产业 AI 客单价低、定制化高的现实。

Numbers

5-10 万/项目 + 1000 元/月维护制造业 AI 落地报价

早报判断

这是 AI 在制造业『非红海』落地的具体配方,价值在于把开源低代码(n8n)+ 工业协议(Modbus)+ RAG(Dify)拼成一条可私有部署、报价清晰的链路。博主的核心判断有道理:老板不会装 n8n,会装就赢一半——制造业 AI 的瓶颈不在模型,而在能把 OT(PLC/Modbus)与 IT(AI/RAG)打通并交付的人。但 5-10 万/项目的报价也暴露了这类落地的天花板:客单价低、高度定制、难标准化,更适合集成商而非平台型生意。

接下来看：方案在不同产线的可复制性 / n8n/Dify 在工业场景的稳定性

#n8n #Dify #制造业 #PLC

X @better_christal:n8n+Modbus 接 PLC 制造业落地方案↗

行业动态重要度 2/5 低置信发展中

案例:20 美元 Claude 月入 $24,542,AI 定制内容挂 Fanvue 卖会员

据 @billtheinvestor(65 赞),一个 AI 变现案例:20 美元买通 Claude,月入 $24,542,用 AI 分析男性偏好定制内容挂 Fanvue 卖 $9.99 会员,从建模到变现闭环只需一人。博主疑问:粉丝粘性会不会崩,这种零成本创业能否复制。

Why

AI 单人闭环变现的极端样本,示范内容边际成本归零后细分订阅的可行性,但数字未审计。

Impact

对个体创业者:AI 降低内容生意启动门槛;对平台:AI 生成内容政策压力上升;反映零壁垒生意的脆弱性。

Numbers

$24,542/月 AI 变现月入(自称)

早报判断

撇开内容伦理,这个案例是 AI 时代『单人闭环生意』的极端样本:一人完成建模→定制→变现,启动成本近零撬动付费订阅。真实意义不在收入数字(单例、未经审计、可能高报),而在示范了 AI 把内容生产边际成本压到接近零后,细分付费订阅成为可单人运营的生意形态。但博主自己的疑问点到了命门:零门槛也意味着零壁垒,粉丝粘性与平台政策是两个随时可能崩塌的变量——这类生意的脆弱性远高于它的利润率。

接下来看：收入数字是否可验证 / 平台对 AI 生成内容的政策走向

#AI 变现 #Fanvue #订阅 #单人创业

X @billtheinvestor:20 美元 Claude 月入 $24,542 案例↗

行业动态重要度 2/5 中置信发展中

社区自建免费 GLM-5.2 API 服务:免注册、每 Key 有效期 1 小时

据 @mcwangcn(60 赞),作者自建免费 GLM-5.2 API 服务,无需注册登录,可用于 coding agent;所有 token 费用自掏腰包,为防浪费每个 API Key 有效期 1 小时,过期重新申请。

Why

折射开源权重模型社区托管趋势,印证 GLM-5.2 在 coding agent 场景的可用性。

Impact

对开发者:零门槛试用 GLM-5.2;对开源生态:社区托管成为分发补充;可持续性受个人补贴限制。

早报判断

这是 GLM-5.2 开源后社区自建免费 API 托管的缩影:开源权重模型让个人也能搭公共服务分发,进一步压低用前沿开源模型的门槛。1 小时 Key 有效期是典型的『防白嫖』设计,折射出这类社区服务可持续性的核心矛盾——靠个人补贴 token 成本难以规模化。信号意义大于实用意义:印证 GLM-5.2 在 coding agent 场景的可用性已被社区认可,也预示开源模型的分发将更多依赖社区托管而非官方 API。

#GLM-5.2 #开源 #API #社区托管

X @mcwangcn:自建免费 GLM-5.2 API 服务↗

行业动态重要度 2/5 中置信发展中

开源开盒工具 ALIENS EYE:ML 模型+25 特征扫 840+ 平台

据 @NFTCPS(1241 赞),开源开盒工具 ALIENS EYE 输入用户名异步几秒扫完 840+ 平台扒出账号分布,非靠 HTTP 状态码瞎猜,而用训练好的 ML 模型加 25 个特征判断,结果分 Found/Maybe/Not Found 三档带置信度,支持 Tor/代理与 JSON/CSV/HTML/Markdown 导出。

Why

开源 OSINT 工具把跨平台身份关联门槛压到接近零,隐私侧值得警惕。

Impact

对普通用户:跨平台复用用户名风险上升;对平台:账号关联防御需升级;ML+置信度的 OSINT 方法论可迁移到正当用途。

Numbers

840+ 平台 ALIENS EYE 覆盖平台数

早报判断

这条技术上是个像样的 OSINT 工具(用 ML+多特征替代状态码瞎猜,带置信度分档,工程上比传统开盒脚本严谨),但它真正的早报价值在于敲响隐私侧警钟:当开源工具能把跨 840+ 平台的用户名关联做到几秒出结果、还支持 Tor 隐藏自身,『同一用户名跨平台身份串联』的门槛被压到接近零。对普通用户这是提醒——跨平台复用用户名等于主动交出身份图谱;对平台,这意味着账号发现与关联防御需要新思路。作者提醒『别拿去干坏事』,但工具开源本身不可撤回。

接下来看：工具滥用与平台防御响应 / ML OSINT 方法论的正当应用迁移

#OSINT #开盒 #隐私 #ML

X @NFTCPS:开源开盒工具 ALIENS EYE 介绍↗

X / Twitter 讨论

推特上在讨论什么

精选 10 条从业者发言,点"原帖"看一手出处

dotey @dotey 2 likes

Anthropic 发布 Claude Tag(beta,面向 Claude Team/Enterprise),团队可在 Slack 频道 @ Claude 派活,Claude 后台拆解执行后在线程回复;管理员预先配置可访问的频道、工具、数据源和代码库。Karpathy 称其为 LLM 交互的第三次重大重新设计:第一代是访问的网站(ChatGPT 网页版),第二代是下载的 App(Codex/Claude 桌面端/Cursor),第三代是持久存在、异步运行、拥有组织级工具与上下文、直接嵌入工作流的实体。Gergely Orosz 澄清重点不在 Slack,而在云端 AI 接入公司全部内部系统后 just works。真正受益的是新员工、非工程师、改动陌生代码库的开发者。

GergelyOrosz：我和 Anthropic 内部几个人聊过后开始理解 Karpathy 在说什么(以及很多人误解了什么):重点不是 Slack,而是一个接入公司所有内部系统、能 just works 的云端 AI——这才是突破。

原帖 ↗

0xCodez @0xCodez 156 likes

Anthropic Managed Agents Lead 在 40 分钟播客中透露:Anthropic 内部 >90% 的工程师在用 self-improving loops 构建,4-6 个月内将达 100%;其 agentic loop 可运行数小时而不花掉数百美元。该 lead 讲解如何从零搭建有效 agent,给出公式 Agent→harness→loops→memory=现代 agent。博主称这一条视频能顶 10 门付费 vibe-coding 课程。

0xCodez：引用自身早前帖,内含该 40 分钟播客链接。

原帖 ↗

OkhayIea @OkhayIea 262 likes

"我不再 prompt 我的 agent,我写 prompt 它的 loop。" Loop engineering 是本月热词,但关键问题在于:能整夜运行的 loop 不等于会学习的 loop——经验能否跨周期存活,完全取决于它落在哪。该团队发布一篇综述,研究经验时代中已部署 agent 如何把交互轨迹转化为持久能力,从自我进化到元进化;并延续此前你不是选模型而是选 benchmark(塑造进化方向的奖励)的论点。结论:loop 的好坏取决于其底层基础设施。

原帖 ↗

369Serena @369Serena 40 likes

Loop Engineering 应用场景:把写作任务本身设计成一个 Loop,而非直接让 AI 写一篇关于 X 的文章(容易得到概念完整但空洞的结果)。写作 Loop 六步:Define 锁定读者与结果→Research 接入外部素材(网页/Obsidian 笔记/项目文件)→Outline 先搭大纲不直接写正文→Draft 第一版只求主线完整→QA Loop 检查钩子、案例落地、AI 腔、空泛概念并转化为下轮修改规则→Polish 改标题/开头/节奏/金句。核心观点:好文章很少一次生成,是在多轮检查修正里长出来的。

369Serena：Loop Engineering 实操工作流,以寻找英文金融 KOL 为例,结构为 Define 锁硬条件→Search→Filter 硬过滤→Content Audit 审近期作品→QA Loop 查脏数据→Feedback 修规则→Stop 达目标数量跳出→Deliver 输出 Excel。

原帖 ↗

rasbt @rasbt 2037 likes

Sebastian Raschka 发文介绍用开源权重模型搭建 100% 本地运行的 coding agent:把本地 LLM 接入本地 coding harness(可用 Claude Code 或 Codex)。文章含一份选型检查清单:长上下文下检查 RAM 占用判断模型是否适合实际工作、测量 prefill 与 decoding tok/s 看速度是否烦人、确认模型理论上的 tool-calling 能力、评估模型在 coding harness 中能否解决较难任务。作者称今年更好的 LLM 与更好的 harness 让本地模型已能胜任严肃工作,这套入门 kit 保持灵活,可随时切换更新的模型或临时调用云端模型。

原帖 ↗

Jolyne_AI @Jolyne_AI 723 likes

Firecrawl 团队开源 Open Lovable,GitHub 已 24k+ Star。零门槛用法:丢入想复刻的网站链接,几秒生成高度还原的 React 版本,布局/样式/交互贴近原站,适合二次开发。亮点:一键克隆任意网站为 React 应用(复杂页面也能扛);可接 OpenAI/Anthropic/Gemini/Grok 多模型按需切换;基于 Firecrawl 抓取页面结构使还原更稳;支持本地调试部署、生成即预览;集成 E2B 沙盒更安全。MIT 协议完全开源,本地配好 API key 即可开跑。

原帖 ↗

sharbel @sharbel 2676 likes

本周 GitHub 增长最快的 10 个仓库:1.OpenMontage(+17.2K) 首个开源 agentic 视频生产系统,12 pipelines/52 tools/500+ agent skills;2.skills(+11.1K) Real Engineers 的 .claude skills 合集;3.codebase-memory-mcp(+7.6K) 高性能代码情报 MCP,把代码库索引成持久知识图谱,158 语言、亚毫秒查询、省 99% token;4.Agent-Reach(+7.2K) 给 agent 装眼睛读 Twitter/Reddit/YouTube/GitHub/B站/小红书,零 API 费;5.daily_stock_analysis(+6.9K) LLM 驱动多市场股票分析、零成本定时运行;6.Anthropic-Cybersecurity-Skills(+5.1K) 817 个结构化网安 skill,映射 MITRE ATT&CK 等 6 框架。本周主题:agent skill 包与 context 文件正成为新的开发者 dotfiles。

原帖 ↗

Rocky_Bitcoin @Rocky_Bitcoin 169 likes

投行 Jefferies 警告:2026 Q3 内存价格将暴涨 50%,Q4 再涨 40%,2028 年前难缓解。内存涨价连苹果都扛不住,英伟达和 AMD 能抗多久存疑,最终两个结果:一是倒逼云厂商减缓 AI 数据中心建设、资本开支下降;二是技术替代,如 MRVL 这类硬件加速方案曲线救国。未来 64G/128G 大内存电脑可能成理财产品。

Rocky_Bitcoin：投行 Jefferies 警告:2026 Q3 内存价格将暴涨 50%,Q4 再涨 40%,2028 年前难缓解。内存涨价连苹果都扛不住,英伟达和 AMD 能抗多久存疑,最终两个结果:一是倒逼云厂商减缓 AI 数据中心建设、资本开支下降;二是技术替代,如 MRVL 这类硬件加速方案。

原帖 ↗

NFTCPS @NFTCPS 1241 likes

开源开盒工具 ALIENS EYE:输入用户名,异步几秒扫完 840+ 平台一次性扒出账号分布。非靠 HTTP 状态码瞎猜,而是用训练好的 ML 模型加 25 个特征判断,结果分 Found/Maybe/Not Found 三档并带置信度。支持走 Tor 和代理隐藏自身,结果可导出 JSON/CSV/HTML/Markdown。作者提醒查人挺好使,别拿去干坏事。

原帖 ↗

better_christal @better_christal 212 likes

制造业比互联网好赚钱的落地方案:n8n 装 Modbus 节点接 PLC 设备,读温度/压力/振动→阈值告警→飞书机器人推送;再加 Dify 知识库做故障编码→处理建议的 RAG;打包成 docker-compose 私有化部署。报价 5-10 万/项目 + 1000 元/月维护。核心判断:老板不会装 n8n,会装就赢一半,互联网红海之外制造业是蓝海。

原帖 ↗

本期导航

深度报告 · 4 篇快讯 · 12 条推特讨论 · 10 条

2026 · 六月

8 期

日

一

二

三

四

五

六

22 23 24 25 26 27 28 29

Signal Mix

头条 1

行业动态 9

观点观察 3

模型发布 1

产品上新 2

Watchlist

Google-Meta Gemini 限制的具体条款与适用范围是否获 Google/Meta 官方确认,及是否扩展到其他对手
HBM/内存涨价是否反映在云厂商 Q3 capex 指引与英伟达/AMD 财报,Jefferies 原始报告口径
Anthropic『self-improving loops 4-6 个月达 100%』的可外部验证产出与时间表
GPT-5.6 三档是否进入广泛开放、Terminal-Bench 公开榜单 Sol 名次
Mythos 5『部分解禁』是否获 Anthropic/美商务部官方原文确认(06-28 增量)
agent 视频/动作技能库的第三方采用与跨平台兼容
Karpathy CLAUDE.md 的 22 万 star 与 65%→94% 数字的真实出处

Previous Editions

往期早报

全部归档 →

2026-06-28 周日 14 则

官方按下暂停键的一天:GPT-5.6 三档预览余热未散,看点转向开源追平与 Mythos 出口管制松动

过去 24 小时,OpenAI 与 Anthropic 官博都没有新的重磅发布——GPT-5.6 Sol/Terra/Luna 三档预览是 6-26 的余热,Claude Tag 进 Slack 是 6-23 的延续。真正的当日动态集中在社区与开源侧:OpenRouter 抛出『开源与闭源前沿差距稳定在 3-6 个月、18 个月没被拉开』的判断,DeepSeek 开源投机解码全栈库 DeepSpec,Coinbase 把默认模型换成开源权重后 AI 支出近乎减半;政策面上,被华府暂停访问的 Mythos 5 据社区转述出现『部分解禁』,亚洲厂商趁封锁窗口抢推 Mythos-like 模型。一句话:今天没有新模型上线,但『谁追上了、谁被允许上线』这两条暗线都在加速。

2026-06-27 周六 17 则

GPT-5.6 三档齐发首由政府审查放行,开源侧 DSpark 与 GLM-5.2 逼近前沿

OpenAI 发布 GPT-5.6 Sol/Terra/Luna 三档模型,Sol 为迄今最强但首次由美国政府审查用户名单后限量放行;同期 Anthropic Mythos 5 恢复向美国可信机构部署,出口管制空档催生亚洲厂商推 Mythos-like 模型。开源侧两记重拳:DeepSeek DSpark 投机解码无损提速 60-85% 并全栈开源,智谱 GLM-5.2(7440 亿参数/MIT)登顶 Code Arena、距 Claude Opus 4.8 不到 1%。三方真实落地数据——OpenAI 内部 Codex token 占比 10 个月升至 99.8%、Anthropic 调查显示三分之一人认为初级岗位高概率被替代、字节 TRAE 90% 代码 AI 生成但人均吞吐仅 1.6 倍——共同指向同一结论:智能体已渗进专业岗位,但工程化交付仍是瓶颈。

2026-06-26 周五 17 则

GPT-5.6 三档齐发,前沿 AI 进入"政府审批"时代

OpenAI 预览 GPT-5.6——旗舰 Sol、均衡 Terra、低价 Luna 三档齐发,主攻网络安全与长程推理。但与模型同样抢眼的是治理:美国政府要审查谁能用 GPT-5.6 并要求延期,Anthropic 的 Mythos 5/Fable 5 也在政府指令下暂停又部分恢复,前沿 AI 正被纳入国家安全框架。同日 Anthropic 指控阿里非法蒸馏 Claude 能力,DeepSeek 用 DSpark 把推理再提速 80%,Qwen 开源世界模型宣称超 Opus 4.8——开源与闭源、东方与西方的张力全面浮现。

2026-06-25 周四 3 则

Claude Tag 把 AI 嵌进工作流,交互范式开始第三次迁移

这一天,Anthropic 发布 Claude Tag,让 Claude 以团队成员身份加入团队既有的协作工具。一位资深研究者把它称为大模型交互设计的「第三次重构」——从「你要去访问的网站」,到「电脑里的应用」,再到「融入人类活动的持续实体」。同周,另一家头部厂商也在把 AI 往工作流深处推,但路径不同:一家讲「智能体替你做事」,一家讲「它伴你做事」。两条路线的分歧,正在显形。

2026-06-24 周三 12 则

Anthropic 指控阿里「非法蒸馏」Claude 闹进参议院,同一天 Qwen 智能体论文登顶 HuggingFace;agent 研究密集轰炸

本期为历史回溯补档(归档日 2026-06-24,北京时间)。实时社媒与算法推荐流无法回溯,且检索期间 WebSearch 接口不稳定,主线事实依据当日 CNBC 同日报道、HuggingFace 策展论文与公开发布交叉整理,所有数字均可溯源至一手页面;凡仅见于单方信件或自建基准的内容,文中已标注 caveat。当天的硬新闻是 Anthropic 致信美国参议院银行委员会,指控与阿里关联的操作者用约 2.5 万个欺诈账户、2880 万次交互「非法提取」(蒸馏)Claude,称这是它「已知最大的一次蒸馏攻击」;戏剧性的是,指控见报同一天,阿里 Qwen 的智能体论文 Qwen-AgentWorld 以 136 票登上 HuggingFace 当日榜首。除这条「IP 与中美 AI 竞争」主线外,当天 HuggingFace 被 agent 研究刷屏:从长程规划评测(PlanBench-XL)、真实职场基准(EnterpriseClawBench)、经验学习(EDV)到开源数据配方(OpenThoughts-Agent),集体把焦点对准『智能体到底行不行、怎么训才行』。

2026-06-23 周二 12 则

智能体能力被「极限拷问」:长程规划与真实办公评测同日登场,效率派架构集体发力

本期为历史回溯补档(归档日 2026-06-23,北京时间),实时社媒与算法流无法回溯,主要依据当日 HuggingFace 策展论文与可检索到的公开发布整理;检索期间 WebSearch 接口持续不可用,深度选题以一手 arXiv/HuggingFace 论文为主力支撑,事实可溯源。当天没有头部厂商的重磅模型发布,主线落在「智能体到底行不行」的硬核评测上:PlanBench-XL 用 1665 个工具、平均 25 轮的零售任务把前沿模型的长程规划逼到崩溃,EnterpriseClawBench 则把 852 个真实职场会话变成可复现评测,直接给 Claude Code、Codex 等 harness 打分。与此同时,GQE、R-SWA、Confident Decoding 等一批「省算力不掉点」的架构/解码工作集中出现,透露出当下业界对推理成本与可靠性的共同焦虑。

2026-06-22 周一 12 则

Five Eyes 警告前沿 AI「数月内」改写网络攻防,GLM-5.2 续压开源成本,智能体记忆研究扎堆

本期为「AI 早报」历史回溯补档(归档日 2026-06-22,北京时间),实时社媒源无法回溯,内容主要依据当日 HuggingFace 策展论文(一手可溯源材料)与可检索到的公开发布/权威媒体报道整理,带主观判断的部分均已标注置信度。当天最硬的官方事件是 Five Eyes 五国情报与网络安全机构罕见联合发声,警告前沿 AI 将在「数月而非数年」内放大进攻性网络能力;研究侧则呈现明显的「智能体记忆 + 扩散语言模型」聚集,HuggingFace 高赞榜被分层记忆、记忆治理、并行区域感知、长程具身记忆等议题占据。模型与产业线多为聚合媒体单一信源转述(GPT-5.6 预览、Fable 5 出口禁令、Noam Shazeer 转投 OpenAI 等),已逐条降置信处理。