Qwen3-235B 金融微调 Accuracy
桥水加 Thinking Machines Tinker 平台,基线 GPT-5、Claude 4.8 错误率高 29.8%
FeitengLi 解读桥水加 Thinking Machines Tinker 平台,基线 GPT-5、Claude 4.8 错误率高 29.8%
FeitengLi 解读vs 基线 GPT-5、Claude 4.8 同任务报价
桥水 Technical Report从 5 月底近 $2 高位回落,每百万 tokens
AlphaguyTrading 指数v6.0.0 release notes 归因于评审流重写,不是 Fable 接入
superpowers releasesAzure 新用户 30 天有效,学生 $2000 可用 12 个月
Azure 官方Extra High 档单次任务,含 2600 栋建筑与 27 家科技公司总部
FinanceYF5 推文Anthropic 用中立社区平台背书 Fable 5 生成能力,首次出现社区评测等同官方背书的转换。
代表 AI 营销可信度的负面锚点,影响所有「AI 快速完成」类宣传的接受度。
代表当下 ML 圈「蒸馏刷指标」的讽刺样本,影响所有「超越 Fable」类蒸馏报告的接受度。
huang_chao4969 开源的 OpenOPC 是一套 AI-native 公司自运行框架:Self-Built 自动实例化角色化 AI 员工,Self-Run 用结构化任务分配加同行评审编排多 Agent,Self-Grown 把每次任务沉淀为可复用组织知识。
代表 Agent-native 公司框架从概念走向工程化。
开源工具用 Playwright 加多模态大模型做闲鱼多任务实时监控:Web 可视化后台、AI 自然语言建监控任务、多任务并发加价格与区域过滤、多账号代理池轮换、Cron 定时、多渠道推送、Docker 一键部署。
代表 Agent 工具从开发辅助扩展到商业流程自动化。
代表 frontier 模型差异化战场从基准分数转向任务分工。
开发者:订阅加工作流编排成头部用户标配。模型厂商:差异化战场转向任务分工而非总分。
vikingmute 用 AI 设计两个应用首页得出五步流程:搜集好看设计参考、PRD 加参考截图喂 AI 精炼展示内容、ChatGPT images-2 出 3 种风格、转页面微调、用 GASP 或 motion 加小动画。
代表「AI 让设计民主化」叙事的反方样本。
设计师:AI 设计工具从「替代」转向「素材生成」。创业者:设计仍是壁垒。设计工具:差异化战场在微调工作流。
jamesob 维护的 jamesob、local-llm 仓库 738★,系统整理本地运行 LLM 的硬件选型、模型量化、推理框架、显存调优,是当下最完整的本地 LLM 攻略。
代表本地 LLM 攻略从零散博客走向系统化工程资料。
开发者:本地 LLM 部署门槛系统性下降。企业:隐私合规场景的可行选项增加。
HUANGCHIHHUNGLeo、claude-real-video 仓库 730★,实现 Claude 真正观看视频:场景感知切帧、去重、转写,通过 MCP 把视频帧与转写一起喂给 Claude,实现视频问答。
代表 MCP 加多模态组合填补 frontier 模型 API 缺口的工程化范式。
开发者:视频问答门槛系统性下降。Anthropic:是否考虑推出原生视频 API 仍待观察。
SuperJJ007、CSSwitch 仓库 218★,一键把 Claude Code 切换到 DeepSeek、Qwen、GLM、Kimi、硅基流动、OpenRouter 等任意 OpenAI·Anthropic 兼容 API 端点,无需改 Claude Code 源码。
代表 Claude Code 协议开放性被开发者社区工具化兑现。
开发者:Claude Code 工作流可接任意后端模型。Anthropic:协议层而非模型层成为新壁垒。
代表 MCP 生态进入需要可观测性的成熟阶段。
MCP Server 开发者:调试效率提升。企业:可审计 MCP 调用成为合规要求。
代表 AI 内容工业化向质感化的拐点。
原帖 ↗theo
- CLAUDE.md 把 Codex 定位成比 Fable 更强的 computer use、UI 验证、spec 清晰任务执行器
- 实测此前约 50% 端到端 agent PR 会被关,搭这套后当天没关过。
原帖 ↗waterloo_intern原帖自称把 230 万条 Fable 5 traces 蒸馏进 Qwen3-4B,得到 100% self-consistency,但讽刺点在学生模型只学到一个固定答案。
原帖 ↗ammaar原帖称用 Fable 5 把《命令与征服:将军》移植到 iPhone、iPad,并让 2003 年引擎原生编译到 ARM64、非模拟器运行。