X 情报日报 · Codex 与 Claude Code 近况

筛选窗口: 2026-06-01 至 2026-06-07 的 X 公开信息。重点不是追热闹,而是找对普通用户、开发者和工作流设计者有直接价值的变化。

今日要点

Codex 正在从“写代码”扩成完整应用闭环 —— OpenAI Developers 展示了 Build iOS Apps plugin: Codex 可以在浏览器里看和测试 iOS app、打开 SwiftUI previews、热重载修改。这类能力的价值在于把“写代码-切模拟器-看效果-再改”的摩擦降下来,尤其适合小团队做移动端原型。来源
Codex Activity/Profile 上线,但默认私有 —— Codex profiles 展示活动图、连续使用、总 token、峰值 token、常用功能等,并支持分享卡片。对个人用户是复盘工具,对团队则可能变成“AI 工作量仪表盘”。需要注意:官方说默认私有,分享前要确认展示内容。来源
Codex CLI 继续强化多 agent 和工具流 —— 0.137.0 提到 multi-agent v2、每线程运行时选择、更多 web/image tools 场景和并行搜索;0.136.0 则补了 TUI 链接、宽表展示、会话归档/恢复、Windows sandbox alpha。对高频用户来说,会话管理和多 agent 编排比单次回答质量更影响效率。 0.137.0 / 0.136.0
Claude Code 修复了异常消耗限额的问题 —— Claude Developers 表示已重置 Pro 和 Max 用户的 5 小时与周限额,原因是部分 Claude Code session 会产生过多并行 subagents。这个信息对重度用户很关键:如果最近额度烧得异常快,不一定全是自己的工作流问题。来源
Claude Code 的 /fork 变成后台 agent —— 新 /fork 会带着当前上下文、工具、历史、模型和 prompt cache 跑后台 agent,结果回到当前会话;旧的“复制 transcript 到新会话”改为 /branch。这更适合让 Claude 并行探索方案、做局部验证、跑备选实现。来源
Claude Code 自检工作流值得抄 —— 官方展示了如何把人工检查编码成流程,让 Claude 在交付前自己跑反馈闭环。对实际项目来说,这比“让模型更聪明”更可控:把验收标准、测试、lint、diff review 写进工作流,减少来回返工。来源
Claude Platform CLI 出现,API 也更 terminal-native —— Claude Developers 发布 ant CLI,把 Messages API、Managed Agents 等端点放进终端,并强调 Claude Code 能理解 claude-api skill。这说明 Anthropic 也在把“编码 agent + API agent + shell 管道”打通。来源

工具与素材

Zapier 开源 GTM agents —— 包含销售、市场、RevOps、客户倡导、支持等 skill 和自动化,可放进 Cursor、Codex、Claude Code 等工具。对非纯工程团队很有价值:Agent 不只是写代码,也能沉淀成业务流程模板。来源
Obsidian skills 让知识库更 agent-native —— X 上热传的整理称,Obsidian 相关 skills 支持 wikilinks、canvas、bases、CLI 等,可接入 Claude Code、Codex 或 OpenCode。适合把个人知识库从“给人看的笔记”升级成“agent 可读写的工作底座”。来源
浏览器自动化开始围绕 agent 优化 —— BrowserAct 这类项目把反爬、验证码接管、token 友好输出和多浏览器隔离打包成 skill。对用 Claude Code/Cursor 做网页操作的人来说,价值不在炫技,而在失败时能人类接管、可持续跑批量任务。来源
视频生成也开始变成代码工作流 —— html-video / HyperFrames 一类项目的共同点是:让 agent 写 HTML/脚本,再渲染 MP4。它把视频制作从“黑盒生成”变成“可 diff、可复现、可迭代”的工程任务,适合产品宣传、知识解说和批量内容生产。来源

使用判断

Codex 更值得关注的方向:应用内测试闭环、插件、profile/activity、CLI 多 agent。适合已经在 OpenAI 生态、需要 web/image/computer use 混合工具的人。
Claude Code 更值得关注的方向:/fork 后台 agent、自检流程、skills、API CLI 和上下文工程。适合需要把复杂任务拆成计划、执行、审查、回收的用户。
真正拉开差距的不是选哪一个,而是工作流设计 —— 近期多条高互动分享都在指向同一个结论:写好 AGENTS.md / CLAUDE.md、把重复任务封成 skill、给每步设置验收标准、让多个 agent 并行探索,比纠结单个模型强弱更有复利。来源

值得沉淀

沉淀 1: 多 agent 工作流模板 —— 规划 agent、实现 agent、测试 agent、文档 agent、审查 agent 分开跑,每个都有 checkpoint、通过标准和失败停止条件。
沉淀 2: Skill 优先于提示词 —— 重复两次以上的流程,不要继续靠临时 prompt,应该固化成 skill/脚本/检查清单。
沉淀 3: Token 与限额要进入成本模型 —— 最近 Codex profile 和 Claude Code 限额修复都说明,AI 编程已经进入“生产力 + 成本 + 可观测性”阶段。