从一篇文章,到一场评审会
一条会话、约 30 分钟跑完的真实长程编排——把设计落到实处
这是一段真实运行日志的复盘:用户从「解读 Anthropic 递归自我改进文章」一路推进到「工程师角色 + 技术架构演进」。助理把材料发给两位专家(Caesar、Junjie)并挂 watch_chat 异步监听,同时把深度调研委派给一个子 flow session;靠 flow 的 answer 回调、两个 watch task 的触发、以及第二次 send 更新报告共同收敛,最终完成报告、建群、发群、建评审会。设计里的每个环节,这里都能对上。
场景与五轮输入
同一条会话里,用户的五次输入层层推进;助理在其间自主完成感知、委派、监听、收敛。下面是用户原话。
解读文章
"…/institute/recursive-self-improvement 帮我解读一下这篇文章"
追问角色变化
"工程师角色从写代码转变为指挥和审查 AI 展开说说?有没有协同的例子帮助理解"
征询两位专家
"你把这个资料发给 Caesar 和 Junjie,看看他们各自有什么看法,重点是跟我们未来的技术架构演进有什么指导。"
委派深度调研
"你在这个过程中,也做一些深度调研,然后整理成一个解读报告吧。"
补充、建群、组织评审
"你把观点补充到材料里面,然后拉一个技术群先发给大家,并组织一下评审会的时间,让 Caesar 主持"
全程编排时序
一切从用户 ⇄ 主助理 对话分叉出三类机制:直接交互(读/感知,当场做、无异步)、reminder · watch_chat(两个独立任务,各自等外部人回信号)、flow session · 委派(create 取回报告、send 再取回更新)。读自由、写过 HITL、长程靠 reminder 与 flow 异步,主会话全程不阻塞。
send 进同一个 flow session、21:00 收到报告 v2。注意收尾顺序:群在 20:58 就先建好(那时报告还没出),21:00 报告 v2 出来后发布、建评审会,最后一步(21:01)才把报告 + 议程发进群。逐条见下方时间线表。技术事件时间线
每一步的触发、机制、关键载荷,以及它对应的架构点。读操作主动、写操作过 HITL、长程走委派与 reminder。
| 时间 | 事件 | 机制 | 关键载荷 | 架构点 |
|---|---|---|---|---|
| 20:32 | 解读文章 | web fetch | 读取 HTML,约 153K 字符 | 读 · 感知 |
| 20:35 | 找两位专家 | 联系人搜索(第一方) | Caesar Ricardo 首席科学家 / junjie wu AI Architect(歧义→选架构师) | 读 · 感知 |
| 20:35–36 | 私信 Caesar、Junjie | /im/messages · HITL approve | 文章链接 + 核心数据 + 「对架构演进的指导?」 | 写 · 行动 HITL |
| 20:36 | 挂异步监听 | create_reminder watch_chat ×2 | timeout 2d,fallback 06-17 20:36 | reminder 异步跟进 |
| 20:36 | 记长期任务 | work board | 新增 collect_feedback + breadcrumb「2 个 watch 已设」 | 义务 / 状态板 |
| 20:41 | 面板定向 | status_panel 注入 | reminders: 2 watching | session_panel |
| 20:42 | 委派深度调研 | flow_session_manage create(async) | 子会话 6a2ff32f…,wait_for_result false | 委派 Handoff |
| 20:45 | 报告 v1 回传 | agent_noti · flow answer | <message from=flow-session>,报告 + 公开链接 | pull-wakeup / 回传 |
| 20:49 | Junjie 回复 | reminder_event 触发 | 三条架构原则(可验证/HITL/沙盒) | reminder 触发 |
| 20:52 | Caesar 回复 | reminder_event 触发 | 五点建议(模块化/验证/可观测/HITL/高阶) | reminder 触发 |
| 20:52 | 改板报错→自愈 | work board 容错 | tasks.0.title: Field required → 补参重试成功 | 失败反馈 / 容错 |
| 20:58 | 追加专家章节 | flow_session_manage send(send_as=request) | 加「八、内部专家观点」,awaiting_answer: 1 pending | send 追加 / 账务 |
| 20:58 | 建技术群 | /im/group/create · HITL | 「AI架构演进评审」,成员 Caesar、Junjie | 写 · 行动 HITL |
| 20:59 | Zoom 未连 → 降级 | 第三方 Link / fallback | /im/meeting 需 link Zoom → 改用普通日历事件 | 第三方 Link · 降级 |
| 21:00 | 报告 v2 回传 | flow answer + VFS | 读 /.flow/…/artifacts → 复制 workspace → 发布链接 | 回传 + 工作区 VFS |
| 21:01 | 发群 + 建评审会 | /im/messages + /im/calendar · HITL | 报告链接 + 议程;06-16 10:00–11:30,Caesar 主持 | 写 · 行动 HITL |
request → 子 flow,子 flow answer 回传清账;第二轮 send 后 awaiting_answer: 1 pending。watch_chat reminder(超时 2d 兜底),Junjie/Caesar 回复时由 reminder_event 触发,不靠主会话轮询。agent_noti(<message from=flow-session>)唤醒主会话,继续取产物、发布、发群、建会。reminders: 2 watching,主助理据此知道还有两条监听未收口;work board 持续记录任务与 breadcrumb 以恢复上下文。最终落地
一条会话跑完,交付物全部就位。