状态:✅ 11篇全部讨论完毕,待统一铺排 参与人:William + Coco 目的:逐篇分析11篇文章对我们项目的借鉴价值,收集要素后统一做任务铺排 原则:讨论阶段不写代码,只记录。11篇全部讨论完后整合成迭代方案。每个Phase有回滚点。
内容:5角色、单Gateway、Discord+Telegram双通道、bindings路由、会话隔离、双轨治理、Workspace标准化、记忆分层、私聊/群聊差异化。
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A1-1 | 双轨治理(配置层硬约束+提示词层软引导) | P0 | 我们目前只有提示词层,缺配置层。HiveSwarm产品化需要 |
| A1-2 | ping-pong=0硬压制Agent互聊 | P1 | 用配置而非提示词禁止Agent间无意义对话 |
| A1-3 | Workspace标准化骨架 | P1 | 20个Agent工作区需要统一文件结构(profile/rules/tools/memory/logs) |
| A1-4 | 总指挥全局监听+其他Agent @触发 | P1 | Coco监听,其他Agent被动响应 |
| A1-5 | 私聊/群聊双模式差异化 | P2 | 每个Agent区分"独立任务模式"和"协作任务模式" |
| A1-6 | 会话/信息隔离(per-account-channel-peer) | P2 | 多租户场景下的信息隔离 |
| A1-7 | 交互层迁移到消息平台 | P0 | 手机脱离电脑的关键——消息平台(Telegram/Discord)作为交互层 |
| A1-8 | 双通道分工(Telegram私聊+Discord协作) | P1 | 不同场景用不同工具 |
| A1-9 | Agent主动推送机制 | P1 | 从被动响应到主动汇报(定时推送+事件驱动) |
深度讨论:手机场景分析
三种手机操控路径: 1. 消息平台即交互层(OpenClaw用户)→Telegram/Discord手机App原生支持 2. Web Dashboard(AlexFinn Mission Control)→NextJS + Convex,Safari PWA 3. CC Web Wrapper(胡渊鸣)→Python subprocess包CC,Web UI,Safari PWA
我们的差距:交互层锁死在Claude Code CLI上,William必须坐在Mac前。 我们的优势:已有Flask Web层(虚拟办公区),可增加CC调度能力打通手机链路。
作者:清华姚班→MIT博士→Taichi创造者(28K GitHub Stars)→Meshy AI($30M ARR,月增30%)
核心路径:把Claude Code从"交互式终端工具"变成"可被远程调度的自动化组件"
10步逐一拆解与借鉴:
| 编号 | 步骤 | 他的做法 | 我们现状 | 借鉴要素 | 优先级 |
|---|---|---|---|---|---|
| A11-1 | Step 1: Cursor→CC | ssh远程访问EC2上的CC,24h可派活 | CC跑本地Mac,无远程 | 24h在线计算节点(Mac mini M4) | P0 |
| A11-2a | Step 2: Container | EC2隔离环境+skip-permissions | 主力Mac上,不敢放权 | 隔离工作环境(Mac mini=隔离) | P0 |
| A11-2b | 每小时自动备份 | 无自动备份 | Git/rsync自动备份作为安全网 | P1 | |
| A11-3a | Step 3: Ralph Loop | 任务列表→自动启动CC→循环 | 永续推进引擎V1.2(未启用) | 极简版Ralph Loop先跑起来 | P1 |
| A11-3b | 手机快速添加任务 | 无 | 任务列表输入要手机可达 | P1 | |
| A11-4a | Step 4: Git worktree并行 | 5个CC并行→1min/commit | Team模式Agent并行 | 代码项目用Git管理+worktree | P2 |
| A11-5 | Step 5: CLAUDE.md+PROGRESS.md | 稳定配置+动态经验分离 | 三层记忆体系(更完整) | 保护CLAUDE.md不被AI随意修改 | ✅已有 |
| A11-6a | Step 6: Web Manager | Python subprocess包CC→Web UI | 有Flask但未接CC调度 | Flask增加CC调度器模块 | P0 |
| A11-6b | iPhone Safari PWA | Dashboard未做移动端 | 手机响应式设计+PWA | P1 | |
| A11-7a | Step 7: CC管CC | --output-format json→结构化日志 | Coco自然语言调度 | Agent结果增加结构化输出 | P1 |
| A11-7b | Manager从20%→95%成功率 | Team模式成功率<100% | 调度逻辑部分代码化 | P1 | |
| A11-8a | Step 8: 语音输入 | Web Manager加语音API→实时 | 语音备忘录T+1批处理 | 实时语音指令通道 | P1 |
| A11-9 | Step 9: Plan Mode封装 | 批量kick off Plan→统一review | 串行Plan | 批量Plan审批视图 | P1 |
| A11-10 | Step 10: 不看代码 | Context, not control | 理念一致 | HiveSwarm UI围绕此原则 | ✅已践行 |
关键战略洞察: - "标准化软件的终结"——威胁:人人自搭Agent→谁买HiveSwarm?机遇:窗口期内大多数企业不具备自搭能力 - "管AI比管人更能提高领导力"——HiveSwarm不只是效率工具,是领导力训练场 - $30M ARR CEO独立演化出与我们同构的架构——最强市场验证
内容:L0(.abstract索引)/L1(insights)/L2(daily logs) + P0/P1/P2 TTL生命周期 + memory-janitor清理
⚠️ 昨天踩坑过滤:02-18我们受这篇文章直接启发做了V2.0升级(MEMORY.md 181→63行纯索引),失败并紧急回滚。核心教训:被动安全>主动检索,不要优化不需要优化的东西。V2.2已吸收合理部分。
剔除的要素(昨天已踩坑): - ~~.abstract自动索引使MEMORY.md变纯索引~~ → V2.0失败的直接原因 - ~~MEMORY.md瘦身优化~~ → 181行<200行上限,无需砍
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A2-2 | TTL生命周期管理(仅用于经验库) | P2 | 08-经验库条目设过期/归档周期防膨胀。不碰MEMORY.md |
| A2-3 | memory-janitor定期清理(仅用于经验库) | P2 | 自动检测过期经验条目,提示归档或删除 |
| A2-4 | SESSION-STATE压缩保护 | P1 | 在上下文压缩前自动保存关键状态,M06 Checkpoint模块可借鉴 |
| A2-6 | 市场验证信号 | -- | 又一个独立开发者演化出分层记忆,验证V2.2方向正确 |
结论:增量价值有限,主要是经验库管理和压缩保护两个细节点。核心架构思想已在V2.2中消化。
William判定:价值不大,跳过。Mac mini实战参考可从其他篇获得。
内容:AlexFinn实战方法论——大脑/肌肉架构、反向提示、每日简报、审批队列、Discord多频道工作流。
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A4-1 | 大脑与肌肉架构 | ✅已有 | 即我们的RouteLLM多模型策略。命名可用于HiveSwarm产品叙事 |
| A4-2 | 反向提示(Reverse Prompting) | P1 | 让Agent主动建议"基于目标我们应该做什么",而不只是等指令 |
| A4-3 | 每日简报自动推送 | P1 | 每天早上推送行业动态+待办+Agent推荐任务 |
| A4-4 | 审批队列(Approval Queue) | P1 ★ | Agent完成→进队列→William手机approve/reject→执行/退回。William确认高价值 |
| A4-7 | Discord多频道工作流 | P1 | 不同频道对应管线不同阶段,可追溯 |
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A5-1 | Qwen3-TTS语音模型 | P1 ★ | 3秒克隆、97ms延迟、开源可本地部署。Iris音频制作+实时语音通道技术底座。William确认有用 |
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A6-1 | Latent Demand产品原则 | P0 | "发现需求而非发明需求"。从20人团队行为中提取HiveSwarm功能 |
| A6-2 | 脚手架=技术债 | 战略 | 为弥补模型短板写的代码,下个模型出来就要删 |
| A6-3 | 为6个月后的模型做产品 | 战略 | 验证"换传输层,保路由脑"的CP/DP分离架构 |
| A6-5 | 子Agent并行调试 | P1 ★ | 遇到难题启动3-10个子Agent并行研究同一问题。William确认要系统化此模式 |
性质:战略思考,非技术实操。
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A7-1 | 三层社会定位验证 | 战略 | William=第二层"算力驱动者",HiveSwarm帮更多人进入第二层 |
| A7-2 | OTT路径(Agent原生基础设施) | 战略 | 与"Agent基础设施提供商"定位完全吻合 |
| A7-3 | "欲望催化剂"而非工具 | 战略 | HiveCosm应是触发欲望的环境 |
| A7-4 | 窗口期判断 | 战略 | 0-3年内窗口正在关闭,验证时间紧迫性 |
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A8-1 | Memory Flush(压缩前主动存盘) | P1 ★ | 压缩触发前自动保存决策/状态/教训到磁盘。M06 Checkpoint借鉴。William确认有价值 |
| A8-2 | 混合检索(Vector 0.7 + BM25 0.3) | P2 ★ | 向量语义+关键词精确双通道,M05记忆引擎进化方向。William确认有价值 |
| A8-3 | 三大失败模式框架 | -- ★ | ①不保存 ②保存不检索 ③压缩销毁。诊断Agent失忆的框架。William确认有价值 |
| 编号 | 借鉴要素 | 优先级 | 说明 |
|---|---|---|---|
| A9-1 | 任务看板(Kanban式) | P1 ★ | 可视化任务状态+分配。比纯文本待办清单更结构化。William确认有价值 |
| A9-2 | 内容管线看板 | P1 ★ | Luna→Ryan→Oliver→Iris管线的可视化Kanban追踪。William确认有价值 |
| A9-3 | 定时任务日历 | P2 | cron job可视化 |
| A9-4 | 记忆浏览器UI | P2 | Agent记忆可视化浏览+搜索 |
| A9-5 | Office虚拟办公室 | ✅已有 | 我们的HiveCosm领先 |
William判定:价值不大,不纳入。
| 编号 | 要素 | 来源 | 优先级 | 分类 |
|---|---|---|---|---|
| A1-1 | 双轨治理(配置层+提示词层) | 篇1 | P0 | 架构 |
| A1-7 | 交互层迁移到消息平台 | 篇1 | P0 | 交互 |
| A11-1 | 24h在线计算节点(Mac mini) | 篇11 | P0 | 基础设施 |
| A11-2a | 隔离工作环境 | 篇11 | P0 | 基础设施 |
| A11-6a | Flask增加CC调度器模块 | 篇11 | P0 | 核心能力 |
| A6-1 | Latent Demand产品原则 | 篇6 | P0 | 产品方法论 |
| A4-4 | 审批队列 | 篇4 | P1 ★ | 交互 |
| A5-1 | Qwen3-TTS语音模型 | 篇5 | P1 ★ | 音频 |
| A6-5 | 子Agent并行研究模式 | 篇6 | P1 ★ | 调度 |
| A8-1 | Memory Flush压缩前存盘 | 篇8 | P1 ★ | 记忆 |
| A8-2 | 混合检索 | 篇8 | P2 ★ | 记忆 |
| A9-1 | 任务看板Kanban | 篇9 | P1 ★ | 可视化 |
| A9-2 | 内容管线看板 | 篇9 | P1 ★ | 可视化 |
| A4-2 | 反向提示机制 | 篇4 | P1 | 交互 |
| A4-3 | 每日简报自动推送 | 篇4 | P1 | 交互 |
| A11-2b | 自动备份 | 篇11 | P1 | 安全 |
| A11-3a | Ralph Loop极简版 | 篇11 | P1 | 自动化 |
| A11-6b | 手机响应式+PWA | 篇11 | P1 | 交互 |
| A11-7a | Agent结构化输出 | 篇11 | P1 | 调度 |
| A2-4 | 压缩保护 | 篇2 | P1 | 记忆 |
| A1-3 | Workspace标准化 | 篇1 | P1 | 架构 |
| A1-9 | Agent主动推送 | 篇1 | P1 | 交互 |
★ = William在讨论中明确确认高价值
核心思想:Coco不是单体,而是"一个灵魂,两个身体"
William
/ \
Telegram/手机 笔记本终端
| |
OpenClaw Coco Claude Code Coco
(GLM-5/Qwen3.5 (Opus 4.6
via LiteLLM) via Code Max)
\ /
共享记忆V2.2(symlink同一套文件)
|
Flask + LiteLLM (localhost:4000)
|
20人Agent团队
关键决策: 1. OpenClaw配GLM-5或Qwen 3.5(通过LiteLLM),日常交互成本≈¥0 2. 复杂任务升级到Claude Code subprocess(Code Max ¥0) 3. 记忆通过symlink共享,两个Coco读写同一套文件 4. 全链路零额外成本
任务路由:
- 简单查询/状态 → GLM-5直接回答
- 中等任务(调度Agent)→ 通过Flask API → LiteLLM路由
- 复杂任务(深度规划)→ claude -p subprocess → Code Max
- 定时任务(简报/监控)→ OpenClaw cron → GLM-5
记忆共享设计:
OpenClaw workspace-coco/
├── SOUL.md → 内容来自 创世纪/genesis.md
├── MEMORY.md → symlink → ~/.claude/.../memory/MEMORY.md
├── USER.md → William偏好和目标
├── project/ → symlink → 日记/数字员工团队/
└── shared/ → symlink → 08-经验库/共享/
| 任务 | 说明 |
|---|---|
| macOS环境配置清单 | Homebrew、Python 3.10+、Node.js、Git |
| iCloud同步配置 | 项目文件双向同步 |
| 自动备份机制 | 每小时Git commit或rsync快照 |
| Flask虚拟办公区部署 | 现有代码部署+venv |
| LiteLLM网关部署 | 8模型配置迁移,端口4000 |
| OpenClaw安装+配置 | 安装OpenClaw + 配置LiteLLM为模型后端 |
| OpenClaw Coco Agent | workspace-coco + SOUL.md + symlink记忆 |
| Telegram Bot创建 | BotFather注册 + allowlist William ID |
| CC调度器模块 | Flask新增API:接收OpenClaw请求→调用claude -p |
回滚点:Mac mini全新机器,关机即回滚
Phase 1完成标志:William在Telegram发消息→OpenClaw Coco(GLM-5)回复
可与Phase 3并行推进。
| 任务 | 来源 | 说明 |
|---|---|---|
| 审批队列 | A4-4 ★ | Agent产出→pending→Telegram通知→approve/reject |
| 任务看板 | A9-1 ★ | Kanban可视化:待办/进行中/待审批/完成 |
| 内容管线看板 | A9-2 ★ | Luna→Ryan→Oliver→Iris各阶段追踪 |
| 每日简报 | A4-3 | OpenClaw cron每天8点→GLM-5生成→Telegram推送 |
| Agent主动推送 | A1-9 | 完成/异常/需决策时主动通知 |
| 反向提示 | A4-2 | Agent定期建议"基于目标应该做什么" |
| 手机响应式+PWA | A11-6b | Dashboard适配iPhone Safari |
回滚点:各为独立模块/组件
| 任务 | 来源 | 说明 |
|---|---|---|
| Memory Flush | A8-1 ★ | 压缩前自动存盘关键信息 |
| 子Agent并行研究 | A6-5 ★ | 系统化"启3-10个Agent并行攻"调度模式 |
| 混合检索 | A8-2 ★ | Vector+BM25双通道 |
| 压缩保护 | A2-4 | SESSION-STATE压缩前写Checkpoint |
| Ralph Loop | A11-3a | 任务列表→自动启CC→循环 |
| 任务 | 来源 | 说明 |
|---|---|---|
| 双轨治理 | A1-1 | JSON/YAML配置层 + 提示词软引导层 |
| Workspace标准化 | A1-3 | 20个Agent工作区统一骨架 |
| Latent Demand提取 | A6-1 | 从使用行为中提取HiveSwarm产品功能 |
| 任务 | 来源 | 说明 |
|---|---|---|
| Qwen3-TTS部署 | A5-1 ★ | Mac mini本地部署,Iris音频+实时语音 |
| 文档 | 路径 | 内容 |
|---|---|---|
| 项目概览 | Mac-mini-双体架构部署/项目概览.md |
架构图+5阶段路线图 |
| Phase1部署手册 | Mac-mini-双体架构部署/Phase1-部署手册.md |
11步部署+10项验证+故障排查 |
| CC Scheduler规格 | Mac-mini-双体架构部署/CC-Scheduler模块规格.md |
4个API端点+并发控制+异步回调 |
| Phase2交互升级 | Mac-mini-双体架构部署/Phase2-交互升级设计.md |
审批队列+任务看板+管线看板+简报+推送+反向提示 |
| Phase3智能增强 | Mac-mini-双体架构部署/Phase3-智能增强设计.md |
Memory Flush+并行研究+混合检索 |
| 预制-OpenClaw配置 | 预制配置/openclaw-config.json |
LiteLLM+Telegram+MemoryFlush |
| 预制-Coco灵魂 | 预制配置/soul-coco.md |
身份+行为准则+任务路由 |
| 预制-William画像 | 预制配置/user-william.md |
背景+偏好+目标 |
| 预制-安装脚本 | 预制配置/setup-macmini.sh |
Homebrew+Python+Node+CC+LiteLLM |
| 预制-启动脚本 | 预制配置/start-all-macmini.sh |
tmux三服务一键启动 |
状态:Phase 1-3设计全部完成。Phase 4-5待后续推进。