多AI编排调度系统 — 集成测试与上线

日期：2026-02-24 模块：M25 自动执行体系负责人：Coco🐳 状态：✅ 完成

一、背景

William拥有8个AI平台资产，其中4个提供CLI编程工具： - Codex CLI (OpenAI, GPT-5.3-Codex) - Gemini CLI (Google, Gemini 3.1 Pro) - Aider (开源, 多模型路由) - Antigravity IDE (Google, 需GUI)

此前各工具独立使用，缺乏统一调度和审计。本次构建 multi_ai_orchestrator.py 统一编排层。

二、集成测试结果

Test 1: Codex CLI ✅

命令：codex exec --full-auto "Create hello.py"
模型：gpt-5.3-codex
版本：v0.98.0
结果：创建文件 + 自动验证运行 + 退出码0
耗时：~15s
关键发现：
  ⚠️ 必须在git仓库中运行（否则报"Not inside a trusted directory"）
  → orchestrator已加入自动git init

Test 2: Gemini CLI ✅

命令：gemini -p "Create hello_gemini.py" --approval-mode yolo
模型：Gemini 3.1 Pro
版本：0.29.5
结果：创建文件 + 退出码0
耗时：~10s
关键发现：
  ⚠️ 正确flag是 --approval-mode yolo（不是 --sandbox permissive）
  ⚠️ 有 punycode deprecation warning（不影响功能）

Test 3: Aider ✅ (之前验证)

命令：aider --model deepseek/deepseek-chat --message "..." --yes
版本：0.86.2
结果：已在02-23验证通过

Test 4: Antigravity IDE ✅ (版本检测)

命令：antigravity --version
版本：1.107.0
结果：CLI可检测版本，但代码执行需要GUI窗口
处理：AppleScript控制层 + 文件协议

Test 5: Codex MCP Server ✅

状态：已在Claude Code中配置
工具：codex / codex-reply
用途：Coco可在Claude Code会话中直接调用Codex能力

三、交付清单

#	文件	行数	说明
1	`multi_ai_orchestrator.py`	~970行	V1.1 四工具统一调度引擎
2	`workflow_registry.yaml`	~215行	6工具 + 8个工作流模板
3	`auto_registry.yaml`	+30行	新增orchestrator条目（总9个任务）

multi_ai_orchestrator.py V1.1 核心能力

4工具调度：Codex / Gemini / Aider / Antigravity 统一dispatch接口
3种工作流：sequential(顺序) / parallel(并行) / review(审查)
审计日志：JSONL格式，全量记录（任务ID/工具/耗时/退出码/输出）
健康检查：5项（4 CLI + Codex MCP）
AppleScript控制层：检测运行/激活窗口/发送输入/截图
自动git init：Codex工作目录无git时自动初始化
Flask Blueprint：6个API端点（dispatch/workflow/status/audit/health/daily-summary）
CLI：6个子命令（dispatch/workflow/status/audit/health/daily）

workflow_registry.yaml 8个工作流模板

code-review (review)：Codex写 → Gemini审
dual-perspective-code (parallel)：双模型比较
frontend-backend-parallel (parallel)：前后端并行
code-migration (sequential)：Aider迁移 → Codex修复 → Gemini审查
auto-documentation (sequential)：Gemini分析+生成文档
bug-fix-verify (review)：Aider修复 → Codex验证
hivecosm-module-dev (sequential)：Codex开发 → Gemini审查 → Aider测试
security-audit (sequential)：Gemini扫描 → Codex修复

四、架构图

William的AI资产 (8平台)
│
├── Claude Code (Opus 4.6) ← Coco🐳运行环境
│   ├── multi_ai_orchestrator.py ← 统一调度层
│   │   ├── dispatch() ← 单任务派发
│   │   ├── workflow_*() ← 多工具编排
│   │   ├── AppleScriptController ← GUI控制
│   │   └── AuditLogger ← 审计日志
│   │
│   ├── Codex MCP ← Claude Code内置集成
│   │   └── codex / codex-reply 工具
│   │
│   └── CLI调度 ←→ 4个外部工具
│       ├── codex exec --full-auto ← GPT-5.3-Codex
│       ├── gemini -p --approval-mode yolo ← Gemini 3.1 Pro
│       ├── aider --model X --message ← 多模型路由
│       └── antigravity (GUI) ← AppleScript/文件协议
│
├── LiteLLM网关 (localhost:4000) ← 8模型在线
└── Dify + LangBot ← C端/B端产品层

五、成本分析

工具	模型	边际成本	推荐场景
Gemini CLI	Gemini 3.1 Pro	¥0	审查、文档、分析（优先使用）
Antigravity	Gemini系列	¥0	大型项目脚手架
Aider+Gemini	Gemini 3.1 Pro	¥0	文件级编辑
Aider+DS	DeepSeek Chat	低	预算敏感任务
Codex	GPT-5.3-Codex	按Token	关键任务、复杂推理

策略：日常任务优先Gemini（零成本），关键任务用Codex（品质最高）。

六、关键教训

Codex必须git repo：不初始化会报Not inside a trusted directory → 已加自动init
Gemini flag不是--sandbox：正确用法是--approval-mode yolo
Codex MCP已内置：不需要额外安装，Claude Code自带
AppleScript可控GUI：macOS原生能力，但需要辅助功能权限
成本优化核心：William的Gemini Ultra年费=Gemini CLI零成本，应作为默认工具

七、后续计划

[ ] Flask app.py注册orchestrator Blueprint
[ ] Automation Dashboard新增Orchestrator区块
[ ] launchd定时工作流（如每日安全审计）
[ ] Codex MCP深度集成（在orchestrator中增加MCP调度路径）

2026-02-24-多AI编排调度系统-集成测试与上线.md