2026-02-24-多AI编排调度系统-集成测试与上线.md

Coco 协调日志

多AI编排调度系统 — 集成测试与上线

日期:2026-02-24 模块:M25 自动执行体系 负责人:Coco🐳 状态:✅ 完成

一、背景

William拥有8个AI平台资产,其中4个提供CLI编程工具: - Codex CLI (OpenAI, GPT-5.3-Codex) - Gemini CLI (Google, Gemini 3.1 Pro) - Aider (开源, 多模型路由) - Antigravity IDE (Google, 需GUI)

此前各工具独立使用,缺乏统一调度和审计。本次构建 multi_ai_orchestrator.py 统一编排层。

二、集成测试结果

Test 1: Codex CLI ✅

命令:codex exec --full-auto "Create hello.py"
模型:gpt-5.3-codex
版本:v0.98.0
结果:创建文件 + 自动验证运行 + 退出码0
耗时:~15s
关键发现:
  ⚠️ 必须在git仓库中运行(否则报"Not inside a trusted directory")
  → orchestrator已加入自动git init

Test 2: Gemini CLI ✅

命令:gemini -p "Create hello_gemini.py" --approval-mode yolo
模型:Gemini 3.1 Pro
版本:0.29.5
结果:创建文件 + 退出码0
耗时:~10s
关键发现:
  ⚠️ 正确flag是 --approval-mode yolo(不是 --sandbox permissive)
  ⚠️ 有 punycode deprecation warning(不影响功能)

Test 3: Aider ✅ (之前验证)

命令:aider --model deepseek/deepseek-chat --message "..." --yes
版本:0.86.2
结果:已在02-23验证通过

Test 4: Antigravity IDE ✅ (版本检测)

命令:antigravity --version
版本:1.107.0
结果:CLI可检测版本,但代码执行需要GUI窗口
处理:AppleScript控制层 + 文件协议

Test 5: Codex MCP Server ✅

状态:已在Claude Code中配置
工具:codex / codex-reply
用途:Coco可在Claude Code会话中直接调用Codex能力

三、交付清单

# 文件 行数 说明
1 multi_ai_orchestrator.py ~970行 V1.1 四工具统一调度引擎
2 workflow_registry.yaml ~215行 6工具 + 8个工作流模板
3 auto_registry.yaml +30行 新增orchestrator条目(总9个任务)

multi_ai_orchestrator.py V1.1 核心能力

workflow_registry.yaml 8个工作流模板

  1. code-review (review):Codex写 → Gemini审
  2. dual-perspective-code (parallel):双模型比较
  3. frontend-backend-parallel (parallel):前后端并行
  4. code-migration (sequential):Aider迁移 → Codex修复 → Gemini审查
  5. auto-documentation (sequential):Gemini分析+生成文档
  6. bug-fix-verify (review):Aider修复 → Codex验证
  7. hivecosm-module-dev (sequential):Codex开发 → Gemini审查 → Aider测试
  8. security-audit (sequential):Gemini扫描 → Codex修复

四、架构图

William的AI资产 (8平台)
│
├── Claude Code (Opus 4.6) ← Coco🐳运行环境
│   ├── multi_ai_orchestrator.py ← 统一调度层
│   │   ├── dispatch() ← 单任务派发
│   │   ├── workflow_*() ← 多工具编排
│   │   ├── AppleScriptController ← GUI控制
│   │   └── AuditLogger ← 审计日志
│   │
│   ├── Codex MCP ← Claude Code内置集成
│   │   └── codex / codex-reply 工具
│   │
│   └── CLI调度 ←→ 4个外部工具
│       ├── codex exec --full-auto ← GPT-5.3-Codex
│       ├── gemini -p --approval-mode yolo ← Gemini 3.1 Pro
│       ├── aider --model X --message ← 多模型路由
│       └── antigravity (GUI) ← AppleScript/文件协议
│
├── LiteLLM网关 (localhost:4000) ← 8模型在线
└── Dify + LangBot ← C端/B端产品层

五、成本分析

工具 模型 边际成本 推荐场景
Gemini CLI Gemini 3.1 Pro ¥0 审查、文档、分析(优先使用)
Antigravity Gemini系列 ¥0 大型项目脚手架
Aider+Gemini Gemini 3.1 Pro ¥0 文件级编辑
Aider+DS DeepSeek Chat 预算敏感任务
Codex GPT-5.3-Codex 按Token 关键任务、复杂推理

策略:日常任务优先Gemini(零成本),关键任务用Codex(品质最高)。

六、关键教训

  1. Codex必须git repo:不初始化会报Not inside a trusted directory → 已加自动init
  2. Gemini flag不是--sandbox:正确用法是--approval-mode yolo
  3. Codex MCP已内置:不需要额外安装,Claude Code自带
  4. AppleScript可控GUI:macOS原生能力,但需要辅助功能权限
  5. 成本优化核心:William的Gemini Ultra年费=Gemini CLI零成本,应作为默认工具

七、后续计划