输出方:Coco🐳(运营管理框架主导)+ Elena💼(财务视角补充) 版本:V1.0 日期:2026-03-13 任务ID:Wave6-005 密级:S2(公司内部,成本数字不可对外披露) 状态:Coco初审通过,待Elena财务复审 → William终审
当前已知工具/API/订阅月度成本估算:
| 类别 | 工具/服务 | 月成本估算 | 付款方式 | 备注 |
|---|---|---|---|---|
| 模型API | Claude Max(Anthropic) | ¥1,500-2,000 | 信用卡月付 | 核心工作引擎,不可替代 |
| 模型API | LiteLLM代理(GLM-4/Gemini/MiniMax/Kimi/DeepSeek) | ¥200-500 | 各平台按量 | 多模型分散调用 |
| 模型API | 即梦AI视频(火山引擎) | ¥200-400 | 积分制 | Vega视频生产 |
| 本地模型 | Ollama(电费折算) | ¥72/月 | 电费 | Qwen3.5-27B当前运行,122B待硬件 |
| 工具订阅 | ComfyUI | ¥0(开源自部署) | — | Frida使用 |
| 基础设施 | iCloud(200GB+) | ¥21/月 | 按月 | 全系统文件同步 |
| 基础设施 | 域名(hivecosm.ai等) | ¥150-300/年 → ¥15-25/月 | 年付 | 域名续费 |
| 当前月度总估算 | ¥2,000-3,100/月 | 不含硬件折旧 |
主要不确定性:LiteLLM的精确调用量未统计;即梦AI积分消耗随Vega产量波动;GLM-4-Flash有大量免费额度,实际付费较低。
核心判断:当前成本结构中,Claude Max占比最高(50-65%),是优化的主要目标。本地模型部署完成后可替代30-40%的Claude调用。
3个必须纳入运营管理的财务控制点:
预算审批制度:当前API/订阅费用属于"隐性支出"——无正式申请,无预算对齐,无实际报销。需建立:月度预算申请(William月初审批)→ 实际支出记录(Elena月末核对)→ 差异分析报告。任何单笔超过¥500的新工具/订阅,需提前报William审批。
成本归属分类:运营成本需按业务归属分摊——哪些成本服务于内容生产(成本中心),哪些服务于客户项目(可向客户分摊或报价时纳入)。MS明森项目的AI工具成本应单独追踪,形成"客户项目成本"基础数据,为后续报价提供依据。
跨境支付合规:Anthropic(Claude)等境外服务通过信用卡外汇支付,需保留支付凭证,确认外汇支出是否在公司账户层面合规处理。国内服务(GLM/Gemini国内接口/即梦)应尽量通过公司对公账户或发票报销,避免全部使用个人信用卡。
适用周期:每月1日前William审批,月末Elena核对
| 类别 | 子项 | 月度预算 | 支付方式 | 续费/扣款日 | 依赖级别 | 备注 |
|---|---|---|---|---|---|---|
| 模型API | Claude Max | ¥1,800 | 信用卡自动续费 | 每月1日 | 核心 | 首席工作引擎 |
| 模型API | LiteLLM-GLM-4 | ¥150 | 智谱官网按量 | 不固定 | 重要 | 国产大量调用首选 |
| 模型API | LiteLLM-Gemini | ¥100 | Google按量 | 不固定 | 重要 | 报告/前端首选 |
| 模型API | LiteLLM-其他(MiniMax/Kimi/DeepSeek) | ¥100 | 各平台按量 | 不固定 | 可选 | 多模型冗余 |
| 视频生成 | 即梦AI(火山引擎积分) | ¥300 | 积分充值 | 按需 | 重要 | Vega视频生产 |
| 本地模型 | Ollama电费(折算) | ¥72 | 电费计入 | — | 核心 | 本地推理引擎 |
| 基础设施 | iCloud存储 | ¥21 | 信用卡月付 | 每月固定 | 核心 | 全系统文件同步 |
| 基础设施 | 域名年费(月均) | ¥20 | 年付折月 | 年度续费 | 重要 | hivecosm.ai等 |
| 应急预留 | 新工具测试/突发 | ¥200 | William审批后动用 | — | — | 不用不消耗 |
| 月度总预算 | ¥2,763 | |||||
| 预算波动区间 | ¥2,200-3,500 | 视Vega产量和GPT调用量波动 |
预算申请流程:
月初(1-3日):Coco整理上月实际支出 → 提交本月预算申请(含差异说明)
→ William审批(口头或YAML确认)
月末(25-31日):Elena核对实际账单 → 生成月度运营报告
超预算超30%:Elena即时告警 → William当天决策是否追加
| 工具 | 用途 | 月成本 | 续费日期 | 主要使用者 | 依赖级别 | 替代方案 | 迁移成本 |
|---|---|---|---|---|---|---|---|
| Claude Max | 核心推理/代码/分析/协调 | ¥1,800 | 每月1日 | Coco+所有Agent | 核心 | 无直接替代 | 极高(全系统迁移) |
| LiteLLM代理 | 多模型路由/国产模型接入 | ~¥350 | 按量 | Agent执行层 | 核心 | 直接API调用(复杂度高) | 高 |
| GLM-4/GLM-5 | 国产大模型/日常任务 | ~¥150 | 按量 | 内容团队Agent | 重要 | Kimi/DeepSeek | 低 |
| Gemini | 报告HTML/前端/多模态 | ~¥100 | 按量 | Pixel/报告引擎 | 重要 | GPT-4o | 中 |
| 即梦AI | 视频/图片生成 | ¥300 | 按积分 | Vega | 重要 | 可灵AI/Sora | 中 |
| ComfyUI | 图片生成(本地) | ¥0(电费) | — | Frida | 重要 | 即梦图片 | 低 |
| Ollama | 本地模型推理(Qwen3.5) | ¥72(电费) | — | S0/S1数据处理 | 核心 | 无替代(安全合规要求) | 高 |
| iCloud | 文件同步/多设备协作 | ¥21 | 每月固定 | 全团队 | 核心 | 坚果云/自建NAS | 高 |
核心(不可替代,30天迁移成本极高): - Claude Max:整个Agent体系依赖Claude CLI,迁移等于重建 - Ollama:S0/S1数据安全合规的唯一保证,云端模型无法满足数据隔离需求 - LiteLLM:多模型路由基础设施,所有国产模型通过此接入
重要(有替代,7天可迁移): - GLM-4/Gemini/即梦AI:有竞品可替代,迁移成本可控
可选(随时切换,成本<1天): - MiniMax/Kimi/DeepSeek:辅助模型,随时增减
| 指标 | 定义 | 目标值 | 数据来源 |
|---|---|---|---|
| 长文单篇API成本 | 一篇长文消耗的模型调用费用 | ≤¥50/篇 | LiteLLM调用日志 |
| 短视频单个API成本 | 一个视频的生成+编辑成本 | ≤¥100/个 | 即梦AI账单 |
| 配图单张成本 | ComfyUI/即梦图片单张成本 | ≤¥5/张 | 工具账单 |
| 内容产出总量 | 月度所有形式内容总数 | 见制片方法论基线 | Mila发布记录 |
| 单篇综合成本 | 总成本 ÷ 总产出数量 | 持续下降趋势 | Elena月报 |
| 指标 | 定义 | 目标值 | 数据来源 |
|---|---|---|---|
| 月均任务完成数 | 所有Agent完成的task_registry任务数 | 基线建立后设目标 | task_registry.yaml |
| Agent利用率 | 有效工作时间 / 总在线时间 | >70% | 协调日志统计 |
| Quinn质量通过率 | Agent产出首次通过Quinn检验的比例 | >85% | Quinn测试记录 |
| 任务重做率 | 需要返工的任务比例 | <15% | 协调日志 |
| 指标 | 定义 | 目标值 | 预警机制 |
|---|---|---|---|
| 月总API调用成本 | 所有模型API月度总支出 | ≤¥2,763(预算内) | 超预算20%触发告警 |
| 平均每Token成本 | 总成本 ÷ 总Token数 | 持续下降(本地模型替代) | — |
| 环比成本变化 | 与上月对比的增减幅度 | ±15%以内为正常 | 单月突增>30%告警 |
| 单日异常消耗 | 单日API消耗超月均30% | 触发即告警 | LiteLLM dashboard监控 |
| 本地模型替代率 | Ollama处理的任务比例 | 3月底>30%,6月底>50% | 月度统计 |
| 指标 | 目标值 | 监控方法 |
|---|---|---|
| Flask服务uptime | ≥99%(月度) | DeepCurrent/Lighthouse巡检记录 |
| 永生引擎可用性 | ≥98% | 记忆查询成功率 |
| iCloud同步延迟 | <5分钟(正常) | 多设备文件时间戳对比 |
| Ollama本地响应时间 | <30秒(qwen3.5-27B常规任务) | LiteLLM日志 |
蜂巢创科AI工作室月度运营报告 报告期:YYYY年MM月 编制:Elena💼 + Coco🐳 密级:S2(内部)
| 类别 | 预算 | 实际 | 差异 | 差异率 | 去年同期 |
|---|---|---|---|---|---|
| 模型API | ¥2,150 | — | — | — | — |
| 视频生成 | ¥300 | — | — | — | — |
| 本地模型(电费) | ¥72 | — | — | — | — |
| 基础设施 | ¥41 | — | — | — | — |
| 应急预留动用 | ¥200 | — | — | — | — |
| 总计 | ¥2,763 | — | — | — | — |
成本异常说明:(如无异常填"本月成本正常,无超预算项")
| 内容类型 | 计划量 | 实际产出 | 完成率 | 平均单位成本 | 通过率(首次) |
|---|---|---|---|---|---|
| 长文(2000+字) | |||||
| 深度报告(3000+字) | |||||
| 短视频 | |||||
| 图片/配图 | |||||
| 音频 |
本月Top 3 文章(按阅读量/互动率): 1. 2. 3.
| 指标 | 目标值 | 本月实际 | 状态 |
|---|---|---|---|
| 长文端到端周期 | ≤7天 | 🟢/🟡/🔴 | |
| 审核队列等待时间 | <4小时 | 🟢/🟡/🔴 | |
| API成本/内容件数 | 下降趋势 | 🟢/🟡/🔴 | |
| Agent任务完成数 | 基线+ | 🟢/🟡/🔴 | |
| Quinn质量通过率 | >85% | 🟢/🟡/🔴 |
| 工具 | 状态 | 本月续费/充值 | 异常记录 | 下月计划 |
|---|---|---|---|---|
| Claude Max | 🟢正常 | ¥1,800 | 无 | 维持 |
| LiteLLM | 🟢正常 | 按量 | 无 | 维持 |
| 即梦AI | ||||
| Ollama | ||||
| iCloud | 🟢正常 | ¥21 | 无 | 维持 |
| 优化措施 | 上月状态 | 本月进展 | 节省金额 |
|---|---|---|---|
| Ollama本地模型替代Claude调用 | 实施中 | ||
| Gemini/GLM-4-Flash替代付费模型 | 实施中 | ||
| 即梦AI积分计划优化 | 评估中 |
本月累计节省:¥—(相较纯Claude调用的理论成本)
| 事项 | 负责人 | 预计完成 |
|---|---|---|
下月预算申请:¥___(含说明)
Elena签字确认:Elena💼(日期:)
与《本地模型部署方案-V1.0》完全对齐:
| 措施 | 现状 | 目标 | 预期节省 |
|---|---|---|---|
| Qwen3.5-27B处理日常任务 | 部分启用 | 替代30%Claude调用 | ¥540/月 |
| Qwen3.5-122B处理复杂任务(Mac Studio M5 Max到货后) | 待硬件 | 替代额外20%Claude调用 | ¥360/月 |
| S0/S1数据强制走Ollama本地通道 | 已实现 | 维持 | 安全合规价值 |
| 措施 | 现状 | 目标 |
|---|---|---|
| GLM-4-Flash(内容摘要/分类/短任务) | 已接入 | 覆盖20%任务量 |
| Gemini免费额度(报告HTML/翻译) | 已接入 | 覆盖15%任务量 |
| 总API付费控制 | ~¥350/月 | ≤¥300/月 |
| 原则 | 执行方式 |
|---|---|
| Claude仅用于需要Claude CLI工具调用的场景 | task_router.py路由规则控制 |
| 纯文本生成任务优先路由本地/国产模型 | agent_executor.py双路径分流 |
| S0/S1关键数据强制本地(不降级到云端) | local_inference.py S0/S1通道 |
| 时间节点 | 月度总成本目标 | 关键动作 |
|---|---|---|
| 当前(3月) | ~¥2,763 | 建立成本基线 |
| 3个月后(6月) | ≤¥1,500 | 本地模型全面接管日常任务 |
| 6个月后(9月) | ≤¥1,000 | 本地+免费API覆盖70%+任务量 |
单位产出成本目标:产出量提升30%的同时,总成本降50%,即单位成本降61%
| 风险类型 | 管控措施 | 执行人 |
|---|---|---|
| 图片版权 | 仅使用Frida/Vega自产内容 或 CC0授权图片 | Oliver核查 |
| 数据引用 | 必须标注来源URL(见质量门禁F-1) | Oliver核查 |
| 竞品引用 | 不得使用竞品LOGO/截图,仅可引用公开数据 | Nora把关 |
| AI生成内容声明 | 按平台要求声明AI辅助创作(抖音/公众号规范) | Mila执行 |
发布前必检(每条内容): - [ ] 无"AI完全替代人类"等夸大表述 - [ ] 无虚假数据(Oliver事实核查通过) - [ ] 无William个人真实信息(姓名/单位/住址/职级) - [ ] 无未脱敏的客户信息(企业名/金额/姓名) - [ ] 无政治敏感内容 - [ ] 涉AI内容符合网信办《生成式人工智能服务管理暂行办法》
KOL合作标准(Nathan/Mila负责):
| 合作类型 | 准入标准 | 合同要求 | 付款条件 |
|---|---|---|---|
| KOL内容推广 | 粉丝质量>垂直行业30% | 合作协议+保密条款 | 效果验收后支付 |
| 内容外包 | 通过Nora质量评审 | 外包合同+版权转让条款 | 验收后7天内 |
| 平台运营 | William审批 | 运营服务协议 | 月结 |
外包管理原则: - 所有外包内容,蜂巢创科保留完整版权(合同必含版权转让条款,Elena审核) - 外包方不可接触S1及以上级别的内部信息 - 外包内容与自产内容同等适用合规检查清单
触发条件:单日API消耗 > 月均日消耗 × 1.3
Step 1:DeepCurrent/LiteLLM Dashboard自动告警
Step 2:Coco收到告警后,查询LiteLLM日志定位异常调用来源
Step 3:若是单个Agent任务导致:暂停该任务,分析是否为无限循环/重复调用
Step 4:若是正常需求峰值:记录原因,无需处理
Step 5:Elena在月报中注明异常日期和原因
Coco自审:预算覆盖完整 ✅ | 成本数字有依据(官网价+实际估算)✅ | 指标有明确数据来源 ✅ | 月报模板可直接填写 ✅ | 降本路径与V1.0方案对齐 ✅ Elena待复审:财务合规确认(预算流程+外汇支付+版权合同)
与《制片方法论-V1.0》交叉引用:制片方法论关注"做什么/谁来做/做多快",本文档关注"花多少钱/怎么降本/效率如何"。两份文档共同构成蜂巢创科内容工厂完整管理体系。
🐳 内容运营标准化V1.0由Coco主导完成,Elena补充财务视角。