2026-02-24 视觉能力体系化建设 — 五层审美工程

协调人：Coco🐳 优先级：P0（William亲自指定）触发：William指出"25模块后端已建好，视觉能力是必须突破的瓶颈"

一、William原始需求

William明确提出六个品质基准： 1. 神经网络大脑图：演示记忆引擎如何设计和工作 2. 王者荣耀级角色：精美的角色选择页面画工 3. 王者荣耀皮肤系统：服装/皮肤变体系统 4. 泡泡玛特品味：多种形象的智能体设计 5. 塞尔达级人物设计：任天堂王国之泪/荒野之息的精美画风 6. 系统性学习能力：不是碰运气出好图，而是掌握最高水平画工的能力

核心论断："做了很多后端，到了前端如果没有最高水平画工，就会被阻挡"

二、三路深度调研成果

2.1 游戏级角色设计AI管线

关键发现： - FLUX Kontext（25,224 stars）：2025年突破性技术，迭代编辑+身份保持，8x快于GPT-Image - IP-Adapter（5,804 stars）：ComfyUI原生风格/构图迁移 - VNCCS（781 stars）：角色身份锚定，专为皮肤/服装变体 - Character Turnaround Sheet LoRA：从单图生成5视图角色模型表 - LoRA训练：25-30张图+FluxGym/ai-toolkit，$5-15即可训练ClaudeMon专用模型 - CivitAI资源：Pop Mart SDXL LoRA / BotW Style LoRA / Nendoroid Chibi XL

米哈游/Riot/任天堂方法论： - 米哈游：文化设计矩阵 + 单光源影控 + 5条艺术支柱 - Riot：剪影可读性测试（32px必须可识别）+ 免费10部分教育视频 - 任天堂：画意混合 + 制度化直觉传承 - 泡泡玛特：核心特征不可变 + 数据驱动迭代（Labubu三代肤色渐白=消费者偏好）

2.2 最美技术可视化工具

S级工具： - PlotNeuralNet（24,400 stars）：LaTeX生成3D神经网络图，CVPR/NeurIPS论文标配 - Manim（72,000 stars）：3Blue1Brown动画引擎 - D2（20,000 stars）：代码→精美架构图，TALA排版引擎 - React Flow（35,300 stars）：交互式节点图，Stripe/OpenAI内部用 - NN-SVG（5,000 stars）：浏览器生成参数化SVG神经网络图

A级工具： - Excalidraw（90K+ stars）/ Diagrams（40K stars）/ Mermaid（75K+ stars） - ECharts（65.5K stars）/ Nivo（13.5K stars）/ D3.js（112K stars） - Three.js（105K+ stars）/ PixiJS（46K+ stars）/ React Three Fiber（28K+ stars） - Manim Community（25K stars）/ Motion Canvas（18K stars） - Rive动画引擎 / GSAP / Lottie

2.3 审美品味构建方法论

核心发现：品味可以被工程化

五层审美能力体系： 1. 审美知识库（Layer 1）：Art Bible + 1000+参考图 + 反面教材 2. 自动审美质检（Layer 2）：LAION评分+CLIP一致性+NIMA技术分+pyaesthetics 3. 风格锁定生成（Layer 3）：LoRA训练+IP-Adapter+FLUX Kontext 4. 设计原则引擎（Layer 4）：剪影测试+配色和谐+黄金比例+核心特征不变 5. 审美学习闭环（Layer 5）：William评分→偏好模型→持续进化

开源审美评分器： - LAION Aesthetic Predictor：1-10分（pip install simple-aesthetics-predictor） - pyaesthetics：对称性/色彩/复杂度（pip install pyaesthetics） - NIMA（8K stars）：双评分（审美+技术质量） - CLIP相似度：风格一致性检测

SVG/矢量突破： - Recraft V4：$0.08/个直接生成原生可编辑SVG，REST API可自动化 - Vectorizer.AI：AI栅格→矢量转换 - 255件资产总成本约$20

三、实施决策

已确认决策

Midjourney暂不投入（无API不可自动化）
Recraft V4为矢量化核心方案
LoRA训练ClaudeMon风格（$5-15首次）
五层审美体系作为系统性方法论
Art Bible由Nova主笔（参照Riot/Polycount标准）
审美质检管线由Frida+Pixel建设

Team分组

Nova🦢：Art Bible V1.0 + 审美参考库
Frida🦚：审美质检管线(aesthetic_gate.py) + LoRA数据集准备
Pixel🐱：技术可视化Demo(D2+PlotNeuralNet) + React Flow交互图
Sage🦬：视觉工具链架构设计 + ComfyUI高级工作流
外部Codex/Gemini：代码生成（aesthetic_gate.py / visual_pipeline.py等）

四、关联决策JSONL

{"id":"A-008","date":"2026-02-24","type":"architecture","title":"五层审美工程体系","decision":"品味可工程化=Art Bible→审美评分→风格锁定→设计原则→学习闭环","confidence":0.92,"reasoning":"三路调研+游戏大厂验证+开源工具成熟","impact":"视觉品质从碰运气→系统性产出"}

五、Team交付验收（4组全部完成 ✅）

组	Agent	交付物	大小	状态
A	Nova🦢	HiveCosm-Art-Bible-V1.0.md	51KB	✅ 已交付
B	Frida🦚	SPEC-AestheticGate-V1.md	22KB	✅ 已交付
B	Frida🦚	SPEC-LoRA-Dataset-V1.md	13KB	✅ 已交付
C	Pixel🐱	hivememory-5signal.d2	7KB	✅ 已交付
C	Pixel🐱	25modules-overview.d2	7KB	✅ 已交付
C	Pixel🐱	5layer-aesthetic-engineering.d2	8KB	✅ 已交付
D	Sage🦬	HiveCosm-视觉管线架构-V1.0.md	34KB	✅ 已交付
D	Sage🦬	ComfyUI-工作流设计-V1.0.md	26KB	✅ 已交付
E	Codex	VIS-001-aesthetic-gate.md (SPEC)	—	✅ 已派发
E	Codex	VIS-004-design-rules-engine.md (SPEC)	—	✅ 已派发
E	Codex	VIS-005-aesthetic-feedback.md (SPEC)	—	✅ 已派发

总计：8份文档 + 3份Codex SPEC = 11份交付物，~168KB

六、文件索引

文件	位置	说明
AI角色设计深度研究	`04-项目档案/HiveCosm蜂巢宇宙/AI角色设计深度研究-2026-02-24.md`	三路调研
视觉能力提升实施计划V1.0	`04-项目档案/HiveCosm蜂巢宇宙/视觉能力提升实施计划-V1.0.md`	实施全文
HiveCosm Art Bible V1.0	`02-蜂巢创科/Nova工作区/HiveCosm-Art-Bible-V1.0.md`	Nova🦢交付 51KB
SPEC-AestheticGate-V1	`02-蜂巢创科/Frida工作区/SPEC-AestheticGate-V1.md`	Frida🦚交付 22KB
SPEC-LoRA-Dataset-V1	`02-蜂巢创科/Frida工作区/SPEC-LoRA-Dataset-V1.md`	Frida🦚交付 13KB
D2架构图×3	`02-蜂巢创科/Pixel工作区/d2-diagrams/`	Pixel🐱交付 22KB
视觉管线架构V1.0	`02-蜂巢创科/Sage工作区/HiveCosm-视觉管线架构-V1.0.md`	Sage🦬交付 34KB
ComfyUI工作流设计V1.0	`02-蜂巢创科/Sage工作区/ComfyUI-工作流设计-V1.0.md`	Sage🦬交付 26KB
Codex SPEC VIS-001	`10-外部IDE协作/codex/INBOX/VIS-001-aesthetic-gate.md`	Codex待生成
Codex SPEC VIS-004	`10-外部IDE协作/codex/INBOX/VIS-004-design-rules-engine.md`	Codex待生成
Codex SPEC VIS-005	`10-外部IDE协作/codex/INBOX/VIS-005-aesthetic-feedback.md`	Codex待生成

七、Codex代码交付（续）

任务	文件	行数	状态
VIS-001 审美质检引擎	`09-虚拟办公区系统/aesthetic_gate.py`	621行	✅ Codex GPT-5.3生成+编译通过+Blueprint注册
VIS-005 审美反馈闭环	`09-虚拟办公区系统/aesthetic_feedback.py`	399行	✅ Codex GPT-5.3生成+编译通过+Blueprint注册
VIS-004 设计原则引擎	`09-虚拟办公区系统/design_rules_engine.py`	736行	✅ Codex GPT-5.3生成+编译通过+Blueprint注册

app.py注册：+3 Blueprint（aesthetic_bp 4端点 + aesthetic_feedback_bp 5端点 + design_rules_bp 2端点），Flask路由总数294条

11个审美系统API端点： - /api/v12/aesthetic/score — 单图审美评分 - /api/v12/aesthetic/batch-score — 批量评分 - /api/v12/aesthetic/stats — 评分统计 - /api/v12/aesthetic/reference-set — 参考集管理 - /api/v12/feedback/review — 提交人工评审 - /api/v12/feedback/trend — 评分趋势 - /api/v12/feedback/history — 历史记录 - /api/v12/feedback/anti-references — 反面教材库 - /api/v12/feedback/export — 导出训练数据 - /api/v12/design-rules/check — 单图设计原则检查（POST） - /api/v12/design-rules/rules — 列出所有规则和权重（GET）

VIS-004 design_rules_engine.py 5项规则： 1. silhouette（0.25权重）：32x32剪影占比+连通域检查（Riot标准） 2. color_harmony（0.20权重）：K-Means 5色→HSV和谐关系+明度对比 3. composition（0.20权重）：三分法/居中构图+黄金比例加分 4. multi_size（0.15权重）：80x100/40x50/32x32三档Laplacian清晰度+边缘密度 5. core_features（0.20权重）：ClaudeMon 4核心特征颜色区域检测（LED眼/胸灯/天线/金属头）

八、后续步骤

William审阅：Art Bible V1.0 + 管线架构V1.0 → 审批后进入Sprint 1
工具安装：D2(brew install d2) / LAION Predictor+pyaesthetics(pip install simple-aesthetics-predictor pyaesthetics torch transformers Pillow) / opencv-python-headless(pip install opencv-python-headless)
LoRA数据准备：按SPEC扩充ClaudeMon训练集到25-30张
里程碑：02-25 Art Bible审批 → 02-26 D2渲染 → 02-27 LoRA数据 → 02-28训练 → 03-01首批60张