日期:2026-03-13(深夜延续) 负责人:Coco🐳 优先级:P0(自我进化里程碑)
完成了Coco-lite从V0.1到V0.3的完整训练迭代周期,并通过系统提示工程将benchmark从37.4%提升到87.1%(优秀级,可用于生产)。
关键结论:在当前数据规模(532条)下,系统提示工程对路由准确性的影响远大于LoRA微调。LoRA的价值在于固化身份认知和安全拒绝反射。
adapters/coco-lite-v0.1/ + models/coco-lite-v0.1-fused/tools/coco_benchmark.py:15题/4分类/155分满分新建 tools/coco_system_prompt.md V1.1,四轮迭代:
| 轮次 | 核心改动 | 得分 |
|---|---|---|
| 1 | 安全规则+路由规则基础版 | 56.8% |
| 2 | 路由/安全分离,不在拒绝回复中提文件名 | 71.6% |
| 3 | 路由规则强化到emoji+全名组合 | 81.9% |
| 4 | 身份描述含蜂巢创科,内容派发说明不自己写,天使轮关键词 | 87.1% 🏆 |
模型:models/coco-lite-v0.2-fused(4GB,Qwen2.5-7B + LoRA身份层)
系统提示:tools/coco_system_prompt.md V1.1
Benchmark得分:87.1%(优秀·可用于生产)
| 文件路径 | 类型 | 说明 |
|---|---|---|
tools/coco_system_prompt.md |
生产配置 | 系统提示V1.1(最终版) |
tools/coco_benchmark.py |
测试工具 | 15题benchmark |
training_data/seeds_v2.jsonl |
训练数据 | 17条路由修复种子 |
training_data/seeds_v3_facts.jsonl |
训练数据 | 12条事实/安全种子 |
training_data/seeds_v4_routing.jsonl |
训练数据 | 8条Alex/Nathan路由种子 |
training_data/train_v3_full.jsonl |
训练数据 | 532条完整集(最新) |
adapters/coco-lite-v0.1/ |
模型权重 | 600步,val_loss=1.558 |
adapters/coco-lite-v0.2/ |
模型权重 | 200步(被中断) |
adapters/coco-lite-v0.3/ |
模型权重 | 600步,val_loss=1.602 |
models/coco-lite-v0.1-fused/ |
融合模型 | 4GB,生产候选 |
models/coco-lite-v0.2-fused/ |
融合模型 | 4GB,当前最优 |
models/coco-lite-v0.3-fused/ |
融合模型 | 4GB |
Coco🐳 | 2026-03-13深夜 | 本地化训练里程碑