Skip to content为什么先用占位
- 快速启动:不依赖任何模型下载与 GPU 环境;
- 风险可控:冒烟失败自动回退,不污染前端产物;
- 易观测:Telemetry 明确标记
missing/skipped,帮助区分“未接入”与“失败”。
常见局限
- 无法评估真实 embeddings/summary 质量;
- 指标多为占位值,仅作管线连通与告警测试;
- 需要在接入真实模型后重新校准阈值与回滚策略。
最佳实践
- 明确切换窗口:在内容与聚合稳定后再切到真实模型,避免多因素干扰;
- 先跑
ai:prepare 再跑 ai:smoke,把失败集中在冒烟阶段暴露; - 失败即回退:保持
AI_RUNTIME=placeholder 能一键恢复占位产物; - Telemetry 校验:确保 overview 为
ok/passed 后再扩大覆盖范围; - 阶段放量:先启用单模块(如 embeddings),观察成功率与时延,再逐步开启 summaries/QA。
切换清单(Checklist)
- [ ] 安装与配置适配器依赖;
- [ ] 补充/校验
data/models.json(checksum、smokeTest); - [ ]
AI_RUNTIME 与 AI_*_MODEL 环境变量就绪; - [ ]
npm run ai:prepare && npm run ai:smoke 通过; - [ ] Telemetry 观测页显示
status=ok/passed; - [ ] 回滚演练一次,确保
placeholder 能快速恢复。