Skip to content

初始痛点

  • 单体脚本串行,耗时长且定位困难;
  • 导航与聚合逻辑耦合紧,改动容易回归;
  • 无统一指标出口,CI/本地观感不一致。

目标与改造要点

  1. 拆分职责模块(collect/sync/feeds/i18n/writer),并补齐单元与集成测试;
  2. 引入缓存、增量同步与批量写入,支持哈希跳过;
  3. Schema 化导航/语言/标签配置,运行前即守门;
  4. Telemetry 输出阶段指标,统一 CLI/页面观测;
  5. 调度并行化与插件生态,暴露生命周期事件。

收益与指标

  • 重复运行的构建耗时显著下降;
  • 写入阶段哈希命中减少不必要 I/O;
  • 观测页可直观看到缓存命中率、写入失败、并发覆写与插件加载结果;
  • 遇到异常时能迅速定位阶段、语言与目标路径。

风险与遗留

  • 英文目录缺内容 → 导航 manifest 为空(不阻断);
  • 初期命中率偏低 → 属于冷启动正常现象;
  • 插件错误可能中断生成 → 可在本地先用 --ignore-plugin-errors
  • 需要持续维护 Schema 与测试,防止配置漂移。

占位阶段的经验

占位运行(placeholder)是一条稳妥的起步路线:

  • 可以不依赖大模型或网络,先把内容/聚合/导航打通;
  • 冒烟失败会自动回退,不会污染线上产物;
  • Telemetry 用 “missing/skipped” 明确标记状态,提醒后续接入真实模型。

切换到真实模型时,只需参考《AI 管线占位与切换指南》,按步骤准备依赖、配置适配器、运行 ai:prepare && ai:smoke 即可。

下一步计划

  • 丰富官方插件示例(如性能报告上报、链接检查增强);
  • 补齐英文内容,消除空 manifest 警告;
  • 将 Pagegen 指标曲线化,提供历史趋势比对;
  • 在 Telemetry 页加入告警阈值配置与屏蔽策略。