2026-06 已上线
ML v7 升级 & 预测反馈闭环
本次更新将线上云海 ML 从 v6(日出窗 43 维) 升级为 v7(precursor 12h + 62 维),并为五女山、东灵山部署点位专属模型;同时上线「预测访问快照 → 次日回测」能力,供标注与模型迭代使用。
LOOCV 准确率对比
留一日交叉验证(LOOCV)在已标注、无日出降水的有效样本上评估;v7 使用 operational 气象(更接近用户提前一晚查看预报的真实场景)。
| 观景点 | 上一版 (v6) | 当前 (v7) | 变化 | 训练样本 |
|---|---|---|---|---|
| 本溪五女山 · 点将台 | 81.5% | 85.5% | +4.0 pp | 55 日 |
| 北京东灵山 · 峰顶 | —(未专项 v6) | 75.0% | 首次 v7 上线 | 36 日 |
五女山 v7 LOOCV AUC ≈ 0.884 · Brier ≈ 0.112。详见 预测模型说明。
v7 模型改了什么?
- 更长的气象记忆窗:除日出 03–07 点外,纳入前一日 20–23 点与当日 0–2 点(precursor 12h),捕捉「前夜增湿 → 日出是否维持」的过程信号。
- 62 维特征:保留 v6 日出窗 43 维,新增 evening / night 段均值与 night→dawn 趋势特征(如
delta_rh_night_to_dawn)。 - 推理对齐训练:线上 ML 在 03–07 点展示时,同样读取 live forecast 的 precursor 窗构建特征,避免「训练用长窗、推理只用 4 小时」的偏差。
- 点位专属模型:五女山、东灵山各有一份
spot_*.pkl,与规则引擎按点位权重融合。
预测反馈(维护者 / 标注员)
用户或标注员打开某日出日的预测时,系统会在后台记录当时的预报快照与概率(不阻塞页面)。日出日结束且已有现场标注后,可回测「当时预报 vs 实况」。
- Admin 标注页(
/label.html?admin=1)新增 「历史预测访问」 面板 - 展示每次访问时间、P(云海)、提前量 lead(h)、对错标记与自动诊断摘要
- 数据从本次升级部署后起积累;可用于分析虚高 case、按提前量分层准确率
普通用户无感知变化;概率展示逻辑与因子面板不变,底层 ML 特征窗已升级。
对你意味着什么?
| 角色 | 变化 |
|---|---|
| 摄影 / 出行用户 | 五女山、东灵山 03–07 点云海概率预期更稳;仍请结合 Meteogram 与现场判断 |
| 标注贡献者 | 标注流程不变;高质量标注继续驱动 v7 重训 |
| Admin / 维护者 | 可查看历史预测 vs 标注;可导出反馈数据做离线分析 |
技术细节见仓库 internal/RELEASE-2026-06-V7.md · 上一版本模型说明仍可在 预测模型 · v6 历史 查阅。