不少人谈天气预报,最常问的是一句话:准不准。若标准只是不要漏报,那么答案其实很简单。每天都预报下雨,命中所有雨天,命中率自然是100%。这样的预报看似高明,实则空洞。
nnnn在预报验证中,最基本的指标之一是POD,即Probability of Detection,探测率。它的计算方法是命中的次数除以实际发生的次数。假设一年有100天下雨,只要那100天全部预报到,POD就是100%。若每天都预报下雨,这个条件必然成立。于是,一个毫无判断力的人,也可以在纸面上取得满分。
nnnn问题随即出现。其余265天其实没有下雨,却全部被预报为雨天。这些错误称为误报。这时便要看FAR,即False Alarm Ratio,误报率。它的计算方法是误报次数除以所有预报为事件的次数。在每天都报雨的情况下,365次预报中只有100次正确,265次误报,FAR约为73%。换言之,超过七成时间在虚惊。这样的预报,难以赢得信任。
nnnn因此,只看POD没有意义。预报可以透过极端策略拉高命中率,却同时放大误报。相反,若从不预报下雨,误报率是零,但所有雨天全部漏掉,POD为零。这同样没有价值。真正的挑战,在于两者之间找到合理位置。
nnnn气象学上常用CSI,即Critical Success Index,临界成功指数,来同时衡量命中、误报与漏报。它以命中次数除以命中、误报与漏报三者之和。若预报过于激进或过于保守,CSI都会偏低。只有在适度平衡之下,CSI才会上升。这个指标要求预报员对整体表现负责,而非沉迷单一数字。
nnnn这背后其实是风险管理。若漏报代价极高,例如强降雨可能引发山泥倾泻,那么可以容忍较高误报。若误报代价高昂,例如错误停课或停工带来经济损失,则必须压低误报率。预报从来不是猜中与否的比赛,而是成本与风险的权衡。
nnnn以上只是最基本的分类预报验证方法。现代天气预报大量采用机率形式,例如预报降雨概率为30%或70%。这类机率预报的验证涉及可靠度、解析度、Brier Score等更深入概念,远比POD与CSI复杂。如何检验一个机率预报是否既可靠又有区分能力,是另一层次的问题。本文暂不展开,日后可再细谈。
nnnn所谓百分之百准确,往往只是定义上的游戏。只要选择对自己有利的指标,就可以制造漂亮成绩。真正负责任的预报,必须同时接受多项指标检验,并清楚说明取舍逻辑。数字不会说话,但人会选择说哪一种数字。
nnnn天气预报如此,其他预测亦然。若只追求表面准确,而不面对代价与不确定性,任何预测都可以看起来完美。问题不在于能否做到全对,而在于我们是否愿意诚实地衡量其意义。
n