爱因斯坦(Albert  爱因斯坦 )报价。

水文讨论,无视我们的虚假信息

我之前说过 信息 不确定 在水文数据中。信息是指数据代表“真实”信号的程度,而不确定性是指根深蒂固于数据中的事实偏差。使用统计方法测量不确定性(例如 表达不确定性指南)使我们能够量化错误信息,但是这些方法目前不足以识别数据中是否存在错误信息。

考虑以下问题:

谁提出相对论?

a)阿尔伯特·爱因斯坦
b)阿尔伯特·爱因斯蒂安
c)理查德·费曼
d)一位科学家

答案(a)是“真实”信息。答案(b)包含错误信息,即它是事实的乱码。答案(c)是虚假信息,即以较高的视在精度认为是错误的。答案(d)也是虚假信息–在这种情况下,它对于要求的“真相”具有较低的保真度。

这两个虚假信息示例说明了 认识的 错误(即知识错误)和 程序错误 (即在寻求真相的过程中出现错误)。两种形式的虚假信息都可能存在于水文数据中,并且都难以完全防止或检测和缓解。此外,水文信息失真可能导致对其他水文过程的错误推断。对水文数据的信任度很高,而通过关闭水平衡所需的会计处理可以填补信息空白。

因此,水文信息失真非常阴险,因为它提供了对水文系统的错误理解,而不是偶然的错误,后者只会使人们对水文过程的理解更加困难。

在Hamilton和Moore(2012)中更详细地探讨了水文不实信息的几个示例,但值得强调的是,将程序与认知错误相融合的机会有多丰富。水文监测通常是在不利条件下进行的。不利于放电测量的条件通常也不利于使用 阶段放电等级。这导致排放量测量具有虚假信息(即“真相”的保真度较低),对排放量阶段到排放量的转换(即认知错误)的决策具有很高的影响力。

正如丹和我在汉密尔顿和摩尔(Hamilton 和 Moore,2012)中提供的示例一样,借助事后观察,更容易识别虚假信息。使用自最初生成数据以来获得的所有累积信息进行的回顾性分析可以提供大量信息。这些分析中的限制因素始终是元数据,该元数据要么不存在,要么已与数据分离。

丢失元数据的一个小例子是有关用于声音测量的行标记的文档。在回顾性分析中,通常很容易确定测深权重是否足以满足所测量的深度和速度。通常很容易确定是否应用了湿线/干线校正。但是,通常无法识别探测线上是否使用了标签。如果是,则干线错误已得到缓解,而湿线错误则相对较小。如果否,则测量中的错误信息可能非常严重。恰恰是有记录的最高测量值会产生此程序虚假信息的最大风险,并且就影响等级曲线的形状而言,这些测量值对认知错误的影响也最高。为什么标准字段注释没有专门用于标签使用的字段?为什么没有标准的操作程序来验证使用距离的标签重量超过重量的标签距离?为什么实地考察总结不能说明探空权重是否足以满足所遇到的深度和速度,如果不能满足,则采用何种缓解方法,以及如何验证缓解效果?

汉密尔顿和R.D. Moore。 2012年。“量化水文记录中的不确定性。”加拿大水资源杂志,37(1):1-19。

照片来源: 曼努埃尔·马丁(ManuelMartín) | 爱因斯坦 | 执照

2条留言
  • Jaime Saldarriaga
    回复
    发表于2012年8月1日上午10:52

    有趣的讨论。虚假信息和不确定性之间有趣的区别。统计方法通常指不确定性。那么,我们是否需要其他主题来处理虚假信息?

  • 发表于2012年8月2日下午12:55

    海梅

    不确定性通常被认为是我们进行精确测量的能力的差异,可以将其表征为许多尝试在完全相同的时间,完全相同的方式进行完全相同的测量的标准偏差。我们并非总能从大量的重复测量中受益,但是可以通过各种技术来估算我们的测量相对于真实情况的分散性。

    虚假信息从根本上有所不同,并且是由于流程错误或错误信念引起的(例如,我认为我的评级曲线可以扩展到我的最高测量值的3倍-非)。任何统计魔术都无法发现这种类型的错误。从根本上说,必须首先防止它存在。

    我希望,作为一个社区,我们可以开发“最佳做法”,以消除所有水文数据中存在的虚假信息。我认为,就这些“最佳实践”可能是什么样子达成共识的最大希望是,揭露各个问题领域并进行讨论。

发表评论

评论
名称
电子邮件
网站