波纹在水从水滴。

禅与水流测量的艺术

Those who work closely with data recognize the 值 of 在 cremental 在 vestment 在 data quality; however, there is despair that this 值 can be quantized 在 terms that are meaningful to the bean-counters who control and allocate funding for monitoring programs. 的discussion prompted 通过 ‘数据质量经济学‘让我想起小说的各个方面‘禅与摩托车维修艺术‘ 通过 罗伯特·皮尔西格. 的story is about many things but it is mostly about a search for quality.

“懂得修理摩托车的人… with Quality…缺少朋友的人比没有朋友的人少’t. And they aren’也不会将他视为某种对象。质量每次都会破坏客观性。” – R.M Pirsig

的‘value’质量较差的维修与‘value’高质量的维修(将摩托车重新带回公路上的价值)直到不良维修失败为止。这是我们在水文计量学中的难题。的‘value’并不是从获得有益的结果来看。主要是避免不幸。

“我个人的感觉是,这将是世界上任何进一步改善的方式:个人做出质量决定,’s all.” – R.M Pirsig

Quality 在 decisions gets to the crux of the problem. 的value of data quality is not 在 trinsic to the data but 在 the quality of decisions that are 在 formed 通过 quality data. Quality enables quality.

Quantifying the 值 of 在 vestment 在 data quality therefore requires summing the costs of averted misfortune. This is clearly an unobtainable goal, especially if 上e attempts to 在 clude all future averted disasters. A more tractable problem would be to quantify the 值 of data quality when data are used for specified purposes.

作为一项思想实验,假设水库运营商的任务是优化供水(例如,用于水利,灌溉或家庭使用),环境服务(例如,用于鱼类栖息地)和减少洪水风险。给定三种情况:‘perfect’ data, ‘pathological’ data and ‘no’数据,就可以以某种准确度预测任何给定流态下每种方案的总收益。

在里面‘perfect’在这种情况下,下游洪水将永远不会发生;始终满足对环境服务的最低要求;剩余的全部水可用于供水。净收益是成本总和(洪水灾害和环境服务 damage, 哪一个 在 this case are zero) and benefits (total of water supply valuation).

在里面‘pathological’在这种情况下,数据通常是正确的,但有时会产生误导。 在这种情况下,操作员会做出一些好的决定,而某些决定会导致不利的结果。很大一部分水 which 可能被用于供水,由于决策延迟而溢漏,因为操作员在信任数据之前等待确证证据。如果大误差与高流量事件同时发生,则存在泛洪的风险。洪水破坏和环境服务受损的成本 可以从供水评估中减去。

在里面‘no’在数据体制下,没有对大坝运行进行适应性调整。旁路流量设置为最频繁的环境服务需求,溢洪道设置为最大可能流入流量(以避免大坝溃坝带来的洪水风险),并且任何残留水都直接流向供水口。

In this thought experiment, 上e could imagine the 病态的 data being manipulated through a range of pathologies, 哪一个 would result 在 a curve of calculated benefit against data quality all the way from ‘no’数据包括‘perfect’数据。该曲线的形状可能是幂函数的形式,其中指数将是所管理的交互水资源目标的数量和类型的某种函数。

如果我们能够针对不同类型的管理方案来表示这些曲线的无单位形状,那么我们将拥有一个功能强大的工具来传达数据质量投资的价值。数据质量的投资与告知复杂的多目标决策的数据的净收益之和之间极有可能存在高度非线性的关系。

I am not convinced that decisions about 在 vestment 在 data quality are being 在 formed 通过 adequate 在 formation about the benefits of those decisions. Quality and its 值 to society may be better defined 在 terms of meta-physics than 在 empirical terms but as 罗伯特·皮尔西格 would say:

“我认为形而上学如果能改善日常生活,那是一件好事。否则忘记它。”

也许是时候开始更具体地讨论数据质量的影响了。从理论上讲,我提出的多目标思想实验可以包含管理目标,这些目标需要长期的工程,科学,政策和计划记录,以及如上所述的操作决策。在质量和价值之间建立联系, which 可以针对不同的管理场景进行概括,这是我认为值得追求的事情。对于任何给定水平的数据质量投资,我们可能无法达成唯一价值,但我们应该能够以一定的信心描述关系的功能形式。

照片来源: 一滴水 由Sven Hoppe许可 CC BY-SA 3.0


免费白皮书:建立更好的阶段放电额定曲线的5种最佳做法

可靠的额定曲线是可靠,可辩护并最大程度地减少返工的曲线。本文概述了高效水文学家使用的5种现代最佳实践。

没有评论

发表评论

评论
名称
电子邮件
网站