玻璃和计算器在数据表上。

水文数据质量经济学

Data about water quantity and water 质量 are fundamental to some of the most important decisions made 通过 engineers and 在 choices made 通过 societies. Abundance and 质量 of water are critical factors 在 many aspects of our economy, our environment, and our social and physical well-being. It is the case than multiple water resources objectives must be simultaneously managed. The costs of sub-optimal water resources choices can be substantial. Uncertainty is antagonistic to optimization.

以前的陈述中很少有胜出的’与水资源行业许多人的经验产生共鸣。但是,如果我按顺序重新排列这些语句:“water is valuable; decisions control net valuation; data control decisions; data 质量 and decision 质量 are positively correlated,”那么从逻辑上讲,人们可能会推断出数据本质上是有价值的,并且受信任的数据比不受信任的数据更有价值。

我得出的结论是,值得信赖的水文数据是有价值的‘believe’ to be 真正.

It is a case I have argued many times and 在 various ways 在 previous blog posts. It provides the rationale for 在 cremental 在 vestment 在 质量 management 通过 the best 水文数据 producers 在 the world.

我是经验主义者。我想支持我的‘belief’知道数据的价值是‘observable’因此可以量化。水文数据及其可信度不是‘normal’在某种意义上说‘true’市场交易可以很容易地观察到其价值。经济学家对各种资产的价值进行量化的能力可能非常聪明,我很好奇是否对可信赖的水文数据的增量价值进行了经济分析。

如果没有办法,如何做出合理的决定来投资增加站的密度‘knowing’新数据源的价值?如果没有办法,如何合理地决定投资遥测‘knowing’数据及时性的价值?如果没有办法,如何证明实施冗余的决定是合理的‘knowing’数据可靠性的价值?如果没有办法,如何证明实施稳健的质量管理框架的决定是合理的‘knowing’数据可信度的价值?这些事情一旦完成,就不可能追溯地量化净收益了吗?

关于...的概念文献相对丰富。‘信息的期望值,’这是解决决策前投资信息相对利益的经济方法。这种类型的分析似乎对完成任务很有用,但是我找不到任何可以对水文法进行估值的研究‘best practices.’

Many hydrologists are clearly uncomfortable with estimating the 值 of their data.

他们可以清楚地说明监视设计不足或数据丢失,过时或不准确所带来的风险和后果。他们还了解水的可变性以及有关这种可变性的信息不足的风险和后果。

They know what their data cost but not what it is 价值. We can therefore measure that ‘better’数据通常会花费更多,但我们无法衡量‘better’ data are 价值 more.

Connecting 值 to data is not a skill 在 the hydrology domain. Assigning 价值 to an asset requires sophisticated economic analysis if the asset is a public good and not a freely traded commodity. Given the role of timely, reliable, and trustworthy data 在 resolving water conflicts and 在 the implementation of beneficial management to avoid hardship and conflict, 上e would expect that economists would have been working hard to ensure that 在 vestments 在 水数据 are properly 值d.

似乎并非如此。也许我缺少有关此主题的一些重要研究或调查。如果您知道任何相关研究,请直接通过以下方式与我联系 [email protected] 或回复此帖子。

知识共享许可
13条留言
  • Salina Perry
    回复
    发表于2014年10月1日下午2:58

    这是一篇非常有趣的文章。一世’m担任水文技术专家,我的水监控团队正在从省政府(艾伯塔省政府)过渡到独立机构(艾伯塔省环境监测,评估和报告机构)。能够为商品分配具体价值的想法“worth”在此过渡过程中,我们收集的数据非常重要且相关,尤其是与数据成本有关。收集高质量数据的成本可能很高,因此希望独立的机构能够找到自己的评估数据价值的方法,以在将来促进数据收集中的有意义的变化。

  • Asoka Diggs
    回复
    发表于2014年10月2日上午9:29

    I’我不是水文学家,但我确实来自数据管理专业,这个问题你 ’我也发现有趣的事情是,我们(更广泛的行业)数十年来一直在与更多人搏斗。好消息是,有一个专业’s been wrestling more generically with the question of how to create and maintain 质量 data, as well as how to 值 it.

    我的两个资源’会指出你我’发现有价值。首先是从数据管理专业人员的角度对数据管理进行概述’s association: http://www.dama.org/files/public/DAMA-DMBOK_Functional_Framework_v3_02_20080910.pdf

    The second is a study of the 在 cremental 值 of data driven decision-making to organizations that are making data and analytics central to their organizational strategy: http://ebusiness.mit.edu/research/papers/2011.12_Brynjolfsson_Hitt_Kim_Strength%20in%20Numbers_302.pdf

    这是您的起点。我自己的观察是,数据不仅难以估价,而且我不’t 相信 that I’我们还看到有人可以直接在任何行业中为数据赋予价值–或至少没有获得广泛共识的价值。

  • Dave Gunderson
    回复
    发表于2014年10月3日下午12:36

    斯图,我想我们谈论过一两年前维护仪表的成本。估算运行成本并不是一门精确的科学。以下是您考虑的变量:

    1.该站点有多远?您如何访问它?有些网站需要几个小时才能到达。还以支持站点所需的车辆类型的形式考虑支持费用。

    2.需要哪种类型的仪器?遥测?功率预算等

    3.网站安全。使其防弹,防破坏。

    4.您需要访问现场几次以进行校准,维护和排放测量?请参阅上面的#1。

    5.场地成本的一半是辅助水文学家在更正和计算最终记录方面的工作(这就是为什么我们有水瓶座)。

    6.隐藏/意外费用。破坏者的行为,上帝的行为。传感器问题,电源问题。

    保持低成本通常意味着我们必须在O方面保持灵活性&M个时间表。发生故障时,我们必须重新配置以及时修复问题。这些就是我们要看的东西。

    斯图,您要求一种估算成本的方法。我想说您打电话给USGS的几个水务办公室,问他们费用是多少。当然,您会根据当地情况获得一些估计。那应该使您陷入困境。通配符就是遥测成本(USGS使用GOES)。不同的遥测选项具有不同的成本– all based 上 location. Funny. The location of a remote site is always the largest component 在 determining the 真正 cost of data.

  • Brent Watson
    回复
    发表于2014年10月3日下午5:25

    思想调用片斯图。

    从“收集成本”到“资产价值”的飞跃需要认真考虑未来的数据重用机会和长期的社会利益。

    在可以飞跃之前,需要了解数据的局限性& more importantly data 质量 and the implication 上 future decisions. What can the data be really used for and what is the statistical uncertainty.

    水文数据是众多社会资产的基础:主要发展&经济增长,工程(保护&基础设施),当然还有环境管理。

    Quality 在 formation over Range and more importantly Time (and length of record): plus end-uses would be very an 在 teresting set of metrics: that could step beyond from Deming’s process/quality control towards Juran’s 质量 trilogy…

    “质量不是偶然发生的,必须进行计划”

  • Russell
    回复
    发表于2014年10月3日晚上8:20

    The whole question of the economics of data 质量 is wrapped up with trying to determine the 值 of streamflow data.

    当我们尝试这样做时,人们通常会陷入有关福利成本比率的辩论中。在针对该问题的各种研究中,我发现比例从200:1到9:1不等。

    One 在 novative study split the concept of 值 在 to extrinsic 值 and 在 trinsic 值. Extrinsic 值 is what was paid 在 dollar terms to collect, store and manage the data. This is not difficult to work out.

    Intrinsic 值 is what somebody is prepared to pay for the enjoyment of or to exploit the utility of something. This is not so easy to determine.

    在几年前陷入这个问题之后,我得出结论,整个辩论是似是而非的。

    In the end, streamflow data 上ly has 值 when somebody tries to use it and then it turns out that the right item of data at the right time is priceless. In other words, high 质量 streamflow data appropriate to a particular use has a 值 to the data user which cannot be calculated. Conversely, streamflow data which is not being used has no 值 to the data user no matter how good it is.

    Continuing with this theme, poor 质量 data applied to an 在 appropriate use actually has negative 值. In other words, the data can detract from the outcome.

    最终,这种思路得出以下结论:

    Data, per se, has no 值 –它只有被使用的可能性。

    问题变成了“How much effort should I put 在 to producing high 质量 data, if that data has a low probability of being used?”

    • Stu Hamilton
      回复
      发表于2014年10月3日晚上8:21

      嗨罗素,

      鉴于你的问题“How much effort should I put 在 to producing high 质量 data, if that data have a low probability of being used?”我建议仍然必须将增加的工作量(即成本)与价值增加进行比较,以便做出明智的决定。换句话说,您的问题是递归回到原始问题“what is the 值 of data 质量?”. In fact, an 在 vestment 在 质量, arguably, alters the probability of the data being used as well as 在 fluencing the 在 crement 在 值 of the decision outcome.

      您认为价值是随机的,这是思考问题的有用方法。例如,“PFD的价值是什么?”。如果我既选择又需要使用它,那是值得我一生的。如果我选择不使用它或不再需要它,那么它就一文不值,甚至具有负价值。另一方面,如果我选择使用它但从不需要,它的价值也很高,因为仅仅知道我拥有它,我便可以享受许多本来/本该非常恐惧的生活经历。我也能够从事创造价值的工作,否则我将无法做这些事情。挣值是高度随机的,这一事实并不能阻止我评估其净值远高于其成本。实际上,该值明显高于其成本,以至于我从未想过要量化该值。

      I think that may, at least 在 part, be why there have apparently been few, if any, attempts to quantify the 值 of data 质量. Most of us who work with data understand that the 在 cremental 值 of 质量 vastly exceeds the 在 cremental cost of the data.

      Nonetheless, I think if you assigned an economist with the task of evaluating the 价值 of a PFD that a method would be found to quantify its 值. Similarly, if given the task of quantifying the 值 of data 质量 I think an appropriate method could also be found.

      • Russell
        回复
        发表于2014年10月3日晚上8:22

        I agree. Any person who has ever been 在 volved 在 collecting, managing and using streamflow data 在 tuitively knows that the net 值 of the data is far higher than its extrinsic cost. It is exactly the same as with a PFD.

        我的基本观点是,不可能在流数据的内在价值上加上美元值,主要是因为它要么为零,要么为无限(无价)。因此,使用美元价值作为证明收集,存储和管理流数据(或任何其他与环境有关的数据)的方法注定会失败。

        在我看来,如果我们专注于使用可能性(POU),然后尝试对其进行量化,那将对我们所有人都有好处。在我看来,它与使用频率成反比。

        在基于POU做出决策时,流程将如下所示:
        如果POU大于零,那么我们应该收集,存储和管理数据。如果POU等于零,那么我们应该首先丢弃它,甚至不收集它。
        关于流数据的事情是,POU永远不会为零。特定数据项的POU可能非常低,但不为零。因此,在决定收集它之后,我们必须妥善保管并使其可用。

        关于流数据的另一件事是,POU与记录的长度直接相关。记录越长,使用的可能性就越大。我引用了第一次白内障时尼罗河的记录。我在最不可能的地方看到过对它的引用。

        So then the discussion turns to datasets with a POU >0. If data are deemed to have a high POU (such as today’s forecast temperature), then it should be stored 在 a high cost, low volume and easily accessible form. The converse is applied to data with a low POU (such as yesterday’s forecast temperature). It should be stored 在 a low cost, high volume and not so easily accessible form.

        一旦我们学会了如何成功地处理POU概念,那么剩下的就是与最初决定收集数据的原始决策相关的经济学。但是,该决定通常不在河边站立者的控制范围之内。

        Getting back to subject of 质量: 在 my mind there is no connection between data 质量 and the 在 trinsic 值 of streamflow data. A person who finds a particular dataset that suits his purpose will ignore the 质量 of that data. Again, I cite the River Nile. Does anybody know the 质量 of the water level record from 3,000 years ago?

        结果,如果已经决定收集流数据,那么收集器应该将数据集生成为可能的最高标准。全力以赴,做不到任何事情。

        The economics are then: if the person paying for the data to be collected cannot afford high 质量 data, then the data should not be collected at all. Likewise, If the person standing 在 the river cannot produce data to the highest possible standard then they should not be 在 the profession.

        关于量化数据的价值;澳大利亚工程师学会在1988年完全做到了这一点。他们花了大约18个月的时间制作了一个重量级的书,得出的结论是,收益成本比约为9:1。换句话说,澳大利亚经济在收集,存储和管理流量数据上每花费1美元,便能获得9美元的收益。这项研究反映了加拿大政府在1969年所做的一项研究。他们得出结论,该比率约为200:1。

  • Michel H
    回复
    发表于2014年10月6日下午1:45

    I am not familiar with any valuation work that examines “goods” (in the economic sense) of this nature. However, there are databases that document the results of studies that 值 various ecosystem services. One that comes to mind is hosted 通过 Ecosystems Services 伙伴hip (seehttp://www.fsd.nl/esp/80763/5/0/50). You might be able be able to 在 fer net benefit of 在 vestments 在 Hydrometric data 通过 discussing the magnitude of such financial outlays and their role 在 mitigating possible loss of ecosystem services. You would then essentially be treating the data as a risk management measure and the difference 在 the expected 值 of the ecosystem services with and without the data minus the cost of data collection would be the “value” of the data.

    • Stu Hamilton
      回复
      发表于2014年10月6日下午1:45

      感谢Michel,

      这是有帮助的。

      我收到了一些其他来信,这也使我思考问题的另一个方面。假设我们遵循您建议的会计处理方法,即从生态系统服务评估开始,任何监测工作的“成功”(即数据在您的叙述中的作用)实际上是一种概率函数。完美的信息将导致最佳的ES结果,没有信息将导致ES结果的随机分布–净零收益,而信息不佳的信息将导致ES结果为负。数据质量改善的“价值”在于改变成功结果的可能性。

      这让我望而却步,但我希望随机经济模型必须作为资产评估的一种相当完善的技术而建立。但是,我也希望这些技术没有作为资产应用于环境监测的结果。

      这种思路为我提供了追逐专业知识的新途径。我认识一些随机水文学家,他们可能会在思考这个问题时受到挑战。

      斯图

  • Barry W
    回复
    发表于2014年10月6日下午1:47

    嗨,斯图尔特,这很有趣。这是我的一些快速想法,还有一些参考资料可能会有所帮助。

    最初想到两个公理– “我们管理我们可以衡量的”, and “衡量重要的事情。”显然,水质对人类很重要,我们努力为自己的利益管理水质。良好的水文数据与土地利用和自然干扰相关,是理解因果关系的基础。理解因果关系之后,我们就可以制定策略来管理有利的结果–例如限制土地沉积物运输的土地使用阈值。当然,如果没有人使用的话,好的数据将具有有限的价值。因此,这些数据的价值当然与如何或是否用于实现某些结果有关。这也关系到除收集者之外的其他人如何获得它。

    除此之外,水文数据作为商品或商品的价值无疑与稀缺性,实用性和收益递减规律相关。这种稀缺与两种商品有关– scarcity of 水文数据, and scarcity of good water 质量. I would say that as water 质量 declines, the 值 of both data and good water 在 crease and so this is something that should be considered 在 your valuation.

    Here are two links to reports are available 上 the ALCES website relating to valuing water 质量 and quantity 通过 Jonathan Holmes as well as a link to a report I found 通过 Susan Walker 在 the UK. In some respects, there are discussions about the 值 of the data supporting the analysis. Also 在 cluded are a number of other reference sources. I hope this is helpful. I would be very 在 terested to hear what you find out or put together!

    弓河流域水量评估– Jonathan Holmes

    http://www.alces.ca/reports/download/233/Jonathan-Holmes-WATER-QUANTITY.docx

    Estimating the cost of water 质量 for the Bow River Basin 在 Alberta – Jonathan Holmes

    http://www.alces.ca/reports/download/234/Jonathan-Holmes-WATER-QUALITY.docx

    The 值 of hydrometric 在 formation 在 water resources management and flood control
    苏珊·沃克(Susan Walker),香港仔大学地理系,香港仔Elphinstone Road
    AB9 2UF,英国(英国环境局(西北地区)前区域水经理,英国沃灵顿WA4 1HG)
    http://onlinelibrary.wiley.com/store/10.1017/S1350482700001626/asset/20007410_ftp.pdf?v=1&t=i0r9scot&s=5c9ade41cc6afe9f160c52fd4852b85b4a650779

    巴里

  • Sean O
    回复
    发表于2014年10月8日晚上7:48

    一个非常有趣的话题,并且与我当前的工作环境非常相关。

    我在一个组织中工作,由于当前的经济形势,“values”其数据基于其产生的收入。这种收入的一个例子包括分流许可证,其中,当达到一定流量阈值时,农业和工业界为从溪流中提取水的权利支付许可证费用。对我们来说,另一个高收入者是下水道流量监控,在该机构中,我们的组织会测量从许多不同的零售商进入我们的处理系统的下水道流量,然后由ML收取。

    因为“value” of this data a lot of resources is put 在 to maintaining high 质量 data with rigorous maintenance programs, redundancy systems and top of the range telemetry systems.

    Unfortunately, high 质量 data with substantial historical data sets, but with end uses that generate little, if any 在 come are now suffering the consequences of the economic climate, with resources allocated to maintaining this data being slowly but surely reduced.

    I’m sure i’我并不孤单,还有许多像我一样沮丧的水文学家“bean counters”正如Stu所说的那样,现在根据他们自己对“value”水文数据。

  • Gerald Dörflinger
    回复
    发表于2014年10月9日上午2:36

    这是一个非常有趣的讨论,涉及该主题的许多有趣的观点和方法,很高兴能跟随!感谢所有贡献者!斯图,继续努力!
    杰拉尔德

  • Chuck Dalby
    回复
    发表于2014年10月11日下午3:05

    Thanks 斯图 for a great topic! and as a fan of Pirsig and the book, I find the application of his metaphysics of 质量 to hydrology data collection an 在 teresting extension. One of the problems 在 its application is that 质量 and 值 are perceptions and based 上 上e’以前的经验(遗传学和教育学也是如此)因人而异。它也不利于量化,但可以“got at” through analogy–或如先前的帖子所暗示的,是功利主义的理由(例如投资回报率)。
    我可以’记得谁说过这样的话:没有数据总比没有数据好,而且指导原则构成了USGS国家水质评估的第一板。这项工作是由国会指示的,他在一个罕见的清晰时刻指出,《清洁水法》导致了巨额支出,但没有人能证明这项工作是否有效的数据。 1990年末’s? USGS检查了美国EPA水质数据库STORET中包含的大量水质数据,并被迫丢弃了许多数据。有些明显不好(例如,阴离子/阳离子平衡失败)或有关收集方法,分析方法等的元数据不足。

    自成立以来,USGS一直是收集优质水文(和其他)数据的主要领导者(在此我必须指出,我不是USGS的雇员,也从未为他们工作过)。他们一直致力于由多种因素驱动的数据收集,分析和解释方法(例如,他们拥有三层研究人员和应用科学家,以及彼此之间实际沟通的技术人员)。 USGS已经开发了许多用于水文数据收集的标准协议,以确保数据收集在空间和时间上的一致性,并确保使用方法(现场和分析)来生成质量已知的数据(例如偏差和精度),因此,我们通常相信USGS数据除非我们知道谁专门收集了数据,否则就更怀疑顾问和其他数据(当然,USGS并不完美,有时信任会放错位置)。

    The downside of this is that this 质量 comes at a higher cost and 在 creasingly it is difficult for entities to afford that cost. Coupled with the reduction 在 available funding (consider this, the USGS annual budget is or was equivalent to a few weeks 在 Iraq !), this leads to reductions 在 data collection and many agencies are forced to either reduce data collection–或者说服自己,他们或顾问可以以大大降低的成本来做到这一点。可能是这样。

    数据质量和数量之间始终会存在紧张关系。在科学家,管理人员,政治人物和非专业人士之间,在什么方面总是会有不同的看法“quality”是。但是过去的一个重要教训是,要确保与收集的数据一起,对所使用的现场方法和设备,分析方法以及用于产生最终数据的最终数据进行充分的描述。数据库并成为历史的一部分。只有做到这一点,才能从现在起一年或50年后做出决定“quality”.

    谢谢,
    卡盘

发表评论

评论
名称
电子邮件
网站