先要开放哪些数据?对开放数据项目中先有鸡还是先有蛋的思考

此处原文来自阳光基金会

图片来自 gettyimages

原作者:Emily Shaw

译者:高丰

授权于 CC-BY

我们期望中的政府开放数据政策是政府数据应当默认开放并且主动开放。然而,在经过漫长的政策讨论后,我们意识到,即使是再有雄心壮志的政府,可能也不能完全做到这一点。当我们仍在从20世纪思维转向21世纪思维的过程中,所有期望让民众更容易在网上访问政府数据的政府应当问自己一问:什么数据是应当被优先发布的?一些数据的发布周期可能会十分漫长,所以政府应当在设计数据开放项目的初期就考虑这一问题。

这个问题乍看上去好像不算什么大问题,但事实却不是如此。数据的格式、质量以及它的可发现性(译者注:即是否容易搜索到、查找到)最终决定了一个开放数据政策的有效性。如果一个开放数据政策未能及时发布那些在项目初期所设想的重点领域数据,那么这个政策无疑是令人失望的。这不仅会让人丧失开放数据的动力,也会让政府将来在基于绩效来为项目安排预算时感到进退两难。

在思考数据开放优先级的时候,政府应当先问一问,「我们都有哪些数据?」。要知道对全局的不知情是会导致盲目制定优先策略的,而这时候一份政府数据清单就是这一切工作的基础。即便一些数据可能因为隐私问题或者安全问题不可能原样开放,我们也强烈建议政府能够编制一份完整的数据清单。当清单编制完成,政府也将有更多的机会来吸引民众的参与,让他们表达对特定数据的兴趣,从而建立起开放数据项目政府内外利益相关群体的合作关系。

因为数据最终真正得以投入使用是我们的目标,所以工作在开放数据政策上的团队应当在初期就考虑他们开放数据的目标是什么。一个能够明确共有目标和价值观的项目不但能够吸引不同利益相关团体的支持,也能够更好明确未来的计划。问一下自己,你的开放数据项目是期望提高公民访问公共服务的能力?还是帮助决策者作出数据驱动的决策?又或是期望振兴经济?如果你代表一个专业机构,那么你的目标应该至少有一部分是由你的任务所决定的。因此不论你的目标是什么,都请深思一下,你可以如何通过安排数据开放的优先级来达成你的目标。

这里我们列出了一系列你可能会设定的目标,以及一些能够帮助达成目标的数据集来供你参考:

政务透明化: 如果一个政府期望能够变得更为透明化,那么它就该让民众得以看到政府是如何作出决策的,哪些因素会影响决策,而这些决策又会如何被落实。如果能开放决策过程中影响法律、条款制定的数据,比如在立法会中引用的指标数据,项目评估数据,总结报告数据等等,那么政府透明化的目标也就能达成了。

政府公信力:照过往历史来看,民众要求政府公开政府信息的一项主要动力是政治丑闻。基于这个理由,对于那些政府常常有道德危机的领域比如政府资产,政治献金,选举筹款,政府采购以及财政审计等等能让民众监管政府的数据就应当开放出来以期达到公信力提升的目标。

政府信息的可访问性:开放数据能够帮助政府更为开放,使得民众得以访问那些他们早已想获取的信息内容。为了提升可访问性,政府可以就过往接到的各类信息请求内容进行一次审查和统计,从而确定数据开放优先级。这些请求内容可能包含记者调查内容,公众咨询内容,以及信息公开内容。同时,一个好的开放数据项目应当设立一种机制来更好地让公众表达他们对信息和数据的需求以及诉求,这包括公众咨询会,线上方案讨论,市政厅会议等等。然而,我们要提醒的一点是,虽然这些让公众直接来参与并贡献想法的方式很重要,但他们不应当作为数据优先级考量的唯一标准,因为还有很多民众可能并不愿意或不知道有这样的机会来提供反馈, 因此也需要考虑其他方法来听取更多意见。

政府政策有效性: 开放数据项目能够帮助政府内外利息相关团体来对项目的质量进行评估,但这一切的基础是相关评估数据能够开放,并且提供在适当的范围,时间范畴以及格式下。

政治人物的诺言达成性:一些政治人物可能选举前作出一系列的承诺,那么当他们当选后,自然应当开放那些能够让民众检验政治诺言是否达成的数据。比如特定法案、政策是否被制定或通过就应当开放。

项目有效性:开放数据能够帮助政府内不同部门在同一项目上更为紧密有效地合作。为了评估何种数据能够帮助达到这个目标,我们建议政府应当评估目前各机构间以及各部门间互相请求数据的频次和内容。同时,为了提高项目评估的质量,我们建议政府应当思考可以从外部哪些渠道引入额外的数据并将它们与自己现有的数据进行整合。

成本:最后,基于现实情况,数据开放的成本也是决定数据开放优先级的重要因素。一些大型数据集和敏感数据集可能需要在开放前花费更多的人力和物力,也因此抬升了成本。然而,我们要指出,成本虽然是一个需要考虑的问题,但它不应当成本考虑优先级的主要因素。政府应当全方位考虑释放一个数据集的利弊,有的时候短期的高额成本却可能带来长期的巨大经济、社会效益。

最后更新于