利用信息公开日志指导数据开放

原文出自 Reinvent Albany, 译者高丰

执行摘要

如今,将公共记录和数据放到网上对于政府单位而言已经是一件成本低廉,操作简单的工作。纽约州和纽约市政府都已经通过自己的开放数据项目向社会开放了上千的数据集。但奇怪的是,政府机构仍旧对于到底要优先发布哪些数据感到困惑。而这正是他们可以咨询信息公开日志的地方。大众通过信息公开向政府提出大量信息和数据的申请,而这正是他们表达需求的方式,政府机构可以从中了解哪些信息是高价值数据从而进行开放。

在2014年6月,州环境保护局向 Reinvent Albany 提供了2013年所的信息公开日志数据共计3,977条记录。在这个日志文件里,包含了信息公开申请者基本信息以及信息公开的简要申请内容。

环境保护局2013年信息公开日志中的要点

l 80%的申请(3,456)来自商业机构

l 12家地产公司提出了20%的信息公开申请

l 大约55%(2,200)的申请是有关特定地产上所发生的化学品或危险品泄漏事故

l 其他州或市级机关向保护局提出了69项申请

l 记者提出的申请仅占到3%(73)

我们的发现

l 保护局可以通过主动发布频繁被申请的数据来减少50%的申请

l 部门保留的信息公开日志能够帮助明确哪些数据被频繁申请

l 很大比例的信息公开回复是基于个别几个数据集作出的

l 部门保留的信息公开日志能够帮助明确哪些是「常规信息公开申请者」

l 我们的分析得以完成完全是依赖环境保护局保留了完整的,电子化的信息公开日志。而很多部门并没有这么做。

l 「常规信息公开申请者」对于今后能够在开放数据门户上下载他们通常申请的数据感到很有兴趣

我们的建议

l 纽约州和纽约市的公共机构和负责开放数据事务的公职人员应当对信息公开日志进行分析

l 频繁被申请的公共数据信息应当被作为开放数据发布

l 公共机构应当采用自动化的信息公开管理系统来追踪申请者的申请内容主题

谁在向环境保护局提出信息公开申请

2013年,环境保护局共收到3,977项信息公开申请。在其中,3,456项申请有明确申请人所在单位信息。而剩余521项则无此信息,故假定为是独立个人作出的申请。

通过分析单位信息,我们发现大部分信息公开申请来自商业机构,例如咨询公司、地产公司、律师事务所等。在2013年,一批咨询公司和工程公司提出了大部分的信息公开申请,其中12家公司提出了全年20%的信息公开申请。

商业机构提出了80%的信息公开申请

向环境保护局提出申请的大部分都是商业机构,仅有5%的申请来自环保活动者或记者(73项申请)。就算我们假定所有独立个人所提出的申请,也可以算作是记者为了自我保护故意如此申请的,那么记者总共提出的也就594项申请,仅比商业机构中的律师事务所多了一点(556项)。

地产公司为了查找信息通常外包相关业务。咨询公司(consultants)和工程公司(2,563)提出了地产经纪(57)50倍的信息公开申请。

我们的分析结果表明,向环境保护局提出申请最多的是商业机构,而他们所要申请的内容往往集中在几个特定数据集上。

常规信息公开申请者所需的是特定几个数据集

Reinvent Albany 和两家地产公司进行了访谈,这两家公司在2013年共提出了300项申请。以下是我们从访谈中,以及后续对其他类型申请者所提出申请的分析所得到几点结论:

1. 环境保护局2013年收到的申请中有2,200项是关于特定房产的

2. 大部分这些申请都是有关于油罐仓储和泄漏事故的。这两家地产公司提出申请的原因是环境保护局提供的在线查询系统非常简陋,而且有大量限制,并且无法下载数据。

3. 其他频繁被申请的信息:房产污染检测,危险废水清理记录等

两家地产公司都表示目前环境保护局提供的开放数据无法满足业界需求。比如,对于泄漏事故数据,你目前只能通过环境保护局的在线系统进行查询。而这个系统只允许以此搜索一个地点,显示一年的数据。因为环境保护局持有1978年至今的数据,这就意味着,用户需要提出37次的单独查询才能得到一个地点的历年记录。对于知道事故编号的用户,则能查看单独一个事故的更为详细的信息。

不仅查询信息非常麻烦和耗时,而且查询到的信息也很有限。其仅包括事故日期,泄漏的物质名称,清理日期三项。如果需要更多数据,则又需要向环境保护局提出信息公开申请才能拿到。

我们也同样访谈了一些咨询师,在访谈中,他们提及为了确认一处房产是否还受过去的泄漏影响,他们必须还得向纽约卫生部门申请水质测试结果,市政申请税收记录,以及建筑管理局申请建筑检测记录。

狩猎、渔业许可证以及其他频繁被申请的公共记录

2013年,环境保护局共收到关于狩猎许可证的200项信息公开申请,150项关于渔业许可证,174项关于建筑、水面交通等许可的申请,以及150项关于水项目和土地项目的申请。

另外还有关于石油存储和危险物存储的150项申请,和州立排污系统的70项申请。

关于环境保护局数据可获得性的问题

我们的调研主要针对那些信息公开申请的数据类型。然而,我们并没有全面地查看到底有哪些数据已经被公开在环境保护局的网站上,以及这些数据是如何可发现以及可获取的。为了能够更好了解环境保护局该如何满足公众信息需求,并降低信息公开上的开支(时间上、财政上),我们希望知道:

1. 环境保护局是否维护一份数据清单,并将其公开在网站上?

2. 是否有人对环境保护局已经在网站上公开的数据进行信息公开申请,为什么会发生?是否因为这些数据很难找到?还是没有及时更新?或者缺失历史数据?

3. 环境保护局信息公开办公室是如何从环境保护局的数据库中提出数据从而回应信息公开的?将数据库数据转换为开放格式的成本是?

4. 是否一些信息公开回复是纸质形式的?为什么,以及哪些记录是这种情况?

5. 环境保护局是如何决定哪些数据要发布在 data.ny.gov 开放数据门户上的?

给Open NY 和其他公共机构的建议

此次分析环境保护局信息公开日志的工作肯定了利用信息公开日志明确公众数据需求的方法是可行的。因此,我们向公共机构和Open NY 项目建议:

1. 和环境保护局协作开放被频繁申请公开的数据集

2. 明确哪些公共机构保留了信息公开日志,并对其中的申请进行主题分类

3. 通过分析信息公开日志,开放相应机构的数据

4. 编写指导手册帮助其他机构分析信息公开日志,从而确定开放哪些数据,如何开放,以及如何将这些数据发布到 data.ny.gov

5. 政府机构应当使用自动化的信息公开管理系统,从而自动追踪频繁被申请的信息,并按主题分类,从而能够产出信息公开日志供分析

最后更新于