如何吸引开放数据用户

此处原文来自于开放数据研究院

原文授权在 CC-BY 协议下

译者:黄瑢遥

数据资源的开放大多意在让人们再次使用它,发掘其潜在价值。这份指南便着重探讨了通过吸引目标用户群来达到最大化数据再使用的多种途径。

在发布数据前

开放数据是一项耗时耗力的活动。因此在投入之前,你需要对开放数据的目的和可能使用数据的人群形成清晰的想法。这有助于锁定其数据使用与你自身目标相一致的人群,并展开有针对性的宣传。 你手头的数据或许可以依托一些现有的应用和服务中实现再使用。所以在公开数据之前,你也可以尝试着寻找合适的应用服务平台,并吸引它们的开发者。 你还可以面向研究者、特定社群和感兴趣的个人展开宣传,且不要忘记你自己所在组织中可能就有潜在的数据使用者。 在这一开放数据的准备期,你应该问自己以下问题:

潜在使用者将可能以何种方式再利用该数据?

何种数据格式和数据使用机制将最大程度便利使用者们?

数据使用者们需要什么必要的保证?

是否存在其他因素阻碍数据的再使用,诸如数据质量偏低?

不同的数据使用者需要何种支持来理解和分析数据?

面对数据使用者可能的疑问,你的应对能力如何?

是否有机会与数据使用者合作?

对话现有的和潜在的数据使用者将帮助你决定公开的数据的最佳方式。然而与此同时,你也需要注意避免将潜在的新用户排除在外。举例而言,即便一位现有的用户希望你以一种专有的特殊格式公开数据,你仍旧应该保留标准格式以满足未来潜在使用者的需要。 开放数据的用户宣传和准备期还可能包括一系列活动,旨在将那些理解数据背景、内容和价值的个人与潜在的数据使用者对接。在这一阶段,活动应该集中精力回答以上高屋建瓴的问题,而非具体的应用和服务开饭细节。 应该定期为数据维护管理者和数据使用者创造沟通机会。这不仅有助于提高数据质量和可用性,还能够让幕后的数据维护者得到应有的认可和尊重,并在你自身组织及更大的范围内实现数据公开的价值最大化。

数据的解释说明

数据使用者需要首先理解你公开的数据才能进一步挖掘其价值。为了节省你自身的精力,也为了扫除数据再使用的障碍,你需要一份清晰的数据说明来帮助使用者无需直接支持便能够理解数据。数据的解释说明有以下几种重要的形式:

元数据

元数据是关于数据的数据,可以理解为数据的背景信息。开放数据的元数据应该帮助使用者了解该数据包含什么,不包含什么,如何正确的解释以及是否能够信任该数据。 你提供的具体说明应该涵盖以下几点:

描述性元数据,诸如标题、描述、关键词或标签等,以帮助使用者了解该数据集包含的内容;

法律信息,即版权声明和数据开放的执照,具体包括在使用责任和任何其他的使用条款(应当最小化以鼓励使用);

范围信息,包含地理范围(数据涉及哪些地理区块),时间范围(数据涉及哪些时期)和完整性(数据纳入或排除了哪些项目);

即时性信息,包括数据何时公布,何时被最后修改,数据更新的频率以及数据从收集到公布的时滞;

可靠性信息,申明你将持续提供数据支持到何时。

如果还有关于数据采集的手册或具体文件,而那对于数据使用有指导作用,那么你也应该考虑将这些文件一并发布。 有了这些信息,使用者便应当能够判断出该数据对于它们的价值大小。

技术说明

一般情况下,使用者需要理解数据集包含的一些特定单元、列和编码才能进行高效率的数据分析。如果数据经由特定的API或服务提供,使用者也需要了解API是如何工作的。 你提供的技术解释需要包含以下内容:

格式说明,即提供的数据是何种格式的,还可能包括你所使用技术词汇的纲要;

编码表,即关于数据集所使用全部编码的细节;提供该信息的一种方式是将包含每条编码解释说明的URL与相应的数据链接起来;

服务说明,解释你所提供的任何API如何工作;如果可得,这也可能包括机器刻度的服务说明链接。

有了这些信息,使用者应该能够理解你所公布的数据含义以及如何开发使用该数据的应用。

支持

吸引数据使用者是一条双向大道:一方面,你将数据公开给使用者;另一方面,使用者也需要将信息反馈给你。同时,你也应该尝试鼓励数据使用者们互相帮助。 具体而言,你应该提供以下支持:

一位数据联络人,回答使用者们关于数据本身或数据使用,以及技术性缺陷的问题;

一个论坛,推荐使用者们提出问题,互相解答问题;你并不一定要是论坛的管理者:一个方便的选择是将使用者导向Get the Data 论坛;

一条错误报告的反馈通道,让使用者们能够提供他们发现问题的修正方案;你提供的信息应该明确这些错误报告的处理方法,以及如何将修正信息告知现有的数据使用者;

如果你的数据包含或是基于个人信息,你还需要一条针对任何保密性问题的反馈途径。

服务

如果你的数据重要且复杂,那么提供一些适当的工具 —— 插件、可视化结果、软件包和服务,将能帮助数据使用者更好地利用他人已有的数据分析成果。许多这些辅助工具是由第三方提供的。你可以开辟一个页面列出这些工具,并说明如何将第三方开发的工具加入到该页面中来。

积极的外联

理解并追踪数据的再使用能够帮助你改善未来的数据开放。你应该考虑以下几点:

在社交媒体上保持活跃;

用搜索引擎提醒功能获知你的数据何时被提及;

利用网络日志展示数据使用的优秀案例;

组织黑客松和其他形式的比赛以鼓励数据挖掘。

在某些情况下,你还可以考虑特定社群的建立、吸进和外联工作。这能够使开放数据为你的组织和其他人带来最大的价值。

最后更新于