开放数据中国
报告/Report案例/Use Cases
  • 开放数据中国
  • Blogs
    • 域外学道:我们从ODI-MS 朋友圈中学到的数据联合创新体的构建 What We learned from ODI-MS PLN
    • [回顾] 普通人的数字权利指北 第 1 期: 我们身边的算法决策和”被流动“的个人数据
    • 【工作坊报名】 我们身边的算法决策和“被流动”的个人数据
    • 数据流通机制探索(一):玩转数据生态画布
    • 高丰:企业如何用好公共数据开放政策
    • 破局数据要素流通,我们入伙了这个微软和 ODI 牵头的「开放数据」朋友圈
    • 高丰:AI时代「开放」数据的三大范式变化
    • 国际数据信托工作组(DTEG)正式成立! 开放数据中国受邀加入
    • 「公平透明、动态渐进」——建言《上海市公共数据和一网通办管理办法草案》
    • 盘点2018年「中国开放数据」的那些事
    • [声音] 上海开放数据进行时
    • 预告 | 开放数据创新营
    • [看对岸]罗佩琪:從 g0v 到 gov -- 潛入衛福部 400 天
    • [看对岸] 台湾行政院长張善政的开放数据垦荒之旅
    • 共治共创视角下的开放数据发展:趋势、挑战和反思
    • [报名] Design SODA:开放什么数据由你说了算
    • 回顾:2015开放数据项目盘点
    • 【快讯】台湾击败英国,夺2015年开放数据指数首名
    • 政府开放了多少数据?2015中国开放政府数据“探显镜”发布
    • 高丰:对于开放环境数据的一些思考
    • [预报名]OpenDataSalon#1: Datacanvas 开放环境数据可视化黑客松
    • [看对岸,以为鉴]1.16台湾行政院开放数据研讨(一)
    • 高丰:为什么开放数据对你的生活很重要?
    • [报名]周六开放数据可视化工作坊@同济
    • 开放数据指数'14:英国继续领导世界开放数据运动,台湾成亚洲数据最开放地区
    • 谁来为开放数据买单
    • [报名] 10月20日晚7点复旦大学「开放数据在商业中的启航」公众演讲
    • 拥抱开放数据机遇的商业模式
    • 费城的开放数据项目
    • G8 开放数据宪章行动计划:默认数据开放,但你可能必须付费使用
    • 我们能从八国集团(G8)开放数据宪章行动计划中学到什么
    • 美国数字问责与透明度(DATA)法案有多独特?
    • 取经台湾: SmartGov “政府开窍” 会议 (下)
    • 取经台湾: SmartGov “政府开窍” 会议 (上)
    • 利用信息公开日志指导数据开放
    • 开放数据对经济的影响——来自GovLab的精选文章
    • 演讲分享:开放数据500
    • 演讲分享:开放数据助力经济发展
    • OKFestival2014: 开放数据全球发展快报
    • 开放数据在墨西哥:42天开放100个数据集
    • 走近英国开放数据系列挑战赛之二
    • 走近英国开放数据系列挑战赛之一
    • 政府对开放数据风险的错误解读
    • 惨淡收场的英格兰 Care.data 项目:走向歧路的政府开放数据
    • 看 GitLaw 如何将法国立法过程变为开放数据
    • 光有开放数据是不够的
    • 如何吸引开放数据用户
    • 新来者对开放数据与开放政府的看法
    • 先要开放哪些数据?对开放数据项目中先有鸡还是先有蛋的思考
    • 解读开放数据工程中的许可协议
    • 让信息公开更像开放数据
    • 开放数据与G20:开放的商业机遇
    • 开放的商业潜能之开放国际贸易数据
    • 10家基于开放医疗数据的企业
    • 浅谈OGP中的开放政府
    • 超链接与希望——Data.gov已上线五年
    • 开放数据——价值2300亿美金的节能革命
    • 开放数据商业在新兴市场的崛起
    • 黑暗中的数据:开放数据目录的重要性
    • 数据共享并非数据开放
    • 公开存取 vs.开放存取
    • 高丰:开放数据≠共享数据≠公开数据!
    • Climate Corp: 开放数据应对气候变化
    • Mastodon C:为英国医保服务节省2亿镑
    • Zillow:开放数据改变房地产行业
    • 麦肯锡报告:政府如何释放开放数据经济潜能
    • 面对开放数据革命,企业何时才会警醒
    • 开放数据赋予南高加索地区公民社会新生命
    • 为什么要开放数据——来自巴基斯坦的答案
    • 缺失的一环:如何吸引私人企业成为开放政府合作伙伴
    • 开放私人企业:开放数据的下一个前沿阵地
    • 开放数据基金正当时
    • 没有开放数据?不是问题!5种发展中国家创业者激发开放数据创新的方法
  • Our Work
    • Data Governance
    • Digital Rights
由 GitBook 提供支持
在本页

这有帮助吗?

  1. Blogs

高丰:开放数据≠共享数据≠公开数据!

上一页公开存取 vs.开放存取下一页Climate Corp: 开放数据应对气候变化

最后更新于4年前

这有帮助吗?

开放数据 (open data) 这个概念自09年奥巴马政府宣布「政府数据默认开放」起已经成为了这个数据革命时代的重要组成部分。但当我们在谈论开放数据时,我们到底在谈论什么,是在说共享数据吗?是在说公开数据吗?

答案是:两者都不是,开放数据并不等同于共享数据,它也不等同于公开数据!

共享数据,顾名思义是将自己掌控的数据在「一定的条件下」与「指定的第三方」共享使用。一个很简单的例子,大家在注册一些服务时(比如申请邮箱,开信用卡等等)都需要提供一定的个人信息,而服务提供方都会注明「信息仅供服务注册使用,不会提供给第三方使用」,这就属于一种消费者和服务提供者之间的基于某种契约的数据共享。

那么什么是公开数据呢?相比与数据共享,公开数据是指「任何人」都有权利访问,但只能在「一定的条件下」获取并使用的数据。这里可以首先看到,数据的受众在公开数据的情况下扩大到了「任何人」,但数据的获取与使用仍旧收到限制。比如,最新的国家人口普查数据任何人都有权利访问,但你只有付费才能获得,且需要在统计局版权规定下进行数据使用。

我们可以看到,上面我们着重点出了两点: 1. 「是谁能使用数据?」,我们关心是否所有人都能用这个数据还是仅一部分人能用 2. 「使用是否有限制?」,我们关心是否数据发布者有利用版权等法律条文或自行定制的条约来限制数据的分发,使用和演绎。

而共享数据和公开数据在这两点上都不能说是没有任何的限制,但信息的无阻碍流通是我们这个数据时代最关键的,故而我们强调开放数据,就是要破除掉「是谁能使用数据」和「使用是否有限制」上的限制,让「任何人」能够「没有限制」地去使用数据——无论是利用数据进行商业活动还是对数据进行重新的整理编辑再分发。

说到「没有限制」,除了可能的版权等因素造成的「法律限制」来约束我们如何来使用数据,这也同时涉及到另外两个方面:1)数据是否免费能获取?即获取数据这一点上是否有「经济限制」。2)数据本身是否提供在一个机器能轻易处理的格式下,即是否采用「机器可读」格式,是否有「技术限制」。

对于「经济限制」这一点,我们可以看到,在共享数据的情况下,很多时候一些数据提供方都需要你支付一定的费用,可能是现金可能是虚拟货币,才能获得数据。比如数据堂有需要付费的数据,百度文库等在线文档也会需要积分下载。而公共数据,也并不是都免费的,比如上文提到国家人口普查数据,最新的数据需要你付费才能获得(当然,你会说我能网上免费下载到,但此类「灰色数据」后文会再讨论)。而对于开放数据,所哟「原始数据」都应当免费获得,而基于「原始数据」产生的价值服务,例如API,则可以收费。

再说到「技术限制」,一般有两种情况。一种是数据本身分享在一个机器较难处理的格式下,比如很多政府机关的数据喜欢放置在word文档,或者PDF里,这就造成了数据提取的困难,甚至有时候数据无法完全提取。另一种情况是,数据虽然可见可访问,但是本身被锁死在某个软件系统里而无法提取。比如,上海地铁实时客流数据,作为一种公开数据可在网站访问,但是你却无法真正获取数据,因为数据被锁死在flash应用中。这些都是再使用共享数据,公开数据中经常遇到的技术难关。而对于开放数据而言,机器可读是一项基本的条件。数据必须被提供在开放格式下,比如CSV,shapefile等等,拒绝PDF以及复杂的HTML等都是基本的要求。

在文章最后,我们不得不再讨论下「灰色数据」,这部分本身应该收到版权保护的数据,因为中国特有的环境,而可以在互联网上免费获取。但是对于「灰色数据」而言,其在使用中有许多问题。首先,灰色数据本身不是由数据真正的拥有者发布的,从而你无法保证数据的完整性和准确性。其次,虽然你能够免费下载这些数据,但是如果运用于商业,你就时刻面临着原版权方追究你责任的风险。最后,灰色数据没有数据更新的保证,对于一些更新频繁的数据,很难说更新的数据会被及时「盗版」出来,这就造成了依赖于这些数据的服务无法保证其本身品质的问题。

综上,开放数据作为一种免费的、无使用限制的数据资源应当受到我们更多的关注,搞明白共享数据、公开数据、开放数据的差异,则是我们在中国推进开放数据所需做的第一步。