[声音] 上海开放数据进行时

编者按

本文为社创客记者杨书源对开放数据中国联合创始人高丰的采访稿,分享目前上海开放数据的发展和SODA创新平台的建设工作。

正文

“开放数据最重要的效能,是将这些关乎公共利益的数据开放给民众,让创业者能免费利用,创造新的价值,最终使民众得利。”30 岁的英国南安普顿大学计算机博士高丰毕业后便致力于此,“我们说开放数据,指的是任何人可以自由的获取、使用、分享的数据。”

就像一瓶被打开了盖子的苏打水,释放出这个城市开放数据的能量。六月初的上海,迎来了为期一周的 SODA 开放数据周,政府、企业、民间团体、社会组织、高校参与其中,各股力量融合交汇的场景也正是上海这座引领潮流的城市,在开放数据运作模式上的一个“浓缩印象”。

一个城市就是一个开放数据有机体

高丰一直喜欢跨界做一些有趣的事。他偏向人机交互、设计新交互系统的方向,后来转向公共政策领域,跨界进入开放数据行业。

英国南安普顿大学是英国开放数据的发源地之一,因此高丰很早就认识到开放数据的价值和意义。2012 年留学期间,他发现用Google 搜寻“开放数据”时,几乎找不到任何简体中文信息,只有通过繁体中文才能找到。

回国后,他开始倡导、推广、支持开放数据。他形容自己好像是一个孤独的数据旅者,几乎无法找到一个合适的工作单位开展开放数据的计划。2014 年 2 月,高丰与伙伴联合发起“开放数据中国”,希望能打造一个中国开放数据生态圈。

作为推动者和先行者,高丰已经看到了中国开放数据的春天。2015 年,国家在《大数据行动纲要》中,明确支持开放数据发展。之后各地方政府开始更为积极的响应。而且政府开放数据后,能和民众建立新的协作共创模式,更好地解决公共服务问题。

说起上海的大数据布局,高丰介绍,目前上海建设有两个大数据基地,同时也成立了上海数据交易中心,又支持了上海大数据联盟的组建,并正在规划产业基金和研究中心。

上海开放数据是如何布局的?

高丰画了一张图,示意几个部门的分工:上海数据交易中心是本市数据资源的集散地,在交易中心进行交换的数据将包括多种信息来源,发挥汇聚数据,推进数据流通的作用。而大数据联盟更像是一个行业协会,是各个参与到大数据发展中的企业的联盟,可以发挥聚人的优势。

至于 SODA 大赛,更像是一个跨界的组织,具有政府、高校、民间以及企业力量的集合,比如在 SODA 的组委会中,上海市经济和信息化委员会、中国工业设计研究院、开放数据中国以及复旦大学数字和移动治理实验室、上海交通大学网络信息中心等不同背景的机构的身影都在其中。SODA 与交易中心和大数据联盟形成互相支撑。

郑磊是复旦大学数字和移动治理实验室的主持人,也是上海开放数据在学界的重要的“智囊团”之一。他认为 SODA 是上海开放数据布局的一个重要实验场,自下而上形成推力、由外向内形成拉力,构造数据提供方(政府)和数据使用方(一般社会成员)的连接点。

在欧美国家,开放数据在最开始的时候,都是由国家层面开始推动的,这和中国的做法很不同。中国的开放数据是由城市开始进行试验的。但是这可能更加有效。郑磊曾经分析过上海数据开放的独特性所在,“看重地方开放数据的价值,这是一条对的路子。有了地方政府作为主体探索数据开放经验的灵活需求,才会有这样的大赛,以大赛带动数据开放的尝试。”

2015 年,由上海市经信委和交通委联合主办推出了第一届SODA大赛,这是全国有史以来政府第一次面向公众提供包括出租车、公共汽车等在内的原始城市交通数据。大赛吸引了将近 5000 人参赛,输送了 500 多个优秀的解决方案。据高丰介绍,2016年SODA大赛将会聚焦城市安全主题,首次开放食品安全、交通安全、社会治安、环境治理、生产安全等多个方面的政府数据,SODA 将进一步推动众包式创新的智慧城市建设进程,并且为未来的数据开放提供准备。

政府:做个牵线搭桥的“媒”

2012 年,上海成为了全国第一个以省级政府为主体向社会公众数据开放的城市。在采访中,高丰多次强调一个事实:从上海的整体布局而言,上海市政府对于“开放数据”的理解和实践在国内的各个城市中都是比较超前的。

根据上海经信委裘薇副处长介绍:2014 年,已经有 46 个市级政府部门在开展政府数据的开放工作,可以说开放数据覆盖了全市各个部门的主要的业务领域,在数据服务网(www.datashanghai.gov.cn)上就可以看到12个主题的数据开放,其中包括经济建设、环境资源、教育科技、道路交通等,公众可以免费下载。同时政府也在进一步优化已经开放的这些数据的服务质量,提升数据的利用价值。

除了这一部分完全公开的政府数据以外,还有一部分数据可能有一定敏感度,比如含有个人信息,目前还不适合立刻向全社会开放,但是又有一定开放的价值,这就需要研判如何具体去对数据做预处理,探索开放路径,所以政府将这部分数据提供给 SODA 大赛,使用目的仅仅限于SODA 大赛,从而通过大赛这样一个可控的“实验室”来对这部份数据的开放方式和数据价值进行探索。

如果一类数据具备极大的社会价值,通过 SODA 大赛已经能够看到落地的成效,而其流通的成本和安全都不成问题,那么SODA 就可以帮助数据提供单位去建立长期完全开放的策略。而如果一类数据通过大赛的测试发现其虽有高价值,但可能需要限定流通对象,那么 SODA 则可以为数据提供单位来建立一套基于数据的决策模型,研判应该面向哪类人群进行定向的共享,从而发挥数据价值。

开放:一个考究层次的“局”

去年,上海市经信委委托了复旦大学的郑磊教授制定了上海市未来三年开放数据的总体规划(2016-2018),2016 年,是郑磊所做的上海市未来三年开放数据的总体规划的第一年,说起上海目前的数据开放现状,他坦言:“在全国,上海算是经验最领先的城市了。但是,目前上海市政府开放数据的总量、价值、动态性、可机读性、平台下载的便利性提升的空间还有很多,一切都只是个开始。”

按照郑磊的说法,等到这个三年规划结束的时候,开放数据的数据集数量将翻一番,当然,数据质量也会大幅提升。

记者:至今中国从未明确界定开放数据的概念,地方政府只能通过字面猜测其含义,因此政府在数据开放中需要注意哪些问题?

高丰:一旦政府只将原有的封闭数据交给一家公司,让其研发产品服务大众,就无法形成行业良性竞争。

一个典型的开放案例是,伦敦交通局在开放了交通部门数据后,市场上出现了将近 500 个 app。也就是说,当所有开发者信息对称,才能通过创意和用户体验进行竞争,而不是市场只有一个 app,大众不得不选择它。

但若政府过于激进,将不该公开的信息公开,比如病人的电子病历数据,这就是侵犯了个人隐私。中国在开放数据行业急需做出明确规定,注明地方政府哪些具体的行业领域数据,是可以也应该公开的。

此外现在政府 87%开放的数据是静态的,需要一年以上才进行更新,这显然对开发者而言没有吸引力。而在 SODA 大赛上,首次提供了强生出租车公司利用传感器显示的车内空载情况,每五秒更新一次,即时动态数据带来更多商机,吸引了大批参赛者。其实创业者对于动态数据的需求远高于静态数据。这也使得上海在去年的政府计划中提到,要将动态数据提升到开放数据的 30%。

记者:对于政府现在无偿提供的大赛数据,经过参赛团队的设计,如果其产品除了具有除公共价值以外也会在未来产生商业价值,那么所获得的利益将如何分配?

高丰:SODA 的规则是谁做出了这个产品,谁就拥有这个产品100% 的产权和收益。比如我们去年的参赛团队中就已经有两个团队获得了人民币千万级的风险投资,而在这个过程中SODA 本身乃至政府并不直接从中获益。而间接来看,这些靠着“开放数据”能够成长起来的企业,是市场上最为鲜活的案例,能够有效促进开放数据生态的发展,而这一生态的发展,则是 SODA 和政府最希望看到的。

特约记者 | 杨书源

感谢澎湃新闻实习生俞雅芸对本文的贡献

最后更新于