数据流通机制探索(一):玩转数据生态画布

前言

在去年底,开放数据中国加入了由微软和英国开放数据研究院共同搭建的「数据流通朋友圈」(Peer Learning Work for Data Collaboration),与全球其他 6 个机构共同交流各自在构想中或实验中的数据流通新机制。在这个朋友圈中,微软和英国开放数据研究院将会在 6 个月的时间内组织多场线上的工作坊,利用工具剖析现有模式,启发新的可能,并推动跨国、跨界别的交流去识别共通的阻碍,收获可以借鉴的解决方案。开放数据中国将会不定期持续地分享在这一平台中所学习收获到的好工具、好方法、好机制,希望有助于在中国本土上对数据要素流通的进一步探索和努力。

什么是数据生态画布?

数据生态画布工具 ( Data Ecosystem Mapping Tool)是由英国开放数据研究院所开发的一个旨在帮助数据利益相关者,即无论是数据的拥有者、管护者还是数据的潜在使用者、最终用户等,能够对数据生命周期过程所涉及的数据利益相关者、相关者间相互关系、相应数据流动关系及价值关系做整体梳理的工具。数据生态画布的工作过程分为三步:

  1. 确定所描绘的生态中的利益相关者(Actor)

  2. 「追踪数据流」,即跟随数据在不同相关者间的流动,构筑其利益相关者间的关系

  3. 「追踪价值」,即思考每一个利息相关者在这个生态中因为数据流动而收获什么?又能如何反向提供什么服务和洞察?

听起来很复杂,对吧?我们具体看个简单的案例:

我们日常都很熟悉,每个公交站现在都提供智能屏查询下一班公交的到站时间或者更便利在我们手机上就能查询到。我们就用这个生活中的场景为例,最简化的勾勒出公交实时数据的数据生态。

在上图中,我们可以看到,我们假想现在有某个站点 A,其站点经过3 俩公交车,其中 1、2 号公交车归属公交公司 A,3 号公交车归属公交公司 B。我们在此处假定市政府有搭建一个统一的中央平台,其能够汇聚各公交公司的每辆公交车传感器的实时数据。上述就是我们这个简易生态中的「利益相关者」。

进一步,在查询公交实时到站的具体场景中,我们假设公交的实时位置数据从每辆公交车(由其传感器采集)汇聚到公司,再汇总到平台由其统一分发至各类智能屏、智能 APP,最终让市民能够准确知晓下一班公交车的到站时间。而我们上述描绘的这个过程,反映在画布上,就是顺着流程将不同的节点(利益相关者)关联起来。这一「追踪数据流」的方式,使得我们能够从数据的产生源头出发,追踪到最终的受益用户。

而在上述的画布里,我们还有一类虚线的箭头,这代表着数据流动所带来的价值创造。在我们绘制的过程中,我们去思考不同利益相关者因为数据流动能够创造什么样的价值?比如数据流动最明显会为市民带来的价值是让市民更好安排出门时间,又比如中央平台获取数据后反向通过数据分析可以帮助公交公司去改善他们车辆的运营(例如调整排期和线路等),又或者监管机构可以通过数据的汇聚去强化数据的标准化,从而便于中央平台归整和分析数据。

数据生态画布的应用反思

1.明确绘制画布目标,及时刹车「脑洞」

通过上述的例子,大家应该对数据生态画布有了一个基础的认知,但事实上在描绘一个数据生态画布时,是很难「刹车」的,因为你总能发现新的机会去添加某些新元素。例如在上述的例子中,我们会发现,这只是一个极其简化的画布,我们除了市民、公交公司、监管机构之外,我们其实还能引入比如交警(更智能化的疏通交通?)、公交司机(是否可以根据车况更动态的规划公交路线?)等终端利益相关者,又或者不同的 App 公司(他们可以和中央平台有不同的交互,甚至可能反馈新的数据)、城市数据中心(可能可以整合中央平台的实时公交数据,用于其他智慧城市的规划治理)。在绘制数据生态画布时,想象空间是无穷的,但归根结底,工具是服务于目的,也因此,我们引入数据生态画布去描绘生态时,最重要的是确定自己希望通过它回答什么样的问题?是希望去充分想象最终的受益群体的可能?还是去挖掘其中技术、标准等应用的可能?又或者是其他的目的。

2.检查数据流动和价值流动的对齐,确保可持续的数据流动

当我们绘制完数据生态画布,值得我们思考的是当前的数据流动是否和价值流动对齐?即数据从一端流动到另一端,是否正向或反向有价值的传递,如果没有,那么很有可能数据流动是无法开展或无法持续的。在市场经济下,我们任何人都有统一的认知,即货物(goods)的流通一定伴随着价值流动(无论是否以货币金钱来计量)。而在数据流动中,我们却往往忽视这一点,或者过于技术化的看待数据流动而忽略了其背后的价值传递逻辑。也正因为此,我们不难看到诸多可信计算、区块链数据账本、数据交易平台等技术角度概念无法得以落地,往往也就是忽视了这个基本的道理。而数据生态画布绘制中,我们最值得警醒的,就是要去检查数据流动和价值流动是否对齐?若不,我们就要思考如何去推动两者的对其,从而使得数据真正得以流动和可用

3.通过观察数据流向的模式和规律,重新认知数据治理的机遇

在数据生态画布的绘制中,我们会发现一些数据流动的模式和规律,从而能够启发我们去思考新的数据治理的机会。例如,在我们上例中,一个中央平台的存在其可能不仅仅是去对接若干个终端的服务,而是成百上千个,这当中如何去标准化数据的输入输出和接口,就是一个需要考虑的治理要点。而如果我们把终端用户进一步分解,例如按照人群分解为老人、上班族等,则他们对待出行信息的不同需求,又会反向指导我们去理解数据标准化的另一面即数据应用的个性化。

下一期预告

以上就是我们在「数据流通朋友圈」(Peer Learning Work for Data Collaboration)学习中所分享的第一期的内容,下一期我们将重点谈谈什么是「可信」(Trust 和 Trustworthy)的数据流动以及相应的分析和支撑工具。

最后更新于