高丰:AI时代「开放」数据的三大范式变化
最后更新于
最后更新于
7 月 10 日,开放数据中国执行主任高丰博士受邀参与了由上海市经济和信息化委员会指导,市大数据应用创新中心、数据交易中心共同主办的世界人工智能大会云端峰会——数据智能主题论坛,并在「开放数据与人工智能」圆桌与复旦大学数字与移动治理实验室主任郑磊教授、OECD 经合组织公共治理部副主任 Barbara Ubaldi、联合国经济和社会事务部公共机构与数字政府司高级官员 Waimin Kwok 共同对话讨论开放数据在人工智能时代下的新发展。
下面为高丰博士的发言核心内容摘要:
我们必须要面对现实承认一点,开放数据这个舶来品从来没有在中国的土壤上真正扎根。
其自带的政治属性天然不契合中国的发展路径,而大力发展数字经济的中国必然需要探寻非常规的「开放」,或者说更为广义的数据要素流通。
但「开放」其所暗含的「透明、问责、信任」又并非完全是政治概念,其也是「公平、有良性竞争的」市场经济所追求的特质。在这样的背景之下,与其迂腐地苛求「开放数据」,不如思考如何将「开放」的特性或者说准则,贯穿式地应用于不同模式的数据要素流通,无论是真正的免费的开放数据,还是基于合作条约的数据交换,又或是基于价值交换的数据交易,“开放”都应该有其必要的意义,从而去确保数据流通的公平、数据隐私的保护、甚至于算法的透明无偏见。
重新认知「开放」,理解其对于数据治理,乃至于数字治理的意义,极为重要。
重新认知「开放」,首要的一个范式变化是「开放」的目标转移。
从「开放数据」的原始定义而言,其是一个强政治概念,诞生的基础即是民众需要透明开放的政府,从而基于信息公开的脉络去要求政府数据乃至公共数据应当以标准的开放格式和开放授权方式向民众免费提供。其核心解决的是一个「Access」(访问获取)的问题,优化的是政府数据和信息的发布范式。
而回应「开放」范式的变化,当前我们面对的不再是「政府透明」。「算法」、「大平台公司」不断在和「政府」博弈变成我们日常生活的「新主宰」(政府不再是单一的权威),而针对他们的透明化,也即针对「治理」(这一行为)的透明化才是这个时代最为关键需要去解决的。
而「多元治理」的基础就是信息差的消弭,而这就需要更为「开放」的信息流通和数据要素流通,其最终回应的是一个「Trust」(信任问题),我们终极需要优化的是公私多元治理模式下信息流的治理范式。
既然「开放」的目标变化了,「开放」所关注的对象也随之变化。我们上面聊到,开放政府数据去优化的是政府如何发布数据,因此「开放」是通过「开放格式」、「开放授权」、「免费」这一系列属性要求而具象化的。
而当我们需要响应的不再仅仅是「政府透明」而是「治理透明」时,我们对开放的要求也自然需要去针对「数据治理」的「过程」而不再是单纯「数据」(作为产出物)本身。这也就意味着「开放」需要通过「开放标准」(数据标准的开放性)、「开放系统」(数据存储、利用的技术体系和架构体系的开放性)、「开放社群」(数据治理的参与群体和决策机制的开放性)去进一步具象化。
而这一范式变化所带来的是我们对「开放与否差异性」的理解的变化,数据本身的开放(即产出物的开放性)与否所带来的差别在于「数据是否可用和好用」,而数据治理的开放(即过程的开放性)与否所带来的的差别在于「数据利益相关者对于整个治理体系的可信与否」。
最后一点,自然是路径的范式变化。过去 10 年,开放数据的推动一般局限在政府数据上,且作为一个泛式概念,针对政府整体相对「粗暴而理想化」地推动落地。而如今,更为聚焦垂直领域板块,讲究利益驱动模式的「开放」路径是我们更为追求的。
事实上,18年国际开放数据大会上就试图讨论开放数据是否应该目标驱动,而 19 年国际开放数据宪章也将其年度战略定义为「Open With Purpose」,这都很好说明我们不再追求盲目开放,而是要将所期望达成的「目标」联动「开放」这一方法。
而「目标」是与「领域/行业」直接关联的。在医疗领域,个人数据的极度敏感和数据共享流通间有着难以调和的矛盾,在这一领域中,我们谈论「开放」和在交通领域讨论例如实时客流数据的「开放」,绝不应该是一致的含义。也因此,「开放」的定义应当是跟随「领域/行业」变化的,其针对不同垂直领域行业的数据治理带来不同类型、不同模式的「开放」要求,从而能够使得「开放」不再是飘在空中的口号,而是能够针对领域行业落地的具象化的要求。