[回顾] 普通人的数字权利指北 第 1 期: 我们身边的算法决策和”被流动“的个人数据
最后更新于
最后更新于
3月6日,国际开放数据日,由开放数据中国、白玉兰开源开放研究院和 AI SPACE 共同组织的互动工作坊「我们身边的算法自动决策与被流动的个人数据」顺利举办,也正式拉开了「普通人的数字权利指北」系列活动的序幕。
此篇根据当天活动的主旨分享内容和工作坊产出的成果,为读者提供一份干货的整理。
01 替代人或辅助人做出决策的算法系统日益增多,但我们对身边的算法自动决策知之甚少,有哪些系统已投入使用?谁创建了他们?用了什么数据?对我们有何种影响?我们所不知道的远远多于我们知道的。
02 我们第一时间较易想起的算法自动决策系统多是商业应用,而我们似乎对公共服务领域有哪些算法自动决策不那么敏感;进一步,公共领域算法的实现离不开企业,但对这类算法到底是政府拥有更多话语权还是企业,似乎这并不说得清楚
03 算法定然是有价值观的。基于客观规则所设定的算法较之基于主观需求(商业诉求、政府治理需要等)所设定的算法来的更为可信,主观的算法其设计和价值体现也更为单一。具备学习能力的动态算法,其价值观既是设计者决定的,亦是其所学习的对象数据所决定的。例如微软小冰基于恶意的交互,就学会了脏话、歧视等用语。
04 大多数的算法自动决策似乎都涉及个人数据,而这些个人数据的流动又绝大多数是「被动」的。我们似乎需要去习惯这种个人数据的被流动,但更希望掌控主导权,同时去平衡个体性个人数据和群体性个人数据的关系。
《普通人的数字权利指北》是开放数据中国在「数字权利」工作板块下新开展的系列活动,旨在通过线上线下的讲座、圆桌、互动工作坊等面向普通市民科普大数据和人工智能正在如何影响每个普通人的生活,并逐步树立起自身数字权利意识,掌握如何通过既有的法律、政策等赋予的工具去主张自身的权益,并共同探索数字时代公民数字权利的新路径、新机制和新工具。
我们试图在本系列中去涵盖的针对「算法自动决策」的权利如下:
这是一个算法爆炸的时代,似乎我们生活中自动化替我们做出选择和决定的算法越来越多,但是我们又恰恰对他们知之甚少。无论是我们身边到底有哪些算法决策系统,又或是更具体的对于这些系统而言究竟谁在建设、原理如何、用到了哪些数据,这些信息我们可能不但不知道,甚至不知道从哪可以获取这些信息。 因此,知情成为了我们最为底线的基本诉求。
作为本场分享点到即止的一个案例,我们也在现场介绍了北欧当前的实践——算法登记,即通过统一的算法登记平台将算法,特别是公共属性的算法,予以披露,并面向普通人说明其背后的原理、数据,以及相应发生错误时可以联络的对象。
对于未能现场参与的朋友,如果感兴趣,可以试图花 30 分钟,按照以下的顺序做一组思考题,来测试下自己对身边的算法自动决策了解多少?
在具体的动手环节讨论中,我们(主理人与参与者们)也共同讨论反思了如下要点:
1 我们对商业性的算法自动决策更为熟悉,最为熟知的是「推荐」、「匹配」、「规划」三类算法
2 公共服务领域下的算法自动决策往往兼具公属性和私属性,商业企业在其中扮演厚重的角色。而算法最终价值观是否单一由企业决定,这正是我们警惕的
3 我们天然对「静态非学习型的、依据客观标准建立的算法」有着信任度,而对于「学习型的、依据主观标准建立的算法」则抱有怀疑态度
4 所谓算法规则的客观与主观,本身亦有着一定的模糊性。但主观性的算法更强烈地代表算法设计和应用者的利益诉求和价值取向
5 绝大多数算法都会涉及个人数据,而是否需要个人数据实则又是算法设计者本身价值观可取弹性考量的
针对个人数据,当前最为主流的应用就是对个人数据予以画像化。而由于没有任何一家公司能够真正获取 360 度关于个人的全部数据,也因此往往针对个人数据产出的画像带有主观臆断和片面性,而这些所谓的用户画像和个人标签又成为算法的输入,两相叠加,产出的结果有可能不靠谱也是必然的。
而在我们强调个人数据保护的同时,我们面临着的现实是个人的数据在群体尺度下是急需被流通应用的,无论是临床数据对药物研发的作用,又或是城市级群体行为数据对城市管理优化的帮助,都是群体性个人数据被需要的案例。而我们需要工具去平衡个体性个人数据和群体性个人数据间的关系。
当天现场我们并未来得及展开使用数据生态画布去围绕一个算法场景追踪个人数据的流动和价值交换,感兴趣的朋友可以参考下面的案例,自行动过手针对一个案例予以练习。
我们拟在 3 月中下旬开展第 2 期活动,围绕普通人面对算法自动决策日益增多的时代下,「知情权」这一权利可被如何赋能、究竟哪些信息是我们应当去了解或试图了解的、以及当下的法律机制又如何可以帮助我们实现目标等要点开展沙龙讲座。 请留意本公众号的推送,或扫描下方二维码加入「普通人的数字权利指北」群聊
(若二维码过期,请添加小助手odchina-editor,验证信息填写活动名称及报名名字)
请关注本公众号「开放数据中国」,回复关键字「数字权利指北」获取各期分享的PPT 与相关资料。
【工作坊报名】 我们身边的算法决策和“被流动”的个人数据数据
开放数据中国是中国第一个聚焦开放式数据要素流通创新和开放式数字治理的社会企业,旨在推进开放性的未来数字时代(Open Digital Future)。其主要工作在「数字要素治理」、「数字权利」、「数字经济创新」三个板块,旨在以「开放原则」(Open Principle)来推进数字时代的要素流通监管,公民权利保护,以及经济模式的创新。
上海白玉兰开源开放研究院(以下简称白玉兰开源)由上海交通大学牵头,联合电子中国电子技术标准化研究院、北京大学、机器之心、复旦大学、华东师范大学、开源社等单位于2020年7月在世界人工智能大会云端峰会上揭牌成立。白玉兰开源致力于推进人工智能软件框架研发与开源,以开源社区平台为牵引,推动人工智能领域开源软件的国际规则互认,在重点领域形成“算力、算法、数据、场景、合规”一体化的人工智能,建设国际人工智能开发生态网络的关键节点。
AI SPACE 作为上海人工智能行业协会理事单位,主要运营由 AI SPACE 线下加速器载体、世界人工智能创新大赛(AIWIN)、国际营(AI@SH Camp)等品牌项目,是上海市经信委认定的“上海市中小企业服务机构”,旨在搭建专业的人工智能产业服务平台。
活动现场我们共有 5 组朋友参与了动手环节,两部分内容最终的各组呈现如下图(左右滑动查看):