一个建议的数据公正框架
第一个支柱,可见性,涉及隐私和代表性。在这方面,可以从国际发展研究、人文地理学和法律学术等领域得出共同的推理线索。对于可见性和信息隐私需求的更详细的框架应该考虑到正在进行的关于社会边缘隐私的工作(Arora, 2016;Gilliom, 2001;, 2014),通过集体隐私风险分析(泰勒,2016 b;Floridi, 2014;Raymond, 2016)以及数据可被视为公共产品的程度(Taylor, 2016d)。
与技术的接触是这个假定的概念框架的第二个支柱。尽管信息通信技术促进发展——促进低收入和中等收入国家与数字技术的接触——已经明确地在促进人类发展和提供信息通信技术之间建立了联系(Heeks, 2010;安文,2009),这一领域的调整,和其他人一样,新的data-producing技术和分析的演变,现在开始批判地址不使用特定技术的自由,特别是不要成为商业数据库的一部分的副产品开发干预(Taylor & Broeders, 2015;Gagliardone, 2014)。控制个人参与数据市场的条款的自由是任何数据公正框架的重要组成部分,因为它支撑了理解和决定个人可见性的力量。在后殖民理论中可以找到关于人们在技术方面自主的重要性的论据,因为在国家和全球数据市场中处理和分析数据的方式将个人定位为次等人(Spivak, 1988),相对于处理他们的数据的人。他们无法自己定义如何使用他们的数据,这些数据被转售给谁,或者这些数据可以支持哪些类型的配置文件和干预措施。在此基础上,Mann(2016)认为,处理经济发展的数据,而不仅仅是发展本身的数据,将注意力集中在独立于大型技术公司收集和分析数据对低收入人群的潜在好处,以及如何在地方层面获取和处理数据的回报。
这一拟议框架的第三个支柱是不歧视。它由两个维度组成:识别和挑战数据使用中的偏见的权力,以及不受歧视的自由。随着数据生产和处理的复杂性增加,人们识别和挑战数据驱动决策中的偏差的能力预计将会减弱(Kroll等人,2016)。随着神经网络和深度学习变得越来越普遍,甚至连系统设计师自己理解数据处理中如何嵌入偏差的能力也在减弱。这意味着,必须设计出能够对算法过程和决策进行治理的方法,在承担挑战个人歧视的责任的同时,政府需要有能力识别并制定惩罚措施(Kroll等人,2016)。
提出的数据公正概念框架的部分贡献是帮助提出必要的问题,并指出答案的方法。在元素周期表中,任何关系和位置的映射也映射出缺失的元素。例如,不参与数据市场或不代表商业数据库的自由尚未被充分理论化:即使是隐私研究也假设这种参与是不可避免的。然而,历史和当代的迹象表明,这种自由是必要的:从19世纪在新工业技术背景下发展了工人权利和抵抗的新政治的勒德抗议者(Binfield, 2015)到荷兰和德国20世纪70年代和80年代的反人口普查活动家(Hannah, 2010;Holvast, 2013),人们一直在争论可以计数和监控的技术在何种程度上符合社会契约,以及公民欠国家多少可见性。这场争论是Heeks、Renken和Johnson提出的方案的基础:被看到和被代表的权利是数据公正的核心,但从数据库中撤出的权利也是如此,无论它是由国家、商业公司还是两者都拥有,就像Aadhaar的情况一样。
也许这里提出的数据公正概念所提出的中心问题是如何平衡和整合被看到和适当表示的需求与自主性和完整性的需求。让人们选择不收集数据意味着什么?例如,如果商业数据库可能被国家用来补充或取代行政或调查数据,人们是否能够选择退出?在民主环境下使用大数据的良好治理原则是什么?谁应该负责确定这些原则?人口普查既是个人与国家关系中最具侵略性的时刻之一,也是民主社会中公民最重要的权利之一。如果州的人口数据很快将至少部分由商业收集的数据(Keeter, 2012)组成,并实时更新,这些数据不仅可以告诉政府关于人口的常规事实,而是几乎所有的事情,合法的观察从哪里结束,非法的监测从哪里开始?
来源:https://doi.org/10.1177/20539517177363