引言:数据公正的案例
随着以前数字隐形人口的数字数据变得可用,世界各地的政策制定者和研究人员正在利用联合国所称的“数据革命”(联合国,2014年)。越来越多的数字数据反映了经济和人类发展,尤其是“数据烟雾”(Thatcher, 2014)——人们使用技术设备和服务的副产品产生的数据——正在推动全球政策制定的转变,从被数据告知到被数据驱动(Kitchin, 2016)。这些可以让研究人员推断人们的行动、活动和行为的细粒度数据来源,对国家和私营部门(以及重要的是,两者联合行动)看待和对待人们的方式具有伦理、政治和实际意义。在低收入环境中,这种分布式的可见性具有更明确的社会和政治影响,在低收入环境中,当局收集准确统计数据的能力以前是有限的。然而,到目前为止,数据革命主要是一场技术革命:收集、管理和使用数据的机构和当局尚未将数据的分类、分类和干预能力明确地与社会正义议程联系起来。执行者也没有高度意识到新数据技术在访问、使用或影响方面可能不是中立的,这是对这一现象的现有研究表明的情况(Dalton et al., 2016)。事实上,虽然数据驱动的歧视正在以与数据处理技术相似的速度发展,但与之斗争的意识和机制却没有。
有两个趋势使得对数字数据使用的全球视角变得迫切需要:一是全球范围内技术采用的指数级增长,二是数据分析的相应全球化。在全球70亿部手机中,有55亿部手机位于低收入和中等收入国家,这些国家有21亿人上网(国际电联,2015年)。印度和中国已经授权创建了数百个智能城市,这些城市将提供跟踪和监控公民生活的各个方面的能力(Greenfield, 2013),数字和生物特征登记正在成为即使在最贫穷的国家的新标准,在国际援助、发展和人道主义响应实践中越来越多地使用大量的数字数据来在低收入地区大规模地地图、分类和干预(Taylor, 2015)。考虑到这些新的数据来源,全球数据市场的触角也发生了变化,跨国公司争相分析数十亿潜在的新消费者(Taylor, 2016a)。与此同时,与公司和国家利用数据进行干预和影响的能力相比,关于数据化如何服务于公民、自由和社会正义的研究和实践很少。
本文认为,正如建立法治需要一种正义理念一样,在数据化的世界中,确定伦理路径也需要一种数据正义理念。数据公正的几个框架正在不同的领域中出现,这些框架有相互建立的潜力。因此,我将分析现有的关于数据公正的工作,并将不同的观点相互对话,然后提出,通过找到共同的原则,我们可以将它们汇集到一个框架中,以便进一步研究和辩论。本文的结构如下:首先,我将概述与大数据的新公私接口相关的担忧的原因,即在人口水平上使用的大规模数据库的学科性和频繁的歧视性。接下来,我将使用实证例子证明,这些担忧不仅被放大,而且在大数据的背景下有根本不同。然后,我将探讨当前数据公正的框架,并确定他们建议解决大数据所产生的问题的哪些方面。接下来,我将提出一个数据公正的总体概念,它可以架起现有方法的桥梁,并形成它们之间对话的基础。最后,我将支持Sen和Nussbaum的能力方法作为这一概念的框架,旨在提供一种能够解决制度、市场、法律体系和公共辩论的生态系统方法。
关于方法的说明:本文提出的框架的理论和实证起点是基于2012-2016年期间进行的一个研究项目,包括实地调查、观察和访谈。该项目包括对来自美国、欧盟以及几个非洲和亚洲国家的学术研究人员、发展援助和人道主义组织、独立技术开发人员、数据和权利领域的维权组织、大型技术公司以及决策者进行的200次正式和非正式访谈以及观察。研究的观察部分是在与“负责任数据”运动相关的国际活动中进行的,通过参与咨询小组和关于数据伦理的公开讨论。这些访谈是在这些活动中进行的,此外还通过2014-2016年在法国和挪威的跨国移动网络运营商以及在印度班加罗尔的一个公共部门数据化项目中的实地工作进行。