从数据分析到人工智能:政府该如何利用数据?
本文为Eddie Copeland在2018年3月27日于爱丁堡数据峰会上发表的演讲内容,阐述了数据分析与人工智能的结合的重要性,及其政府在其中所起到的作用,首发于Nesta网站,由全球智慧城市联盟翻译。
在过去的五年中,我一直在和一些人探讨公共部门组织该如何更好地使用他们自身的数据以获得更多的好处。
我强调了“使用他们自己的数据”,因为英国似乎采取了一种不同的数据处理方式。
一方面,我们一直是开放数据的有力拥护者:我们希望在公共部门组织发布他们的数据集后,其他人可以在这些数据的基础上发现一些有趣的结果。
另一方面,我们对智慧城市充满热情,在可以为城市提供更多数据的新技术上投入数百万英镑,但公共部门组织的人员却完全不知道如何使用这些数据。
现在,我承认,在这些领域中有不少成功的故事和经验。
但是中间还缺失了一部分内容。缺失的部分是公共部门组织的广泛认可,即他们应该是自己数据的主要消费者。
多年来,记者和评论员们在纠结用什么词来形容数据,是新的石油、燃料?还是促进创新的种子茁壮成长的肥沃土壤?不管将数据比作什么,其核心都是要表现出数据是有价值的。对公共部门组织来说,如果不能从数据中获得好处,那么数据就没有价值可言。
那么,我提到的数据的价值到底指什么?
我花了相当多的时间来研究公共部门组织如何改善自身,以及如何应对他们所面临的压力,然后突然醒悟,数据能够推动人们不断尝试和检验更好的工作方式。
目前的问题是,该行业目前的数据处理方式阻碍了工作人员从中获得好处。具体来说,这是一种“拼图”问题:每个团队都有自己的小数据拼图,但没有人能把这些碎片拼在一起,看看图片会显示什么。
这就是问题所在。
例如,我们知道共享服务可以产生价值,前提是设计和执行环节都没有出现问题。但是,如果相关组织既没有大量的数据,又无法把握问题、需求和发展机会,那么组织该如何与其他机构分享更多的数据、团队和资源呢?
我们知道,如果组织资源稀缺,就有必要重点面向需求最大的领域。如果公共部门组织不能获取那些能够显示需求量的数据集,那就很难继续深入发展了。
我们也知道,一些最复杂和最费钱的公共服务,比如成人和儿童社会关怀,可能需要多达三十个组织共同努力来提供一个家庭所需的服务。如果这些组织没有彼此之间的相关数据,他们如何高效智能地协调工作?
公共服务改革的最高目标是:预测和预防,或者说是预测和早期干预。很简单,我们知道在问题还没产生严重后果的时候,或者已经造成了最小危害时,或者更直白地说,就是解决问题的成本还不高的时候,进行干预是合情合理的。公共部门组织可以做到这一点,但前提是他们能够汇总和分析预测未来风险的数据集。
导致拼图难以成形的原因是众所周知的。在我们成功地解决这些问题之前,我们需要反复分析数据。
目前存在一些技术问题。多年来,每个公共部门组织都购买或开发了自己的IT系统,其中许多系统很难互通和共享数据。更糟糕的是,一些IT供应商甚至向公共部门客户索取相关数据。
数据方面也存在问题。即使这些组织之间可以访问数据集,但这些数据往往是根据不同的格式和约定进行记录的,比对数据就像是在比较苹果和橘子一样。
法律上也存在着一些问题。有一些做法是法律不允许的,因此禁止此类做法是合情合理的。但是,对于另外一些数据方面的做法,普通公共部门的工作人员并不确定这些做法是否符合数据保护立法,所以这些做法也没有继续下去了。他们需要谨慎行事,这是可以理解的。
最后是组织方面的问题。每个公共部门组织都是在过去的某个时候建立起来的,并且以某种方式服务于某个社区。这些组织需要在精神上,组织结构上和文化上形成系统合作的理念。
他们必须要进行合作。
数据分析办公室
为了帮助这些组织克服其中的一些障碍,两年前,Nesta推出了数据分析项目办公室,帮助城市和地区对数据进行分析,并采取相关措施促进公共服务改革。
到目前为止,我们已经直接参与了三个试点项目的工作,在每一个项目案例中,我们都发现以下四个问题可以帮助工作人员确定一个特定的公共服务挑战是否可以用数据来解决。
1 - 我们的问题是否足够具体、足够有影响力?运用数据需要时间、金钱和政策的支持。除非要解决的问题能够激发所有的相关人员参与进来,否则很难确保数据可以解决问题。
2 - 我们知道要采取怎样的干预措施吗?给这个问题一个很好的答案是非常重要的:“如果你有关于这个问题所需的所有信息,你会做出怎样不同的选择?”。数据并不是一种干预,数据是一种推动力,所以我们想要做什么?
3 - 我们知道需要什么样的信息产品吗?一线工作人员或服务经理应该在纸上或平板电脑屏幕上看到哪些相关信息?是地图,热点图,优先列表,仪表板,警报等信息吗?
4 - 创建信息产品所需的数据是否可用?数据是否可以用于此类目的?
在这些问题的基础上,我们与伦敦十二个行政区、GLA和ASI数据科学开展合作,共同发展伦敦数据分析办公室的试点项目,该项目旨在开发一种预测算法,以发现未知的HMO。 (关于该试点的全面报告将很快公布)
我们还与数字弹射中心(Digital Catapult),英国东北部地区的地方当局、警察和卫生组织进行合作,收集有关酒精危害问题的数据,探索这些问题的性质和影响程度。(该试点项目最终失败了,因为我们未能清楚地回答上面提到的第2个问题,也未能明确更好的信息将会带来什么样的影响。)
目前,我们在与埃塞克斯郡的警方、当地议会和公共部门进行合作,应用数据分析技术来识别企业是否苛待劳工。
分享经验
在以上案例中,数据都发挥了重要作用。然而,在许多方面,有关如何使用数据的谈论和实践过程才能反映数据的真正价值。无论最终的结果如何,不同的公共部门聚集在一起,共同商讨面临的问题和所需的信息,这就足以产生巨大的价值了。
令人高兴的是,许多组织都认同了这一观点。目前,大曼彻斯特郡、西米德兰兹郡、伍斯特郡、埃塞克斯郡等地涌现了数据分析办公室,并且很快伦敦也会建立一个数据分析办公室。Nesta希望数据分析办公室能够支持各部门互相学习,并提炼出有用的东西。
迄今为止,我们发现许多关于如何充分利用数据分析的经验都过于简单乏味。因此,我将强调三个最重要的经验。
公共部门领导人需要创造有利于数据发挥作用的空间和文化。我的这句话强调的是两件事。首先,公共部门领导人需要树立一种意识,即如果不能深入分析数据,那么就不能做出重大的决定或进行改革。公共部门的专业人员有权根据自己的专长选择不同的方式来处理数据,但他们无权无视数据所涵盖的内容。这种思维应该自上而下地建立起来。
其次,公共部门领导人需要认识到,在他们的组织中,他们所拥有的数据分析师可能并没有完全发挥其能力。这些分析师需要做的不是紧盯每月的图表报告和KPI报告,而是应该让他们与服务经理和前线员工一起处理更高价值的问题。
地方当局应该实现各部门的数据互联。我们的经验表明,如果公共部门组织不能将其内部IT系统之间的数据集连接起来,那么就不能与其他组织开展数据方面的合作。他们需要将关于地址和居住者的数据集(使用UPRN)连接起来,创建地理空间和个人数据的黄金记录
我们需要统一整个公共部门的法律法规。我们需要结束当前这种混乱的局面,每个公共部门都各自的法律法规,并且对同一立法有不同的解释。GDPR(《通用数据管理条例》)的引入是一个大好的机会,能够让我们在新规则的解释方面达成共识,有利于造福所有人。
简而言之,如果想要享受数据科学带来的好处,我们首先需要解决数据的问题。
还有比这更令人激动的事情吗?
人工智能的作用
Nesta是一个鼓励创新的机构:我们总是在探索新兴的发展趋势。对于那些希望更加智慧地使用公共部门数据的人来说,人工智能的发展是他们最感兴趣的关注点。
毫无疑问,对人工的炒作很多。然而,正如Geoff Mulgan在最近的一篇文章中所概述的那样,人工智能确实能够为政府和更广泛的公共部门带来巨大的价值。
在我看来,最有潜力的领域(无论是好是坏)是将机器学习用于算法决策。
为何如此重要?
我们经常提到制定政策一定要以证据为基础。对于政治家和政策制定者来说,在制定政策时,在宏观层面上使用证据是件好事,但如果在做出紧急决策时还要过于顾虑证据,那么就无法取得很大的成效。每个公共部门组织的真正成效在于其员工每天所做的成千上万个小决定的总和。
人工智能有助于我们在这个领域做出基于证据的决策:帮助一线工作者在最重要的时刻,基于对已知工作的智能分析,做出更明智的决定。
很明显,这有很大的可能性会导致严重的错误,特别是在对群体或个人产生重大影响的决策时应用算法。
在我看来,使用一种算法来实现它从未被设计过的目的是不可接受的,比如一些私营部门的公司试图利用个人信用评分来决定是否雇佣应聘者。
如果没有首先考虑训练数据中不可避免的偏差,以及如何采取措施减轻偏差的情况下,就不能应用算法。
用于做出个人决策的算法数据必须保持透明。
为了让更多的人参与这个话题的讨论,最近我发布了公共部门使用算法决策的原则草案(链接)。我已经收到了大量有关如何改进草案的有用反馈。
草案包含10条原则,但本质上归结为关键的一点:如果使用人工智能的人不能合理地理解其基本目标、功能和限制,那么使用人工智能来进行决策就是不合适的。
人们在这方面很容易犯错,我们多年来一直冒着公众信任崩溃的风险在使用这种技术。最近的一些报道显示,即使是那些世界上最大的公司,也会在出现决策错误时遭到强烈反对。
这是公共部门无法承受的错误。
当涉及到政府对数据的使用时,Nesta将继续促进有关数据使用的基本经验交流,同时探索应用新技术的最佳方式。
从数据分析到人工智能,我们还有很长的路要走。
责任编辑:仁德财
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网
-
新基建助推 数据中心建设将迎爆发期
2020-06-16数据中心,能源互联网,电力新基建 -
泛在电力物联网建设下看电网企业数据变现之路
2019-11-12泛在电力物联网 -
泛在电力物联网建设典型实践案例
2019-10-15泛在电力物联网案例
-
权威发布 | 新能源汽车产业顶层设计落地:鼓励“光储充放”,有序推进氢燃料供给体系建设
2020-11-03新能源,汽车,产业,设计 -
中国自主研制的“人造太阳”重力支撑设备正式启运
2020-09-14核聚变,ITER,核电 -
能源革命和电改政策红利将长期助力储能行业发展
-
探索 | 既耗能又可供能的数据中心 打造融合型综合能源系统
2020-06-16综合能源服务,新能源消纳,能源互联网 -
5G新基建助力智能电网发展
2020-06-125G,智能电网,配电网 -
从智能电网到智能城市