从社会治理的角度,大数据更是一种“机制”,既是一种应用机制,更是一种推动、倒逼机制:就大数据的本性而言,它对所有人都是平等的,它天生地趋向自由。(资料图/图)
(本文首发于2017年2月9日《南方周末》,原标题为《用人工智能助推社会治理 大数据治理的几条具体建议》)
在司法领域,设想有一个“人工智能法官助理”,我们可以象给阿尔法狗“喂棋谱”那样把浩如烟海的法律文本(包括所有的立法解释、司法解释等)“喂”给它学习,把连篇累牍的案例材料“喂”给它了解,它对法律和案例的融会贯通、完整掌握一定能超过任何单个的人类法官。
有了大数据基础之上的人工智能,有了国家治理领域的“阿尔法狗”,就可以用人工智能和人之间的制约、制衡来保证决策正确和及时纠错,同时还不明显降低效率。当然,这种制约、制衡机制必须法律化、强制化。
看到这个题目,很自然联想到的就是“利用大数据破获犯罪”之类,这是现在对大数据应用的较为普遍的思路,即把大数据视为一种“工具”,一种“手段”。我认为,从社会治理的角度,大数据更是一种“机制”,既是一种应用机制,更是一种推动、倒逼机制:就大数据的本性而言,它对所有人都是平等的,它天生地趋向自由,只有在它的基础上,绚烂的现代民主治理之花才能更为合理、更为必然、更不受束缚地绽放,人类在自然科学领域的发明和成果,才能从根本上推动人类自身的相互关系和治理结构的变革和优化。
社会数据化,数据社会化
之所以如此,首先是由于人类自身的“数据化”。对于社会成员,从工作内容到每日行程,从单位内部的往来到“朋友圈”的互动,从鸿篇巨制中的煌煌高论到推特脸谱上的片言只语,从你背过的单词到你走过的步数,每个人的工作、生活、社交、教育、运动等各方面的行为都在越来越频繁、普遍、精确地数据化。对于社会管理者,他们的管理、控制行为基于数据,也被数据所记录:电子政务系统记录着政府的每个流程、每项决策、每个文件及其所有的原始记录。单从“依赖”的程度、不考虑“毒害”的因素,可以说数据化是信息时代的“鸦片”:在社会成员和社会管理者从数据化得到越来越多便利的同时,他们自觉不自觉地把自己的思想、行为、言论甚至感情表达更加深入、更加全面地数据化,乐在其中,势不可挡。
这种数据化的趋势,一定伴随着数据的多源化。如果说在信息时代的初期,与社会成员相关的主要数据还都由政府保有、管理,发展到今天,企业、私营机构、社会组织等掌握的数据,已经和政府的规模不相上下。所以,电量、运输量、贷款量可以和政府公布的GDP互相印证,电商交易量可以和社会零售业总额交叉检验,自媒体则成了主流媒体不可缺少的补充。这种趋势将随着“小政府、大社会”的进程而日趋明显。
数据来源越来越多样化,也就越来越意味着数据的公开化。在政府为单一数据来源时,美国历史上围绕着《信息自由法案》、《电子信息自由法案》争讼纷纭。今天,世界各国政府都宣称“信息公开是常态,不公开是例外”,而且正纷纷从“信息公开”走向“数据开放”。而企业、社会组织、自媒体等的数据更活跃、更原生、更倾向于公开。数据来源的多样性也倒逼着数据公开:如果某一数据源不开放数据,而这一数据又是社会公众所需要的,其他来源的数据将会逐步替代这一数据源。不公开,就会被替代或淘汰,信息产业史上不乏这类例子。
寻求最大共识,避免“多数错误”
数据的多元化、公开化、自由化,必然导致数据的平等化、数据分析结果的客观化。首先,大数据分析工具的分析、萃取基本不受人为因素影响,能够客观、全面地挖掘出数据的本质。其次,即使工具本身出了问题,即使人为地对工具施加了不当影响(如调整权重等),也会有另外的工具,从另外的数据源进行分析、比对,如统计局的GDP可以由售电量等数据来比对。这样,就保证了数据分析结果、判断结论的真实性,就能真正提炼出全社会的最大公约数、最大共识。
从平等化的数据、真实化的结果,就有可能实现基于大数据的社会治理,即以大数据为基础、规范、标准的治理。大数据,就是社会成员已经做完的事情,因此,以大数据为基础的治理,就是最原生的人民主体、群众路线、实践标准。
例如,某国的交通规则规定是:某一高速公路的限速是60英里,如果你开上该公路时发现其他的汽车的时速都是80英里,你就应该按照80英里,而不应该拘泥于限速。这实际上是“以大数据为标准”治理交通的雏形:因为大数据展示绝大多数汽车的时速都是80英里,这表明大家一致认为在这段高速公路当时的车流密度、气象条件下80英里是安全可行的时速,交通管理就应该按照这一大多数人的意志。当然,公路的速度标志应该优化,改为可变的“建议时速”。
又例如,自动翻译软件原来的思路是穷究语义,力图得出“最准确的翻译”,但多年以来一直无法完美实现。近年来,改为以大数据为基础,即:大多数人怎么翻译,翻译软件也怎么翻译。你“喂给”翻译软件的实例越多,翻译软件的结果就越被大多数人认同。这就是“翻译领域”的群众路线。
当然,大数据也要防止“多数人的暴政”、纠正“多数人的错误”。比如,怎样防止在公路上大家越开越快?怎样纠正大部分人都容易犯下的翻译错误?解决问题的思路还是大数据,即应该基于大数据来积累、制定、完善检验、判定的标准。例如,根据对这一路段多年的交通事故统计数据,得出在任何气候条件、任何交通流量下都不能超越的时速,加以严格的提示和限制。比如,基于多年的教学、翻译数据,列出一些明显的翻译错误,即使大多数人都犯了这一错误,也不能认为这种翻译准确;也可以大大提高语言学专门人员翻译结果的权重,使之抗衡“菜鸟级”翻译的错误,等等。
人工智能与数据治理
实际上,基于大数据的社会治理,绝非上述那样简单,而必须不断运用人工智能技术的新成果,包括神乎其神的“深度学习”。基于大数据的人工智能已经并且正在很多领域(典型的如围棋、驾驶等等)证明:人工智能可以超过单个的人类成员。阿尔法狗已经战胜了雄踞世界围棋前列的李世石,谷歌的自动驾驶汽车已经创造了任何人类驾驶员都无法企及的安全驾驶记录。那么,在社会治理领域,是否有可能出现类似“阿尔法狗”这样的“虚拟选手”呢?答案是肯定的。
比如在司法领域。设想有一个“人工智能法官助理”,我们可以像给阿尔法狗“喂棋谱”那样把浩如烟海的法律文本(包括所有的立法解释、司法解释等)“喂”给它学习,把连篇累牍的案例材料“喂”给它了解,它对法律和案例的融会贯通、完整掌握一定能超过任何单个的人类法官,甚至还可能发现法律本身存在的不一致、发现判例之间的矛盾。这样,无论在大陆法系还是英美法系,只要把某一案件的案情详尽、精确(这是人工智能法官助理对案情描述精确性、准确度的倒逼)地向它描述,它就能给出判决建议及其依据。法官可以不采纳它的建议,但是必须提出不采纳的理由。人工智能法官助理的建议及其依据、法官采纳与否的决定及其依据,都以适当的形式公布并存档,同时也成为人工智能法官助理深度学习的新内容。
比如在国家决策领域。设想有一个“人工智能决策助理”,我们同样可以像给阿尔法狗“喂棋谱”那样把执政党的党纲、党章、各种理论、与决策相关的宪法法律法规、执政党处理历史案例的经验和教训等“喂”给它学习,把从多源的社会数据抽取、分析得到的“社情民意”、“最大共识”让它了解,它对执政党理论体系的掌握、对宪法法律体系的理解、对党情民意的把脉应该是最完整、最准确、最内在一致的,而且,一定不会受到学历、专业、经历、好恶、注意力等的影响,是一个“不断学习、时刻更新、无一遗漏、永不疲倦、高度稳定”的决策助理。当某一需要决策的事项发生时,只要把该事项的情况详尽、精确(这同样是人工智能对决策事项描述精确性、准确度的倒逼)地向它描述,它就能给出决策建议及其依据,并且评估该建议可能产生的各方面的后果。执政党可以不采纳它的建议,但是同样应该提出不采纳的理由。人工智能决策助理的建议及其依据、执政党采纳与否的决定及其依据,都以适当的形式公布并存档,同时也成为人工智能决策助理深度学习的新内容。
这种国家治理领域的“阿尔法狗”,为解决国家治理结构的“制衡”悖论提供了技术上的可能。这种悖论就是:为了让权力不做傻事,需要设计制约机制,用人与人的制约,即所谓“政治人物之间互相依靠又互相制约”来保证决策正确及必要的纠错,但这样就会导致决策效率低下、影响社会经济发展和人民生活。为了提高效率、加快发展、“集中力量干大事”,就需要排除七嘴八舌的干扰、统一决策、高度集权,但对集权于一身的领导人的素质要求极高,而且很难设计和实现纠错机制。有了大数据基础之上的人工智能,有了国家治理领域的“阿尔法狗”,就可以用人工智能和人之间的制约、制衡来保证决策正确和及时纠错,同时还不明显降低效率。当然,这种制约、制衡机制必须法律化、强制化,你不能今天高兴了,就问一下“人工智能决策助理”,明天就不理它;你也不能把电脑的电源拔掉,让“阿尔法狗”无法工作。在这个意义上,社会领域的大数据,是从机制上对执政者的制约。
这种制约,不仅仅是对执政者的,也是对全体社会成员的。因为每个社会成员的所有行为都数据化了,而在大数据基础上形成的判定标准是一致的,每个人都受其约束、规范,而且是无所不在、无处不在的制约(想想因为成为“表叔”而下台、因为暴露“开房记录”被处分的官员!),这种制约,比道德、法律的制约更为普适。在信息时代的一定阶段,与“依法治国”、“以德治国”并列的,还会有“数据治国”。如果我们把它看成套在每个人头上的“紧箍咒”,那么,这就是人类进步历史上的又一次“异化”。
借用一句外来语:“除了上帝,谁都需要数据”。对于社会成员,谁都在数据的规范和约束下,否则就会受到数据的惩罚;对于社会管理者,谁都必须遵循大数据所揭示的民意、趋势,否则,也自然会被以大数据为代表的公平、正义所抛弃。
(作者为九三学社中央委员,凯发k8天生赢家一触即发软件股份有限公司董事长)