法律人工智能导论
上QQ阅读APP看书,第一时间看更新

第二节 法律人工智能发展历程

自20世纪50年代“人工智能”一词产生以来,人工智能与法律的结合已经有70多年历史了。在梳理法律人工智能发展历程之前,本书拟先对“法律人工智能”与“法律信息化”作出区分,防止实践中把一些没有体现出类人类一般的自主思考能力的应用都冠以“法律人工智能”的称谓。一般来说,法院的信息化建设是人工智能运用的基础,但并不等于人工智能运用本身。两者之间虽有着承继关系,但法律人工智能却呈现出技术介入的广泛性与深刻性。1在国外,人工智能的运用也被看作深化法院信息化建设,特别是在线纠纷解决的一种发展方向。2例如,电子卷宗生成技术、网上办案平台、在线庭审等技术,其本质仍是电子化的信息处理方式,旨在实现法院办案方式由纸质向电子、由线下向线上的转变,并未体现计算机自主思考后进行加工的“额外知识”,而仍是需要由人进行操作的信息化方式。这种模式其实是“人+电子化”,或者说是数字化、在线化。3

纵观世界人工智能发展历史,人工智能发展经历了以推理和搜索为标志的首轮热潮和以专家系统为标志的第二波热潮,再到21世纪由机器学习推动的第三轮热潮。伴随着人工智能发展的三次大浪潮,法律人工智能的发展也相应经历了三个阶段,大体可概括为从学理研究到应用探索阶段,再到快速发展阶段。

一、学理研究阶段

20世纪70年代以来,人工智能与法律关系的研究一直是学界感兴趣的课题。 1970年,在人工智能专家系统刚刚起步之时,美国学者布坎南·赫里克( Buchanan & headrick)在《斯坦福法律评论》发表了《关于人工智能和法律推理的若干问题的考察》 ( Some Speculation about Artificial Intelligence and Le-gal Reasoning)一文,对法律研究和论证模型进行了探讨,特别是对建议系统、法律分析系统、法律论辩架构进行了讨论,为人工智能的推理和算法研究提供了思路,揭开了研究人工智能法律推理的序幕。4这篇文章被视为首个法律人工智能提案,因为这是第一次正式把“人工智能”与“法律推理”关联起来思考问题。

1976年的《哈佛法律评论》刊登了法律人工智能领域标志性的文章《反思TAXMAN:人工智能和法律推理的一项实验》 ( Reflections on Taxman: An Experiment in Artificial Intelligence and Legal Reasoning),建立了基于定理证明、服务于公司法的程序原型TAXMAN。该原型具有开放架构的特征,并且将法律概念拆解成为复杂的且具有深度的模型。 1977年,杰弗瑞·梅尔德曼( Jeffrey Meldman)开发了计算机辅助法律分析系统,它以律师推理为模拟对象,试图识别与案件事实模型相似的其他案件。安东尼·阿马托( Anthony D. Amato)提出,人类法官是否以及应该被机器法官所取代,以消除法律的不确定性。但这一设想是否正确以及可行在美国学术界一直争论不休,甚至还被上升至哲学层面讨论。5例如,J. C.史密斯( J. C Smith)指出,“电脑可以或应该代替法官”的见解是基于笛卡尔的“灵体二元论”和“莱布尼茨的谬误”,二者犯了智力可以独立于人体而存在和所有的人类思想都可以通过一种通用的语言来表达的错误。61978年,卡罗尔·哈夫纳发表了使用人工智能方法改善流通票据领域的法律信息检索( IR)系统的研究,并可以使用语义网络表达来超越纯粹基于关键词的方法。

我国的法律人工智能研究大概始于20世纪70年代末80年代初。 1979年年底,著名科学家钱学森在《光明日报》发表文章,将法治系统工程纳入系统工程体系。71983年,龚祥瑞和李克强在《法学杂志》上发表的论文《法律工作的计算机化》最早提出了运用计算机系统建立法律数据库、辅助审判业务的构想。8这一阶段可视为以推理和搜索为目标的首轮法律人工智能研究热潮。

二、应用探索阶段

20世纪80年代,法律人工智能的相关研究主要集中在信息提取和信息检索方面,以及构建各种所谓的专家系统。这一阶段的法律人工智能进入以专家系统为标志的第二波热潮。

这一时期的法律专家系统经历了繁荣发展的十年,许多计算机科学领域的专家和律师投入法律专家系统的研发之中。两大法系基于各自法律传统分别形成基于规则、案例的法律专家系统。基于规则的法律专家系统是用专家系统模拟与规则相关的法律、司法解释、地方性法规等内容,建立复数的规则与相应权重的连接,从而预测裁判结果。在基于规则的法律专家系统中,具有代表性的是被誉为“人工智能与法之父”的麦卡迪所创建的 TAX-MAN 系统。基于案例的法律专家系统的发展,既是英美法系判例法传统与人工智能融合发展的产物,也是对基于规则的法律专家系统缺陷的弥补,即知识表示不仅是法律规则的简单选择,还应提取要素结合案例予以表达。具有代表性的如美国学者阿什利和里斯兰设计的HYPO法律专家系统。该系统能根据案件要素的相关性与重合程度进行索引从而发现类似案例,作为裁判参考。9此后各类专家系统如 CATO、 CABARET 和 PROLEXS 等相继出现,有的已用于司法实践之中。10

我国于20世纪80年代中期开始研究法律专家系统。 1986年,上海华东政法学院朱华荣、肖开权主持的“量刑综合平衡与电脑辅助量刑专家系统”课题获批国家社科“七五”研究项目,建立盗窃罪量刑数学模型。武汉大学法学院赵廷光教授从1987年开始研究量刑公正与人工智能技术的结合问题,并于1990年、2004年先后研发推出“中国刑法专家系统”软件和“辅助量刑系统”软件。111993年,中山大学学生胡钊等研制了“ LOA律师办公自动化系统”。12

现阶段人工智能技术的诸多司法应用,如诉讼策略辅助、案件结果预测等,在20世纪80年代末90年代初就已面世。例如,20世纪90年代研发的案件推理系统就可以从案件中提取事实,然后为双方当事人形成辩论要点与反驳观点。13令人遗憾的,是类似研究很快遭遇“知识获取‘瓶颈’”。原因在于司法人工智能技术应用的成败取决于能否获得海量法律知识以及能否将这些海量知识转换为计算机可识别的知识。14而当时可供训练的司法数据量与计算条件否决了很多现今流行的司法人工智能算法。另外,由于以法律专家系统为代表的法律知识工程在知识获取上依赖人工,专家知识库的知识结构不清晰且仅是无规则地被放置在机器中用于检索。因此,这些系统面临法律解释困难、难以解决规则冲突及缺失等问题。尤其是对于案件要素的相关性应由何种方法确定,这个法律专家系统的最核心问题,法律专家系统理论始终未能给出有效的回答。这一时期法律专家系统的热潮,实际上是在赫伯特·哈特所倡导的那种简单化的、以规则为导向的法律理论的影响下成长起来的。但是,这种依据法哲学理论所进行的研发,在实践中必定会遭遇各种复杂的法律问题,因为逻辑编程无法反映法律运行的真正逻辑; 我们必须重视实体法的具体问题,但是这些研发者缺乏足够的专业法律知识。15自20世纪90年代后,传统的法律专家系统跌入低谷。16

法律人工智能真正的第一次实践应用,是1981年由沃特曼和皮特森开发的LDS法律判决辅助系统。作为检测美国民法制度的一种应用,此系统可以“计算”民事案件中产品的赔偿责任。 1983年,霍华德·加德纳首次提出“多元智能理论”,从多角度分析问题,结合法律概念对相似案例进行比较分析,检验结果的合理性与正确性,最后得出司法裁量结果。171987年,首届国际人工智能与法律会议( ICAIL)在美国波士顿的东北大学成功举办,标志着人工智能与法学共同体的正式形成,有力地推动了人工智能与法律这一跨学科领域的研究和应用。与会者达成共识,每两年召开一次学术大会。为了进一步引领与推动人工智能与法研究,1991年在牛津大学召开的第三届人工智能与法国际大会上成立了“国际人工智能与法协会” ( IAAIL),旨在推动人工智能与法律这一跨学科领域的研究和应用。18该协会不仅引领了法律人工智能的发展方向,还引领了人工智能的发展方向。191989年,伯曼( Berman)发表文章提出了人工智能司法应用的分工。人工智能可存在于司法程序的每一个环节,每个专有系统在自己的分支环节运作,系统也可以通过观察评判法官的裁判结果,模拟法官的审判思维,来预测司法裁量。201993年,美国匹兹堡大学法学院资助创办的《人工智能与法》杂志,由斯普林格出版社出版。

1989年,澳大利亚开发了IKBALSI系统用于解释事故司法补偿条例,处理工人事故补偿问题。211982年至1995年,日本第五代计算机系统工程促进了人工智能与法律实践的快速发展。 Split-Up系统在1995年被研发出来并用于离婚纠纷案件中双方财产的处理。221991年,Deedman提出了专家断案系统。此后,很多学者对法律人工智能的理论研究开始与实践相结合,通过AI产品和系统的研发设计搜索系统和裁量模型等,不断地适应司法实践的需要,推动司法领域相关改革。

2003年,本奇提出在利用人工智能技术进行类似案件筛选时,应考虑案件与案件之间的关联性。贝叶斯网络,又被称为有向无环图模型,于2005年被Biedennann用于法庭调查的证据评估。232008年,里森( Riesen)以受害人的特点为视角,通过贝叶斯网络对美国刑事案件进行推算演绎的自动分析,极大地提高了刑事案件的处理效率。 2009年,Dung通过设立涵盖知识、信仰、常识等当事人事实信息系统,建构推理模型辅助法官快速、准确做出司法判决。之后,许多国家和国际组织开始研发自己的司法专家系统或裁量模型,如基于案例和规则的混合系统CABARET等。

2015年,全球著名十大律所之一Demons,启动了一项名为Nextlaw Labs的项目,主要向一些法律与高新科技结合的研发计划提供资金支持。24同年,斯坦福大学的学生约弗亚·布朗德( Joshua Browder)创建了世界上首个机器人聊天律师DoNotPay,从最初处理违章停车罚单纠纷,到现在能够回答消费者权利和劳动争议的1000多种法律问题。

在美国,刑事司法系统中的人工智能应用主要表现为刑事司法中的“风险评估工具或软件” ( Risk Assessment Tool /Software),集中应用于审前和量刑阶段。 2013年起,美国有一半以上的州应用了风险评估软件辅助量刑。目前,美国已有2/3以上的州应用这些软件来辅助法官量刑。

美国风险评估工具出现在20世纪70年代。一是暴力犯罪评估指南( Violence Risk Appraisal Guide),其被视为暴力犯罪方面最受欢迎的风险评估系统,包含年龄、婚姻状况、犯罪前科以及精神疾病等12项风险评估因子;二是Static-99,属于在性侵类犯罪方面应用较为广泛的风险评估系统,包含被告人的犯罪前科、受害人性别、行为人年龄以及双方是否同居等10项风险因子;三是联邦审前风险评估系统 ( Pre-trial Risk Assessment tool),是近年研发出来适用于缓刑的风险评估系统,包含所犯罪行的严重性、教育程度、年龄、工作状况等11项风险因子。这一时期的风险评估工具主要采取了一种量化统计的方法,根据已量化的风险因子辨别行为人再犯风险的高低。

20世纪70年代晚期至80年代初期的风险评估工具引入了动态风险因子,通过动态风险因子与静态风险因子的协同运作预测再犯可能性。 The Historical, Clinical, and Risk Management Violence Risk Assessment (简称HCR-20),是在暴力犯罪再犯风险预测方面应用性广以及预测准确性高的风险评估系统,包含了 20种风险评估因子。25水平评估量表( The Level of Service Inventory-Revised, 简称LSI-R),其特点是通过对可能引发犯罪的风险因子进行分析来预估再犯可能性。水平评估量表具体包括了54项风险评估因子,大致可以归为10类:犯罪前科、教育或工作状况、经济状况、婚姻家庭状况、居所状况、娱乐消遣、伴侣状况、酒精药物、情感状况以及个人定位等。这些风险因子一般通过半结构化访谈获取,并在此基础上进行数值累计,数值越高则行为人的再犯风险越大。美国“威斯康星危险评价工具” (The Wisconsin Risk-Assessment Instrument)是在西方国家比较有影响的危险性评估工具。这份量表是由贝尔德(Baird)、海因茨(Heinz)、贝莫斯(Bemus)在1979年编制的。

目前,在美国刑事司法领域应用最多的是COMPAS ( The Correctional Of-fender Management Profile for Alternative Sanctions)系统,又被称为基于网络的风险评估工具,旨在评估诱发犯罪行为的因素和罪犯再犯可能性。 COMPAS主要包括两个风险预测模型:再犯风险预测和暴力犯罪再犯风险预测。此外,还有风险筛选模型以及审前释放风险预估模型等。26COMPAS的风险因子主要集中在犯罪相关因素、人际关系、人格、家庭关系以及是否有反社会倾向等五个领域。所以,COMPAS在提供风险评估估值的同时,也会提供暴力犯罪风险估值、再犯风险估值、不到庭估值以及社区矫正失败风险估值。此外,COMPAS的独特之处在于它能够提供诱使罪犯实施犯罪行为的画像,包括罪犯的犯罪前科、主观恶性以及所处的社会环境等信息。27

除上述“风险评估工具”外,美国的一些州还使用法律人工智能工具来确定被告人的刑期长短。此类工具参考了数十年的量刑案例来设计算法,通过设置所在居住地、受教育水平、关系亲密人群的犯罪状况、中学前是否有过乘坐飞机旅行的经历等权重模块,评估被告人在一定时期内重新犯罪的可能性。还有学者通过机器学习的方法研究了新奥尔良地检署1988—1998年10年间145000名被告人的280000起案件,建立了被告人的再犯可能性模型,分析何种案件、什么样的人会得到法院的减刑与保释。28

美国早在21世纪初就开始了建设网络法院的探索。 1993年,威廉与玛丽法学院启动了一项利用信息技术改革法院的研究项目“ courtroom 21”,提出利用信息网络技术的科技来建构虚拟法院( Mc Glothlin Courtroom),这就是密歇根州网络法院的原型。 2001年2月,美国密歇根州议会通过《网络法院法》 ( The Cyber Court Act) 。 2001年3月28日,密歇根州最高法院根据《网络法院法》,对《密歇根州法院规则》和《证据规则》进行了修订。其中,最重要的变化是在《密歇根州法院规则》下增加第2700节“电子操作”( electronic practice)作为网络法院审判实务操作的指导规则。虽然计划详尽,“网络法院”却未真正设立。最大的原因就是缺乏资金支持。据估算,筹建“网络法院”需要25000~50000美元来建设并配备高速网络、证据和文件展示硬件,以及电子文件管理系统等软件。 “网络法院”拟由密歇根州最高法院提供资金,但州预算紧缩,这个计划最终流产。

三、快速发展阶段

21世纪初期,人工智能和法律领域开始研究机器学习技术,法律人工智能进入了由机器学习推动的第三轮热潮。

自2013年起,密歇根州19家法院和俄亥俄州1家法院陆续推行Matter-hom在线平台。除了针对小额索赔民事争议,该在线平台主要被用来替代针对未偿担保案件和交通违法(连同一些民事侵害案件)的诉讼程序,它允许当事人、执法者和法院人员远程上传文书,取代法庭听证会。29

自2015年以来,由于人工智能技术的突破以及政策、社会和商业机构的关注、投入,法律科技市场再次繁荣。特别是随着2016年Alpha Go的横空出世,人工智能迅速升温。在各国人工智能战略和资本市场的强势推动下,以深度学习为主要特征的新一轮人工智能浪潮席卷全球。得益于知识图谱、算法、大数据的发展突破,法律人工智能技术取得飞速发展。

2017年,法国人路易·拉海·查内便设计了一款离婚诉讼结果预测软件,大获成功,受到了雷恩上诉法院、杜埃上诉法院及里尔律师公会的关注。同年,IBM公司研发了全球首位人工智能律师ROSS,此平台几乎输入了所有法律文件数据,ROSS可以通过证据的收集以及对法律和判例的解读,推理论证得出基于证据的高度盖然性结论。而且,ROSS还可以通过展示与案件相关的法律条文,结合以往判例,提出假设等方式与律师互动。此外,ROSS平台还能记录法律体系的发展与变化,时刻更新法院新型案件的司法判决。

2017年,英国的 Case Cruncher Alpha 在伦敦举办的一场“基于数百个PPI(付款保护保险)错误销售案例事实来判断索赔与否”的法律比赛中,以86. 6%的准确率战胜了百名人类律师取得胜利。此后,一支来自谢菲尔德大学、宾夕法尼亚大学和伦敦大学学院的研究团队,通过人工智能识别几百个案件数据,经过整合分析后,预测到79%的案件审理结果与欧洲人权法院的案件审判结果相同。

我国这一阶段的法律人工智能也呈现飞速发展之势。我国在司法领域的智能化主要是“智慧法院”的建设。这项活动最早开始于2015年,当前已在全世界处于遥遥领先的地位。 2016年10月,我国法律服务商“无讼”宣布国内首款法律机器人“法小淘”正式诞生,其能基于法律大数据实现智能案情分析和律师遴选。在学术研究层面,以“法律人工智能”为关键词在中国知网进行检索,可以看到,中文文献的数量从2017年起呈现递增的趋势。

四、发展现状分析

一般认为,人工智能的发展可以分为弱人工智能、强人工智能以及超人工智能三个阶段。从人工智能的发展来看,仍处在弱人工智能阶段。弱人工智能阶段的法律人工智能“可用但不好用”。基于机器学习的人工智能缺乏人类具有的背景知识,还没达到人脑的程度,尚未拥有智能或自主意识,距离强人工智能或者超级人工智能仍有相当一段距离。例如,目前用于智慧法院建设和其他法律领域的“人工智能”系统大多只是封闭的专家系统,有赖于知识的人工输入,还不具备深度学习的能力。30类案推荐、量刑辅助、 偏离预警等应用面临着图谱构建过度依赖人工干预、情节提取的自然语义识别技术准确度不足、类案识别的准确率偏低、模型训练的样本瑕疵、量刑算法的非可视化、偏离度预警的颗粒度悖论等技术“瓶颈”。31

从应用的广度来看,目前的法律人工智能还只是有选择地被应用于某些法律场景,并非全面推广应用。例如,司法人工智能被集中运用在警务活动及司法活动的少数环节,在通用技术相当成熟的如人脸识别、语音转换领域,人工智能的应用比较成功。但是,在关涉效率与公正等司法决策的真正疑难问题上,司法人工智能的应用仍是浅尝辄止,存在应用不多、不具体、实效不够等问题。32从应用的深度来看,目前司法人工智能在实践中仍限于充当辅助法律人决策的角色,难以胜任知识覆盖面大、技术含量高的司法工作,更适宜于处理技术性、辅助性的工作。即使在司法辅助活动中,人工智能的应用也是相对有限的。如“智慧法院”建设中推出的庭审智能语音识别、电子卷宗生成、类案推送、量刑辅助、法律问答机器人等,这些运用在一定程度上满足了当事人的需求,减轻了法官的工作量,同时在司法活动中开始发挥提高效率、有效地节约了司法资源,但其效果还相当有限,未能如预期地普遍运用。33

1 参见王禄生:《大数据与人工智能司法应用的话语冲突及其理论解读》,载《法学论坛》2018年第5期。

2 Amy J. Schmitz,Expanding Access to Remedies Through E-Court Initiatives,67 Buffalo Law Review. 89, 2019, p. 146.

3 参见左卫民:《从通用化走向专门化: 反思中国司法人工智能的运用》,载《法学论坛》2020年第2期。

4 See Bruce G. Buchanan etc., Some Speculation about Artificial Intelligence and Legal Rea-soning, Stanford Law Review, 1970, 23, pp. 40-62.

5 See Anthony D'Amato,Can /Should Computers Replace Judges,11 Georgia Law Review. 1277 (1976-1977).

6 See JC Smith,Machine Intelligence And Legal Reasoning,Chicago-Kent Law Review (1998).

7 参见钱学森:《大力发展系统工程,尽早建立系统科学的体系》,载《光明日报》 1979年11月10日版。

8 参见龚祥瑞、李克强:《法律工作的计算机化》,载《法学杂志》1983年第3期。

9 参见高翔:《智能司法的辅助决策模型》,载《华东政法大学学报》2021年第1期。

10 参见张妮、徐静村:《计算法学: 法律与人工智能的交叉研究》,载《现代法学》2019年第6期。

11 参见赵廷光等:《实用刑法专家系统用户手册》,北京新概念软件研究所1993年版。

12 参见杨建广、骆梅芳编著:《法治系统工程》,中山大学出版1996年版。

13 参见於兴中:《人工智能、话语理论与可辩驳推理》,载葛洪义主编:《法律方法与法律思维》(第3辑),中国政法大学出版社2005年版。

14 Henry Prakken, Al & Law on Legal Argument: Research Trends and Application Prospects, 5 SCRJPTed;A Journal of Law, Technology and Society, 449-451(2008).

15 See Philip Leith,The Rise and Fall of the Legal Expert System,30 International Review of Law,Computers & Technology 94-106 (2016).

16 参见高翔:《智能司法的辅助决策模型》,载《华东政法大学学报》2021年第1期。

17 Anne von der Lieth Gardner, An Artificial Intelligence Approach to Legal Reasoning, MIT Press, MA, USA, 1987, pp. 1-50.

18 此次会议主要包括十大议题:法律推理的形式模型;论证和决策的计算模型;证据推理的计算模型;多智能体系统中的法律推理;自动化的法律文本分类和概括;从法律数据库和文本中自动提取信息;针对电子取证和其他法律应用的机器学习和数据挖掘;概念上的或者基于模型的法律信息检索;自动化次要、重复性的法律任务的法律机器人;立法的可执行模型。

19 参见熊明辉:《法律人工智能的前生今世》,载中国社会科学网( http://ex. cssn. cn/zx/bwyc/201810/t20181010_4666738_1. shtml),最后访问日期:2022年11月1日。

20 Cal Deedman, J. C. Smith, The Nervous Shock Advisor: A Legal Expert System in Case-Based Law, Operational Expert Sysems Applications in Canada. Ching Y. Suen and Rajian Shinghai eds, Pergamon Press, 1991. pp. 56-71.

21 参见张妮、杨遂全、蒲亦非:《国外人工智能与法律研究进展述评》,载《法律方法》 2014年第16期。

22 John Neleznkow, Australian perspective on research and development required for the con-struction of applied legal support systems, Artificial intelligence and Law, Vol, 10: 237-260, 2002.

23 贝叶斯网络在1986年由Judea Pearl 提出,本质是一种概率网络,基于概率推理的图形化网络。一种在不确定条件下进行命题推理的标准认知模型,具有强大的不确定性问题处理能力。它能有效地进行多源信息表达与融合。其成为研究人工智能领域非精确知识表达与推理领域几十年的热点。

24 参见谢澍:《人工智能如何“无偏见”地助力刑事司法——由“证据指引”转向“证明辅助”》,载《法律科学(西北政法大学学报)》2020年第5期。

25 K. S. Douglas,C. D. Webster, The HCR-20 Violence Risk Assessment Scheme: Concur-rent Validity in a Sample of Incarcerated Offenders. Criminal Justice & Behavior,1999(1): 3-19.

26 Practitioner's Guide to Compass Core,Northpointe. https: //assets. Documentcloud. org /documents/ 2840784 /Practitioner-s-Guide-to-COMPAS-Core, last access: Mar. 13, 2020.

27 T. L. Fass, K. Heilbrun,D. Dematteo,et al. The LSI-R and the COMPAS: Validation Data on Two Risk-Needs Tools. Criminal Justice and Behavior,2008(9): 1095-1108.

28 参见左卫民:《热与冷: 中国法律人工智能的再思考》,载《环球法律评论》 2019年第2期。

29 参见〔美〕伊森-凯什、〔以色列〕奥娜·拉比诺维奇·艾尼:《数字正义》,赵蕾、赵精武、曹建峰译,法律出版社2019年版。

30 参见郑戈:《大数据、人工智能与法律职业的未来》,载《检察风云》2018年第4期。

31 参见王禄生:《司法大数据与人工智能开发的技术障碍》,载《中国法律评论》 2018年第2期。

32 参见左卫民:《从通用化走向专门化: 反思中国司法人工智能的运用》,载《法学论坛》2020年第2期。

33 参见左卫民:《从通用化走向专门化:反思中国司法人工智能的运用》,载《法学论坛》2020年第2期。