带着机器人去开庭

人工智能是近年来十分热火的讨论话题,法律人士每当讨论到人工智能时,往往会有一种被机器人替代的担忧。尤其是今年Alpha Go打败柯洁之后,这种担忧加剧:计算机技术对传统行业的颠覆从替代机械劳动,进一步影响到脑力劳动领域。

计算机能否替代脑力劳动?计算机技术的边界是什么?这还要从人工智能的目前常见的三种类型说起。

一、Type I - 相似性

许多律师会使用笔记类软件作为工作记录,我们所大部分律师用的都是印象笔记。印象笔记相较于其它电子笔记软件,有一项杀手级应用——“推荐内容”(高级版功能)。这个功能可以在你写笔记的时候,自动在下方提示可能与本条笔记相关的其它笔记。如果你习惯于将平时的工作和思考都记录在印象笔记里的话,这一功能十分实用。我经常遇到这样一种情形:在记录某项正在进行的工作时,印象笔记提示我之前曾做过类似的工作或是读过与此相关的文章,从而避免重复劳动,事半功倍。


带着机器人去开庭_第1张图片
推荐内容

更重要的是,这是一种模拟人脑思维的表现。人脑发挥创造力最重要的一个手段,就是把两个不同的想法连接起来。这个连接越是意想不到,创造出来的东西就可能越有意思。想要让想法连接,你得先拥有很多很多想法才行,而现在你可以把想法寄存在一个外部工具里,让计算机帮你建立连接!

这个功能看起来非常人工智能,但使用的技术并不高深。可以推测该功能主要是通过内容分词以及词汇匹配算法,即当两则笔记有多个词汇一致时,则视为两则笔记有“相似性”,根据相关性的高低排序,显示在笔记下方。

无讼天同码也使用了类似的技术。众所周知,天同律师事务所出版的天同码,是一套“麻袋”级别的重量级工具书,在体现法律知识厚重感的同时,也带来了极度的不便利性。我为了能方便查阅这套工具书,将天同码整体扫描成PDF版,并对目录部分进行OCR识别校对,建立索引。即便如此,用起来还是多有不便。

无讼科技显然也意识到这个问题。近期上线的无讼天同码,也做到了相似性自动匹配的功能,不禁让人眼前一亮。当你在无讼案例中打开某篇裁判文书时,系统会自动提示与这个判决相关的天同码(如有)。我推测这种关联是基于案由、标签、案件关键词等实现的相关性匹配,准确率很高。我们查找裁判文书,常常是为了找到一个结论,以及与这个结论相关的案例来支撑自己的观点。但是要判断某篇裁判文书的结论是什么,十分耗费时间,通常需要大致先看一下案情,再看法院查明事实,最后重点阅读法院认为部分。有了天同码之后,你可以第一眼就看到天同码的22字结论,方便你作快速判断。


带着机器人去开庭_第2张图片
天同码

想像如果能将天同码集成到印象笔记里将会多么美妙!相当于你有了一位贴身秘书,这位秘书通读天同码中所有的判决,当你谈到一个法律问题时,这位秘书会主动提示你,法院判决是怎样的。而且这位秘书惜字如金,每次只说22个字。

二、Type II - 用户大数据+相似性

大数据也是一个十分火的概念,甚至有些过火,说什么都要和大数据扯上关系,出现了一种言必称大数据的局面。但从定义上看,大数据是指“让传统数据处理应用无法处理其复杂性的数据集”,所以那些用excel统计出来数据咱就别硬叫大数据了吧。

大数据与相似性的组合可以让人工智能更进一步,具有更高的拟人性。以我们日常使用的音乐软件为例,许多音乐软件都会有推荐算法。比如你收藏了某一首歌,软件就会推荐相似的歌曲和歌单给你。这个推荐功能有的时候准到让你怀疑人生,我有一次就因为推荐听到了一首我很多年前听过非常喜欢但记不起名字的歌曲,顿时觉得它比我自己还要懂我的音乐品味。


带着机器人去开庭_第3张图片
音乐推荐

然而,音乐品味这个东西这么玄,软件是如何做到识别你的品味的呢?其实并没有,软件根本不会去分析你的品味,而是从海量的用户数据中去检测相似性——如果有许多用户在喜欢A歌曲的同时也喜欢了B歌曲,那么软件就判定A和B两首歌是有相关性的。然后当你喜欢了A或B歌曲后,软件就会将另一首歌推荐给你。

法律界有没有这种模式的人工智能?目前看来还没有,原因在于法律圈缺少一个记录用户行为的大数据来源。有人可能会问这么多裁判文书不是大数据吗?裁判文书确实是大数据,但更像是一种难以啃动的原始素材数据,相当于音乐软件里的海量歌曲,其本身难以被直接分析;而大量用户对裁判文书(歌曲)的评价、点赞等行为才是真正的用户大数据。用户大数据有其特定类型、具体数据,能够很容易被计算机分析,并以此辅助对原始素材的整理、分类以及各种智能化的运用。

我之前曾和Open Law的创办者聊过用户大数据的一种可能:让用户给判决书评胜负,即你认为是原告胜诉还是被告胜诉;让用户给法官评分,即判得好不好。这类大数据一旦形成,会让司法审判更有可预见性:某个类型的案件通常是如何判的,该案审判法官可能有某种倾向性,系统为你推荐擅长这个领域的律师,该律师胜诉率为多少,都可以通过大数据分析得出参考结论。

三、Type III - 大数据+特征分析+策略评估

让我们说回Alpha GO。围棋曾因为其不可穷举性,一度被认为计算机无法战胜人类中的顶尖高手。但事实证明Alpha GO已经“学会”了围棋,并战胜了人类。这个学会过程十分复杂,很难讲清。简单理解,Alpha GO做的事情其实是策略分析,利用海量棋谱(大数据)分析目前局面下(特征分析)下一步棋的最优解(策略评估)。具体来说,就是让机器学习大量棋谱,从中自动找到特征(类似于围棋定式),符合某一特征可以评几分,模拟多种策略选择其中评分最高的策略。


带着机器人去开庭_第4张图片
策略分析

法律问题也是如此复杂,无法穷尽,一度让人觉得机器无法介入。但如果参照Alphda GO的思路细想,其实法律实务中同样存在“一些特征”。美国电影《失控陪审团》一开场就讲述了双方律师在选择陪审团时,分析陪审团候选人员的背景信息,如性别、年龄、婚姻状况、工作情况等,就能敏锐地捕捉到一些特征信息,比如失业妇女有可能情绪不稳定,不适合作为本案的陪审员。资深律师一旦发现特征信息,就会直觉式地对案件有一个初步判断。同样道理,计算机如果能将这些特征纳入分析并评估,也能产生类似的“直觉感”、“大局观”。

有了特征分析之后,便可以作进一步的策略评估。美剧《POI》中第S04E11集,讲述了主角被困,人工智能(The Machine)通过监控周围敌人力量分布,并预演各种逃生可能,算出生存概率最大的逃生路线,最后帮助主角逃出层层包围的故事。

这一类型种人工智能则是否足以撼动法律工作者的饭碗?未必。我们可能忽略了一个问题——真实性。对于围棋比赛来说,是不存在真实性疑问的,落子无悔,也不可能造假,Alpha GO只要根据盘面数据直接分析即可。但是法律实务中是存在大量真实性问题的,审判质证环节就是为了解决这个真实性问题。事情真实与否,计算机很难判断,比如一份文件上的签字,律师一摸没有笔迹用力形成的痕迹,就立刻知道不是原件,真实性存疑。真实世界如此复杂,计算机怎么玩得过人类的套路,单独出来混,只有被骗的份。

想像一种可能的场景:律师通过与当事人面对面沟通、书面阅读证据材料、实地走访现场等方式获取一手信息资料并捕捉其中的细节,然后借助计算机进行策略分析,并对其中一些复杂问题进行人为修正,实其更符合真实情形,最终得出一个最优方案,着手处理。说得形象一些,就是带着机器人去开庭。以后当事人在给律师出具授权委托书时,有可能需要多委托“一位”了。

你可能感兴趣的:(带着机器人去开庭)