随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)

随机森林算法预测法官判决,准确度优于人类水平

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第1张图片
1

近日,Science 报道了一种利用最高法院数据库和随机森林算法构建的法官判决预测系统,该系统在判决预测上甚至要比法律专家还准得多。以前机器之心就曾对话过首个致力于法律服务的人工智能创业公司 Ross Intelligence,这一次是人工智能应用于法律的新进展。

「最高法院见!」唐纳德·特朗普总统在上周为回应地方法院对国家安全政策的看法而发推文这样说。但把这样一个案件直接递送到最高法院是一个好主意吗?人工智能可能会很快就给出答案。一项新研究表明,即使在信息比较少的情况下,计算机也能比法律学者更好地预测最高法院的判决。

还有其他一些研究也通过算法预测法官的判决行为。例如在 2011 项目中,其使用了 1953 年到 2004 年任意八名法官的投票来预测同一个案件下第九名法官的判决,该系统实现了 83% 的准确度。而另一篇 2004 年发表的论文通过使用 1994 年以来一直在法院工作的法官及其判决来预测 2002 年案件的判决结果,该系统实现了 75% 的准确度。

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第2张图片
1-

ggimage:ggplot2中愉快地使用图片

本文介绍了ggimage包,允许在ggplot2作图时嵌入图片,并支持aes映射,可以把离散型变量映射到不同图片。目前有几个包可以使用图片嵌入做图,但都是针对特定的场景,这里使用ggimage来展示在这些特定领域里的应用,ggimage的设计是通用的,并不被特定场景所限定,文末又介绍了用R图标来画出R、用饼图来画气泡图等实例。

R 基础图形库(base graphics)可以在做图的时候嵌入图片,使用的是graphics::rasterImage。

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第3张图片
2

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第4张图片
2-


回归分析中的问题和修正的探讨 (上篇)

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第5张图片
3

回归分析 Regression Analysis 有四大常见问题, 多重共线性, 异方差, 自相关, 变量误差。 上篇对前两大问题进行了简述。

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第6张图片

多重共线性是指回归模型中的两个或多个自变量高度相关的情况,使得它难以或不可能分离出单个变量对因变量的影响。 对于多重共线性,即使R^2 (决定系数)可能“过高”,估计的OLS系数可能在统计学上不显著(甚至具有错误的信号)。 通过收集更多的数据,利用先验信息,转换函数关系,或者舍弃高共线变量中的一个,有时可以克服或减少多重共线性。

随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第7张图片
3-

以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注 Datartisan 数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!


随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10)_第8张图片

你可能感兴趣的:(随机森林算法预测法官判决,准确度优于人类水平丨数据工匠简报(May. 10))