读算法霸权笔记06_犯罪预测

1. 犯罪预测软件

1.1. 该软件根据地区的历史犯罪数据,按小时计算最可能发生犯罪的地点

1.2. 该软件预测出的犯罪地点可被看作一块相当于两个足球场那么大的正方形区域

1.3. 如果警方在相应的时间在这些预测区域安排更多警力巡逻,那么他们就很有可能阻止犯罪的发生

1.3.1. 一年后,盗窃率下降了23%

1.4. 和其他大数据行业一样,犯罪预测软件的开发人员也忙于搜集所有能提高其模型的预测准确性的信息

1.5. 原理就借鉴自地震预测软件

1.5.1. 研究一个地区的犯罪发生情况,将其整合到已有的历史模式中,以此预测下一次该地区的犯罪事件可能发生的时间和地点

1.5.2. 如果窃贼袭击了你隔壁邻居的房子,那你也要做好准备了

1.6. 第1类犯罪

1.6.1. 包括杀人、纵火和人身侵犯

1.6.2. 这些犯罪事件通常都是必须被警方记录在案的

1.7. 第2类犯罪

1.7.1. 流浪、侵犯型乞讨、贩卖和消费少量毒品等

1.7.2. 如果不是警察就在现场,这种轻微的妨害罪通常不会被记录在案

1.7.3. 这些轻微的妨害罪在许多贫困社区都很常见

1.7.4. 在有些地方,警察称之为“反社会行为”,简称ASB

1.7.5. 在模型中囊括这些妨害罪的数据会导致预测结果发生巨大偏差

1.7.5.1. 当这些轻微犯罪被更多地记录在案时,警方的犯罪预测模型中就会出现越来越多的此类数据点
1.7.5.2. 警察将被再次派往这些轻微犯罪高发的贫困社区
1.7.5.3. 恶性循环
1.7.5.3.1. 警方自身不断制造新数据,证明了对贫困社区加大警力的合理性

1.8. 模型致力于优化资源配置

1.9. 模型并不关注个人,它关注的是地理位置

1.9.1. 从统计学上来说,“物以类聚,人以群分”是对的

1.9.2. 模型没有将种族和民族作为指标纳入其中

1.9.3. 美国监狱里则挤满了成千上万个妨害罪罪犯

1.9.3.1. 他们大多数来自贫困社区,很多是黑人或拉美族裔
1.9.3.2. 即使这类模型不关心种族因素,其结果仍然体现了种族偏差
1.9.3.3. 过度拥挤的监狱系统有巨额利润可图

1.9.4. 在存在种族隔离的城市中,地理位置是种族的一个非常有效的替代变量

1.10. 模型最擅长预测轻微犯罪

1.10.1. 实际上,在世界各地应用该类模型都将导向这个结果

1.10.2. 纳入轻微犯罪数据的模型则会“完美”地呈现出一个治安混乱的城市面貌

1.10.3. 在大多数地区,这样的犯罪地图将与该地区的贫富分布图大幅重叠

1.10.3.1. 由此得出的贫困地区犯罪率高的结论只能证实并强化社会中上层阶级的普遍观点:穷人要为自己的境遇负责,大部分坏事都是穷人干的

1.10.4. 醉汉总会在同一面墙上尿尿

1.10.5. 瘾君子总会睡在同一个公园的长椅上

1.10.6. 偷车贼或抢劫犯则总会四处走动,试图预测警察的动向

1.11. 出于最高尚的初衷的一个会自行发展的数学杀伤性武器

1.11.1. 授权了警察局锁定穷人、拦截穷人、逮捕穷人,并把其中的一部分穷人罪犯关进监狱

1.11.2. 指着地图上的贫困社区说,这就是犯罪高发地

1.11.3. 先进的大数据技术为他们一贯以来的观念赋予了精确性和“科学性”

1.11.4. 我们一边将贫困视为犯罪,一边相信我们的工具既科学又公平

2. 拦截—搜身政策

2.1. “拦截—搜身”并不完全是一种数学杀伤性武器

2.1.1. 因为该政策依赖于人的判断,并没有被程序化

2.1.1.1. 大约85%被拦截的人是非洲裔或拉美裔的年轻人
2.1.1.2. 一些被拦截的无辜民众由于对此遭遇感到过于愤怒而进行了激烈反抗,这些人最终反倒因此而被指控拒捕
2.1.1.3. 黑人男性入狱的可能性是白人男性的6倍
2.1.1.4. 被警察击毙的可能性是白人的21倍

2.1.2. 但此政策建立在一个简单却极具破坏性的算法之上

2.1.2.1. 如果基数足够大,即使命中率很小,你仍然能实现你的目标
2.1.2.2. 如果被拦截的人增加6倍,被逮捕的人也能随之增加6倍,那么成千上万无辜的人所遭受的不便和骚扰就会被认为是合理的牺牲

2.2. 政策的主要受害者少数族裔却被警方记录在案,他们中的一些人甚至因此被发配到监狱

2.2.1. 每一次逮捕都创造了新的数据,这又进一步证明了这一政策的正当性

2.3. 要求对巡逻警察的行动予以录像,这将有助于确定某次行动是否有合理根据的,并在一定程度上消除“拦截—搜身”模型的不透明性

2.3.1. 对改善不公平的治安管理体制并没有产生根本性的影响

3. 破窗理论与社会治安

3.1. 犯罪学家乔治·凯林与公共政策专家詹姆斯·威尔逊于1982年在《大西洋月刊》上发表的关于“破窗理论与社会治安”的文章

3.1.1. 反社会行为与犯罪之间存在必然联系

3.2. 低级犯罪和轻罪造就了一个混乱的社区氛围,吓走了守法的公民,留下了黑暗和空荡的街道

3.2.1. 这些地方正是滋生严重犯罪的温床

3.3. 应对办法是阻止无序的蔓延,包括修复破碎的窗户,清理涂满涂鸦的地铁车厢,采取措施阻止轻微犯罪等

3.3.1. 纽约市的警察会因为地铁逃票而逮捕孩子,甚至连在场的逃票者的朋友也全都不放过,警车会在城市里轰隆隆地行驶几个小时,直到把他们全部逮捕归案

3.4. 破窗理论引发了20世纪90年代各地的“零容忍”运动热潮

3.5. 破窗理论和零容忍运动也都分别代表了一类模型

4. 金融领域犯罪

4.1. 警察所有的培训、装备,从上岗训练到防弹背心,都只适用于小街小巷

4.1.1. 不具备开展金融领域行动的专业技能

4.2. 警察可以主动选择把关注点放在哪儿

4.2.1. 他们几乎只关注穷人

4.2.1.1. 是他们的一贯作风
4.2.1.2. 是他们自己认为的使命所在

4.3. 金融界的驱动目标是赚取巨额利润

4.3.1. 越多越好

4.4. 由于金融界拥有巨额财富和强大的游说集团,金融行业在很大程度上并不处在监管之下

4.5. 打击白领犯罪需要的是完全不同的工具和专业人才

4.5.1. 美国联邦调查局和证券交易委员会的调查组负责打击此类罪行的资金不足的小团队从几十年前就知道,银行家实际上是无懈可击的

4.5.1.1. 除了一些像庞氏骗局操作者伯纳德·马多夫这样的极端罪犯,金融家是不会被逮捕的
4.5.1.2. 这个群体在2008年的市场崩盘中几乎毫发无损,现在又能拿他们怎么样

5. 效率和公平与平等

5.1. 宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小

5.2. 无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人

5.3. 数学杀伤性武器更倾向于效率

5.3.1. 数学杀伤性武器建基于可测量和可计算的数据

5.4. 公平是模糊的,很难量化,它是一个抽象概念

5.4.1. 计算机还完全不理解公平这个概念

5.4.2. 程序员不知道该如何为公平编码,他们的老板也很少会要求他们做这件事

5.5. 公平的概念没能被编入数学杀伤性武器,这导致了大规模的、产业化的不公平

5.6. 如果你把数学杀伤性武器想象成工厂,那么不公平就是那些从烟囱里冒出来的黑色排放物。这些黑色排放物是有毒的

5.7. 正义的关键是平等

5.7.1. 正义不能仅仅由社会的一部分人强加给另一部分

5.8. 被拦截、被指控、被逮捕归案并被记录到司法系统中,并不意味着“拦截—搜身”政策或犯罪预测模型所造成的恶性循环就此结束

5.8.1. 不公平的治安管理体系所产生的不公正的数据现在都集中到了这一模型中

5.8.2. 比起刑满释放后回到富人区的金融诈骗犯,刑满释放后回到穷困社区的罪犯再次触犯法律的可能性也更高,这是毫无疑问的

5.9. 刑事司法系统不去分析监狱、优化监狱,而是把监狱隐藏起来,把它变成一个黑盒子

5.9.1. 坚持一个依据可疑却不容置疑的假设,即高风险囚犯的囚禁时间越长,我们就越安全

5.9.2. 如果有研究旨在推翻这种假设,那么这种研究很容易就被忽视了

5.9.3. 在得克萨斯州哈里斯县,服刑时间越长,囚犯在获释后找不到工作的可能性就越大,因此他们就需要更多的食品券和其他的公共援助,而且更可能会犯下更多的罪行

5.10. 和罪犯生活在同一街区的无辜人士则因此遭受了极为不公的对待

5.10.1. 由于贫困和犯罪记录之间的紧密联系,穷人将继续受困于这些数字法网难以逃脱,而未受影响的大多数则不愿意花时间考虑这个问题

6. 数据实验室

6.1. 亚马逊有一个数据实验室

6.1.1. 专注于开发一种“再犯”模型

6.1.1.1. 希望人们反复来此网站购物
6.1.1.2. 会锁定“再犯者”,并鼓励“再犯”

6.2. 亚马逊会更频繁地针对这些人投放广告,比如经常给他们提供购物折扣

6.2.1. 如果该营销策略起效,那么这些有较高再犯分数的人就会重新购物

6.2.2. 营销结果似乎证实了亚马逊评分系统的合理性

6.3. 如果公司希望查明什么是驱使消费者再次购物的因素,数据实验室就会着手对此问题进行研究

6.4. 数据科学家不仅关注用户的地理位置和教育水平,还会考察其对于整个亚马逊销售平台的用户体验

你可能感兴趣的:(读算法霸权,算法,模型,算法霸权,数据实验室,数据科学)