MIT团队:开发自动化假新闻检测器|技术前沿洞察

640?wx_fmt=jpeg

硅谷Live / 实地探访 / 热点探秘 / 深度探讨


随着人工智能、5G、区块链等技术越来越多出现在我们的科技新闻当中,到底这些技术的最新进展如何?学界、产业界都是如何对技术前沿进行探索的?


无论是开发假新闻探测器,还是辅助医生进行诊断,又或者是如何让 5G 延迟减半。今天密探带大家来看看,从麻省理工学院到电信巨头,从高校到企业,近期的技术新进展!


5G技术动态


Verizon:边缘计算将5G延迟减半


根据 Telecoms 报道,美国电信巨头 Verizon 已成功完成利用边缘计算将 5G 延迟削减一半的测试。


5G 旨在减少前一代无线通信技术的延迟,这就意味着需要减少信息进行往返的时间。延迟的减少,将为视频游戏,实时VR甚至远程手术等应用开辟一系列可能性。(5G应用场景可参考密探此前相关文章:远程做手术、实现自动驾驶……5G如何影响这五大行业?)


近日,Verizon工程师将 Multi-access Edge Compute(MEC,多路边缘计算)设备和 MEC 平台软件安装到更靠近网络边缘的网络设施中。他们希望证明,减少某个无线设备与正跑着该设备的应用程的计算设备之间的距离可以提高性能。


对于他们的测试,Verizon 使用了一款面部识别应用程序。测试证明,在网络边缘分析数据,与使用传统的集中式数据中心进行分析相比,这个应用识别个体的速度提高了一倍。


Verizon 网络规划高级副总裁 Adam Koeppe 说:


“对于需要低延迟的应用程序,向中心化的云发送和接收大量数据已不再适用。数据处理和管理需要更接近用户。MEC 将应用程序的运算、存储和管理转移到无线接入网络的边缘,以提供所需的低延迟体验,从而实现新的颠覆性技术。应用程序数据处理地点的转变,5G 更有效的传递数据的能力,以及使用毫米波波段,对于我们未来的通信场景都是至关重要的。”


Verizon 的试验是在德克萨斯州休斯顿的5G测试平台进行的。不过,他们并没有提供确切的延迟结果。


同时,他们的竞争对手也开始测试边缘计算。 AT&T最近在硅谷开设了一个边缘计算测试平台,并正与Linux基金会合作开发一个支持它的软件项目。


A10 Networks:如何对抗针对5G网络的威胁


5G 技术在带来更快的网速,更低的延迟,以及更大的覆盖范围的同时,也会带来新的网络安全风险。举例而言,随着更多强大的智能设备上线,承载这些设备的网络将具有更大的攻击面,这使得他们成为 DDoS 攻击的目标。近期,A10 Networks发布了一份报告,强调了去年 DDoS 武器化增长的主要观察结果,以下是总结的一些要点:


1、放大武器


攻击者利用UDP(用户数据报协议)中的漏洞来欺骗获取目标的IP地址,并利用启动反射响应的服务器中的漏洞。此策略通过生成远大于初始请求的服务响应来放大攻击。


2、DDoS僵尸网络武器


攻击者会利用恶意软件感染的计算机,服务器和越来越多的物联网设备,这些设备由僵尸牧民控制,通常来自DDoS-for-hire服务(受雇DDoS服务)。生成的僵尸网络用于启动有状态和无状态的体积网络和应用程序攻击。


3、武器的主要来源


虽然DDoS攻击的性质是分布式的,但数据显示,高度集中的DDoS武器来自最密集的互联网连接人群。中国4,374,660例,其次是美国3,010,039例。报告还强调,DDoS武器在云端托管的趋势越来越明显。这归因于移动设备的涌入和云的日益普及。


这些观察突出了当下企业面临的挑战。企业DDoS防御的重点应始终放在用户身上。毕竟,当关键服务的访问暂停时,员工会选择回家或使用不安全的方法。企业需要全面、经济的防御,以确保服务可用并保护用户。这就是采用弹性和复杂的双管DDoS防御(two-pronged DDoS defense)以及威胁智能(threat intelligence)解决方案对于抵抗攻击最有效的地方。


4、威胁智能


先进的DDoS威胁情报与实时威胁检测和自动签名提取相结合,使企业能够抵御最大规模的多向攻击。可操作的DDoS威胁智能通过对当前精准的DDoS僵尸网络IP地址和这些类型的攻击中常用的易受攻击的服务器创建黑名单,来实现主动的DDoS防御。


如果想要获取完整报告,链接在此:https://www.a10networks.com/resources/ebooks/state-ddos-weapons


人工智能领域动态


MIT:机器学习辅助医生做诊断


据麻省理工学院(MIT)新闻报道,本校研究人员已经开发出一种机器学习模型,可以读取并学习多种类型的、看似并不相关的患者的健康数据,并合成为一份相对较为完整的健康数据报告,以辅助医生对患者作出诊断。


“预测分析”领域为许多医疗保健应用带来了希望。通过数据学习——预测——分析的方式,可以训练机器学习模型寻找患者数据中的固定模式,从而预测患者在 ICU 中患病或死亡的风险,协助病患的护理,或为设计更安全的化疗方案提供参考。


由于患者的数据有很多不同的来源,而且通常是不完整的,若要获得有效的诊断辅助数据,机器学习模型需要分析所有可以找到的可用数据。但是,大多数机器学习模型都无法处理高度复杂的数据,或者是无法捕捉到不同健康变量之间关系的相关性,例如呼吸模式如何帮助预测睡眠时间或疼痛程度等等。


在一篇即将在 AAAI 人工智能会议上发表的论文中,MIT 研究人员提出,他们研究出了一个单一的神经网络,它在输入简单和高度复杂的数据后,使用已知变量,填写所有缺失的变量。 比如,根据来自患者的心电图(ECG)信号(测量心脏功能和自我报告的疲劳水平)的数据,该模型可以预测患者的疼痛水平,患者可能不记得或正确报告。


该模型将各种子模型拼接在一起,而每个子模型被赋予以描述变量之间的特定关系。 子模型在进行预测时共享数据,并最终输出预测的目标变量。 “在我们这个模型网络中,各个子模型可以相互沟通,所以我们从不同类型的数据中获得的信息,可以预测我们不知道的东西”,该论文的主要作者 Hao Wang,一位计算机科学与人工智能实验室(CSAIL)的博士后说。 “如果我们需要八种不同类型的病患数据,并且目前这位病人只有其中七项的数据信息,利用模型之间的沟通,我们也可以填补这位病人在第八项数据中的空白部分。”


MIT团队:开发自动化假新闻检测器


麻省理工学院的一个团队发表了一篇题目为The Language of Fake News: Opening the Black-Box of Deep Learning Based Detectors的论文,揭示了机器学习模型捕捉真新闻与假新闻语言中的微妙但一致的差异的方法。 该研究还对假新闻探测器应如何进行更严格的测试作出了解释。


随着社交网络的发展,虚假新闻越来越成为让人们头疼的事情。为了解决这一问题,研究人员开始开发自动化假新闻检测器——用神经网络对从大量数据进行“学习”和预测,以识别指示虚假文章的语言线索。


然而,在这里有一个“黑匣子”问题——没有人知道深度学习在自我学习、分析期间的所接触的到语言模式是怎样的。我们看不见深度学习所习得的内容,也无法了解其每一步的学习进程。


在会议和神经信息处理系统研讨会上发表的一篇论文中,MIT 的研究人员解决了这两个问题。 他们开发了一种深度学习模型,学习如何检测虚假和真实新闻的语言模式。他们的部分研究“破解”了深度学习的黑匣子,即找出此模型捕获的单词和短语,并对这些内容进行预测和分析。


除此以外,他们还将此模型在它没有接触过的话题上进行训练。这种方法基于语言模式对单一文章进行分类,从而与真实世界的新闻读者们所接触到的应用软件更接近。传统的假新闻检测器往往基于文本结合源信息对文章进行分类,例如维基百科页面或网站等。


“在我们的研究中,我们想要了解仅仅基于语言,人工智能在分类时的决策过程是什么样的,因为这可以提供我们关于假新闻语言的见解,”论文共同作者Xavier Boix,Tomaso Poggio实验室的博士后说。


“在机器学习和人工智能的研究中,有一个关键问题——机器学习给了你答案,但你不知道为什么会得到这个答案,”论文第一作者Nicole O'Brien说,他是一名在校研究生。 “展示这些内部工作,是迈向了解基于深度学习的假新闻探测器是否可靠的第一步。”


该模型检测了在真实或虚假新闻中出现频次高的词汇集合——有些可能是显而易见的,有些则是不容易察觉的。研究人员表示,从研究结果可以看出,虚假新闻喜欢用夸张或最高级的形容词,然而真实新闻则倾向于使用相对保守的词语。


想要查看完整论文,地址在此:https://cbmm.mit.edu/sites/default/files/publications/fake-news-paper-NIPS.pdf


MIT和微软合作,提高自动驾驶领域安全性


麻省理工学院和微软研究人员开发了一种新型的机器学习模型,这种模型可以检测出自动驾驶车辆的训练材料和现实世界有哪些出入。这样一来,工程师就可以使用该模型来提高无人驾驶车辆和自动机器人等人工智能系统的安全性。


无人驾驶车所使用的 AI 系统,通常都是在模拟了几乎所有真实世界可能发生的情况的这种虚拟仿真的环境中训练的。然而,这些无人车在真实世界行驶时,常会因为各种各样的突发情况而出现错误。


比如,当一辆传感器不全的无人驾驶车行驶在道路上,它很难区分带有红色灯光的大型白色面包车与闪着警报红光的救护车的区别,不知道是否要减速或停在路边,从而造成事故。


在去年的Autonomous Agents and Multiagent Systems会议,以及即将召开的人工智能促进会议上发表的一篇论文中,研究人员描述了一个利用手动输入来找出这些 AI 训练“盲点”的模型。


与传统方法一样,研究人员通过模拟训练设置了 AI 系统。但是,当该系统在真实世界中使用时,人们密切监视系统的行为,并在系统制造或即将发生任何错误时,立刻提供反馈。然后,研究人员将训练数据与人工反馈数据相结合,并使用机器学习技术生成一个模型,该模型可以精确指出AI系统最有可能需要“人工指导”的情况。


“这个模型可以帮助 AI 系统更好地了解他们不知道的东西,”论文第一作者Ramya Ramakrishnan说,他是计算机科学和人工智能实验室的研究生。 “很多时候,当部署这些系统时,他们的仿真模拟与现实环境不匹配,因而AI系统可能会犯错误,例如发生事故等等。 我们的想法是提前在安全的环境下,用人工反馈将仿真环境与现实世界相连接,从而降低真实使用时事故发生率。”


想要查看完整论文,地址在此http://interactive.mit.edu/sites/default/files/documents/Ramakrishnan_AAAI_2019.pdf


UCSF:如何更快地用AI诊断阿尔兹海默症


加利福尼亚大学旧金山分校(UCSF)的一个研究小组正在展示深度学习和数据结合的强大程度——以及这项研究对改善医疗保健系统的潜力。这次,针对的是我们通俗叫做“老年痴呆症”的阿尔茨海默病。


通过机器学习,在使用来自 1000 名阿尔茨海默病患者的 2000 多张脑图像训练深度学习算法后,UCSF 这个团队在最终诊断时平均提前75个月检测到疾病,灵敏度达到100%。这意味着,能比医生对阿尔茨海默病患者的诊断早了六年。


这些数据来自于阿尔茨海默病神经影像学倡议组织(ADNI),90%的ADNI图像进行训练,而10%的图像用于验证。该团队还利用TensorFlow和Keras深度学习库以及Google的Inception神经网络架构进行图像分类和检测。


此次研究者包括 UCSF 的助理教授Dexter Hadley,其母亲就是一位阿尔兹海默症患者。Hadley 希望,深度学习可以成为早期发现多种疾病的答案。例如还有乳腺癌。


区块链技术动态


苏黎世大学研究人员:如何阻止黑客将比特币分成两部分


黑客可以把比特币分成两部分。根据2017年的研究,这甚至不是一件难事。由于支持互联网的技术的不安全性,拥有足够能力的人可以利用边界网关协议(BGP)伪造他们的身份并误导网络发送洪水数据到不当的地方。这被称为 “互联网上最大的安全漏洞”,并且已被用于从窥探政府电子邮件到窃取加密货币等各方面。


就分裂比特币而言,这样的攻击如果成功执行,网络的一部分将完全切断另一部分。没有人可以与作为“其他”网络一部分的人进行通信和发送交易。这就是来自著名的瑞士苏黎世大学的研究人员希望提供帮助的地方。


如新白皮书所述,他们发明了一种名为 SABRE 的中继网络,并希望有一天能够建立在比特币之上。与拿破仑时代常见的弯曲刀片同名,SABRE听起来像是用来将比特币切成两半。相反,它希望做的事情是对即将发生的攻击者使用军刀,将其阻止。


SABRE 是一个由一个实体管理的网络,为比特币节点提供了一个“额外的安全通道”,用于在网络中移动区块。该网络由各种节点组成,这些节点具有公知的IP地址(允许其他节点查找并连接到它们的ID号)。这样,任何比特币节 点都可以连接到它们。并且比特币节点仅需要连接到其中一个节点以利用其保持与其他节点连接的能力。


Eth Zurich 计算机网络研究员Maria Apostolaki说:“SABRE 是一个小型中继网络,其节点的战略位置使得它们保持相互连接并连接到尽可能多的常规节点,即使存在劫持流量的AS级攻击者。” 她说,这个网络将“使分区失效”。


研究人员声称,当使用 SABRE 时,分裂的风险会下降。如果没有SABRE,ISP 可能只用“小”路由攻击就能攻击和分区比特币。但是,根据研究人员对一组五个节点的模拟,攻击者劫持网络并对其进行分区的可能性仅为3.1%。随着节点数量的增加,概率也会降低。


本周的技术前沿就先到这里,大家还希望了解什么技术动态和科技前沿的趋势呢?欢迎告诉小探!


(文章头图来自the Atlantics,版权属于原作者)



推荐阅读

640?wx_fmt=jpeg

区块链报告 | 脑机接口报告 

硅谷人工智能 | 斯坦福校长

卫哲 | 姚劲波 | 胡海泉 

垂直种植 | 无人车

王者荣耀 | 返老还童 



640?wx_fmt=jpeg

你可能感兴趣的:(MIT团队:开发自动化假新闻检测器|技术前沿洞察)