点击左上方蓝字关注我们
01
「百度@了所有车企」:Apollo自动驾驶商用上岗,欢迎上车
1月25日,由威马汽车主办的“WeLab威马科技开放日”在上海举行,搭载百度Apollo AVP自主泊车方案的威马W6亮相。
场景明确,功能刚需。
车主平常最头疼的停车、找车位,以及停车入位,从威马W6开始,这些事都不会成为麻烦——一切交给了AI司机。
国内品牌实现量产级L4,威马W6是首例。
而这不光是这个品牌本身抢占先机,更是它身后的技术、新商业模式的第一次示范性证明。
广汽、长城……等等传统OEM的类似产品能力上岗,只会是时间问题。
因为,在它们背后同时提供技术支持的,都是百度Apollo自动驾驶。
信息来源:量子位
02
堪比当年的LSTM,Transformer引燃机器学习圈:它是万能的
谷歌研究科学家 David Ha:Transformer 是新的 LSTM。
2017 年 6 月谷歌发布论文《Attention is All You Need》时,我们或许都没有意识到它提出的 Transformer 架构将带来多少惊喜。
在诞生至今不足四年的时间里,Transformer 不仅成为自然语言处理领域的主流模型(基于 Transformer 的预训练语言模型成为主流),还开始了向其他领域的跨界,近几个月来出现了大量将 Transformer 应用于计算机视觉领域的研究。
2020 年 10 月,谷歌提出了 Vision Transformer (ViT),可以直接利用 transformer 对图像进行分类,而不需要卷积网络。ViT 模型取得了与当前最优卷积网络相媲美的结果,但其训练所需的计算资源大大减少。
2020 年 12 月,复旦、牛津、腾讯等机构的研究者提出了 SEgmentation TRansformer(SETR),将语义分割视为序列到序列的预测任务,该模型在 ADE20K 上排名第一,性能优于 OCNet、GCNet 等网络。
2021 年 1 月初,OpenAI 又连放大招 ,用 DALL·E 和 CLIP 打破了自然语言与视觉的次元壁。两个模型都利用 Transformer 达到了很好的效果,前者可以基于本文直接生成图像,后者则能完成图像与文本类别的匹配。
由此,「Transformer 是万能的吗?」成为了近期机器学习社区的热门话题。谷歌大脑研究员 David Ha 发推表示:Transformer 是新的 LSTM。
他否定了自己在 2017 年 5 月发表的言论:「LSTM 就像神经网络中的 AK47。不管我们多么努力地想用新事物取代它,都是白费力气。从现在起它还将应用 50 年。」LSTM 由 Sepp Hochreiter 和 Jürgen Schmidhuber 于 1997 年联合提出,当时已诞生 20 年。
David Ha 不会想到,这句预言被一个月后出现的 Transformer 打破,而这仅用了 4 年时间。
信息来源:机器之心
03
Github Star 突破10K!超级好用的OCR数据合成与半自动标注工具,强烈推荐!
OCR方向的工程师,一定需要知道这个OCR开源项目:PaddleOCR。
短短几个月,累计Star数量已超过10K!!!频频登上Github Trending 日榜月榜,称它为 OCR方向目前最火的repo绝对不为过。
最近,它又带来四大新发布与升级:
核心内容先睹为快:
全新发布数据合成工具Style-Text:可以批量合成大量与目标场景类似的图像,在多个场景验证,效果均提升15%以上。
全新发布半自动数据标注工具PPOCRLabel:有了它数据标注工作事半功倍,相比labelimg标注效率提升60%以上,社区小规模测试,好评如潮。
多语言识别模型效果升级:在开源测试集评估,中文、英文、韩语、法语、德语、日文识别效果均优于EasyOCR。
PP-OCR开发体验再升级:支持动态图开发(训练调试更方便),静态图部署(预测效率更高),鱼与熊掌可以兼得。
PaddleOCR历史表现回顾
先看下PaddleOCR自去年6月开源以来,短短几个月在GitHub上的表现:
6月,8.6M超轻量模型发布,GitHub Trending 全球趋势榜日榜第一。
8月,开源CVPR2020顶会SOTA算法,再上GitHub趋势榜单!
10月,发布PP-OCR算法,开源3.5M超轻量模型,再下Paperswithcode 趋势榜第一
这个含金量,广大的GitHub开发者们自然懂。
3.5M超超轻量模型的效果图大家直接看,绝对杠杠的。
火车票、表格、金属铭牌、翻转图片、外语都是妥妥的。
3.5M的模型能达到这个识别精度,绝对是良心之作了!
传送门:
https://github.com/PaddlePaddle/PaddleOCR
信息来源:飞桨PaddlePaddle
04
19款国产手机无一幸免:15分钟破解人脸识别,打印眼镜让刷脸形同虚设
你的新手机不错,借我刷一下脸?
人脸识别技术在智能手机上已经是标配,今天的我们刷脸解锁、刷脸支付就像吃饭喝水一样自然,以至于疫情期间戴口罩无法解锁手机时,我们会感到很不习惯。
在享受便利的同时,却鲜有用户去关心安全问题。虽然手机厂商往往会在发布手机的时候宣称「破解人脸识别的几率低至百万分之一」,但双胞胎解锁对方手机的事情仍然偶尔会上新闻。
最近一段时间,来自清华的 RealAI(瑞莱智慧)向我们展示了一项更为简单的攻击技术…… 在一副眼镜的攻击下,19 款使用 2D 人脸识别的国产安卓手机无一幸免,全部被快速破解。
具体来说,RealAI 团队选取了 20 款手机做了攻击测试,覆盖不同价位的低端机与旗舰机。
测试者佩戴了一副含有对抗样本图案的眼镜,制作这副眼镜的成本很低:借用一台打印机,加上一张 A4 纸。
对抗眼镜。
最终,除了一台 iPhone11,其余安卓机型全部解锁成功,完成整个破解过程只花了 15 分钟。攻击测试人员成功解锁手机后,任意翻阅机主的微信、信息、照片等个人隐私信息,甚至还可以通过手机银行等个人应用 APP 的线上身份认证完成开户。
RealAI 团队表示,这一攻击测试主要利用了人工智能算法存在的「对抗样本」漏洞,但不同于之前的攻击尝试主要在实验环境下进行,而这次手机的攻击测试则佐证了这一安全漏洞的真实存在性。
RealAI 表示,这是世界唯一通过 AI 对抗样本技术攻破商用手机人脸解锁的案例。
更为严重的问题在于,这一漏洞涉及所有搭载人脸识别功能的应用和设备,一旦被黑客利用,隐私安全与财产安全都将受到威胁。
信息来源:机器之心
05
再夺AI专业全球冠军!清华力压CMU夺得CSRankings高校AI领域第一
每次CSRankings更新,都会引发舆论大哗。
今年这个让大家关注的排名终于又更新了!全球院校计算机科学领域实力排名开源项目CSRankings,更新了2020-2021年的最新数据。
最新排名显示:
AI(含5项细分领域)排名中,清华大学排名第一,北京大学排名第二,CMU排名第三。
而AI中的「Artificial intelligence」一项,北京大学排名第一,中科院第二,清华第三。
CSRankings(Computer Science Rankings):是由马萨诸塞大学安姆斯特分校(University of Massachusetts Amherst)信息与计算机科学学院教授Emery Berger发布的基于研究指标(全球各机构的学者在各顶级学术会议上发表的论文)的全球顶尖计算机科学机构排名。
信息来源:新智元
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END