ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。
对于近日网传的乐视400名员工过着『没有老板的神仙日子』,乐视给出了官方回应,确实400人,确实没有996,确实没内卷,确实五年从未拖欠过工资和社保,确实营收还行,甚至在考虑四天半工作制了。
乐融致新CEO张巍表示,乐视视频和乐视电视都有各自的会员和广告收入,这是持续多年的传统收入,乐视视频目前还有与其他第三方合作的MCN、小程序等收入,乐视电视有智能硬件收入等。
https://www.autoregex.xyz/
正则表达式模式复杂,编写和理解都超有难度(谁写谁知道)。这个网站借助NLP(Natural Language Processing,自然语言处理)技术,可以将日常英语生成正则表达式,也可以对正则表达式进行英文解释。
https://github.com/massCodeIO/massCode
massCode 为三栏式的界面,第一栏显示储存片段所在的应用程序库,第二栏显示当前位置的所有代码段,第三栏是代码编辑器。massCode 灵感来自于 SnippetsLab 和 Quiv,并持续吸收各类应用的优点,目前GitHub已经 2.5k Star 啦!
https://github.com/pocketbase/pocketbase
PocketBase 是一个开源后端,由嵌入式数据库 SQLite 组成,具备实时订阅、内置用户管理、仪表盘 UI 和简单的 REST-ish API 等功能。PocketBase 既可以作为独立应用程序上手即用,也可以作为 Go框架/工具包实现自定义的业务逻辑。GitHub 5.7k Star!
https://github.com/stoneatom/stonedb
StoneDB 是一个兼容 MySQL 的高性能混合交易/分析处理(HTAP)数据库,为 MySQL 提供了分析处理(AP)能力。运行中的系统可以不改变任何代码、无缝迁移到 StoneDB。
https://github.com/HaisenbergPeng/ROLL
ROLL 提出了基于LOAM的全局匹配模块(其中包含了临时地图)。这可以防止在场景变化较大或地图覆盖不足的地区出现定位失败。并且一旦匹配再次可靠,临时地图可以被合并到全局地图上。
https://github.com/ExpressAI/AI-Gaokao
Gaokao Benchmark 旨在跟踪 human-level intelligence 实现的研究和进展,全面评估各任务/领域,并提供多样化的人类表现,这使得人工智能系统与人类表现的直接比较更为便捷。
https://github.com/zhengjingwei/machine-learning-interview
https://ona-book.org/ , https://github.com/keithmcnulty/ona_book
Keith McNulty 在《Handbook of Graphs and Networks in People Analytics》 书中描述了网络分析技术一个有趣的应用方向——组织管理。网络分析将个人之间看似简单的对偶关系编织成一个完整的社会结构,并可以通过分析和应用网络数据来应对组织挑战。
作者做了大量努力,使得数据和代码变得简单生动——只阐述最重要的理论、大量的示例数据集和代码片段、可视化图表等。作者对于网络分析在组织中的应用方向,也非常激动人心——新员工入职、鼓励多样化的合作、寻找有效的沟通策略、确定更好的组织结构、寻找潜在的领导者等等。
https://github.com/ziqihuangg/CelebA-Dialog
CelebA-Dialog 是一个大规模的视觉-语言面部数据集。面部图像上有丰富的细粒度标签,根据其语义将一个属性划分为多个等级。每张图片也都有描述属性的标题和用户要求的样本。
可以点击 这里 回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2021.01.13『机器学习』 MLGO: a Machine Learning Guided Compiler Optimizations Framework
- 2022.07.05『计算机视觉』 Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Segmentation
- 2022.07.05『代码生成』 CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning
- Meta AI 2022『自然语言处理』 No Language Left Behind: Scaling Human-Centered Machine Translation
论文标题:MLGO: a Machine Learning Guided Compiler Optimizations Framework
论文时间:13 Jan 2021
所属领域:机器学习
论文地址:https://arxiv.org/abs/2101.04808
代码实现:https://github.com/google/ml-compiler-opt
论文作者:Mircea Trofin, Yundi Qian, Eugene Brevdo, Zinan Lin, Krzysztof Choromanski, David Li
论文简介:Leveraging machine-learning (ML) techniques for compiler optimizations has been widely studied and explored in academia./在学术界,利用机器学习(ML)技术进行编译器优化已被广泛研究和探索。
论文摘要:在学术界,利用机器学习(ML)技术进行编译器优化已被广泛研究和探索。然而,在通用的、具有工业实力的编译器中采用ML还没有发生。我们提出了MLGO,一个将ML技术系统地整合到工业编译器–LLVM中的框架。作为一个案例研究,我们介绍了用机器学习模型取代LLVM中基于启发式的内联优化的细节和结果。据我们所知,这项工作是第一次在现实世界的复杂编译器中全面整合ML。它可以在LLVM的主资源库中找到。我们使用两种不同的ML算法。梯度策略和进化策略,来训练针对大小的内联模型,与最先进的LLVM-Oz相比,实现了高达7%的大小减少。在一个语料库上训练出来的同一个模型,可以很好地推广到现实世界的各种目标,以及经过几个月的积极开发后的同一组目标上。训练过的模型的这一特性有利于在现实世界的环境中部署ML技术。
论文标题:Efficient Spatial-Temporal Information Fusion for LiDAR-Based 3D Moving Object Segmentation
论文时间:5 Jul 2022
所属领域:计算机视觉
对应任务:Autonomous Driving,Semantic Segmentation,无人驾驶,语义分割
论文地址:https://arxiv.org/abs/2207.02201
代码实现:https://github.com/haomo-ai/motionseg3d
论文作者:Jiadai Sun, Yuchao Dai, Xianjing Zhang, Jintao Xu, Rui Ai, Weihao Gu, Xieyuanli Chen
论文简介:We also use a point refinement module via 3D sparse convolution to fuse the information from both LiDAR range image and point cloud representations and reduce the artifacts on the borders of the objects./我们还通过三维稀疏卷积使用了一个点细化模块,以融合来自LiDAR测距图像和点云表示的信息,并减少物体边界上的伪影。
论文摘要:准确的移动物体分割是自主驾驶的一项重要任务。它可以为许多下游任务提供有效信息,如避免碰撞、路径规划和静态地图构建。如何有效地利用空间-时间信息是三维激光雷达移动物体分割(LiDAR-MOS)的一个关键问题。在这项工作中,我们提出了一个新的深度神经网络,利用LiDAR扫描的空间-时间信息和不同的表示方式来提高LiDAR-MOS的性能。具体来说,我们首先使用基于范围图像的双分支结构来分别处理可从连续LiDAR扫描中获得的空间和时间信息,然后使用运动引导的注意力模块将它们结合起来。我们还通过三维稀疏卷积使用了一个点细化模块,以融合来自LiDAR测距图像和点云表示的信息,并减少物体边界上的伪影。我们在SemanticKITTI的LiDAR-MOS基准上验证了我们提出的方法的有效性。我们的方法在LiDAR-MOS IoU方面明显优于最先进的方法。受益于所设计的从粗到细的架构,我们的方法在传感器帧速率下在线运行。我们的方法的实现作为开放源码可在以下网站获得:https://github.com/haomo-ai/MotionSeg3D
论文标题:CodeRL: Mastering Code Generation through Pretrained Models and Deep Reinforcement Learning
论文时间:5 Jul 2022
所属领域:代码生成
对应任务:Code Generation,Pretrained Language Models,Program Synthesis,reinforcement-learning,代码生成,预训练语言模型,程序合成,强化学习
论文地址:https://arxiv.org/abs/2207.01780
代码实现:https://github.com/salesforce/coderl,https://github.com/salesforce/codet5
论文作者:Hung Le, Yue Wang, Akhilesh Deepak Gotmare, Silvio Savarese, Steven C. H. Hoi
论文简介:To address the limitations, we propose “CodeRL”, a new framework for program synthesis tasks through pretrained LMs and deep reinforcement learning (RL)./为了解决这些限制,我们提出了 “CodeRL”,一个通过预训练的LM和深度强化学习(RL)来完成代码生成任务的新框架。
论文摘要:程序合成或代码生成的目的是生成一个满足问题规范的程序。最近使用大规模预训练语言模型(LMs)的方法已经显示出有希望的结果,但它们有一些关键的限制。特别是,它们通常遵循标准的监督微调程序,仅从自然语言问题描述和真实程序对中训练代码生成模型。这种模式在很大程度上忽略了问题描述中一些重要但潜在有用的信号,如单元测试,因此在解决复杂的未见过的编码任务时,往往导致性能不佳。为了解决这些限制,我们提出了 “CodeRL”,这是一个通过预训练的LM和深度强化学习(RL)进行程序合成任务的新框架。具体来说,在训练过程中,我们将编码生成的LM视为一个actor网络,并引入一个critic网络评估,该网络经过训练,可以预测生成程序的功能正确性,并向actor提供密集的反馈信号。在推理过程中,我们引入了一个新的生成程序,该程序具有临界抽样策略,允许模型根据来自实例单元测试和critic评估分数的反馈自动重新生成程序。对于模型骨干,我们扩展了CodeT5的编码器-解码器架构,增强了学习目标、更大的模型规模和更好的预训练数据。我们的方法不仅在具有挑战性的APPS基准上取得了新的SOTA结果,而且在较简单的MBPP基准上也显示了强大的零样本迁移学习能力,取得了新的SOTA结果。
论文标题:No Language Left Behind: Scaling Human-Centered Machine Translation
论文时间:Meta AI 2022
所属领域:自然语言处理
对应任务:Machine Translation,Translation,机器翻译
论文地址:https://research.facebook.com/publications/no-language-left-behind/
代码实现:https://github.com/facebookresearch/fairseq
论文作者:Marta R. Costa-jussà, James Cross, Onur Çelebi, Maha Elbayad, Kenneth Heafield, Kevin Heffernan, Elahe Kalbassi, Janice Lam, Daniel Licht, Jean Maillard, Anna Sun, Skyler Wang, Guillaume Wenzek, Al Youngblood, Bapi Akula, Loic Barrault, Gabriel Mejia Gonzalez, Prangthip Hansanti, John Hoffman, Semarley Jarrett, Kaushik Ram Sadagopan, Dirk Rowe, Shannon Spruit, Chau Tran, Pierre Andrews, Necip Fazil Ayan, Shruti Bhosale, Sergey Edunov, Angela Fan, Cynthia Gao, Vedanuj Goswami, Francisco (Paco) Guzmán, Philipp Koehn, Alexandre Mourachko, Christophe Ropers, Safiyyah Saleem, Holger Schwenk, Jeff Wang
论文简介:Driven by the goal of eradicating language barriers on a global scale, machine translation has solidified itself as a key focus of artificial intelligence research today./在消除全球范围内的语言障碍这一目标的驱动下,机器翻译已经巩固了自己作为当今人工智能研究的一个关键焦点。
论文摘要:在消除全球范围内的语言障碍这一目标的驱动下,机器翻译已经成为当今人工智能研究的一个关键焦点。然而,这些努力都是围绕着一小部分语言进行的,而把绝大多数低资源的语言抛在了后面。要打破200种语言的障碍,同时确保安全、高质量的结果,并将道德因素牢记于心,这需要什么呢?在 "不落下任何一种语言 "中,我们接受了这一挑战,首先通过对母语人士的探索性访谈,将低资源语言翻译支持的需求情境化。然后,我们创建了数据集和模型,旨在缩小低资源语言和高资源语言之间的性能差距。更具体地说,我们开发了一个基于稀疏门控专家混合的条件计算模型,该模型是在使用为低资源语言量身定做的新颖有效的数据挖掘技术获得的数据上进行训练的。我们提出了多种架构和训练方面的改进,以便在对数千项任务进行训练时抵制过度拟合。关键是,我们使用人类翻译的基准,Flores-200,评估了超过40000个不同翻译方向的性能,并将人类评估与涵盖Flores-200中所有语言的新型基准相结合,以评估翻译安全性。我们的模型相对于以前的最先进水平实现了44%的BLEU改进,为实现通用翻译系统奠定了重要基础。最后,我们开放了这项工作中描述的所有细节,可在 https://github.com/facebookresearch/fairseq/tree/nllb 获取。
我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。