原创: 秦陇纪 数据简化DataSimp 今天
数据简化DataSimp导读:《2018年最出色的30个机器学习项目》是美国IT媒体Medium原标题30 Amazing Machine Learning Projects forthe Past Year (v.2018)汉译文,来自Mybridge介绍了2017年最惊艳的30个机器学习项目。这些ML项目有:第1名FastText,第2名Deep-photo-styletransfer,第3名face_recognition,第4名Magenta,第5名Sonnet,第6名deeplearn.js,第7名fast-style-transfer,第8名Pysc2,第9名AirSim,第10名Facets等。欢迎下载PDF资料,附数据简化DataSimp社区简介。
盘点:2018年最出色的30个机器学习项目
文|Mybridge,数据简化DataSimp2018-09-13
在过去的一年里,我们比较了近8800个开源的机器学习项目,并从中评选出了前30名(0.3%的机会入选)。这是一个极具竞争力的榜单,它仔细挑选了2017年1月到12月之间发布的最好的开源机器学习库、数据集和应用程序。Mybridge AI将项目的受欢迎程度、参与度和时效性等指标纳入评估标准来判断项目的质量。这些项目在Github上收藏量(获得的星数)的平均值是3558,这个数字足以让你对这些项目的质量有个大致了解。
开放源码项目对数据科学家很有用。而你也可以通过阅读源代码这一方式来学习,并在这些现有项目的基础上构建一些新的内容。给自己足够的时间去尝试一下这些去年你可能错过的激动人心的机器学习项目吧。
第1名:FastText
用于快速文本显示和分类的库,Github收藏量11786星。项目隶属于Facebook研究院。
第2名:Deep-photo-styletransfer
论文“深度照片风格转换”的代码和数据,Github收藏量9747星。项目隶属于Fujun Luan,康奈尔大学博士。
第3名:face_recognition
世界上最简单的用于Python和命令行的面部识别API,Github收藏量8672星。项目隶属于Adam Geitgey。
第4名:Magenta
利用机器智能进行音乐和艺术创作的项目,Github收藏量8113星。
第5名:Sonnet
基于Google TensorFlow 的神经网络库,Github收藏量5731星。项目隶属于来自Deepmind的Malcolm Reynolds。
第6名:deeplearn.js
用于网络的硬件加速机器智能库,Github收藏量5462星。项目隶属于来自Google Brain的Nikhil Thorat。
第7名:fast-style-transfer
基于TensorFlow的图片与视频风格转换工具,Github收藏量4843星。项目隶属于来自MIT的Logan Engstrom。
第8名:Pysc2
星际争霸2学习环境,Github收藏量3683星。项目隶属于来自Deepmind的Timo Ewalds。
第9名:AirSim
为微软AI研究部门的自动驾驶汽车提供的基于UnrealEngine的开源模拟器,Github收藏量3861星。项目隶属于来自微软的Shital Shah。
第10名:Facets
机器学习数据集的可视化项目,Github收藏量3371星。项目隶属于Google Brain。
第11名:Style2Paints
给图片上色的AI工具,Github收藏量3310星。
第12名:Tensor2Tensor
谷歌研究院一个通用序列到序列模型的库,Github收藏量3087星。项目隶属于来自Google Brain的Ryan Sepassi。
第13名:pytorch-CycleGAN-and-pix2pix
Pytorch中图像风格或者内容转换工具,如卫星地图转换为二维平面图、油画与照片风格转换等;Github收藏量2847星。项目隶属于来自伯克利大学的博士Jun-Yan Zhu。
第14名:Faiss
一个高效的相似搜索和密集向量聚类的库,Github收藏量2629星。隶属于Facebook研究院的项目。
第15名:Fashion-mnist
一个类似于mnist的时尚产品数据库,Github收藏量2780星。项目隶属于来自Zalando Tech的研究科学家Han Xiao。
第16名:ParlAI
在各种公开可用的对话数据集上训练和评估AI模型的框架,Github收藏量2578星。项目隶属于来自Facebook研究院的Alexander Miller。
第17名:Fairseq
Facebook AI研究序列到序列模型的工具包,Github收藏量2571星。
第18名:Pyro
用Python和PyTorch进行深度通用概率编程,Github收藏量2387星。项目隶属于Uber的AI实验室。
第19名:iGAN
由GAN驱动的动态图像生成,Github收藏量2369星。
第20名:Deep-image-prior
不借助机器学习而实现的神经网络图像恢复,Github收藏量2188星。项目隶属于俄罗斯Skolkovo科学技术大学博士Dmitry Ulyanov。
第21名:Face_classification
使用fer2013/imdb数据集与keras CNN模型和openCV进行的实时人脸检测和情感/性别分类,Github收藏量1967星。
第22名:Speech-to-Text-WaveNet
使用DeepMind的WaveNet和tensorflow技术进行精确到句子的端到端英语语音识别,Github收藏量1961星。项目隶属于Kakao Brain的Namju Kim。
第23名:StarGAN
多网络下图像到图像转换的统一生成框架,Github收藏量1954星。项目隶属于高丽大学的Yunjey Choi。
第24名:MI-angets
机器学习统一代理,Github收藏量1658星。项目隶属于Unity3D深度学习部门的Arthur Juliani。
第25名:DeepVideoAnalytics
一个分布式可视化搜索和可视化数据分析平台,Github收藏量1494星。项目隶属于康奈尔大学的博士Akshay Bhat。
第26名:OpenNMT
Torch环境下的开源神经网络机器翻译工具,Github收藏量1490星。
第27名:Pix2pixHD
利用受限的GANs合成和操作2048x1024图像的工具,Github收藏量1283星。项目隶属于Nvidia的AI研究院科学家Ming-Yu Liu。
第28名:Horovod
针对TensorFlow的分布式训练框架,Github收藏量1188星。项目隶属于Uber Engineering。
第29名:AI-Blocks
一个强大且直观的“所见即所得”人机界面,任何人都可以基于这一工具创建机器学习模型。Github收藏量899星。
第30名:deep-voice-conversion
TensorFlow中用于语音转换(语音风格转换)的深层神经网络,Github收藏量845星。项目隶属于来自Kakao Brain AI研究院的Dabi Ahn。
-END-
参考文献(470字)
1.Medium.30 AmazingMachine Learning Projects for the Past Year (v.2018).[EB/OL]Mybridge,https://Mybridge.Medium.org/a/30Amazing Machine Learning Projects for the Past Year (v.2018),2018-04-00.
2.Mybridge.盘点:2018 年最出色的 30 个机器学习项目.[EB/OL]36氪,http://www.sohu.com/a/252229840_114778,2018-09-06.
x.秦陇纪.数据简化社区Python官网Web框架概述;数据简化社区2018年全球数据库总结及18种主流数据库介绍;数据科学与大数据技术专业概论;人工智能研究现状及教育应用;信息社会的数据资源概论;纯文本数据溯源与简化之神经网络训练;大数据简化之技术体系.[EB/OL]数据简化DataSimp(微信公众号),http://www.datasimp.org,2017-06-06.
我桥2018年最出色的30个机器学习项目 (3105字)
秦陇纪
简介:我桥2018年最出色的30个机器学习项目。(公号回复“机器学习2018”,文末“阅读原文”可下载31图5k字12页PDF报告) 蓝色链接“数据简化DataSimp”关注后下方菜单项有文章分类页,欢迎转发、赞赏支持社区。作者:我桥MyBridge。来源:MyBridge网站、数据简化社区秦陇纪微信群聊公众号,引文出处请看参考文献。主编译者:秦陇纪,数据简化社区、科学Sciences、知识简化新媒体创立者,数据简化OS架构师、C/Java/Python/Prolog程序员,IT教师。每天大量中英文阅读/设计开发调试/文章汇译编简化,时间精力人力有限,欢迎转发/赞赏/加入支持社区。版权声明:科普文章仅供学习研究,公开资料©版权归原作者,请勿用于商业非法目的。秦陇纪2018数据简化DataSimp综合汇译编,投稿合作,或出处有误、侵权、错误或疏漏(包括原文错误)等,请联系[email protected]沟通、指正、授权、删除等。欢迎转发:“数据简化DataSimp、科学Sciences、知识简化”新媒体聚集专业领域一线研究员;研究技术时也传播知识、专业视角解释和普及科学现象和原理,展现自然社会生活之科学面。秦陇纪发起未覆盖各领域,期待您参与~~ 强烈谴责超市银行、学校医院、政府公司肆意收集、滥用、倒卖公民姓名、身份证号手机号、单位家庭住址、生物信息等隐私数据!
目录
我桥2018年最出色的30个机器学习项目(3105字)
A我桥2018年最出色的30个机器学习项目(2641字)
参考文献(470字)Appx(845字).数据简化DataSimp社区简介
Appx(845字).数据简化DataSimp社区简介
信息社会之数据、信息、知识、理论持续累积,远超个人认知学习的时间、精力和能力。应对大数据时代的数据爆炸、信息爆炸、知识爆炸,解决之道重在数据简化(Data Simplification):简化减少知识、媒体、社交数据,使信息、数据、知识越来越简单,符合人与设备的负荷。数据简化2018年会议(DS2018)聚焦数据简化技术(Data Simplification techniques):对各类数据从采集、处理、存储、阅读、分析、逻辑、形式等方ose 做简化,应用于信息及数据系统、知识工程、各类Python Web框架、物理空间表征、生物医学数据,数学统计、自然语言处理、机器学习技术、人工智能等领域。欢迎投稿数据科学技术、简化实例相关论文提交电子版(最好有PDF格式)。填写申请表加入数据简化DataSimp社区成员,应至少一篇数据智能、编程开发IT文章:①高质量原创或翻译美欧数据科技论文;②社区网站义工或完善S圈型黑白静态和三彩色动态社区LOGO图标。论文投稿、加入数据简化社区,详情访问www.datasimp.org社区网站,网站维护请投会员邮箱[email protected]。请关注公众号“数据简化DataSimp”留言,或加微信QinlongGEcai(备注:姓名/单位-职务/学校-专业/手机号),免费加入投稿群或”科学Sciences学术文献”读者微信群等。长按下图“识别图中二维码”关注三个公众号(搜名称也行,关注后底部菜单有文章分类页链接):
数据技术公众号“数据简化DataSimp”:
科普公众号“科学Sciences”:
社会教育知识公众号“知识简化”:
(转载请写出处:©秦陇纪2010-2018汇译编,欢迎技术、传媒伙伴投稿、加入数据简化社区!“数据简化DataSimp、科学Sciences、知识简化”投稿反馈邮箱[email protected]。)
普及科学知识,分享到朋友圈
转发/留言/打赏后“阅读原文”下载PDF
阅读原文
微信扫一扫
关注该公众号