作者丨Giant@知乎(已授权)
来源丨https://www.zhihu.com/question/47563637/answer/1997061212
编辑丨极市平台
导读
本文介绍几款深度学习领域的有趣应用,一起来看看吧。
人工智能炼丹师既是工程师也是艺术家。随着NLP、CV、ASR等技术的逐渐成熟,一些好玩的应用开始进入我们的生活。
比如大家多多少少听说过的AI下围棋、打Dota、玩德扑、解方程等等,这里再分享几个让我咋一看直呼“好家伙”的DL应用。
想给自己做一个卡通风或者古风头像吗?
字节一位小哥哥用GAN界新秀 AgileGAN 训练了一个换脸模型,一键上传体验瞬间换脸。工作累了可以来娱乐一把!
我们以于和伟老师为例,看看卡通、油画、古风三种效果下,于老师的变脸效果:
除了这三种风格,还有很多其他好玩的特效,感兴趣的同学可以去在线demo尝试一下。
在线demo:https://www.agilegan.com/,paper:https://guoxiansong.github.io/homepage/paper/AgileGAN.pdf。
近日,快手 AI 平台部的研究者用非常简单的方法在斗地主游戏中取得了突破,几天内就战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。而且,复现这个研究只需要一个普通的四卡 GPU 服务器。
斗地主是一款合作与竞技并存的游戏,牌型组合复杂,一直以来被认为是一个极具挑战的领域。
DouZero 模型创新性地将传统的蒙特卡罗方法与深度学习相结合,提出了动作编码机制来应付斗地主复杂的牌型组合。让我们期待AI能否拿下下一个冠军宝座。
paper:https://arxiv.org/abs/2106.06135,code:https://github.com/kwai/DouZero,在线demo:https://www.douzero.org/。
AI写诗一直是NLP文本生成任务非常有趣的应用之一,清华大学的开源的写诗系统“九歌”就是这样一位兼赋智慧与诗意的“诗人”。
模型支持五言七言等诗歌载体,可以自定义内容主题,AI作诗后机器会自动从通顺、连贯、新颖、意境等角度进行打分。
九歌—人工智能诗歌写作系统:http://jiuge.thunlp.org/。
DeOldify 模型基于深度学习技术,专门用于修复&上色拍摄于一百余年前的黑白老照片、电影胶卷,甚至也能处理几个世纪前的油画和线条画。
我看完几张模型上色的照片感觉非常和谐真实,除了图片,DeOldify 还能为黑白视频上色。
更多项目细节查看开源仓库:https://github.com/jantic/DeOldify。
两位来自MIT的朋友八成是期末要交AI大作业了,硬生生搞出了这么个玩意儿。
没有专业人士标注,400张图片的训练集和80张图片的验证集,就直接上CNN,是不是有点迫击炮打蚊子的味道?
他们还特地做了个交互界面,上传图片,哦,是一匹好奇的马。厉害厉害。然而,我不关心马,我目前见到的会关心马的情绪的也只有你们俩,好了,下一个。
文章地址:https://github.com/jantic/DeOldify。
该工作是通过人在幼年时期头骨的形状,预测其成年时面相的变化。
这个工作挺有价值的,比如说对走失儿童、无名尸体的鉴别,以及医美方面都用得上,说不定还能给中国传统文化之算命提供一定的可解释性。
但是,这个模型的效果如何要打个问号:如果以头骨的数据作为输入,那这个任务隐含的假设是小时候长相相似的人在成长过程中面部变化的倾向也会相似。而实际上,基因、成长环境、生活习惯等因素都对人的长相有重要的影响。
此外,如果真的想为这个任务建一个数据集,那么十年左右的数据采集周期是必不可少的,祝研究者好运啦。
文章地址:https://rxiv.org/pdf/2106.10464.pdf。
照片风格迁移,即利用一张图片的风格元素来绘制另一张图片的内容。你可以用最喜欢的艺术家的风格,重新绘制自己的照片,只需三步哦。
官网提供了各种供迁移参考的风格艺术照,当然,你可以用自己喜欢的照片。
官网demo:https://deepart.io/。
前两天在公司内部的“CEO面对面”活动上,公司同时提供了中文直播频道和英文传译频道。
为了锻炼自己的英文听力,我切换到英文频道,同声传译者是一位声音非常好听的小哥哥,口音地道、翻译专业。半个小时后,看评论区我才知道实现同声传译的居然是AI模型。好家伙,这效果也太逼真了!
AI同声传译得益于语音识别、机器翻译、语音合成技术的发展与成熟,借助机器持久、高效的工作能力或许是未来同传发展的最优解。
深度学习领域奇特有创意的应用还有很多,先分享到这里,之后再陆续更新啦。小伙伴们有发现好玩的应用也欢迎来分享呀!
[1] 白鹡鸰:近期神奇机器学习应用大赏
[2] 快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?
[3] 人工智能在现实生活中有哪些有趣的应用?
作者名片
Giant,本名叶琛,浙江大学计算机技术硕士。一个爱旅行,懂养生的算法工程师兼干货答主,也是个喜欢用接地气的文风为年轻朋友分享职场经验和算法知识的人。本文仅做学术分享,如有侵权,请联系删文。
下载1
在「计算机视觉工坊」公众号后台回复:深度学习,即可下载深度学习算法、3D深度学习、深度学习框架、目标检测、GAN等相关内容近30本pdf书籍。
下载2
在「计算机视觉工坊」公众号后台回复:计算机视觉,即可下载计算机视觉相关17本pdf书籍,包含计算机视觉算法、Python视觉实战、Opencv3.0学习等。
下载3
在「计算机视觉工坊」公众号后台回复:SLAM,即可下载独家SLAM相关视频课程,包含视觉SLAM、激光SLAM精品课程。
重磅!计算机视觉工坊-学习交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有ORB-SLAM系列源码学习、3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题