Q:最顶尖的AI技术到底离我们有多远?
A:三行Python代码的距离。
导读
今天小编为大家推荐一个AI领域相当优秀的项目,
粗略估计,这个项目价值超过千万,
当前star 8.6k,大胆预判,这个项目肯定要火,
在Hugging Face Space上已经登录Trending TOP3,
而且在海外破圈,网友好评不断!
未来Star数很快可以到10k甚至20k!
传送门:https://github.com/PaddlePaddle/PaddleHub
话不多说,直接看效果:
prompt:古风华服少女,唯美,俏皮,火凤凰
prompt:日落时的城市天际线,秋天风格
prompt:巨大的纯白色城堡
prompt:a beautiful landscape photography of snow covered Rocky mountains, a dead intricate tree in the foreground, sunset, dramatic lighting, by Marc Adamus
prompt:close-up maximalist illustration of panther, by makoto shinkai, akihiko yoshida, yoshitaka amano, super detailed, hd wallpaper, digital art
prompt:clouds surround the mountains and Chinesepalaces,sunshine,lake,overlook,overlook,unreal engine,light effect,Dream,Greg Rutkowski,James Gurney,artstation
prompt:在artstation上的一幅美丽的画,一个独特的灯塔,照耀着它的光穿过喧嚣的血海
由greg rutkowski和thomas Kinkade所作
prompt:孤舟蓑笠翁,独钓寒江雪, 水粉画
prompt:在宁静的风景中画一幅美丽的建筑画,由Arthur Adams在artstation上所做
以上惊艳的文图生成效果,是通过PaddleHub三行Python代码实现的作品:
import paddlehub as hub
module = hub.Module(name="ernie_vilg")
results = module.generate_image(text_prompts=["巨大的白色城堡"])
本次PaddleHub v2.3.0开源ERNIE-ViLG、Stable-Diffusion(SD)、Disco-Diffusion的文生图大模型能力,将以上ernie_vilg替换为stable_diffusion或disco_diffusion_ernievil_base即可轻松体验不同的文图生成模型,用户也可自定义修改text_prompts来获得不同的效果体验。
三行代码虽然简单,但是代码背后的文图生成模型可不简单,分别来源于现在文图生成领域最顶尖的开源成果:ERNIE-ViLG、Stable-Diffusion以及Disco Diffusion + ERNIE-ViL。以DD+ ERNIE-ViL为例,DD扩散模型负责从初始噪声或者指定初始图像中来生成目标图像,ERNIE-ViL负责引导生成图像的语义和输入的文本的语义尽可能接近,随着扩散模型在ERNIE-ViL的引导下不断的迭代生成新图像,最终能够生成文本所描述内容的图像。这种惊艳的效果,在PaddleHub这里只需要三行代码即可体验。也可以通过huggingface的ERNIE-ViLG空间体验,如图:
点击阅读原文获得链接
★ 欢迎Star关注 ★
https://github.com/PaddlePaddle/PaddleHub
欢迎大家入群沟通交流,组队参加各种创意赛以及获取PaddleHub优质项目合集,获取预训练模型发布最新资讯。
PaddleHub
最新升级
PaddleHub中除了AI作画之外,还有更多丰富模型宝藏。本次2.3.0版本更新,新增了包括文心大模型在内的40+模型,累计预训练模型数量已经超过400个,包括大模型、CV、NLP、语音、工业应用等大量优质模型。
目前累计star数量已超过8.3K,频频登上Github Trending日榜月榜,used by 800+,还有不少小伙伴频频贡献,也是深受开发者喜爱。
图像领域
包括图像分类、人脸检测、口罩检测、车辆检测、关键点检测、人像分割、语言文本识别、图像超分/上色/动漫化等任务模型,实现效果见下图。
文本领域
包括中文分词、词性标注、句法分析、AI写诗/对联/情话/藏头诗、情感分析、文本审核、机器翻译、同声传译等
语音领域
支持语音识别、语音合成、声音分类和声音克隆
语音识别效果如下:
Input Audio:
Recognition Result:我认为跑步最重要的就是给我带来了身体健康。
合成效果如下:
输入:Life was like a box of chocolates, you never know what you're gonna get.
三行代码的手把手实践教程
致谢开发者
★ 欢迎Star关注 ★
https://github.com/PaddlePaddle/PaddleHub
加入PaddleHub
技术交流群
欢迎大家入群沟通交流,组队参加各种创意赛以及获取PaddleHub优质项目合集,获取预训练模型发布最新资讯。
如果群人数超限,可以添加微信小助手微信号并发送"hub"邀请入群。
相关地址
飞桨官网:https://www.paddlepaddle.org.cn/
PaddleHub GitHub地址:https://github.com/PaddlePaddle/PaddleHub
PaddleHub大模型体验教程:https://aistudio.baidu.com/aistudio/projectdetail/4462918?ad-from=PaddleHub
更多模型检索:https://www.paddlepaddle.org.cn/hublist
文心官网体验地址:https://wenxin.baidu.com/moduleApi/ernieVilg
目前文心大模型API已经正式开放,可以支持开发者直接调用或者精调。
Huggingface Demo体验地址:
https://huggingface.co/spaces/PaddlePaddle/ERNIE-ViLG
注释:当前体验服务生成的所有内容都是由人工智能模型生成,我们对其生成内容的准确性、完整性和功能性不做任何保证,并且其生成的内容不代表我们的态度或观点。我们的服务来自于法律法规允许的包括但不限于公开互联网等信息积累,并已经过不断的自动及人工敏感数据过滤,但仍不排除其中部分信息具有瑕疵、不合理或引发不快。