OpenAI家又上新了,输入文本就能生成高质解析图片。怎么用呢?

AI人工智能预训练模型的发展一日千里,在许多方面展现超越人类的能耐,例如,Open AI通过自家开发的Bots让《Dota 2》游戏顶尖高手在一场表演赛中首尝败北的滋味;AI还会写文章,由OpenAI研究实验室推出的GPT-2及GPT-3预训练语言模型,因为能书写出媲美人类文笔的文章,因而成为某些人撰写假新闻、伪文章的利器。如今,OpenAI推出新一代的DALL·E 2系统,只要输入一段描述文本,AI便能帮你产生各种图片。

2021年1月,Open AI推出基于GPT-3与DALL·E的图片识别系统CLIPDALL·E,可将用户输入的文本转变成生动的超现实主义图片。例如,用户可以用文本进行描述,要求DALL·E产生一张蝴蝶带动的在海上航行的轮船图片,或是两只泰迪熊在月球上进行新AI研究的图片,其超现实的程度甚至媲美超现实主义画家达利(Salvador Dalí), “DALL·E”这个字就是达利与迪士尼电影《瓦力》(WALL-E)机器人这两个名字的组合。

OpenAI家又上新了,输入文本就能生成高质解析图片。怎么用呢?_第1张图片 

第一代的DALL·E图片像素只有256×256,如今第二代的DALL·E 2图片画质可达1024×1024,分辨率与低延迟的表现更佳。如今DALL·E 2更新了CLIP系统,并改名叫unCLIP。该新系统支持扩散的处理效果,该程序会先从随机点形成的图案开始,一旦取得更具体的描述重点后,会渐近地转变成图片。

除了产生新图片外,用户还可通过DALL·E 2变更现有图片中的一部分,例如在水池图片中添加一只鸭子或去除某个对象,系统同时会将阴影、反光及材质等特征因素纳入考量。用户还可以根据原始图片,发挥创意地额外产生不同风格、内容或角度的变体图片。

OpenAI家又上新了,输入文本就能生成高质解析图片。怎么用呢?_第2张图片 

如同语言模型会被拿来产生假新闻一样,DALL·E 2之类的图片产生工具也有可能遭到滥用。对此,OpenAI提供了一些保护机制,包括隐私方面的考虑(用户无法根据姓名生成人像照)以及公序良俗方面的考虑(无法生成或上传令人反感的内容)。再者,除了仇恨、骚扰、暴力、自残、裸露及非法活动等主题严禁涉及外,也禁止产生包括假新闻、政治、医疗乃至疾病相关的图片。

未来,Open AI有可能不会直接公开推出DALL·E 2,而会提供给第三方App使用。

  又是不直接公开!

是不是已经跃跃欲试,想去动手开发新应用了?发现又是不直接公开!

GPT-3并不向中国的用户开发申请。看来技术有时候也是有国界的。

不过没有关系,中国版的GPT-3于2021年9月就上线了——源1.0大模型。浪潮源1.0大模型开源了向人工智能应用开发者群体进行开源开放,开放内容包含开放模型API,开放高质量中文数据集,开源模型训练代码、推理代码和应用代码等。只要你有创意,零代码低代码就可以开发超高级的AI应用。

开放平台:https://air.inspur.com/,可进行模型API、中文数据集的申请使用。

开发者社区:https://github.com/Shawn-Inspur/Yuan-1.0,可浏览训练代码、推理代码和应用示例代码。

你可能感兴趣的:(语言模型,nlp,ai,自然语言处理)