白日梦丨AIGC还是艺术?AI开源公司Stability AI化技术为艺术

随着人工智能技术的发展和5G时代的到来,内容生产的方式开始发生巨变。

从文字和图片到音乐和视频,再到直播和游戏,传统的UGC(用户生产的内容)和PGC(专业生产的内容)已经跟不上人们对丰富内容的需求。新时代,互联网人更倾向于选择具有视觉表达的数字内容。

而且传统的数字内容生产模式效率低下,落后的生产模式成为了元宇宙内容生产的瓶颈。

随着技术的发展,AI不仅在工业生产和科研场景中占据一席之地,也开始为内容创作注入新鲜血液。我们正在见证各种AI生成技术在各种商业场景落地,创造越来越多的价值。

最近AI创造频频出现在热门话题上,大家又爱又恨。AI产生的火热内容有目共睹。

在所有AI玩家中,最知名的是推出稳定扩散开源模式的公司Stability AI。


凭借广泛的用户和强大的技术支持,稳定性AI已经成为业内备受瞩目的“独角兽”企业,这距离稳定性AI成立仅两年时间。

StabilityAI是一家怎样的公司?它为什么能成为AIGC领域的“领头羊”?其开源产品将如何引领内容生产的AI革命?下面我们一个一个的拆解一下。


StabilityAI是怎么诞生的?


Stability AI的创始理念是基于一家名为Open AI的公司。

回到10年前,AI大热的时候,相关的技术研究在计算能力和经费上都很有限,对AI这种新技术感兴趣的科研人员只能望而却步。

开放AI的出现为AI研究人员创造了新的可能性。这家公司提供了一个相对自由的研究环境,并得到了大量资金和计算能力的支持,可以帮助技术部门专注研究AIGC领域。

然而好景不长。2020年,公司内部爆发问题,已经无法支撑非营利项目的后续运营,也导致大量核心研究人员离职。

此时,Emad Mostaque站出来继续开放人工智能的企业价值理念。

曾在多家科技公司担任工程师、分析师和投资官的Emad Mostaque,根据他至少20年的投资基金经验,成立了一家非营利机构,其非营利模式与Open AI相同,同时更加开放。

2020年,他创立了Stability AI,Mostaque希望它能延续开放AI的理念,并将其发扬光大。他将公司的使命定为打造开源AI项目,并很快推出了首个免费开源的产品模式Stable Diffusion。

Stable Diffusion是一种根据人物生成图片的AI技术模型。只需要几秒钟就能生成高分辨率、高清晰度的图片,同时保留真实性和艺术性。

这个技术模型项目的开发者是AI视频剪辑公司Runway的Patrick Esser和在慕尼黑大学机器视觉系工作的Robin Romabach。

他们从DALL-E2、Imagen等开源模型项目中总结经验,供项目参考。同时,在Stable Diffusion推出时,他们得到了稳定AI技术团队和外部开发社区的支持。


近年来,AI技术和科学研究的过程往往是高度封闭的。

而Stability AI的团队则平衡了计算能力、资金和公众之间的关系,选择将其代码和模型设计为开源。用户可以基于稳定的扩散代码构建与设计、增强现实、视频游戏、广告甚至电子商务相关的应用,从而成功解决封闭的AI技术问题。

除此之外,Stability AI甚至为不懂代码的用户提供无代码网站。

凭借稀缺的开源特性和用户友好的体验,该项目一经公开测试就受到了大量研究人员和用户的欢迎,而Stability AI早早就积累了可观的用户群体。

同时,随着人脉的积累,Stability AI在整个AI研究和应用领域,包括学术和工业领域,都得到了广泛的关注和认可。Stability AI赋予前沿AI模型通用特性,更多用户可以享受和利用这项技术。

最初,Stability AI完成了1000万美元融资,估值1亿美元。近日,Stability AI宣布获得Coatue和Lightspeed的1.01亿美元投资,估值将达到10亿美元。

Stability AI表示,公司计划利用这笔融资继续投资在研发,并将公司规模从100家扩大到300家。除了Stable Diffusion,该公司正在开发用于生成语言、音频、视频和3D的AI生成模型,为未来的内容创作提供更多开源模型。

那么,Stable Diffusion与其他AI发展模式相比有什么特别之处呢?稳定性AI如何在竞争激烈的AI市场脱颖而出?


Stable Diffusion是如何成长的?


此前,Open AI今年发布的图像生成器DALL-E2拥有超过150万用户,每天创建超过200万张图像;另一个人工智能生成器Midjourney在其官方Discord上拥有超过300万用户。

风险投资公司红杉资本(Sequoia Capital)表示,AI内容制作可以创造数万亿美元的经济价值。种种迹象表明,AIGC已经成为未来的重要趋势之一。

今年8月,Stability AI发布了开源模型Stable Diffusion,这是一个类似于DALL-E2的系统,可以通过文字描述生成相应的图像。与DALL-E2和Open AI等老牌企业不同,它允许任何人在没有监督的情况下使用和构建其模型。

Stable Diffusion开源的底层代码可以让开发者绕过数据的限制,实现其他平台难以实现的功能。

这意味着任何人都可以查看代码并运行修改后的版本,甚至可以使用该软件来驱动自己的商业产品。

此外,在其他平台被禁的名人肖像和敏感图像也可以在Stable Diffusion平台上使用。自代码于8月发布以来,已有超过20万人下载了它,并使用基于它算法构建的工具创建了数百万张图像。


然而,2022年8月20日,Stability AI关闭了他们免费的Discord图像生成器,并发布了DreamStudio应用程序。

这是一个由Stable Diffusion支持的新的AI系统,它可以根据自然语言的描述来创建逼真的图像、艺术和动画。

DreamStudio旨在通过自然语言处理和革命性输入控制的结合,赋予每个人无限的想象力和轻松的视觉表达,以加快创造力。


这款面向消费者的产品拥有超过100万注册用户,他们来自全球50多个国家,共同创作了超过1.7亿张图片。虽然Stable Diffusion模型已经开源,但DreamStudio作为一项服务,用户必须为生成的图像付费。


每位新用户将获得200点免费DreamStudio积分的一次性奖励。默认情况下,每张图片都会向用户收取一个信用额度。


DreamStudio会根据用户选择的图像分辨率和步数(大小、配置比、种子、步数和图像数)来消耗积分。一旦免费积分用完,用户需要自己购买积分。


Stability AI希望将权利归还给开发者社区,为开创性的应用打开大门。


Stability AI的创始人兼首席执行官Emad Mostaque说,“将AIGC置于数十亿人手中将带来新机遇的爆炸性增长。”




Stability AI能站稳AIGC的头部地位吗?




AIGC正在成为继PGC(专业生产内容)和UGC(用户生产内容)之后的一种新的内容创作方式。只需输入简单的文字描述,AI就能在几秒钟内自动生成一幅真实的画作。AI技术的发展让人们的想象逐渐成为现实。


2022年8月,AIGC的画作“太空歌剧院”获得了科罗拉多州博览会艺术竞赛数码类一等奖。与此同时,这幅画很快遭到了质疑。


AI创作的作品能否被认定为艺术作品,一直是很多人类艺术家争论的话题,但资本和机构的加速入场,透露出已经成为一种新的趋势。


如前所述,Stability AI已收获1.01亿美元投资,估值10亿美元;此前,AIGC初创公司Jasper宣布获得1.25亿美元A轮融资,估值15亿美元。


除了Stability AI和Jasper等新独角兽,科技巨头也在积极准备加入AIGC赛车场。


9月,Meta宣布将推出Make-A-Video;;10月,谷歌推出Imagen Video和Phenaki,只需要几行文字或几句话,就能把想象带入现实,创造出独一无二的视频。


AIGC的出现可以说是AI算法的重大突破,意味着人类可以利用AI技术不断辅助人类进行内容生产。就像的油画《太空歌剧院》一样,这幅作品并不完全是AI创作的,也不是作者独立完成的。






今年9月,红杉资本联合GPT-3发表了一篇题为《生成式AI:一个创意新世界》的文章,文章写道,“人的梦想:生成式AI将把创作和知识工作的编辑成本降低到零,并产生巨大的劳动生产率和经济价值,以及相应的市场价值。”


这也意味着每个人都可以成为创作者将成为现实,AIGC内容平台将迎来爆发式增长。


从AI绘画到AI视频,我们的内容生产和创作方式正在发生变化,AI技术在创意产业中发挥着越来越重要的作用。


得益于相关技术的发展和迭代,AI可以快速灵活地生成不同模式的数据内容,而稳定扩散的官方开源无疑开启了AIGC时代的大幕,为更广泛的用户提供了重新定义想象力的机会。


Stability AI不同于其他大型AI公司的“家长式作风”。艾玛德·莫斯塔克通过开源使技术民主化,为真正有才华的开发者提供最大程度的自由。同时,Stability AI还与各国政府和机构合作,以期建立一个更加开放的社区。


Stability人工智能正在催化其生态系统的发展。但所有平台都会探索商业化的道路,所以能否建立良好的商业模式,可能是Stability AI成为领头羊的关键。让我们拭目以待。





为什么AIGC对元宇宙很重要?




全球知名咨询机构Gartner在《2021年预测:人工智能对人类和社会的影响》中指出,到2023年,20%的内容将由生成式AI创造。


同时,Gartner还预测,到2021年,生成式AI产生的数据将占所有数据的10%,而目前还不到1%,Gartner所指的生成式AI就是我们现在所熟悉的AIGC。


从目前的内容生产来看,其实因为一些社交媒体的出现,图文音视频的创作门槛变得更简单了,这也是内容生产力解放的重要原因,这也导致了近五年短视频的爆发式增长。


但另一方面,我们知道一些流行的内容创作方式已经开始从2D转向3D影像,这给很多内容从业者在创作上带来了门槛。


因此,AIGC的出现可以大大降低这个门槛,为元宇宙的出现奠定基础。





比如我们熟悉的虚拟人,仅仅依靠人来创作内容,包括虚拟人角色的塑造、环境的搭建或者虚拟现实的增强,都会极大的消耗内容创作者的精力。所以EPIC公司开发的虚幻引擎出现是为了减少虚拟场景的构建时间,但是虚幻引擎还是不够友好。毕竟不是一般人可以涉猎的内容创作方式。


所以,在虚幻引擎的基础上,我们看到了AIGC的诞生,只要用文字描述,就可以构建出我们想要的音频、视频或者图片。就像以前种地需要人力和畜力,现在我们有了各种播种收割机,必然带来生产力的快速提升。


我们还处于AIGC产业发展的初级阶段,甚至可以把2022年定义为“AIGC元年”。


在元宇宙出现之前,AIGC的应用场景其实并没有那么丰富。毕竟,每个人对当前内容的需求已经足够了。


随着元宇宙的发展和普及,我们发现内容的构建成本又被抬高了,于是像AIGC那样便捷地构建内容的方式受到了关注,打开了新的局面。


可以说,Metaverse和AIGC就像需求和生产力变化之间的关系。当需求发生变化时,新的生产方式必然会被认可。


目前,AIGC的内容生成还存在很多问题。比如内容创作没有边界,有涉黄涉暴的案例,这也是人工智能和监管者需要寻找的契合点;以及对一些AIGC创作成果的误解,导致了“苹果长在水里”的神奇画面。虽然有趣,但不符合实际意义,而这正是人工智能需要成长的地方。


然而,上述关于AIGC的问题并不妨碍它的发展。唯一的问题是,这些“问题”何时才能得到解决,因此人们对AIGC的关注和使用可能会进一步增强。


当然,对于广大内容创作者来说,AIGC不仅仅是一个“神器”,更是行业的“利器”。大师们可能会在内容创作上更上一层楼,错过的人可能会被人工智能抛弃。


AIGC的突然爆发会让我们觉得自己正站在一个全新时代的开端,但从某种意义上来说,我们其实并不知道这个时代会在什么时候到来。

来源:Metaverse Hub

你可能感兴趣的:(白日梦丨AIGC还是艺术?AI开源公司Stability AI化技术为艺术)