OpenAI Sora 超强文生视频如何使用:最新详细教程-小白教程
1.Sora 是什么
仅仅凭借文字就可以生成一段视频!近日,OpenAI的一款新产品又火出圈了。当地时间周四(2月15日),OpenAI发布了首个文生视频模型Sora。
2024年2月16日,OpenAI在官网上正式宣布推出文本生成视频的大模型 Sora,该工具可以通过使用文本迅速制作出一段长达60秒的视频,视频中可以呈现多个角色、特定动作、以及复杂场景。OpenAI的官网上现已更新了48个视频案例,可以说是效果逼真,能展现艳丽的色彩,呈现准确的细节,连人物角色都是表情丰富。
随后在周六(2月17日),负责Sora项目的研究科学家Bill Peebles在社交媒体X上分享了Sora的一项新功能——可以一次性就同样场景生成多个视角的多段视频。
Peebles强调,“并不是我们把五个视频拼接在一起,是Sora决定同时将五个不同的视角结合在一起的!”
接下来将为您提供关于小白如何入手Sora)的最新详细教程,来让你快速上手。
2.Sora 的应用案例
Sora的应用范围非常广泛,从教育教学、产品演示到内容营销等,都可以通过Sora来实现高质量的视频内容创作。下面是 OpenAI 官方发布的应用案例:
2.1 长达60s超长的长度
在一堆AI视频,还在4s连贯性的边缘挣扎,OpenAI直接向人工智能这个海洋扔下了一篇超级炸弹,不装了,我摊牌了,直接说到:我能生成60s视频,闪开,我能打十个。
1.Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
翻译:一位时尚的女性走在东京街头,周围是温暖闪亮的霓虹灯和活力四射的城市标识。她穿着一件黑色皮夹克,一条长长的红色连衣裙,搭配黑色靴子,并背着一个黑色手提包。她戴着墨镜,涂着红色口红。她步履自信,悠然自得地走着。街道潮湿而反光,呈现出丰富多彩的灯光的镜面效果。许多行人在街上走动。
我完全不知道是如何能实现出来的,官网的解释是:
只能先等他们的技术文档,再来详细看看了。
2.2单视频多角度镜头
现代的AI工作流程已经实现了令人难以置信的突破,,能够在单个视频中 seamlessly integrate 多角度镜头,同时保持主体的完美一致性,这在过去几乎是难以想象的。OpenAI 只通过简单的提示语,就能在一分钟视频内实现多角度的镜头切换,并且令人惊叹的是,物体的一致性j居然得到了完美保持。
2.Prompt: A beautiful silhouette animation shows a wolf howling at the moon, feeling lonely, until it finds its pack.
提示:一个美丽的剪影动画展示了一只狼对着月亮嚎叫,感到孤独,直到它找到狼群。
此时,一匹狼孤独地对着月光长啸,其声悲凉,彰显着它的孤单,直至它终于找到了属于自己的族群。
孤独——这一主题,在视频中就这样被完美得体现出来。
以多角度的镜头切换,每一幕都如同精心设计出来的一样,展现了制作的精细考虑,就像超电磁炮一般直击人们的内心
2.3世界模型
3Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
翻译:几只巨大的长毛猛犸象踏过一片雪白的草地,它们长长的毛发在微风中轻轻飘动着,远处覆盖着雪的树木和雄伟的雪山,午后的光线下有些薄云,太阳高悬在远方,营造出温暖的光芒。低角度的摄影视角令人惊叹,捕捉到了这些大型毛茸茸的哺乳动物,画面景深感强烈。
4.Prompt: Historical footage of California during the gold rush.
翻译:加利福尼亚淘金热时期的历史影像。
5.Prompt: A close up view of a glass sphere that has a zen garden within it. There is a small dwarf in the sphere who is raking the zen garden and creating patterns in the sand.
翻译:放大观看一个玻璃球,里面有一个禅宗花园。球内有一个小矮人,他正在用耙子整理禅宗花园,并在沙地上创造出图案。
A cartoon kangaroo disco dances.
翻译:一只卡通袋鼠在迪斯科舞厅跳舞。
7.Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
翻译:摄像机跟随一辆白色老式SUV,顶部有黑色行李架,它加速通过一条陡峭的土路,周围是松树,地势陡峭,车轮卷起了尘土,阳光照射在SUV上,它沿着土路飞驰,给场景增添了温暖的光芒。土路在远处轻轻弯曲,看不到其他车辆。路边的树是红杉,绿色的植物点缀其中。汽车从后方的镜头中轻松地跟随着曲线,使其看起来好像在崎岖的地形中轻松驾驶。土路周围是陡峭的山丘和山脉,天空晴朗,偶有薄云飘过。
8.Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.
翻译:一辆列车穿越东京郊区时,窗户上的倒影。
9.Prompt: Tour of an art gallery with many beautiful works of art in different styles.
翻译:参观一个艺术画廊,展示了许多不同风格的精美艺术品。
10.Prompt: A grandmother with neatly combed grey hair stands behind a colorful birthday cake with numerous candles at a wood dining room table, expression is one of pure joy and happiness, with a happy glow in her eye. She leans forward and blows out the candles with a gentle puff, the cake has pink frosting and sprinkles and the candles cease to flicker, the grandmother wears a light blue blouse adorned with floral patterns, several happy friends and family sitting at the table can be seen celebrating, out of focus. The scene is beautifully captured, cinematic, showing a 3/4 view of the grandmother and the dining room. Warm color tones and soft lighting enhance the mood.
翻译:一位头发整齐梳理的祖母站在木制餐桌后面,桌上摆放着一个五彩缤纷的生日蛋糕,上面点着许多蜡烛,她的表情洋溢着纯粹的喜悦和幸福,眼中闪烁着快乐的光芒。她向前倾身,轻轻吹灭了蜡烛,蛋糕上涂着粉红色的糖霜和彩色糖粒,蜡烛的火焰也熄灭了,祖母穿着一件淡蓝色的上衣,上面点缀着花卉图案,可以看到几位快乐的朋友和家人坐在餐桌旁庆祝,但是他们处于焦点之外。这个场景被美丽地拍摄下来,有电影般的感觉,展示了祖母和餐厅的三分之四视角。温暖的色调和柔和的光线增强了氛围。
11.Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
翻译:一个有中国龙的中国农历新年庆祝视频。
3.Sora的弱点
Sora当前存在的弱点,OpenAI也是直接指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。
比如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。
该模型有会可能混淆提示的空间细节,例如混淆左右,可能难以精确描述随着时间推移发生的事件,例:遵循特定的相机轨迹。
4.Sora AI如何用
1.首先登录您的OpenAI账户,找到Sora的使用界面。在指定区域输入您的文本描述,可以是一个故事概述、场景描述或是具体的动作指令。
(PS:不过Sora 是Openai 刚刚官宣不久的模型,目前并没有向所有的用户开放,只是邀请行业内一些人员,艺术家等体验,但是按照以往Open ai Chatgpt 新功能的开放速度,应该会很快就全员开放!
Sora是文本生成视频的模型,openai 下面还有超级火爆的ChatGPT, AI 对话,以及文本生图的强大功能,可以直接使用:
以下是ChatGPT的使用例子,你可以根据特定的领域向他提问,他会给你相应的思路,并且回答问题,使用方法是拥有一个ChatGPT账号,还没有注册的朋友可以点击2024年2月最新,手把手教你如何为ChatGPT4.0充值,升级及使用技巧(订阅指南+图文教程) | AI教程
5. Sora是否安全?
就像面对任何新兴的人工智能技术一样,人们对于Sora能产生什么样的内容持有一定的担心。为了应对这些担忧,OpenAI正致力于寻找解决方案。
除了与能够识别风险和潜在问题的“红队成员”合作之外,OpenAI还在开发新的工具,以帮助识别误导性内容。其中一个工具是“检测分类器”,能够辨别出哪些视频是由Sora制作的。
对于文本内容,OpenAI有一个文本分类器工具,它会审查用户的输入提示,并拒绝那些违反使用政策的内容,比如含有极端暴力、色情、仇恨信息、名人形象或侵犯他人知识产权的请求。
OpenAI还计划与世界各地的政策制定者、教育者和艺术家合作,这样他们不仅能听到这些群体的担忧,还能发现这项新技术的积极应用方式。
6. 当前怎么用Sora ?
目前,Sora平台的使用被限定于一个特定的用户群体,这主要包括被称作“红队成员”的专家。这些专家有能力评估风险、识别潜在的问题,如错误信息、偏见和仇恨言论。
同时,Sora也对一些视觉艺术家、设计师和电影制作者开放,以便收集他们的反馈,进一步优化平台,让它更加符合创意行业专业人士的需求。这部分用户能够提前体验模型,并且在当前阶段,他们可以免费使用Sora。
对于一般用户来说,由于OpenAI还没有公开Sora对公众的开放时间表和具体使用条款,因此他们暂时无法通过Sora平台生成视频。
7.将如何影响未来,以及哪些群体可能因此面临就业挑战?
在技术进步的浪潮中,我们面临着既充满希望又不无忧虑的未来。对于许多人来说,人工智能的快速发展既是激动人心的进步,也可能是对现有工作的威胁。
特别是在影视行业内,视频剪辑师和后期制作人员等岗位可能最先感受到这种变化。随着像Sora这样的视频模型能够自动或半自动地生成视频,传统视频制作和编辑工作的需求可能会逐渐减少。剪辑、特效和音效等后期制作环节,也可能通过AI技术变得更加自动化。
然而,在这个快速变化的时代,Sora的出现不仅仅是技术的一个跳跃,它也向我们展示了人工智能潜在的、几乎是无限的可能性。到了2024年,我们已经站在了一个新的历史节点上,它向我们展示的是希望多于绝望。这并不意味着我们将面临一场无法避免的失业危机。相反,这项技术可能会激发视频行业走向更高的技术水平和更多的创新路径。
在这个过程中,我们需要共情和理解——理解技术如何改变我们的工作和生活,以及如何适应这些变化,找到新的机遇。我们共同的任务是探索如何让技术进步惠及每一个人,确保在未来的世界里,每个人都能找到自己的位置。
8.对Sora的疑问解答
划重点
1.因为Sora 目前还未正式对外上线。后续预计先在 GPT Plus 覆盖。
2.截止2024年2月16日,OpenAI只向部分专业用户开放了Sora的访问权限。普通用户只能观看其发布的演示视频。
- 视频类岗位是不是很危险?
虽然从目前来看视频类岗位可能会有一些风险,但机会与发展空间并存
9.结语
OpenAI的Sora开启了视频创作的新纪元,无论是专业人士还是爱好者,都可以轻松创作出高质量的视频内容。尽管仍有一些限制,但随着技术的不断进步,相信这些问题将会逐渐被解决。立即尝试Sora,开启您的AI视频创作之旅吧!