都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?

都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?_第1张图片
有没有感觉所有厂家都在拼命研究相机?
以前3G的时候,发条文字微博,就挺高兴。后来有了4G,就开始在社交平台上发照片和表情包,修图和滤镜工具也越来越多。
到了后4G时代,流量多得花不完,短视频爆发了。谁没有拍过小视频,用过视频特效,关注过几个博主?
不止想记录一个画面,还要把多个画面组合得有意思,有慢动作和延时更好,甚至能剪辑加配乐……相机的需求不断在延伸。
这次小米CC9 Pro尊享版的DXO综合总分拿到了第一,但其中一个单项相对令人意外——视频拍摄也拿到了第一。
都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?_第2张图片


其实并不突然。2018年5月,小米正式成立相机部;2019年2月,小米9拿到DXO视频拍摄第一,再到现在小米CC9 Pro,影像技术方面的努力在一点一点兑现。
和相机部软件产品设计负责人聊天的时候,我说做这么多功能用得到吗?这个女孩反问我,都9012年了,难道这些不是标配么?


-
先恭喜咱们不仅拿到了DXO总分第一,还拿到了DXO视频榜第一啊。


可以不谦虚一次么? 这次真的下了狠功夫。


小米CC9 Pro相机这次好评不少,视频相关的新功能尤其亮眼,先介绍下?
基本上我们已经从图片时代进入视频时代了,用户对于视频拍摄和视频处理的需求越来越多。
但其实视频相较于图片的拍摄以及后期,处理难度都是更大的。
在抖音或者其他短视频平台看到很酷很精致的vlog,多数都出自大神之手,需要借助电脑工具花费一定的时间才能完成效果。
我插一句解释下vlog是啥。就是Video blog,视频博客,用视频代替文字图片来记录和表达。
对,其实除了专业作者,很多普通用户也表示想拍vlog的。
但门槛还是有,大多数人都没有专业的机器、云台,不会运镜,不会操作剪辑软件。
这样就会拍不稳、拍不好,剪不出效果,也没法加字幕。特别是酷炫的运镜,对于他们来说太难了。
我们在想,科技都这么发达了,有没有智能的办法?用一台手机基本搞定入门vlog?
然后设计师、产品、研发在这次的视频功能上死磕了小半年,又联合小米AI实验室团队,实现了不用动手机就能完成自动运镜的vlog效果。
小米CC9 Pro 自动运镜功能

这些镜头,专业人士一般都得用滑轨和各种手摇才能实现。神奇了。
是吧,即使是新手,也能完成看起来很专业的东西。
而且我们这次还做了超级防抖,手抖也没关系,画面还是可以拍得非常稳,不会导致视频质量降低。

小米CC9 Pro 自动卡点模版


酷,还能自己卡点儿。


没错!一般想要帅气的卡点视频,都得拍很多素材,还要在剪辑软件里磨很久,卡到最后生无可恋。
现在我们用智能算法也解决啦。
语音自动转字幕这个功能,也太方便了吧。我自己也拍视频,每次加字幕真的很累。
哈哈哈,加字幕有多麻烦,每个视频工作者都懂的。
语音转字幕这个功能,可以一边拍一边将正在说的话转成文字字幕,能帮大家减轻一点痛苦。
如果有转得不准确的地方,还能在拍摄完毕后进相册再次编辑调整。

小米CC9 Pro 自动加字幕功能
有了聪明的工具,以后人人都能成为vlogger,吃了好吃的,去了好地方,都可以随手用视频记录,多好。
这些功能算法应该挺难吧,我们是怎么搞定的?
一个难点是自动运镜。 让画面自动运镜是一个特别细微精准的操作。
每一帧视频的角度都必须做到精准匹配,需要对4K分辨率的数据做实时的缩放、平移、旋转、转场之类的计算。
这个对算法的精度和复杂度要求非常高。
我们的AI实验室做了大量的算法优化和实时调校,把CPU、GPU、mediacodec等多个计算单元有机结合,最大限度发挥了手机平台的计算性能。


还有一个特别难的是,怎么将4K分辨率的视频做到每秒30帧的实时处理。
4K分辨率(3840x2160)一帧就有829万个像素点,一秒钟需要对将近2亿5千万个像素点做精准处理,还要预留出部分计算资源,保证系统的流畅运行和控制手机的功耗。
原来这么复杂和繁琐啊。
做的过程中也很痛苦呀,但就是顶着压力死磕,多花时间调适。
从整个相机团队到小米AI实验室视觉团队,大家都很轴,不做完美不罢休。
有没有一些貌似很简单但做起来没那么容易的点?
目前市面上虽然滤镜种类很多,但同质化挺严重的。要做出有小米特色的Vlog滤镜就很不容易了。
前期我们收集了大量复古胶片、经典电影的色调,针对每种风格进行曲线特性还原,分析色彩和质感,看哪些色调适合我们。
然后再给画面的高光、中间调、阴影部分做单独优化,保证小米有自己的风格。

我们还研究了专业视频的拍法和特效,推、拉、摇、移、甩啊各种……
发现镜头的运动衔接以及转场衔接是关键,不同的运镜手法需要搭配不同的转场才能出效果。
比如推近的运镜搭配合放大转场,拉远的运镜搭配合缩小转场,能给人一种强的视觉冲击力。
看来炫酷什么的也有固定套路。
哈哈哈哈。
还有语音转字幕这个功能,虽然算法能力已经基本成熟了,但是在用户拍摄的时候,“即拍即转”的体验还不够细致。
相机算法团队也是比对和研究了多方技术,做出了不论从语音识别精准度,还是断句体验上都算业界超前的版本,上手试试就能感觉出来。

视觉效果上,小米视频团队还给我们定制了专属的字体渲染库,采用了Android系统Canvas绘制能力,让用户的视频字幕形式变的更精致。


过程中有什么有意思的事么?
大概是整个团队对于效果的要求都太高了。做完这个项目,我们的工程师都变成了vlog达人了,拍摄剪辑技术都666。

之后还会做什么功能?跟我们爆料下呗。


嘿嘿,先卖个关子。持续关注小米相机部,一定不会让你失望的。






关于相机,你有什么想说的? 或者你还希望我们做出哪些改进?
来留言吧 都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?_第3张图片

点击下图直达

拍照拍视频都全能的小米CC9 Pro


都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?_第4张图片

都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?_第5张图片

你可能感兴趣的:(都9012年了,你的手机还不能自己运镜/转场/卡点/加字幕吗?)