CSDN 有很多的老朋友,专门做音视频技术的 LiveVideoStack 就是其中的一位。
一个月前,在微信的大本营广州 TIT 创意园,微信多媒体内核中心音视算法高级工程师梁俊斌面对 LiveVideoStack 提问“为什么选择音频这么小众、枯燥和孤独的领域”时,表示:“你用了‘孤独’这次词形容音频技术开发很到位。”
这折射出多媒体领域的一个尴尬现象 —— 对多媒体技术人的需求很大,但能够深入到底层开发的人少之又少。这也就导致了这一领域人才极度抢手,薪资水涨船高。
“我们预计国内的多媒体开发者有几万人吧”,LiveVideoStack 这样告诉某 TOP 级短视频平台多媒体技术负责人,后者的反馈是:“应该没有那么多人。从招聘的情况看,能被我们认可的人才非常少。”
区区几万人,只占到国内开发者数量的几百分之一,“孤独”是很正常的。在国内,并没有一个被广泛认可的“多媒体开发工程师”的岗位,许多多媒体技术开发的正式岗位名字是“运维”、“大数据工程师”。即便在一些主流的视频平台,许多多媒体开发工程师的 title 是“算法工程师”,表面上和多媒体开发一点关系也没有。
当别人在聊 DevOps、IPFS、CNN,你一张口就是 Codec、PSNR、VMAF,瞬间就没有了朋友。
LiveVideoStack 经常收到推荐多媒体技术人的消息,如果是运维、前端、Android 开发岗位,推荐起来并不困难,但是想要资深的多媒体技术人很难。所以,基本上这样的请求,只能无功而返。
梁俊斌还告诉 LiveVideoStack,“应届生招进来,需要学习算法和基础知识,当条件具备了可以开始做产品时,已经过去 3 年了。”显然,这不是小公司也可以承担的。面对人才的瓶颈,许多公司不得不采取了极端的防守策略——至少保证辛苦培养的技术人不被挖走。一名 TOP 级的视频平台公司的 HR 告诉 LiveVideoStack:“我们对崭露头角,有一定能力的工程师进行特别的保护”。事实上,LiveVideoStack 一直在邀请这家公司的技术人来 LiveVideoStackCon 音视频技术大会分享,但始终没有得到积极的反馈。
另一个不容忽视的现实是,一线大学的毕业生选择金融、P2P、区块链、AI 这些领域,毕竟可以离 money 更近。这进一步挤压了多媒体技术人的供给,愿意投身多媒体开发的技术人相应的减少。
如果展望未来三、五年,VR、5G、4K 乃至 8K 视频的机会就在眼前,为什么愿意投身多媒体的技术人反而更少呢?
多媒体技术很难?
是的,很难。多媒体技术是一门实践的科学,不是通过下载源码,把玩下开源软件就能搞定的。在现实中,需要面对复杂的网络情况,各种约定俗成的方法,没有注解的源码,千奇百怪的硬件和非标准的协议。
上图便是直播视频所经历的关键模块,这还不包括视频的前处理和后处理。当然,如果加上人耳、眼睛在声音、图像上的生物特性,以及相关心理感知模型,全部知识体系是如此庞杂。
“视频领域是个海洋,可以游泳、冲浪,也可以潜水、远航……编码优化、去噪声、视觉特效等很多问题都是跨领域的,涉及计算机、电子、通信,甚至艺术、生理、心理学等,无论本专业还是外专业都需要再学习”,北京大学信息科学技术学院教授马思伟告诉 LiveVideoStack。
腾讯多媒体内核中心高级研究员时永方在接受 LiveVideoStack 采访时表示:“多媒体涉及高等数学,数字信号处理,通信原理,信息论等基础学科。”
同时掌握这么多专业知识,挑战可想而知。但投入并不一定能产生高回报,至少回报周期很长。横向的与 AI、区块链等热门领域对比,学习多媒体技术的投入产出比没有任何优势。
多媒体开发者的机会
如此看来,多媒体技术似乎是学霸们才能玩得起的。事实上,并不完全如此。如果你是要做深入底层的多媒体开发者,的确需要更多时间,而且最好是科班出身,有多媒体领域的导师带路,不断探索和丰富自己的知识体系与经验。比如在视频 Codec 领域,能够对底层进行优化的肯定是少数人。
但如果你并不想深入底层,只在应用层开发,那么难度会大幅降低。比如最近十分流行的 WebRTC,以及不断完善强大的 FFmpeg,这些框架、工具不仅强大,而且有完备的文档,社区也足够活跃,使用它们可以大幅降低学习、开发多媒体产品服务的门槛。
未来,多媒体技术会像通信技术一样成为一种能力,渗透在各种应用场景中,无论你是前端、后端、运维都需要或多或少地涉及多媒体技术。针对特定场景的多媒体能力开发,需要大量的人才支持。在 5G 和 4K 高清视频的趋势下,多媒体应用将诞生新的应用和商业模式。
10 月 19-20 日,CSDN 与 LiveVideoStack 联合出品的 LiveVideoStackCon 2018 音视频技术大会将在北京举行,这是一次针对多媒体技术的全面梳理与展望,也将开启多媒体技术世界的大门。不过,作为多媒体开发初学者,或者只是有兴趣学习相关的技术,能否在专业的技术大会上有所收获呢?先看看有哪些专家分享经验?
点击查看更清晰
以上列出了 LiveVideoStackCon 的部分讲师,以及出品人和联席主席,大约还有 20 位讲师仍在沟通确认中,在官网上会随时更新讲师与议题的最新进展 (扫码即可查看)。
不难发现,他们中的大多数都来自多媒体技术重度应用的平台,各自承担着多媒体技术关键任务。同时,组委会与出品人会对讲师的内容提出要求,并经过至少两轮审校,这将保障内容源于实践,富有启发性,严谨准确。
比如,YY 音视频算法中心负责人林绪虹会介绍如何重构 YY 的音视频技术栈,提升用户 QoE,控制成本。
学而思网校客户端架构负责人赵文杰将介绍如何实现功能强大的白板功能,以及如何在复杂网络条件下的实现低延迟保障与可用性。
Hulu 全球高级研发经理视频编解码与传输领域资深专家傅德良则会介绍在 Hulu 内部的一套视频质量评价体系,以及他如何帮助 Hulu 甄选 Codec,他包含一系列客观评价指标,如画质、延迟、压缩率等。
快手流媒体大数据平台架构师罗喆会介绍快手如何提升用户观看短视频的体验的,这包括全链路的状态抓取,以及相应的分析、告警、故障定位和优化。
腾讯视频视频编码团队负责人汪亮则会分享腾讯视频在视频质量、画质增强、成本控制等方面的经验。
思科视频研究员张睿将会分享如何设计 WebEx 的架构,以及如何全方位监控网络与客户端实现高品质的视频通话。
其次,除了来自工业界的一线专家,LiveVideoStack 也邀请了来自学术界的代表。
比如,北京大学信息科学技术学院教授马思伟将会分享全球最新的视频编码技术的趋势以及 AVS2 相关的进展。
上海交通大学教授宋利则会分享视频画质评定技术,包括相关的开源工具、方法及工业界的应用情况。
清华大学电子工程系教授、博导窦维蓓将介绍音频编码标准的演进等。
三菱电子研究院田栋则会介绍点云技术的标准与实现方案,以及在全景视频、VR 等方面的应用进展。
如果说在一线的多媒体技术人可以带来更接地气的分享,帮助解决实际应用中的问题。那么,学术界的各位大咖则可以帮大家补补课,重温经典算法,开启全球视野。
最后,还有一些代表各自领域的 TOP 级公司,带来各自的独门秘籍。比如,杜比研究高级总监 Claus Bauer 会带来杜比如何在千差万别的设备中实现声音特效。
Twitch Principal Research Engineer 沈悦时则会分享如何将 HLS 打造成比 RTMP 更低延迟的方法,以及通过机器学习的方式自动优化网络。
Intel Media SW Engineering Manager Faouzi Kossentini 将会带来如何基于 Intel 的 CPU/GPU 对 HEVC 及 AV1 编码的优化,对于算法复杂度超高的 AV1,如果通过硬件加速的方式提升编码速度,将给 AV1 带来巨大的机会。
RealNetworks CTO Reza Rassool 会带来 AI 技术为 Codec 带来的优化,以及如何在低算法复杂度下实现极致的软件编解码。不少 80 后都有过观看 RM/RMVB 视频的经历,在那个 64KB 带宽就算是宽带的年代,RM/RMVB 风靡一时。
北京美摄网络科技有限公司 CTO 见良将分享在移动端视频处理的性能保障与优化,设计 Codec 优化、视频渲染、GPU 加速等。
外界对于快手的技术充满了好奇,尤其多媒体技术方面快手有一帮顶尖技术人才。快手音视频技术负责人于冰将首次公开分享快手在多媒体技术方面的经验与探索,包括 AI、编码和网络算法等。
Akamai 首席架构师 William Robert Law 会分享这家全球最大的 CDN 针对网络方面的优化,如何使用 CMAF 和 QUIC 协议来实现 2-3 秒的低延迟直播。
三体云实时视频高级工程师李幸原将分享低延迟音视频技术在社交、音乐教育等场景下的技术难点与实现。
爱奇艺 CTO 刘文峰介绍 AI 对于一家多媒体娱乐公司的价值,AI 在影片制作、剪辑、编码、传输、广告以及个性化推荐等方面做的探索。
Aupera Senior Embedded Vision/AI Engineer Narges Afsham 则会带来如何通过 FPGA 硬件来加速实时编码、转码,相对于 CPU/GPU/ASIC 方案,FPGA 在效率、灵活度以及画质方面可以达到较完美平衡。
除此之外,LiveVideoStackCon 也关注多媒体技术应用的重要行业场景,如教育、医疗、视频会议、安防等。
如 51Talk 技术总监陈靖会介绍音视频技术在 51Talk 的应用实践,尤其在延迟、卡顿方面的优化。
即构科技技术副总裁冼牛将会分享实时音视频技术在教育、游戏和社交领域的应用案例。
智慧树网副总经理袭普照将会介绍在业务快速扩张的情况下,如何选择技术栈与供应商,保证技术平台的可用性及一定限度的扩展性。
前面提到,在 LiveVideoStackCon 期间提供了若干场面向初学者的技术培训,旨在帮助学员快速掌握和提高技能。除了 FFmpeg Maintainer 李忠、英特尔资深软件工程师张华联手带来的《FFmpeg 视频编码原理与实战》培训以外,全民快乐研发高级总监展晓凯还会带来一场《抖音短视频特效实战》培训,掌握基本的播放器技巧和 3D 渲染,并亲手完成各种视频特效。
One More Thing
正因为“孤独”,才更享受相聚的日子。LiveVideoStackCon 上准备了丰盛的自助餐,轻松的社交晚宴,以及“你问我答”与“帮你约专家”活动。
互动一:热门问题现场解答。你可以扫描下方二维码提交话题或问题。
也可以直接以“问题”+“讲师”的形式留言向指定专家提问。被关注最多的 10 个问题将在大会期间的“讲师问诊”环节由相关讲师回答。
互动二:帮你约专家。仅听分享还不过瘾?你还可以留言,提交你想见到的讲师,组委会会尽力邀请。
号外:我们还在招募讲师。LiveVideoStackCon 是每个多媒体技术人的舞台,如果你在某一领域独当一面,愿意让个人的经验帮到更多人,欢迎通过 邮箱 [email protected] 申请讲师。
当然,学习多媒体技术也并非一朝一夕,也不能指望几天的技术交流就能带来翻天覆地的提升。不过,给自己一个机会,可能会开启一片新的天地,期待相约 LiveVideoStackCon!
LiveVideoStackCon 音视频技术大会是多媒体技术领域的盛会,也是生态中的重要玩家的展示舞台。感谢 CSDN、三体云、金山云、声网、即构科技、腾讯云、百度云、相芯科技、英特尔、七牛云、傲睿智存 Aupera、Akamai、美摄 SDK 等伙伴的支持,他们的优秀专家也正在努力的准备着与大家分享的资料。有你们才让 LiveVideoStackCon 更精彩。
点击阅读原文、或扫描下方二维码,即可进入大会主页。
了解 LiveVideoStackCon 更多信息。特别提示,使用 CSDN 渠道邀请码【CSDN】购买门票,还可以获得 100 元精美购物卡回馈,快来抢购吧。
快速报名,请点击下方“阅读原文”。