晚上八点多,采访结束。和于老师寒暄了几句,他说下周要去WWDC,还要去访问圣地亚哥实验室。我们相互道别后,他转身回去工作了。我大快朵颐着快手的免费晚餐——寿司和赛百味面包。来到楼下,看到几幢四面透明的玻璃大楼,灯火通明,负责公共关系的员工告诉我,这里有食堂、星巴克、超市、健身房、理发室、邮局……都是快手自有的,像是一个独立的小镇。
过去的一个多小时,与于老师交流了他个人的成长与理想,一起探讨了他是如何坚持初心,并一步步实现理想的。
文 / 于冰(快手音视频技术负责人)
策划 / LiveVideoStack
创业相关
LiveVideoStack:今天我们是在快手北京的总部,邀请到快手音视频技术负责人于冰,于老师同时还是8月份LiveVideoStackCon2019北京的联席主席。我一般在采访前先研究一个人的背景,所以我花了大概一个多小时研究您在Linkedin的资料。我很好奇,您曾经有两段创业经历,能聊聊这两段创业的故事吗?
于冰:创业有快乐也有痛苦。首先分享快乐的事情吧,最快乐的事当然是把自己的创新技术应用到产品里面去,为用户创造价值。我参与创办过两家To B的创业公司,都是为电视台提供互联网视频解决方案的。在这个过程中,我了解了专业媒体机构是如何使用视频技术的,利用我们所掌握的全新技术,帮助传统电视台将媒体平台拓展到互联网上,是一段很跨界的经历。
端到端的视频技术突破是产品的核心竞争力,从视频采集编解码、传输分发,再到播放都是自主研发的。我们在2008年首创了H264+HTTPFLV技术,在浏览器内实现了实时+7天内任意时移回看,从清晰度流畅度,交互体验创新上,在当时在行业内是最领先的。
创业公司人手不够,我几乎什么都自己动手做过,从前端到后端,从编解码设备,流媒体服务器到播放器,从运维到售前到产品经理。一开始我们给不同客户做定制化开发,后来逐步把解决方案产品化。很多一线电视台、互联网公司都采用过我们的产品,也承接过超大规模的直播活动如优酷Nokia演唱会、2008年奥运直播等。通过技术改变世界,还是很有成就感的。
创业最大的痛苦在于,To B市场做起来比较辛苦。因为客户的需求都是个性化的,定制化的东西非常多,每个项目做下来都投入非常大,但可复制性不高,每个客户都要拨出人力去做支持,公司很难实现规模盈利,团队也就很难成长得快。我中间在外企FreeWheel修炼了几年,优秀的老板和同事们带我在技术上和管理上更进了一步,后来看到新的技术机遇,还是没忍住又出来创业。第二次创业和第一次面向的市场客户还是类似的,区别在于技术上更成熟了,而且会使用一些更新的技术,比如用Flash P2P来解决规模和成本问题,用硬件编码器来提升编码集群密度等。
LiveVideoStack:我相信这两段经历你让收获了很多经验,有了对市场认知。最大收获是什么?
于冰:我觉得最大的收获是转变技术主导的思维,多思考技术以外的东西。首先,作为技术合伙人,在公司内外,还需要跟非技术人员做大量沟通,过程中也认识了很多朋友,得到了很多有益的帮助。公司内的产品、设计、销售、售前售后支持,合伙人、投资人,公司外的各种客户,电视台的领导、技术人员、编导等,合作伙伴如集成商、友商、CDN厂商等,各行各业各种类型的人都接触过。三人行,必有我师,这个经历,没创业是很难获得的。另外,在公司内,我在研发团队内的管理方面也得到了比较多的锻炼。比如在资源受限条件下,如何招聘到比较好的工程师?如何跟产品业务部门PK沟通需求,排定路线图?应该如何处理突发事故?怎样去激励团队,怎样苦中作乐?在创业过程中必然会历经很多磨难,但吃一堑长一智,都是个人成长的源泉。
LiveVideoStack:当初决定去创业时候,相信会有自己的目标或梦想,目标和梦想是什么?
于冰:团队的初心很明确,就是希望能够自己从头到尾构建一个最强大的视频系统,解决一些别人解决不了的问题——那个时候Google对技术人员的影响是比较大的,大家都希望能够通过技术来改变世界。
我们最开始是在清华的教师宿舍里创业,团队都是清北的背景,应该是在当时做To B视频技术公司中比较出众的。我们希望用技术来改变视频分发和传输架构,在视频编码密度、质量、系统吞吐率和最终用户体验上都要做到极致。能够跟优秀的算法专家、工程师一起合作,一起解决难题,这个过程非常爽。
LiveVideoStack:跟这样一帮人在一起就是让你觉得技术可以真正的改变世界了。
于冰:是的,在产品体验获得客户认可的时候,是很有改变世界的成就感的。只是当时底层技术虽然做的还行,但产品化做的不够好,复制成本高。受限于行业规模,公司成长空间也受限,还是希望能够做影响力更大的事情。当时做的很多直播相关的技术,现在整个行业也还在应用,说明大方向是对的,只是时机未到,平台也不够大。
LiveVideoStack:但是梦想和目标始终都没有变?
于冰:没有变。我个人是一个技术控、产品控,同时爱才如命。一方面要在技术指标上追求极致,一方面要把用户体验做到最优,因此必须跟最好的人来合作,达成这个目标。
LiveVideoStack:回到今天,回到您加入快手,跟当初创业有非常紧密的关系?
于冰:现在的想法和当初创业时是一样的,做技术的人都希望跟强者一起合作,这样会效率更高。我一直在找能够打造一流团队的平台,希望有更大的成长空间,更好的品牌来吸引优秀的人。这样的话,团队和平台双赢,创造更大的价值。
其实在快手的几年,更像是和公司一起创业,快手的音视频团队从初期六个成员成长到如今一百余人的规模,这个成长速度是创业团队才有的,大家的状态也一直都是创业团队的状态。
快手的使命是“用科技提升每一个人独特的幸福感”。在快手,每个人都能够看到更广阔的世界,也能够被更广阔的世界看到,这就要求平台坚持普惠、去头部化,不然普通用户是永远没机会被看到的。平等普惠,真实向善的价值观,用户导向,技术驱动的方法论,吸引了一批最优秀的人才一起去努力,一起追求极致,将用户体验打磨的更好。
LiveVideoStack:所以,Google只招全世界最聪明的人,至于这个人做什么不重要。
于冰:人很重要,做什么也是很重要的。因为做事情需要专注,需要你对这件事热爱,两者是相辅相成的。
LiveVideoStack:你一直在寻找吸引行业中最顶尖人才,等待机会一起来做足够大的事情。
于冰:做一件大家都热爱的事情,这个想法一直没有变。
在快手,两年的时间,我们已经逐步构建了端到端的音视频技术体系,打通了整个短视频+直播的技术栈,建立了完善的数据驱动的音视频体验优化体系。
图:快手的音视频技术体系(摘自于冰在LiveVideoStackCon2018北京的主题演讲PPT)
LiveVideoStack:您有些事业上的追求,寻找最优秀的人在一起,接下来就是两个选项,一是大公司,二是创业。如果都能满足要求,你会选什么?
于冰:对于视频行业来说,创业比较难。因为大平台拥有流量的优势、资本的优势,在创业公司则很难拥有这样的资源去发挥你的价值。
现在快手平台日活已超过2亿,原创视频总量超过100亿条,每日视频播放量超过150亿次,每天上传视频超过1500万,这个平台规模是创业公司所不能比拟的。我们团队每天并行的AB实验就有几十个,规模小的系统可能数据置信度都保证不了。在快手平台,每做一个音视频相关的优化,可能会影响上亿人的使用体验,如果产生的收益,也会是一个天文数字。我们通过大量线上实验证明了,技术优化对于核心用户体验(QoE)影响十分显著,对业务指标有直接的贡献,也直接对应巨大的用户价值。在创业公司很难产生这么大的价值,因此投入规模也会比较受限。
LiveVideoStack:这个行业里技术创业,难度非常大?
于冰:我并不是持一个完全消极态度,只是觉得只靠技术来创业很难,除非是特别强的人,才能做起来。一方面技术上需要有别人真的做不出来的东西,或者至少是短期内做不出来的东西,要有足够前瞻性的技术布局和储备;另一方面还要有刚需的用户场景,解决的是真需求而不是伪需求;最后一个建议是,不妨结合一些非技术的要素,比如资源、数据、版权等,建立自己的核心价值和壁垒。
LiveVideoStack:对于那些还是想去试一把的技术人,有什么建议?
于冰:影响创业成功的因素很多,再说一下人的因素吧,公司肯定不止要做技术,早晚需要做业务来让公司持续赚到钱,走向正向循环。技术人要么自己放弃技术,快速进化成为合格的业务负责人,同时找到合格的技术合伙人来帮你搞定技术问题;如果自己不放弃技术,就需要找到能力强,可依赖的业务合伙人,否则创业很难成功。好的技术人,做业务的潜力也是很大的,因为你有更加结构化、系统性、客观的思维方式;但在感性思维和沟通方面,需要多锻炼加强。
LiveVideoStack:您一直在从事这个行业,但是我们回顾互联网发展有机会,有社交、游戏、区块链还有AI,对技术人来讲,机会很多,那我的问题是,为什么还会一直专注在视频这个领域?
于冰:视频是一个比较垂直的大行业,以视频作为牵引,可以集成很多技术,未来是有很大的空间和机会的。但我觉得AI、区块链都是解决问题的手段,不是问题本身。视频行业问题本身是视频体验——怎样更清晰更流畅,这么多年这个行业一直在解决这个问题,我们现在在用AI来解决传输、图像处理、视频压缩、音频处理的问题,问题还是不变的,只是手段变多变高级了。
LiveVideoStack:问题的本质是?
于冰:提供更好的用户体验。
LiveVideoStack:只要能够更好的解决问题,就有足够的价值?
于冰:是的,如果能够把用户的视频体验做到最好就有足够的价值。在快手,我们比较崇尚用户导向、技术驱动的做事方式,首先理解用户场景,之后根据用户痛点设计优化方案,设定优先级,最终用数据来验证优化的QoE收益。
当然用户导向也会给技术同学带来很大挑战。大家通常喜欢从技术角度出发想问题,但是现在要换位思考,从用户角度、用户需求去考虑,要有反向思维的能力,要培养同理心,这是非常难的事,很多工程师需要经历一段时间的思路转变才能做到。
要说改变起来其实也简单,就是研发人员要成为产品的深度用户,自己从用户角度来推敲和优化,跟产品经理一起深入探讨如何改进得更好。同时要做很多的技术储备,这样当用户需求来了,随时可以拿出来用。如果自己的技术储备不够,又十分着急的话,要考虑采用成熟的第三方技术,而不是从头开始造轮子,让业务方干等着。最终技术好不好要用实际数据来说话,看用户是否接受它,而不是盲目上线技术上看起来很厉害却曲高和寡的东西。
LiveVideoStack:这个事情值得你去用十几年二十年去投入?
于冰:值得,会一直关注,一直做下去。720P做完了做1080P,1080P做完了做4K,4K做完了还有8K,还有HDR、高帧率、全景声、VR等更好的体验等着我们,挑战也越来越大:举个例子,8K@120fps HDR的视频如何做实时压缩,想一想就觉得很兴奋,非常有挑战。
LiveVideoStack:从这个角度来看,多媒体技术人职业的发展应该是非常宽阔的,应该是充满了机会。
于冰:是的,解决核心问题有各种各样层出不穷的手段,这个领域有很多细分方向,只要沿着主航道去深入发展就充满了机会。
LiveVideoStack:这又引出另外的问题来,许多专家吐槽,这个行业里的人才太少了,供给出现了问题。从学校这个最大的人才的输出机构来看,选择多媒体、编解码、网络这些底层的技术的学生越来越少。想招一个合适的学生非常难,学生更愿意去搞AI或者金融。
于冰:首先,在我的观察看来,现在有很多学生研究AI、做深度学习,实际上很多人都是拿现成的框架去解决一些自己拍脑袋想出来的问题,而且大多把时间花在了标注数据和调参上。我建议同学们多思考一下哪些问题是真实场景中的真问题,避免解决伪问题。在找到真问题之后,不妨尝试用传统方法搭建框架解一遍,把问题白盒化,有深入理解之后,再尝试用深度学习去解决其中的难点。否则一开始就尝试用深度学习去解端到端的问题,对于领域知识问题本质都缺乏了解,对于深度学习这个黑盒有没有足够的能力掌控,必然会碰壁。
说回行业的问题,其实建议在学校的同学可以放开视野。多媒体领域有很多问题待解决,例如一些老问题可以解的更好:比如如何通过算法做主观质量评价,如何更精确地预测带宽变化,如何进一步对视频图片进行压缩,如何通过算法优化图像质量等等。而且总是有新的问题、亦或新的方法涌现出来,尤其是在即将到来的5G+AI时代,问题和对应的方法会越来越多。想搞AI的同学不妨来视频行业看一下,这里有很多实实在在、时时刻刻都在发生的问题,我们有大量的数据集,包括用户行为日志数据、内容样本、传输日志等等,还可以在大规模真实用户中做实验,这些条件在实验室是完全接触不到的。 在学校关起门做科研的问题在于,学生直接发paper,却不了解问题本质,不了解真实的用户需求,有可能paper涉及的问题是一个根本不存在的问题,或者是个伪问题。而在工业界每天遇到的问题都是实实在在存在的,你用什么方法去解都可以,也可以用非常高深的算法去解决。只是如果用非常复杂方法解,最终很可能是上不了线的,原因可能是算法复杂度太高,或者有一些bad case特别难fix,但发paper大概率是可以的。
要解决高校多媒体专业的人才供给问题,一个思路就是希望高校能够以开放思路来建设实验室,多跟工业界的大平台合作,这样可以为学生提供真实的问题、真实的数据,通过实战的项目,能够进一步开阔眼界,锻炼动手能力。与真实场景问题结合,发paper也更容易中。有了产学研结合双赢的机制,相信会有很多优秀的学生选择多媒体相关的专业。快手去年就跟清华大学联合成立了“清华大学-快手未来媒体数据联合研究院”,一起去培养学生,鼓励大家多用AI尝试解决产品上的问题,有了不少喜人的落地成果。
最后说到行业人才问题,其实国内外多媒体人才并不少,尤其是国内每年优秀的毕业生很多。但与其他行业一样,最好的人才都是比较抢手的。快手在音视频工程算法方向的收益明确,投入坚决。我们在算法方向招聘要求是出了名的高的,主要面向海内外高校TOP实验室招聘最优秀的研究型人才;工程方面覆盖面很广,移动端双端开发和SDK、服务端C++/Java、大数据系统和分析、音视频质量实验室都有开放职位,目前在北京、杭州、深圳、硅谷、西雅图、圣地亚哥都建立了研发中心和算法实验室,也在考虑开设更多的办公地点,吸引一流人才入驻。
LiveVideoStack:刚刚提到了大平台的流量和资源的优势,可以满足你达成技术人梦想。如果让你用几个关键字来形容一下快手这家公司会用哪些词?
于冰:去年我在LiveVideoStackCon2018大会上讲过,前边也提到了:“用户导向,技术驱动”,这是我非常认同的方法论。快手是一家特别重视用户体验的公司,可以说整个公司的人都在优化体验,投入巨大,今年公司对大家的要求也是 “追求极致”,这已经成为了公司的基因不会改变:“追求极致”就需要在关键领域上有足够大的压强,这样才能够突破。我们给了最优秀的技术人员一个很好的机会——把特别细的细节做好,不像有的产品只做到80分就够了。这就可能要求在一些别人看起来非常小的领域中投入非常大,当然我们做得还不够,积累的时间还不够长,某些技术也正在逐步赶上。另外,前边还提到过,公司的价值观也是吸引众多优秀技术人才的因素:平等普惠,真实向善,是贯穿在公司内外的行为准则。
LiveVideoStack:毕竟人力是有限的,当你在做一个决策的时候,到底是自己来做,还是先用供应商的产品。你也说到,业界有团队会做得非常出色。
于冰:我们一直都抱有开放的心态,积极调研外界的新产品新技术,跟自研系统来PK,很多友商的产品做得相当不错,不过很多公司并不对外提供技术,有的则价格很贵,而且要采用第三方的产品上线还必须考虑各种各样的非技术因素。当然在这个行业里面,评测下来我们自己做的还可以。
我们很欢迎大家多利用LiveVideoStackCon大会这个平台来探讨,怎样把技术做得更好。希望大家能够保持长期的合作,一起做对比测试,我们有非常专业的质量测试实验室,会帮忙建议哪里需要加强,我们也可以知道自己哪里做的不好:三人行,必有我师。这样的话,技术才能不断改进,而不是盲目骄傲自满。
LiveVideoStack:快手和外界的供应商与技术团队是一个比较良好的互动切磋?
于冰:我希望建立一个开放的系统,而不是封闭的闭门造车,我自己创过业,相信创业团队在某些点上很可能会做的比我们深入。只是团队有时候比较忙(没有时间一一反馈),也有些时候是因为提测的技术没成熟到一定程度,评估需要花比较多人力去测试,因此我们会尽可能多做评测,同时也会谨慎选择。
LiveVideoStack:很多公司有一套自己的数据集和系统来评估Codec,快手是否有这样的系统?
于冰:我们有一套比较完善的codec评估体系,主客观都会做评估。我们的移动端短视频和直播的通用测试集,可以提供给相关合作伙伴采用自己的算法做压缩,结果出来后,我们会对比质量是否达标,客观指标主要看PSNR和SSIM BDRate,主观指标有专业的评估团队来看。十分期待LiveVideoStack组织一个中立的比赛,让大家用同样的测试集PK,用标准的评估手段去考验大家对Codec实现和调优的能力,提升整个行业的水平。
LiveVideoStack:快手、大疆,包括华为、阿里、腾讯等越来越多的国内企业在标准组织贡献专利,参与标准的制定。怎么来解读这个现象?我们能看到一个原因是规避一些专利风险。
于冰:我认为多数公司是从专利这个角度出发来思考的。除此之外,我们有更深入的考量。首先,面向广播电影电视内容制订的压缩标准,实际上对移动端视频并不是特别的适合,所以我们会针对移动端做许多创新的算法研究。第二,在研究算法的同时,我们也希望把算法实现到产品里去,看如何做的更有效率,这方面标准算法研究团队的专家们可以很大的忙。
LiveVideoStack:倒数第二个问题。5G带来产品机会,哪些技术会因此会受益,快速普及或难点突破?
于冰:目前暂时还不明朗。3G到4G经历了互联网移动化大潮,这个过程中有新的终端产生:智能手机,它的用户体验远远超越了传统的终端,但是在5G时代还没有出现这样的终端。实际上如果没有智能手机的普及,4G是没有应用场景的。 2007年初乔布斯开iPhone发布会之前,所有的运营商、电信设备商都很焦虑,他们看不出4G做出来有什么用?发图片、发短信3G就够了。但在5G时代,这几年内如果没有一个能创造类似量级的体验革命的终端出来,很可能会遭遇4G发展初期类似的困境。
LiveVideoStack:哪些技术会有机会?
于冰:革命性的终端出现前,技术都是渐进式的变化,不会特别明朗。
LiveVideoStack:最后一个问题,今年有什么计划?2019年马上过去五个月了。
于冰:今年要做的事挺多的,跟公司大方向一致,那就是“追求极致”。我们在移动端视频拍摄编辑、传输算法、压缩算法等方向都在进一步突破。
另外,今年我们会将音视频中台的建设作为重点工作,音视频中台是快手技术中台的核心支柱之一,我们希望利用领先的音视频工程算法能力来支持快手APP以外的其他业务,如AcFun、快手海外版Kwai和视频编辑工具快影等。通过中台的建设,我们的技术落地场景将会更多,包括短视频、直播、长视频等,将覆盖更大范围的用户,也将会迎来更大的技术挑战。
这里也预告下,快手的短视频架构负责人陈彬、直播架构负责人郭亮在LiveVideoStackCon 2019北京站大会上,会分别分享“快手高性能移动端多媒体引擎架构”以及“快手直播的升级之路”,欢迎大家来听听我们在做的事情。
LiveVideoStack 招募
LiveVideoStack正在招募编辑/记者/运营,与全球顶尖多媒及技术专家和LiveVideoStack年轻的伙伴一起,推动多媒体技术生态发展。了解岗位信息请在BOSS直聘上搜索“LiveVideoStack”,或通过微信“Tony_Bao_”与主编包研交流。
点击【阅读原文】或扫描图中二维码,了解更多大会讲师及分享内容信息!