LiveVideoStack是专注在音视频领域的技术社区,聚焦在音频、视频、图像等技术的最新探索与应用实践,覆盖教育、娱乐、医疗、安防、旅游、电商、社交、智能设备等行业领域,旨在推动相关开源项目与最佳实践普及和传播,让技术改变我们的交流、学习、娱乐和工作。
唐赓,北京密境和风科技有限公司iOS技术负责人,负责直播技术开发与研究,目前工作集中在主播端功能特性开发与优化。在音视频多媒体技术、云计算、系统优化方面有多年工作经验。
在经历了野蛮发展的2016直播大战后,App端的技术扮演越来越重要的角色,好的技术可以让App在大量同质化的直播App中脱颖而出,让用户体验和用户留存率显著提升。互联网老码农、朝阳区老群众唐赓将在本次分享上介绍某知名直播App在手机端技术的探索和实践、以及对未来的展望和思考。涉及265、GPU技术、游戏级交互引擎、人工智能、深度学习等技术在直播中的应用和展望。
张玺辉,布卡互动创始人,清华大学网络极客,互联网教育创业者。
在大规模、高并发的需求下,怎样的网络基础架构能够实现音视频较好的传输,达到不卡的效果。时时交互的音视频应用,不掉线到底对系统有多大的影响?而视频延迟这个事,没有最低,只有更低。本次分享将重点讨论布卡互动在卡顿、掉线和延迟方面的优化实践。
刘文,多年机器视觉算法和音视频算法研发经验,先后负责证件识别、图片滤镜特效、视频点播、视频成本优化等方面的工作。目前主要负责微博视频消费侧算法和视频新技术的研发工作。
全景图片和视频包含的信息更丰富,可以为用户带来沉浸式的体验,但是相比普通的图片和视频面临更多的挑战。例如全景图片和视频需要更高的清晰度和分辨率,文件会很大,带宽成本会提高,展示需要的加载时间更长,设备解码的消耗也会更高,这些对高质量的全景体验形成了挑战。本次分享主要围绕微博全景在处理这些挑战时的一些实践经验。
张弩,百家云架构师。从2006年开始进入音视频行业,负责软件视频会议系统设计、研发工作。对分布式系统、大数据并发传输、音视频编解码有丰富经验。 2013年后关注在线教育,并积极探索基于互联网的音视频教育系统的实现和优化。
在教育场景下,直播业务的有独特的特征及技术实现,如低延迟、交互性、“音视频+文档+问答业务”、场景回放等。此外,在线教育还需要与硬件产品结合,如手写板、双摄像头及各类双师硬件。本次分享将介绍百家云针对这些场景的实践经验,此外还会分享一些领域的探索,包括海外用户的直播保障、VR、连麦等。
唐通,CC视频研发副总监,多年的流媒体行业从业经验。曾先后参与并负责了CC视频点播、直播云平台的基础架构与团队建设工作,专注于实时高并发分布式系统的架构。从2015年起组建团队打造场景化直播云平台,为上百家企业提供稳定多样化的服务。
相较于秀场类直播,在线教育直播对于直播过程中的互动需求更高,如何用webRTC实现多人的连麦,如何将多对多高实时模型与一对多高承载模型相结合,如何实现互动白板与文档,将是本次分享讨论的重点。
郝明非,金山云视频技术总监,前百度媒体云技术负责人。9年多媒体云和端开发经验,负责过直播CDN开发,移动端开发,服务端实时转码、分布式转码、p2p项目开发,擅长多媒体领域大数据处理。
随着直播、点播服务同质化越来越严重,通过技术手段保证播放质量、降低运维难度就十分重要了。本次分享将介绍金山云视频平台的技术探索,包括265编解码全方案,高可用CDN架构、监控与数据统计、自动适配等。
全行业
技术本身并不会产生价值,只有与应用场景和行业结合才能发挥价值,LiveVideoStackCon将覆盖教育、娱乐、医疗、安防、游戏、电商、社交、智能设备等行业领域。
国际化
LiveVideoStackCon放眼全球,将邀请Google Chrome、FireFox、DeepMind、Hulu及WebRTC、FFmpeg社区的技术专家,为参会者带来全球同步的技术实践与趋势解读。
服务社区
LiveVideoStackCon不仅邀请国际著名社区WebRTC、FFmpeg、VideoLan、live555的开发者者,还会邀请本土有影响力的社区代表,包括SRS、Yasea、EasyDarwin等。借助此次大会,让更多优秀的开源软件和社区领导者得到推广。
编解码始终是核心技术,也是难点,如何做到带宽成本、清晰度、流畅度之间的平衡,伴随着FFmpeg和H.265的普及,各家在实践应用中各显神通。
赵军
英特尔
资深软件开发工程师
随着视频图像数据的爆发式增长,对视频图像处理的性能要求越来越高,在大部分的的平台上,有专门的硬件用于执行Video相关的任务,这些硬件被用于解码,编码,转码,图像后处理,视频分析等任务,这些方案与纯粹的CPU方案相比较,在功耗和性能方面有很大优势;但也同我们所知道的大部分的事情一样,利弊共存;即使如此,在一些实时场景以及对Video性能有很高要求的情况下(如高密度的视频转码),FFmpeg的硬件加速方案依然凸显出了非常高价值,在Intel平台上,我们使用Intel的GPU,提供了一套基于VAAPI/Media SDK的硬件加速方案,本报告将介绍Intel平台下的FFmpeg的GPU加速的当前状态以及一些技术细节,同时给出进一步的开发计划,并综述了FFmpeg在其他平台上的硬件加速方案。
鲍金龙
暴风影音
首席架构师
鲍金龙,早年毕业于北京大学化学系,在职软件工程硕士。曾任国家653工程教材编委,编写《c/c++多媒体开发案例实战》一书。目前担任暴风科技有限公司首席架构师。 具有在多个大型软件公司中高层技术职位任职经历,成功组织开发十数个多媒体/流媒体软件产品,制定EVD国家规范等。在视频压缩技术,网络流媒体应用,视频播客、直播、点播、P2P、服务器集群,多线程开发、并行计算等底层核心技术的基础理论、框架标准和程序实现,以及性能优化等领域耕耘多年。
a) 如何去除左右图像之间的空间冗余;相比左右排列,编码效率提高30%以上; b) 在不明显降低质量的前提下大幅提高压缩效率。主要思想是对图像进行分层处理,不同层的图像使用不同的编码质量; c) 在可接受的延时下大幅提高X265编码器在超过16核心时候的并行效率; d) 大幅提高X265编码器在4k图像上的编码速度。
李大龙
腾讯
视频移动端播放内核技术负责人
李大龙,腾讯视频移动端播放内核技术负责人。研究生毕业于武汉大学国家多媒体工程研究中心,加入腾讯大家庭后历经腾讯研究院、QQ影音、QQ视频聊天、腾讯视频等多个音视频产品技术团队。十余年的业界经验让我深感视听体验不仅是互联网泛娱乐的富媒体手段,更是全人类品质生活的连接器。站在人工智能时代的黎明,我们目送H.264/AVC、Flash等老朋友渐行渐远,与HEVC、VR/AR、HDR/WCG诸多新鲜元素相伴熟悉,一路高歌前行、永远灵感相随,让我们一起Change the World!
2017年初腾讯视频启动提升全网清晰度攻坚战,这对自身已有海量用户基数的业务而言,面临巨大的成本增加。在利用技术创新“保本”增效的探索道路上,我们一方面将智能学习技术引入到编码场景划分、ROI码率增强、图像质量评测等辅助编码环节,向率失真极限再次发起冲击;另一方面从客户端方案入手,重构了统一播放框架、用极致可靠的前端实现推进HEVC的大规模成熟应用。
此次分享覆盖腾讯视频近期在编解码两端的技术探索和实践经验:从HEVC编码算法框架谈起,如何在计算效率与压缩效率之间取得平衡;而后结合近年来智能学习技术的发展,重点介绍腾讯视频在编码各环节的辅助增强思路及实施方案;最后全面归纳移动端播放框架的形成与演进,梳理HEVC划时代跃进背景下对我们的挑战以及应对之道。
李成亚
新浪微博
视频转码平台技术负责人
李成亚,15年加入新浪微博,新浪微博视频转码平台技术负责人,曾参与微博混合云体系建设;在互联网后端服务研发及架构方面有多年的实践经验,关注高可用,高并发,云生态等领域。
近两年,视频在互联网社交领域爆发式增长,极大的提高了内容的丰富程度和用户体验;但是,相较于文字/图片内容,视频要复杂的多,它会消耗几乎所有的硬件资源(CPU/GPU、内存、磁盘、带宽);本此分享结合新浪微博视频相关业务的发展历程,对视频转码服务的架构变迁做了一个深入的剖析;也会结合每个阶段我们碰到的一些业务、技术上的问题,分享一些具体的实践方案。
朱政
金山云
视频云算法技术总监
2010年获浙江大学博士学位。2014作为合伙人创办仟壹视讯,主持并作为主力开发H.265 codec软件,实现复杂度对标X264知名软件,获得业界认可;2015.11至今,金山云视频云技术总监,负责算法部门,主持编解码、图像视觉和AI等方面工作。
KSC265在各个阶段的研发思路以及重点投入的方向;KSC265如何一步步实现复杂度与X264的对标,并保持H.265应有的压缩性能;KSC265的研发规划。
郑鹏
海康威视
嵌入式软件开发工程师
以往实时通信技术属于仅仅被视频会议行业所掌握的“高大上”技术,行业以外只能依赖IETF文档进行“盲人摸象”般的探索,并且几乎没有高质量的开源实现。该领域不但技术门槛高,而且专利陷阱多。WebRTC的出现改变了这一局面,它不但揭开了实时通信领域的神秘面纱,而且提供一条从专利角度来说比较安全的切入途径。然而,WebRTC技术对于安防主流视频编码支持不够好,对H.264仅支持到Baseline Profile,对H.265的官方支持更加遥遥无期;另外,它捆绑了点对点、安全、传输等一系列技术,和传统协议的对接存在较大困难。这两点原因(尤其是第一点)造成了它暂时无法在安防业内普及。
幸运的是,WebRTC采用的各种技术都是通用开放技术,我们完全可以借鉴学习以后使用到自己的项目中去解决实际问题。本次演讲我将围绕WebRTC中的音视频传输技术,将其中各个关键算法实现的具体类从WebRTC大量的源代码中剥离出来,并谈谈我自己的理解。
目标听众是对RTP/RTCP相关技术感兴趣的人。
郭亮
腾讯音视频实验室
音频技术负责人
先后供职于中兴通讯、腾讯科技。热爱技术,深耕于音视频行业十余年,在实时音视频以及直播架构的定义、设计、运维、质量评估与监测等方面有大量的实践经验和独到见解。关注新技术动向,对机器学习等前沿算法在音视频技术中的应用有着浓厚的兴趣。
1. 音视频通讯能力作为标配渗透到了各个行业,本次分享不仅将与大家一起探讨在各个细分场景下如教育、金融、游戏等行业下的音视频技术,以及腾讯音视频实验在流畅无卡顿、回声消除等音频前处理、网络部署与覆盖等各个技术上的一些深度解析;
2. 同时,更加会介绍腾讯音视频实验室一些前沿技术上创新与探索在音视频场景中的落地应用,如高性能手势识别与跟踪等。
秒开、美颜、智能抠像、3D动画,这些还不够,还有哪些App端的黑科技?
唐赓
北京密境和风科技有限公司
iOS技术负责人
1. ARKit、3D引擎等技术等技术在直播场景下的应用;
2. 深度学习技术在直播中的应用;
3. 265等技术在直播中的应用。
傅徳良
Hulu
全球高级研发经理,视频编解码与传输领域资深专家
本次分享会结合hulu的生产实践,介绍我们流媒体服务质量和其与用户体验之间关系的理解,并介绍通过对自适应码率算法进行优化从而改进流媒体服务质量与用户体验的实战经验与心得。
孙磊
网宿科技
资深音视频专家
孙磊,早稻田大学博士学位,专攻视频编解码技术,熟悉H.264/H.265等主流视频编码标准以及各种流媒体传输协议和封装格式。目前就职于网宿科技股份有限公司,主要负责音视频架构设计,以及前沿科技研究,工作内容包括搭建高效转码系统、点播直播端到端的H.265视频编解码方案、低带宽下的VR视频传输技术研究等。
VR视频以其沉浸感为点播直播带来了全新的体验,成为在线视频的下一个发力点。在体验提升的同时,与传统视频相比4倍以上的带宽需求给VR视频的推广带来了极大困难。本次分享整理了当前低带宽下VR传输的主要技术点,包括球面到立方体投影方式转换、根据视角按需传输、H.265以及P2P,网宿科技基于上述各项技术已可在2-5Mbps下做到4K@10Mbps相当画质。
江文斐(闻非)
阿里巴巴
高级专家
江文斐,阿里巴巴高级专家,优酷媒资生产和阿里云视频算法负责人,近十年来他一直从事视频领域的学术研究和产品研发,发表了多篇顶级学术论文,申请了30余项全球专利。他为阿里集团建立了一套支撑着优酷、UC、淘宝视频、天猫魔盒等各类业务的通用转码服务,并为阿里视频云打造了云点播、云直播、画质重生多款产品。他推出的“窄带高清”转码,一种从人眼视觉系统出发,将编码器压缩能力用到极致的视频技术,为阿里集团以及一大批云客户节省了20-40%的带宽成本,并同时提供更清晰的观看体验。
编解码标准是视频行业不可或缺的要素,过去20多年来每一代编解码标准的推出都要经历好几年乃至上十年的研发和普及。标准的更新换代节奏逐渐赶不上目前视频行业的发展速度,如何让视频的压缩率和清晰度快速且大幅提升呢?阿里巴巴推出的“窄带高清”,完全遵循H.264或HEVC标准,不修改任何语法或解码流程,从人眼视觉模型出发,将编码器的优化目标从经典的“保真度最高”调整为“主观感受最好”,使得窄带高清H.264码流在相同码率下画质不低于HEVC,窄带高清HEVC码流画质不低于JVET和AOM最新的实验性编码码流。正是这套技术,帮助优酷、淘宝、阿里云突破了当代视频编码器的能力上限,在节省20%以上码率的情况下,也能提供更加清晰的观看体验。
冯迅
欢聚时代(YY)
直播部媒体技术中心研发经理
从事通信网络十几年,具有丰富的网络传输经验,YY音视频传输系统和音视频直播后端系统技术负责人。
结合YY实践,主要阐述:实时传输网络的主要影响因素;主播系统和观众系统在传输上有哪些差异化;实时、可靠层面,我们做过哪些努力和优化。
无论是微信还是浏览器,越来越多的音视频互动在通过更轻量的方式实现,但如何保证各个浏览器的兼容性,又兼顾开发效率呢?
刘连响
dotEngine
音视频通话云创始人兼CTO
随着主流浏览器都支持了webrtc,实时音视频技术上的开发成本越来越低,webrtc相关的技术被更广泛的应用。但想把webrtc用好还有很多的工作要做,比如防火墙的穿透,各种视频编码的兼容,信令协议的选择,Android平台软硬件编码兼容问题。我们在开发dotEngine中也遇到了各种各样的问题。本次演讲主要讲在刚接触到webrtc开发时容易遇到的问题.以及如何选择。
目标受众需要对webrtc有基本了解, 已经对音视频编码有基本了解.
姜雨晴
熊猫直播
前端技术专家
本科毕业于四川大学,研究生毕业于加拿大Dalhousie University。曽任FedoraRepository team Member。现于熊猫直播从事H5播放器内核开发、弹幕引擎开发、WebGL开发。
随着Flash逐渐退出历史舞台,基于HTML5的视频播放技术盛大登场。与Flash相比,HTML5视频播放则基于浏览器原生实现,有着更高的性能和更低的消耗。但由于浏览器实现差异,及视频源多样性,使得HTML5播放器的实现变得异常复杂,本次分享将以熊猫直播业务为背景,对HTML5播放器内核和处理机制进行研讨。