音视频技术开发周刊 | 149

每周一期,纵览音视频技术领域的干货和新闻投稿:[email protected]

架构

WebRTC M84 版本发布

M83 反而更令人兴奋。

https://groups.google.com/forum/?utm_medium=email&utm_source=footer#!msg/discuss-webrtc/MRAV4jgHYV0/5019yB-HAwAJ

传输网络

变革世界中的实时流媒体

本篇是来自Streaming Media的圆桌讨论,主题是:"变革世界中的实时流媒体",主持人是来自nformation Today公司视频发布总监,以及流媒体制作人编辑SteveNathans-Kelly。

https://mp.weixin.qq.com/s/fYf3CJ2MIm678LqTqtF-lw

如何优化实时流媒体的工作流程

本文是来自Streaming Media East Conect 2020的演讲,演讲者是来自videoRx的CTO,Robert Reinhardt。演讲的主要内容是如何优化实时流媒体的工作流程(How to optimize your live streaming workflow)。Robert在这次演讲中详细分享了进行一次直播所需要的相关知识和所需准备。

https://mp.weixin.qq.com/s/oJLNmLMWqc5beEmRQtvr3w

详说TCP粘包和半包

TCP服务端和客户端建立连接后会长时间维持这个连接,用于互相传递数据,TCP是以流的方式传输数据的,就像一个水管里的水一样,从一头不断的流向另一头。理想情况下,发送的数据包都是独立的。

https://juejin.im/post/5eeac734f265da02f45380cd

iOS 分享一个边播边缓存的库(支持VOD和HLS)

SJMediaCacheServer 是一个 iOS 端的 HTTP 媒体数据缓存框架. 播放器向本地 HTTP 代理服务器发送播放请求后, 会查询本地缓存, 如不存在缓存, 则进行下载并返回给播放器。

https://juejin.im/post/5ee31be851882557525a8b18

编解码

FFmepg 4.3发布

大约每6个月,FFmpeg项目就会发布一个新的主要版本。在主要发布之间,发布会添加重要的bug修复,但没有新特性。注意,这些版本是为分销商和系统集成商准备的。强烈建议希望自己从源代码编译的用户考虑使用开发分支,这是FFmpeg开发人员工作的唯一版本。发布分支只从开发分支中挑选选中的更改,因此开发分支会得到更多更快的bug修复,比如附加特性和安全补丁。

http://ffmpeg.org/download.html#release_4.3

如何利用客观质量指标微调编码

本篇文章来自Streaming Media East Connect 2020的一篇演讲,演讲者是来自Streaming Learning Center和Streaming Media的JanOzer。

https://mp.weixin.qq.com/s/7ogQE-4xouCfiq8dmT88KA

爱奇艺编码团队:我们让AV1编码速度提升5倍

如果说VVC是编码标准中的白富美,那么AV1就代表了广大的互联网玩家——承受不起高昂的专利版税。为了实现免专利费的目标,AV1不得不“舍近求远”的方式躲开已有的专利,这导致其计算复杂度非常高。爱奇艺科学家王志航透露,在同等的画质下,编码速度是开源SVT-AV1的5倍。LiveVideoStack团队也在极力邀请王志航加入LiveVideoStackCon2020北京,期待届时带来对该编码器的更详细的解读。

https://mp.weixin.qq.com/s/4G0Il_ZwjA1Kj6jeIO-E2Q

视频技术

Square Off 机器人对战国际象棋游戏增加了用于远程视频通话功能

我想知道他们是否在这里使用了 WebRTC。

https://techcrunch.com/2020/06/05/the-square-off-robotic-chess-board-gets-a-video-calling-component-for-remote-games/

Lifesize 视频会议系统增加端到端加密功能

Lifesize 使用端到端加密量翻倍了,为此使用 WebRTC 并解释其缺失的部分。

https://www.lifesize.com/en/video-conferencing-blog/e2ee

互动直播中的前端技术 -- 即时通讯

本文介绍了互动直播中的即时通讯技术的在前端中应用,并分享了自己在工作开发中的一些经验,希望对您有所帮助,欢迎探讨。

https://juejin.im/post/5edd963ff265da76ee1f5b18

人物专访

魔镜魔镜告诉我,画质评测哪家强?|LiveVideoStackCon2020讲师专访

蔡媛,15年加入金山云, 现任金山云高级技术总监,负责视频云AI 产品线、媒体处理产品线、视频质量评测体系建设的产品及研发工作。核心项目包括媒体云转码、集智高清、画质增强、KSC265、KQoE等。

https://mp.weixin.qq.com/s/-QkUd0NkKjwAS2QS7fuNlg

毕业五年的音视频开发工程师过得怎么样了?

5年的时光对于互联网从业者而言,足够去了解互联网产品的璀璨生命力了,有些产品和公司在这五年间从默默无闻走向家喻户晓,这也振奋了我们这群从业者的激情和信念。

https://mp.weixin.qq.com/s/vLbUdnzB17V-SMgLXLg9iALVS

AI智能

拯救渣画质,马赛克图秒变高清,杜克大学提出AI新算法

将「马赛克」像素级别的大头照转换成高清照片,是一种怎样的体验?杜克大学提出的 AI 算法,不仅可以「去掉马赛克」,还能精细到每一道皱纹、每一根头发。你要试试吗?

https://mp.weixin.qq.com/s/ArbIPiyHtBWbr-ToKzT9UA

图像

比OCR更强大的PPT图片一键转文档重建技术

目前越来越多的资源信息是以图像形式存储,然而很多用户在获取图像后需要对图片进行编辑或者电子文档形式进行存储。最主流的做法是直接进行 OCR 提取,但这种方法无法满足用户对排版的需求。

https://mp.weixin.qq.com/s/nD-TcFVk63b8LGCAbiMUNA

资源推荐

轻量级图片选择库ImageSelect

android 量级选择图片框架,支持拍照,获取相册图片,获取本地视频,可以多选,单选。

https://github.com/JackLiaoJH/ImageSelect

盘点 | 22 款神经网络设计和可视化工具

深度学习领域,最常见的就是各种网络模型,那么在写论文或者文章,介绍网络模型的时候,最好的办法当然就是展示代码画图,今天介绍的 Github 项目,就是整理了 22 个设计和可视化网络结构的工具,其地址如下:

https://github.com/ashishpatel26/Tools-to-Design-or-Visualize-Architecture-of-Neural-Network

音视频技术开发周刊 | 149_第1张图片

点击“阅读原文”了解更多关于线上峰会信息。

你可能感兴趣的:(音视频技术开发周刊 | 149)