音视频技术开发周刊 | 284

每周一期,纵览音视频技术领域的干货。

新闻投稿:[email protected]

音视频技术开发周刊 | 284_第1张图片

Google联合多加巨头推出ML基础设施:OpenXLA

阿里巴巴,AWS,AMD,Apple,Arm,NVIDIA都在其中。

https://opensource.googleblog.com/2023/03/openxla-is-ready-to-accelerate-and-simplify-ml-development.html

万字长文,探讨关于ChatGPT的五个最核心问题

我们判断,如果ChatGPT不犯大错,两年内,整个科技行业甚至人类社会都会被颠覆一遍。倒计时已经开始了。

音视频技术开发周刊 | 284_第2张图片

Stable Diffusion + ControlNet + Unreal 5 驱动的AI虚拟人

这也许是数字人的新玩法?

https://twitter.com/CoffeeVectors/status/1632825278148870145

Stable Diffusion完美复制Korean doll likeness

Stable Diffusion是2022年发布的深度学习文生图模型。它主要功能是用文本的描述产生图像。

https://zhuanlan.zhihu.com/p/606825889

音视频技术开发周刊 | 284_第3张图片

HDR转SDR实践之旅流程总结

本系列文章主要讲Android中如何正确处理HDR视频,从开发遇到的问题作为切入点浅显易懂讲解HDR理论。

https://juejin.cn/post/7205908717886865469

音视频技术开发周刊 | 284_第4张图片

Meta的AV1在Reels的应用实践

我们坚信,AV1将成为Meta未来几年最理想的编解码器选项。与前几代视频编解码器相比,AV1能够以明显更低的码率提供更高画面质量。

https://engineering.fb.com/2023/02/21/video-engineering/av1-codec-facebook-instagram-reels/

2023年视频软件编码最新技术与趋势

在这篇评论文章中,微帧科技(Visionular)公司联合创始人兼CTO Zoe Liu分享了她对于2023年及之后编码领域的发展态势预测,具体包括低能耗视频转码、HEVC与AV1的发展前景、实时转码、AI在转码中的作用等议题。

音视频技术开发周刊 | 284_第5张图片

Akamai迎来900GBps攻击

攻击发生在今年2月23日,每秒1.58亿网络包。

https://www.akamai.com/blog/security/record-breaking-ddos-in-apac

SRS6.0: 七年长跑,全面支持H.265

SRS在6.0中终于正式支持了HEVC(H.265),几乎全面支持,包括RTMP、FLV、SRT、TS、HLS、DASH、GB28181、WebRTC(Safari)、DVR FLV、DVR MP4、WordPress SrsPlayer等等。

跳帧技术实现高‍帧率 UHD 实时通信

本文提出了一种帧跳跃机制,通过主动管理解码器队列中的帧,有效地降低了队列延迟。

音视频技术开发周刊 | 284_第6张图片

Dirty Pixel-极端环境下联合ISP成像和感知的端到端算法方案

本文重点说明了图像理解任务结合AI-ISP处理的潜力。本文的模型在低光照和其他具有挑战性的成像条件下,输出的图像能够帮助提升后续图像分析任务的性能。

音视频编解码--JPEG格式2——读源码

我们针对源码深入学习一下相关原理。

音视频技术开发周刊 | 284_第7张图片

Google发布通用语言模型 支持超过100种语言

基于1200万小时的语音,约280亿句子训练而成。

https://ai.googleblog.com/2023/03/universal-speech-model-usm-state-of-art.html

音视频技术开发周刊 | 284_第8张图片

对话Shopify创始人Tobias Lütke:把小事聚在一起办大事

来自于Linkedin联合创始人Reid Hoffman与Shopify创始人Tobias Lütke的一次关于“Be a platform”(打造一个平台)的深度对话。在这次对话中Tobi分享了关于他早期创立Shopify的成长故事。

对话镕铭微电子蔡媛:深入理解用户痛点,满足差异化需求

FPGA具备可编程的属性,成本也非常高,一块高性能FPGA成本就要几千美金。ASIC编解码芯片在满足超高清视频编解码的需求前提下,其TCO成本仅为行业性能领先的软件编码器成本的1/15 - 1/20。

音视频技术开发周刊 | 284_第9张图片

老牌搜索引擎DuckDuckGo推出维基百科 + AI的问答引擎

本周三,DuckDuckGo推出了DuckAssist,一个基于OpenAI技术的问答引擎,而且是免费的。

https://arstechnica.com/information-technology/2023/03/wikipedia-ai-truth-duckduckgo-hopes-so-with-new-answerbot/

Google和亚马逊有兴趣投资SHEIN

SHEIN考虑采购更多Google的广告资源,以及来自Google和AWS的云服务。

https://www.theinformation.com/articles/shein-had-informal-talks-with-u-s-tech-giants-about-potential-investment?rc=nkup8q


活动推荐

Google I/O 2023

5月10日开启。

https://developers.googleblog.com/2023/03/lets-go-its-google-io-2023.html

音视频技术开发周刊 | 284_第10张图片

倒计时21天:和LiveVideoStack在2023年的第一场约会

时隔15个月,再聚北京。

时间:8238ad2161e5404d71109607b5fb5c68.png2023年3月31日 - 4月1日

报名:16bd84fe2593002bc796d8eadf225b88.png点击【阅读原文】了解详细信息,报名参与。

你可能感兴趣的:(音视频)