LiveVideoStack_

视频质量评价——从裁判到教练

视频质量评价(VQA)是视频服务系统中的重要技术要素，贯穿成像、编辑、处理、编/转/解码、渲染、显示等整个视频技术链条。上海交通大学教授宋利在LiveVideoStackCon 2018大会上对VQA的工业标准，服务流程管理技术等相关内容进行了详细的介绍。LiveVideStack对演讲内容进行了整理。

文 / 宋利

整理 / LiveVideoStack

大家好，我是来自上海交通大学的宋利，接下来我将从以下三个方面为大家分享有关视频质量评价的内容。

1. VQA技术图谱&工业标准

1.1 总体框架

在开始正式介绍之前让我们了解一下什么是VQA。简单来说VQA就是视频质量评价体系，主要分为主观评测与客观评测两个部分。主观评测是忽略各种客观影响因素单纯依据终端用户对画面的直观感受作出的质量评价，其过程为由具有统计意义的一组人进行评分并重点考察观看测试条件、个人偏好对评测结果的影响，这种评测方法的特点是成本高且速度慢。为了实现更公正的规模化视频质量评价，我们需要引入客观评测指标结合主观评测对视频质量做出综合分析。所谓客观评测更多是依靠仪器、软件等客观评价手段对视频画面质量做出判断并尝试寻找与主观评测结果之间的联系，这种由机器自动评分的方法其精度逼近主观评测，可明显提高评测效率并为实时评测提供技术支持。简而言之，VQA以主观评测为基础指标，以客观评测为重要参考指标。

1.2 主观评价目的

主观评价可衡量总体服务体验，并为客观评价指标体系（延时、卡顿、丢包等）提供校验基准。通常来说，测试指标越贴近用户所感则越可称其为“体验”，因为“体验”更多反应的是用户主观感受。VQA主观评价体系将用户体验质量摆在首要参考位置，并以底层网络或媒体层参数作为基础逐级形成。主观评测及获得的大数据是我们优化技术、服务用户的参考依据。

1.3 工业标准——ITU研究组

1）总体框架

VQA的工业标准由ITU研究组建立，ITU研究组的职责除了提出视频质量评价体系的工业标准，还有运营SG12这样一个用于确立VQA视频质量相关研究工作的研究组织。作为音视频工业界的标准之一，ITU的架构十分复杂，这就需要SG12研究组做出许多努力。

2）分层评价模型

ITU所制定的分层评价模型能够对视频质量评价体系做出系统性模型分解，其结构最上层为媒体层模型，紧接着往下依次为比特流层模型、包层模型与规划模型。不同模型借助不同的衡量体系评价视频质量，如媒体层模型通过内容对比度、模糊度、色调等多个维度分析预测视频质量，比特流层模型主要通过提取分析视频传输层编码信息如QP、复杂度、丢包、花屏参数等预测视频质量；包层模型通过分析包头信息从帧类型、大小、码率等多个维度预测视频质量，而网络规划模型则通过业务KPI和业务KPI需求推导出视频质量目标。当然，现在这一套评价体系距离成熟的大规模商用还有一定距离，相对于其他评价体系其工业化程度也并不是很高。

1.4 工业标准——视频体验联盟标准工作组

国内也成立了如视频体验联盟标准工作组这样的标准制定组织，我也有幸成为此标准工作组的组长。在围绕此领域进行许多研究后我们发现，首先ITU标准中能够落地并实现规模化应用的实例较少，其次就是学术界中许多很好的研究成果成果没有及时反映至标准制定当中。所以标准制定工作组的作用就是帮助新技术快速快速落地于整个视频服务体系当中。

1)工作组发展

上图展示了视频体验联盟标准工作组过去四年的发展历程。该联盟在2016年12月发布了国内首个“视频服务用户体验评估标准1.0”，并协助发布2016年中国视频服务体验白皮书；2017年召开联盟成立大会并立项新标准uVES1.1，并在2018年通过了CCSA标准化立项审核，发布了2018年中国视频服务体验白皮书。

2）体系框架

下图展示了uVES标准的体系框架，其中底层为源视频的传输参数及接收码流，底层之上的KPI包括了视频编码参数、视频传输质量、终端显示、信源信号参数、媒体封装质量、信令交互等基本参数与指标。KPI之上的KQI包括视频质量如压缩损失对视频画质的影响；观看体验质量如由丢包等原因造成卡顿对观看体验带来的影响；交互体验质量如快进快退是否流畅等影响人机交互的因素。顶层则为用户体验，我们综合视频源质量、观看体验质量与交互体验质量三个维度的评价为每个视频赋予相应的分值来判断其质量优劣。

以上三个维度的关键参数与覆盖的典型应用场景如上图所展示的那样，其中的视频源质量主要根据视频的码率、帧率、分辨率、编码类型、屏幕尺寸、音频质量以及视频信号质量、内容复杂度、视频后处理与信号源质量等方面的参数指标做出判断；与观看体验质量相关的考察则依据传输类型有所不同，但会重点分析卡顿与花屏的情况；交互体验质量方面的考察则更多针对与用户交互直接相关的关键参数如加载时长与快进快退时长等。

3）模型的算法评价方法与流程

首先从样本序列库选取目标Samples，经由网络KPI对相关参数做出评价，在此之后经过包接收处理后得到的Metrics会被输入KQI并做出评价，最后根据之前评价结果输出相应MOS分。而算法评价方法则如上图下半部分展示的那样分为主观测试序列与客观预测模型，其中客观模型由主观测试序列与主观测试活动得出的主观测试数据利用分开样本集得到建模序列，再通过数学建模并结合统计评测结果得到。

4）成果介绍

视频体验联盟标准制定工作组建立后制定了uVES1.0标准，并在随后的uVES1.1标准中加入了对新一代编码标准与4K、HDR等技术的支持。

1.5 工业标准——uVES1.0

1）视频源质量

视频源质量是指音视频本身质量指标的高低，其主要影响因素有显示质量Qs、压缩质量Qcod、播放质量Qv。对应在码流层包括基于显示质量、基本压缩参数的Mode 0、基于显示质量和压缩质量的Mode 1，而在图像层还有基于播放质量的Mode 2。

其中的Mode0主要评估视频的显示质量，主要包括了对电视机分辨率、视频显示屏幕尺寸与视频码率的评价。由上图左侧的公式我们可以得到屏幕多项关键质量参数对视频质量的影响，如右侧图线展示的42寸屏幕的各种分辨率MOS极限。

而Mode1则综合考虑了显示质量与视频源压缩质量，其中的评价参数除了电视片分辨率外，还有帧类型、帧大小、量化参数、运动矢量、Skip模式和非Skip模式的比例。得到的Qcod为视频序列的质量分析结果，帮助我们了解视频源压缩对视频质量的影响。

上图表格帮助我们进一步了解Mode1模型的关键参数。

接下来的Mode2则是评估基于图像层的视频播放质量，其关键参数包括块效应、模糊度、对比度与噪点度。其中的块效应表示在编码过程中造成的块边界不连续的情况，模糊度则表示对图像模糊程度也就是基于图像灰度的梯度幅度变化的衡量；对比度是指一幅图像中明暗区域最亮的白和最暗的黑之间的差异范围，而噪点度则是指对像素色度值的浮动的衡量，这种浮动对图片质量无正影响也没有固定的规律。大家可能发现这这里的方法并不新，主要约束在于考虑大规模终端部署时硬件复杂度受限。

上图表格可以比较清晰地帮助我们了解Qs与MOS的分段对应关系。

2）交互体验

交互体验是指视频业务使用过程中业务操作的便捷性与效率，其影响因素主要包括视频系统的响应速度、菜单操作的响应速度、视频初始加载时长、频道切换时长与快进快退响应速度等指标。业界公认的“2秒定律”鲜明体现了上述参数对交互体验的影响：消费者能够接受视频初始加载在2秒内能完成的服务，超过2秒后，加载时间每增加1秒就有10%的用户选择放弃服务；当交互时延达到10秒时绝大多数用户会选择放弃服务。

交互体验的量化分析主要由直播时切换时长、点播初始加载时长、直播时频道切换时延、点播时初始缓冲时延、当前已播放时长与基于人类遗忘曲线得到的用户最大遗忘时长这几个参数共同决定。我们会综合频道切换得分、实时评分与会话评分来判定交互体验的优劣。

3）观看体验

观看体验是指视频在播放过程中是否出现异常的质量劣化问题，包括花屏、马赛克、卡顿、音画不同步等。其影响因素包括网络环境与传输能力、业务平台能力导致的缓存、数据延迟与卡顿。落实在用户体验上，我们通过调研发现受到过去使用惯性的影响，用户对不同尺寸终端的观看体验容忍程度不同。如用户对于同样的卡顿现象，在电视上的容忍程度较低而在手机上的容忍程度较高，相对而言用户体验受到相同异常的影响也有所不同。

- 花屏

关于花屏问题对体验的影响，我们会统计花屏的频率、面积比、时长占比，使用上图展示的数学模型分析并赋分。

- 卡顿

关于卡顿问题对用户体验的影响，我们会重点分析卡顿时间、间隔与频率，使用上图展示的模型结合不同设备类型得到相应的能够体现其对用户体验影响的分值。

1.6 工业标准——uVES1.1

经过基于拓展行业发展与行业新需求，在实际部署行与可操作性上做出的不断优化，uVES1.0之后的uVES1.1应运而生。

相对于uVES1.0，uVES1.1为后续HDR以及全4K视频服务质量评价提供了保障。uVES1.1的Mode0/1实现了对新编码标准的支持。使用的国际大型数据集虽然没有提供主观分值，但却提供了许多参考分值，将已有主观分值与参考分值进行结合并进行模型整体训练，可以极大提升其性能。除此之外，通过对参数采集要求与参数影响权重的优化，进一步简化参数，降低大规模部署的难度。

关于Mode2的改进主要添加了对UHD视频与HDR视频的质量评价，其中对UHD视频的质量评价主要从基于场景检测的颜色度指标、对比度指标与清晰度指标三个部分展开，对HDR视频的质量评价则进一步完善了图像层评价指标体系，将模糊度、块效应、对比度与噪点度和曝光度与颜色丰富度相结合，并且进一步支持了高量化精度、宽色域视频质量的评价。

针对观看体验的评价，uVES1.1使用机器学习相关技术进一步优化质量评价过程。首选系统获取每个采样间隔的视频源质量与卡顿时间信息，并分别输入视频质量模块与卡顿模块；通过机器学习模块整合两者分析结果为最终的媒体回话质量得分。

为了进一步优化观看体验方面的评价过程，我们依据国际最新标准，通过统计量代替单次卡顿信息并删除了低权重参数等简化有效参数；同时使用BP神经网络替换原有RF模块来优化方法，得到的优化算法在减少数据采集量的同时更加清晰展现了观看体验对视频质量的影响。

uVES的近期后续工作包括：实现对AVS2编码标准的全面支持来继续拓展模型对编码标准的兼容性；实现对全4K视频规格的良好支持，如高分辨率比、高动态、高帧率、高量化精度与宽色域视频；最后继续拓展更多服务类型如低延时、交互、V/AR等新型视频的应用。

2. VQA服务流程管理技术

下面我们谈一下VQA服务流程管理技术。

2.1 QoE管理系统

QoE管理系统主要包括QoE模型、QoE监控与QoE控制。

上图展示的QoS/QoE监控系统的数据采集架构流程，可以看到监控系统采集来自远端服务、内容提供到中间的网络环境与用户终端的数据并分析其每一项对QoE造成的影响。而无参考工具PSQA则通过采集Video-Related Assumptions、Common Assumption和Speech-Related Assumption内的多项参数，结合、Video Quality Parameters与Speech Quality Parameters的数据，重点分析Video Quality Estimation Function与Speech Estimation Function，最终汇总并得出Multimedia Quality Integration Function，输出与Video Quality、Multimedia、Speech Quality相关的三项指标，从多个维度监控QoE的动态变化。

2.2 IPTV视频质量监控系统

IPTV视频质量监控系统的总体框架如上图展示的那样，Agent端包括RTP会话管理模块与RTCP发送模块，媒体服务器端与Agent端的RTCP流会经由IPv6/IPv4网络输入质量监控服务器端，首先通过质量监控服务器端中的RTP会话管理模块与RTCP接受记录模块进行初步分析，得出的数据进入界面显示模块、决策分析模块与记录写入磁盘模块进行进一步分析；其中决策分析模块得出的结果会反馈至QoS反馈模块进而影响记录写入磁盘模块与IPv6/IPv4网络。下图展示了多款成熟厂商的IPTV视频质量监控系统。

2.3 基于软件开发的主观视频质量评测

1）模块介绍

主观视频质量评测的应用设计与体系结构包括评价模块、基于数据库的应用模块与演示模块。

- 应用服务模块

应用模块的作用是为了创建和配置测试会话，其具有管理模块与Web 界面并允许管理员执行下图展示的多项任务。

- 演示模块

演示模块除了用于加载每个会话中播放的视频片段并执行播放列表之外，还负责在Application Server的指示下播放和暂停视频片段。

- 评价模块

在评价模块，我们使用了ACR评级系统将视频质量分为Excellent、Good、Fair、Poor、Bad五个等级，使用HTTP协议与Application Server进行联系与数据交换。

2）自动化评测的优势与问题

自动化评测具有多项优势，如评测过程不需要特殊的硬件设备，许多观众都可以同时参加同一个会议；可以轻松扩展设计以在真实场景中进行质量评估，也可以实现离散或连续秤；除此之外，设备没有线缆、纸张与笔，使得整个评测过程非常人性化。

当然自动化评测系统也存在许多问题，如传统的主观评价和确定性适应的手段尚不明确，在服务端用户的反馈处理需要的时间还有优化的空间，并且此过程只能在离线状态下执行使得其应用场景受到很大限制，而且也不能满足各种视频流媒体服务所需的实时、准确的QoE管理，我们希望能够增加评估模型的准确性以帮助监控过程。

2.4 基于预测性的视频流服务管理系统

基于预测性的视频流服务管理系统包括基于服务器的预测性视频体验质量监控、基于用户的预测性视频体验模型与预测性视频体验控制。

1）视频质量评估

2）视频质量优化与控制

3）服务器端监控

4）选取DL方法的算法

3. VQA驱动的视觉感知编码技术

在开始了解VQA驱动的视觉感知编码技术之前，先回顾一下视频质量与码率的关系。由上图左侧曲线不难看出视频质量MOS与码率R大致呈指数关系，而由右侧研究基于H.264编码器不同分辨率下达到特定MOS时所需码率的图线我们可以发现，相同分辨率的条件下，MOS越高所需码率越高；而控制MOS为特定值时，分辨率越高所需码率越高。

不同的视频内容对码率的影响各不相同，相比于盲目追求较高的视频质量，我们去更加倾向于选择满足一定视频质量要求下所需的最合适的码率并反过来利用其指导编码工作。

具体来说，VQA驱动的视觉感知编码技术的流程是首先对原始视频序列进行包含空间信息（SI）与间隔信息（TI）的特征提取，并对提取出的特征进行聚类分析，得到的多个簇会被输入预测模型；与此同时，主观视频质量评测部分输出的MOS分值也会被输入预测模型，并综合得出预测码率。

基于自适应比特率的机器学习为VQA驱动的视觉感知编码带来进一步提升。视频主观视频质量评测得到的数据会辅助内容自适应RD预测模型实现对视频多项关键性参数指标的预测，其结果会帮助内容自适应ABR编码进行视觉感知编码。

上图展示了基于自适应比特率的机器学习的具体流程。首先待预测视频会和各簇中心点的数据结合以计算欧式距离，计算结果会被归入某一簇中；随后根据此簇的模型，按照预期MOSexp计算获得预测码率；在模式优化阶段，会对编码后视频做主观测试并得出其MOS，并计算预期MOSexp与主观测试得分值MOS的相关性，获得模型预测效果。

上图非常直观地展示了模型预测码率与实际码率的关系。

精品文章推荐

技术干货：

LinkedIn：用数据提高视频性能
使用级联SFU改善媒体质量和规模
基于HLS格式的低延时互动直播技术
机器学习帮助WebRTC视频质量评价
王亚楠：基于强化学习的自动码率调节
利用JPEG制作更快，更准确的神经网络
精致前处理，精准码控 — 极致视觉效果
Salsify：高流畅度的实时视频传输新方式
基于QoE的实时视频编码优化：低功耗，低延时，高质量

你可能感兴趣的:(视频质量评价——从裁判到教练)

发起请求并处理响应：`XHR` 与 `axios` 使用指南来啦[特殊字符]~
又又又要长脑子呐~了解到通过发起HTTP请求并在不刷新页面的情况下更新页面内容是一种常见的需求。学习使用XMLHttpRequest或axios来实现，现在进行对比两者，比较项目使用时候的优缺点，文末使用表格进行对比学习1.使用XHR实现下面是一个使用XMLHttpRequest发起GET请求并处理服务器响应的示例：html体验AI代码助手代码解读复制代码//创建一个新的XMLHttpReques
2024年最全kali无线渗透之用wps加密模式可破解wpa模式的密码12_kali wps，网络安全开发究竟该如何学习 2401_84558314 程序员 wps web安全学习
一、网安学习成长路线图网安所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。二、网安视频合集观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。三、精品网安学习书籍当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
在C#中，可以不实例化一个类而直接调用其静态字段就是有点傻 C#c#
这是因为静态成员（staticmembers）属于类本身，而不是类的实例。这是静态成员的核心特性1.静态成员属于类，而非实例当用static关键字修饰字段、方法或属性时，这些成员会绑定到类级别，而不是实例级别。它们在类加载时（通常是在程序启动或首次访问时）由CLR（公共语言运行时）分配内存并初始化，与是否创建实例无关。2.为什么不需要实例化？内存分配：静态字段的内存空间在程序运行期间只有一份，所有
如何在YashanDB数据库中实现数据查询优化数据库
在现代信息技术环境中，数据量的快速增长使得数据库的性能优化成为重要课题。如何提升查询速度，降低资源消耗，成为了数据库管理人员和开发者必须面对的挑战。有效的数据查询优化不仅能提高响应时间，还能显著提升用户体验与系统效率。在YashanDB数据库中，优化数据查询需从多个技术角度进行综合考量与实际应用。利用索引技术优化查询索引是提升数据库查询性能的常用手段。在YashanDB中，主要支持BTree索引、
深入解析BEM架构：架构级全局样式管理方案 neon1204 前端方案分析和实践架构前端 css webpack
深入解析BEM架构：架构级全局样式管理方案在前端开发领域，CSS架构一直是影响项目可维护性和可扩展性的关键因素。随着SPA应用的普及，传统CSS管理方式的缺陷在开发中暴露出明显的问题：样式冲突、选择器权重失控、命名污染等，从代码质量和开发效率角度出发可以借鉴一些优秀的案例。各种组件库（element、antd、vant…）使用多了能发现它们的样式就是采取的BEM（Block,Element,Mod
如何实现YashanDB中的数据冗余处理数据库
数据冗余是数据库管理中的一个重要话题，直接影响到数据的可用性与可靠性。在高并发场景下，数据冗余能够有效防止数据丢失，并提升系统的容灾能力。YashanDB作为一款高性能的数据库产品，通过灵活的结构和多种部署方式，实现了数据冗余处理。本文将详细探讨YashanDB中实现数据冗余处理的技术细节，为数据库管理员和开发人员提供理论支持和实践指导。YashanDB的数据冗余机制单机部署中的数据冗余在单机部署
Python多线程vs多进程：一场关于效率的“宫斗戏“，谁才是你的真命天子？
清晨的咖啡还冒着热气，你盯着监控面板上飙升的CPU使用率，键盘敲出的代码在"多线程"和"多进程"之间反复横跳——这可能是每个Python开发者都会经历的"效率抉择时刻"。当项目从"能跑就行"进化到"必须快跑"，多线程与多进程这对"欢喜冤家"就会跳出来，用各自的"十八般武艺"让你挑花眼。今天咱们就来扒开表象，从底层机制到实战案例，彻底搞懂这对CP的爱恨纠葛。一、GIL：多线程头顶的"紧箍咒"要聊多线
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
青年开发者董翔：在代码世界中探索创新边界程序猿全栈の董（董翔） javascript 开发语言开发者
引言：从兴趣萌芽到技术深耕当大多数00后还在适应大学生活时，2004年出生的董翔已在软件技术领域展现出超越同龄人的探索热情。作为软件技术专业大一学生，他以“技术创新解决实际问题”为核心理念，在前端开发、数据修复等领域构建了独特的研究体系。从高中时期自学编程的懵懂少年，到提出“同源数据互补修复机制”“框架质疑学习法”的青年研究者，董翔的成长轨迹折射出新一代技术人对知识的主动建构与实践突破。一、学术探
【学习】搭建个人Hexo博客网站程序员
一、准备环境1、安装node访问Node.js官网：https://nodejs.org/下载LTS(长期支持版本)安装时保持默认选项即可安装完成后，打开命令提示符验证安装：node-v2、安装npmnpm已包含在Node.js安装包中，安装Node.js时会自动安装打开命令提示符验证安装：npm-v更新npm到最新版本（可选）：npminstall-gnpm3、安装hexo打开命令提示符，以管理
Redis Geo结构详解：从原理到实战，手把手教你玩转地理位置功能码不停蹄的玄黓 redis 数据库缓存
在互联网产品中，“附近的人”“附近的店”“配送范围”这类功能越来越常见。以前做这种功能可能需要依赖MySQL的经纬度计算，或者上专业的GIS数据库（比如PostGIS），但Redis3.2版本后推出的Geo（地理信息）模块，用极简的API和高效的性能，完美解决了这类问题。今天咱们就来深入聊聊RedisGeo的底层原理、常用命令和实战场景。一、为什么需要RedisGeo？先想个场景：你要做一个“附近
git checkout功能用法 ᴡᴀᴋᴜ⌓‿⌓ᴡᴀᴋᴜ 写给新人 git
背景gitcheckout这个命令承载了太多的功能，以至于在很长一段时间，我都会时不时疑惑，“咦，gitcheckout怎么还有这个作用？”。感觉还是没有理解到本质，只是停留在粗浅的表面。为了减轻记忆负担，本文就来梳理一下gitcheckout的核心作用。相关概念下面将介绍三个相关概念：提交哈希（CommitHash）、分支名（BranchName）、HEAD为了形象理解，如果我们把Git仓库当作
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
GitHub账号注册与Git关联：从零到一的完整指南 Android洋芋前行路黑科技经验历程 github git GitHub注册 Git关联 SSH密钥团队协作
简介GitHub是开发者协作与代码管理的核心平台，而Git则是实现版本控制与团队协作的必备工具。本文将从零开始，手把手教你完成GitHub账号注册、Git环境搭建、SSH密钥生成、本地仓库初始化及与GitHub仓库的绑定。通过代码示例、Mermaid图解及企业级应用场景，帮助你全面掌握GitHub与Git的关联技巧，为个人开发与团队协作打下坚实基础。一、GitHub账号注册与基础配置1.1注册Gi
数据存储：使用Python存储数据到redis详解数据知道爬虫和逆向教程 python redis 数据库非关系型数据库
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一.安装相关库和进行连接二、存储数据到Redis2.1存储字符串2.2存储列表2.3存储集合2.4有序集合类型2.5存储哈希三、数据的持久化与过期设置3.1持久化3.2过期设置四、其它操作4.1删除操作4.2关闭连接4.3使用连接池4.4处理异常五、总结在Python中，我们可以使用redis-py库来与Redis数据库进行交互。以下是如何将数据
Git 常用命令指南：从入门到精通 Takumilovexu 小技巧 git
文章目录前言1.初始化一个Git仓库2.克隆远程仓库3.查看仓库状态4.添加文件到暂存区5.提交代码6.推送到远程仓库7.拉取远程仓库的更改8.分支管理9.查看提交历史10.回退到某个版本结语前言如果你是一位开发者或者对代码感兴趣，那么你一定听说过Git。Git是目前最流行的版本控制系统，可以帮助你管理代码，跟踪历史变化，甚至还能协作开发项目。虽然Git功能强大，但对初学者来说，刚开始使用时可能会
视觉设计全栈解析：必知的8大核心方向与应用场景
在数字时代，视觉设计早已渗透到生活的方方面面——从手机APP界面到街头广告牌，从书籍的版式到产品的包装，这些统统离不开视觉设计的支撑！所以，了解视觉设计分类，不仅能帮助我们理清设计的边界与应用场景，更能让初学者找到学习的方向，让从业者精准定位创作目标哦。接下来，我们就来详细解析视觉设计分类中的8大常见类型，一起来享受这场视听盛宴吧~一、视觉识别图形设计在视觉设计分类中，视觉识别图形设计是构建品牌形
深入理解 CSS 选择器：从基础到高级蓝精灵001 css 前端面试职场和发展学习 html AI编程
CSS（层叠样式表）是网页设计中不可或缺的一部分，它通过选择器来定位HTML文档中的元素，并为这些元素定义样式。掌握CSS选择器是前端开发的核心技能之一。本文将从最基础的选择器讲起，逐步深入到高级、复杂的结构和伪类/伪元素选择器，帮助你全面掌握CSS选择器的使用。一、什么是CSS选择器？CSS选择器是一种模式，用于匹配文档树中的一个或多个元素。通过选择器，你可以精确地控制哪些HTML元素应该应用特
STM32中的UART详解
前言在嵌入式开发中，串口通信是最常用的调试与数据传输方式之一。UART（UniversalAsynchronousReceiver/Transmitter，通用异步收发传输器）作为一种简单、可靠的异步通信协议，被广泛应用于STM32与传感器、上位机、蓝牙模块等外设的交互场景。本文将从协议基础到STM32实战，全面解析UART协议在STM32中的应用，包含硬件设计、软件配置、实战案例及调试技巧，适合
Docker 容器全生命周期操作指南
以下是Docker容器全生命周期操作指南，按步骤清晰划分，涵盖从镜像加载到容器销毁的完整流程：一、镜像加载与验证1.从.tar文件加载镜像sudodockerload-iubuntu18.04-boost1.88-cmake3.27-git_1.0.tar2.查看已加载的镜像sudodockerimages输出示例：REPOSITORYTAGIMAGEIDCREATEDSIZEubuntu18.0
红色用 RGB 16进制表示的值 BlueBirdssh RGB颜色值
**红色**在RGB颜色模型中，表示为**#FF0000**（16进制表示）。以下是详细解释：---###1.**RGB模型**RGB模型由**红（Red）**、**绿（Green）**和**蓝（Blue）**三种颜色组成，每种颜色的值范围是0到255（十进制），或者**00到FF**（十六进制）。-红色的RGB值为：-红色（R）=255（十进制）=FF（十六进制）-绿色（G）=0（十进制）=00
ubuntu 6.8.0 安装xenomai3.3 ZPC8210 ROS ubuntu linux 运维
通过以下步骤来获取和准备Linux内核6.8.0的源码，并应用Xenomai补丁：1.下载Linux内核6.8.0源码你可以从TheLinuxKernelArchives下载Linux内核6.8.0的源码。以下是具体步骤：访问内核官方网站：打开TheLinuxKernelArchives。找到对应版本的内核：在网站中找到内核6.8.0的下载链接。通常在v6.x目录下。下载源码：下载linux-6.
（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
php输出扶墙而立的三角形,扶墙而立的成长历程——涉县五中刘嘉巍王克丹 php输出扶墙而立的三角形
两周，我们就犹如一个婴儿，从母亲的怀抱实现了能够扶墙而立的成长历程。经过两周的实践，我基本能按照教案的要求，将一堂体育课较为完整执行开展，而且最重要的是我们每个人从心理上实现了从学生到教师的转变，当然这也体现在我们的举止、仪表、谈吐和教态间。相信，每一个实习老师在上完一节体育课后，心中总有那么股成就感和无限的自信。这就是我们成长与进步的最好体现。实践的操作、指导老师的传授、自己的亲身经验、使我们在
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
python# python:3.5 aarch64构建镜像 Ling丶落 centos
构建失败从ubuntu中尝试构建FROMpython:3.5-slimLABELMAINTAINER="[email protected]"#installrelatedpackagesENVENVIRONMENTDOCKER_PRODWORKDIR/workCOPY./dataset.py/work/dataset.pyCOPY./model.py/work/model.pyCOPY./PyA
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><