声网Agora

RTE 大会回顾 | 基于 Web 引擎技术的 Web 内容录制

随着基于WebRTC技术的Web应用快速成长，记录web在线教育、视频会议等场景的互动内容并对其准确还原越来越成为一项迫切需求。在主流浏览器中，通常基础设施部分已实现了页面渲染结果的采集及编码。开发者可以利用浏览器提供的API对页面内容进行录制。但受限于Web标准以及浏览器厂商在专利授权方面的问题，使用Web API实现页面录制在易用性和可用性上均较难令人满意。针对上述问题，声网Agora Web 引擎高级架构师高纯在 RTE 2020 实时互联网大会上就Web引擎渲染采集原理进行了分享，并就基于Web引擎的服务端录制技术进行探讨。

▶️点击「阅读原文」可观看视频回放，获取 PPT

以下为演讲实录：

大家好，我这次技术分享的主题是Web互动场景还原—基于Web引擎技术的Web内容录制。

我叫高纯，是来自声网的Web引擎高级架构师，接下来我将会为大家介绍以下的内容：包括应用背景、浏览器内容采集、服务端Web录制引擎，服务端Web录制引擎性能优化，最后会进行一个总结。

先看一下应用的背景，我们知道最近几年随着RTC行业的火热，基于Web RTC技术的Web应用快速成长，记录Web在线教学、视频会议等场景的互动内容并对其进行准确的还原越来越成为一项迫切的需求。

在主流的浏览器当中，其基础设施部分已经实现了对页面渲染结果的采集及编码过程，开发者可以利用浏览器提供的Web API对页面内容进行采集以及录制。但是受限于Web标准以及浏览器厂商在专利授权方面的问题，要使用Web API实现页面录制，在易用性和可用性方面还难以满足业务需求。

浏览器内容采集

我们先来看一下浏览器内容采集，所谓Web录制实际上就是对页面内容采集及编码并存储的过程，在主流的浏览器当中它的工作基本上都是在一个多进程的架构之上，页面的渲染会在一个或者多个的Render Process里面处理，最终的结果会在Browser Process里面来进行呈现，我们要做的事情就是在Renderer Process里面渲染的内容包括视频、音频及其他动画来进行采集并且录制成文件，这个过程就是页面内容采集。

目前在chrome浏览器上面我们可以使用两种方法来进行页面的采集，一种方法是通过chrome extension，目前chrome extension API提供了一条叫做chrome.tabcapture的对象，这个对象当中的capture API可以用来进行页面内容的采集，结合HTML5标准当中的其他模块，比如说像LocalMediaStream、MediaRecorder以及Blob这些组件，我们可以对页面内容进行采集及录制。

它的大概流程如这个示例代码所展示的一样，在使用chrome.tabcapture API的时候，我们需要给它传入一个是否允许video的采集，以及是否允许audio的采集，并且还要传入一些video相关的分辨率、采集帧率等信息。然后这条API在执行的时候会通过一个回调,把它采集到的结果以LocalMediaStream 的形式返回，我们在回调函数中拿到LocalMediaStream的对象之后，可以利用这个Stream对象来创建一个Media Recorder，同时给这个Media Recorder来指定我们视频编码的码率、音频编码的码率，以及我们视频编码的格式。

目前在chrome上面，它所支持的视频编码格式主要有H264、VP8、VP9。音频它只支持Opus格式，在文件格式方面他目前只支持WebM的媒体格式，通过调用MediaRecorder.start()方法，我们可以发起录制过程，在MediaRecorder的ondataavailable回调当中，他会把采集到的编码处理之后的视频数据返回。

我们拿到这个返回的数据之后可以把它交给一个blob来进行存储，在录制结束之后，我们可以利用这个blob来创造一个超链接，把这个文件下载下来，这就是用chrome extension来进行采集的一个过程。

这个过程的主要问题有什么呢，主要有以下几点，一个是他的音频编码仅支持opus格式，opus实际上支持的媒体格式是比较有限的，像在TS这种流媒体文件中它是不被支持。视频编码方面他提供的可选参数非常有限，视频编码的性能相对比较弱，另外由于他仅支持webm格式的录制，且没有往这个文件当中写入进度信息，录制出来的文件在播放的时候是没有办法去拖动的，另外由于是在录制完毕的时候才会生成整个文件，它的可用性是比较差的，一旦在录制过程中出现了故障，服务出现了崩溃，这意味着我们之前所录制的所有内容都会丢失。

我们来看另外一种页面内容的采集方式，是利用chrome devtools API来进行采集，chrome devtools API它是第三方应用来驱动chrome工作的一个API，它支持chrome以headless模式来工作。第三方的应用和chrome之间进行通信是使用chrome devtools protocol协议。但是它只能采集chrome可视的数据，音频是没有办法采集的，它目前提供了三条API来做页面内容的采集。包括StartScreenCast()、StopScreenCast()、以及CaptureScreenstot()。Capture Screenstot可对页面进行截图，只能采集单帧的数据存储到image文件。我们主要使用的是StartScreenCast、StopScreenCast这两条API，它的方法大概是以下几个步骤:

首先我们要启动chrome，启动chrome的时候需要给它加上Headlees参数，令chrome以Headless模式启动，所谓Headless模式就是以一个服务进程在后台运行，他是没有用户界面的，在启动它的时候，我们需要给它带上remote debugging port调试端口的参数，同时要指定它渲染结果的窗口大小。

在启动Headless chrome之后我们可以利用一个node应用，在应用中使用google提供的叫做chrome remote interface的插件。利用这个插件我们就可以和Headless chrome进行通信来获取它采集到的数据。

具体的调用过程，首先会创建一个chrome remote interface的对象，并且拿到这个对象当中的Page对象。我们通过调用Page当中的startScreenCast的方法，来给它传入相应的编码格式，然后能够获取到它的每一单帧的数据，请求每一帧的数据方法叫做ScreenCastFrame，通过这个示例代码可以看到,浏览器在编码的时候，它采用的是图像的编码方式，目前chrome支持两种方式，一种是png一种是jpeg，我们拿到了这个png/jpeg的数据之后需要对这个图像进行解码，利用我们写的插件来对它进行视频的重新编码，然后保存为文件，这个是利用chrome devtools API来采集的整个过程。

用chrome devtools API采集主要的问题是什么，它主要有三种问题，一个是整个过程他会有png/jpeg数据的编码、解码，以及视频的编码过程，它整个开销是很大的，另外它不支持音频的采集，然后在node应用和chrome应用之间它是使用websocket来进行数据传输的，它的传输性能是比较差的。

在介绍完两种主要的chrome进行页面数据采集的方法之后，我们来给大家介绍一下，chrome是怎么进行页面渲染的，它的流程大概是怎么样。然后chrome内部又提供了哪些接口来让我们进行页面采集和录制。

我们知道chrome浏览器或者web引擎在解析了HTML文档之后会创建DOM树，DOM Tree中的每一个节点它都对应到HTML文档当中的一个节点。对DOM tree应用CSS属性之后，会生成相应的layout tree，layout tree中的每一个节点就是layout object，它除了能够表达它在文档结构当中的位置，它还能表达它在排版过程中的所有属性。

在页面绘制的过程中，web引擎它不会对整个layout去进行完整的绘制，它会对layout tree进行一个分层，对每一层进行独立的绘制，最后通过合成器把不同的绘制结果合成出来。

这个分层的过程其实是有一些规则的，它主要包含哪些规则呢？

首先我们的DOM Tree的根节点以及和它相关的这些节点，会作为一个layer来进行绘制，有一些特殊的节点比如包含一些位置信息应用了relative, absolute或者transform属性的这些节点，也会作为独立的层来进行绘制渲染，对于一些应用了CSS filter的节点也会作为独立层渲染。

假如说有一些节点会产生溢出会产生overflow它也会进行独立的绘制。另外在DOM Tree中，对于一些特殊的节点，比如说像video element 或者canvas element来进行2D或者3D内容绘制的时候，这些节点也会作为独立的层来进行绘制。

在分层之后，我们的web engine会对render layer 或者paint layer来创建相应的Graphics Layer，由所有Graphics Layer组成的树就叫做Graphics Layer Tree，每一个Graphics Layer当中会维护一个Graphics context，这个Graphics context就是这一层内容绘制的一个目标。每一个Graphics layer还会维护一个叫paint controller，这个paint controller会来控制我们每一层具体的绘制。

除了Graphics layer tree之外我们的layout tree 在预绘制的过程当中还会生成相应的Property Trees，所谓的Property其实是指四种类型的属性，它包含了像Transfer，一些位置的变换；或者是clipping，对内容进行裁剪；包括effect，一些特效，比如像透明度或者mask信息；然后还有scroll信息，就是当我的内容需要进行滚动的时候它也会有自己的一些信息，这些属性都会存储在这个Property Trees里面。

当我们的DOM文档结构发生变化的时候，或者CSS属性发生变化的，或者是Compositing发生变化的时候它会产生相应的invalidation，一旦invalidation发生，layout Tree会找到它发生变化的相应的节点，然后会利用它相应的Graphics layer来进行绘制。这个图是发生变化的区域。

绘制的过程实际上就是把layout Tree当中的layout Object属性转换成绘制指令的过程，这个绘制指令是通过术语display items来进行表达的。

有了这个Graphics layer Tree和Property Trees，之后我们可以对Graphics layer tree中的每一层来使用Compositer来进行合成，由于Compositer的输入有自己的格式，我们需要对Graphics layer tree和Property Trees进行转换，需要把Graphics layer tree转成layer list，把blink Property Trees转成CC Properties Trees。拿到这两个结构之后浏览器接下来就可以进行合成。

所谓的合成就如上面这张图所显示的，它是把浏览器当中的不同的部分，以及浏览器的界面进行层叠。最终显示出我们可以看到的最终效果的过程。但是在浏览器当中实际的合成过程是分成两个部分的，有两个阶段。

在第一阶段是在浏览器的渲染线程来实现的。它通过刚才我们拿到的layer List和CC Properties Trees来形成光栅化，如果是软件光栅化会生成位图，如果是硬件光栅化会形成GPU当中的纹理。

拿到这些结果之后来进行层叠处理，最终Compositer会输出一个叫做Compositer Frame的数据，Compositer Frame并不是实际的最终渲染的结果，它不是一个位图或者一个纹理，它实际上也是一系列的绘制指令，这些指令在光栅化之后才会产生实际的位图或者是纹理。

在第二个阶段我们的浏览器会利用dispaly Compositer 把我们上一阶段的合成结果和浏览器的UI部分，比如说像地址栏、标题、标签页的按钮来进行合成，最终输出到物理设备上面，这整个渲染过程就完成了。在render进程和browser（浏览器）进程之间它的数据传输是通过shared Memory的形式来传输的。

通过了解上面的这个过程其实我们就可以很明显的发现，如果我们需要对chrome当中的页面进行采集的话我们需要的是什么，我们需要的其实就是Compositer Frame光栅化之后的bitmap 或者是texture，通过对这个数据的编码以及经过muxer存储文件，我们的录制就可以完成了。

接下来我们来看一看chrome这个项目当中提供了哪些接口来让我们对音视频数据进行采集。在chrome当中由于它的渲染进程是跑在sandbox（沙盒）里面的，在sandbox（沙盒）进程当中是没有办法对系统调用，它对系统API的调用是受限的，由于我们的录制需要去访问本地文件，所以我们整个的采集过程是在Browser进程来实现的。

chrome在Browser线程提供了ClientFrameSinkVideoCapturer这个类，这个类会向渲染线程发起相应的采集请求，客户程序只需要通过当前tab页对应的CreateVideoCapturer来实例化这个类。

同时实现FrameSinkVideoConsumer这个接口，通过这个接口当中的OnFrameCapturer的回调来获取它返回的每一帧的Video Frame数据。

在Render进程大概的过程是怎么样的呢（如上图所示），由于时间有限我不做太多的介绍。只描述一下简单的过程，在类FrameSinkVideoCapturer当中，当它接收到Browser端发来的采集请求，就会去Schedule一次采集的请求。然后会把这个请求转发给它聚合的CompositorFrameSinkVideoSupport对象，这个对象拿到请求之后，会把这个请求放在队列里面。

由于CompositorFrameSinkVideoSupport对象，它实现了SurfaceClient的接口，可以从Compositer当中拿到输出的Surface，一旦有新的Surface产生它就会得到通知，它会利用实现的CompositerFrameSink接口，通过其中的didAllocateSharedBitmap方法来创建相应的共享内存，然后把Surface当中的数据写到共享内存当中，同时会把这个共享内存的ID返回给Browser进程，Browser进程拿到这个ID之后会从Shared Memory里面把数据给解出来，这个采集过程就完成了。

那么对于音频的处理呢（如上图所示），chrome在进行音频播放的时候它会把页面当中所有的Audio Media Streams直接交给系统的Audio framework来进行混音和播放。它的混音的过程是由Audio framework来做的。如果我们需要对所有的Audio media Streams进行采集的话我们需要自己来实现混音的过程，混音之后的Audio 数据我们把它交给encoder进行编码，最终存储到文件里面来。

同样在chrome当中它也提供了相应的接口，让我们来进行音频数据的采集，这个接口主要有AudioLoopbackStreamCreator以及Audio input stream这两个类。

我们通过创建AudioLoopbackStreamController来启动一个音频采集过程，在启动之后它会通过AudioLoopbackStreamCreator去创建一个AudioLoopbackStream，同时它会去创建相应的线程，这个线程会通过Socket不断的从Render 进程来获取采集到的音频数据，一旦这个Audio frames达到一定量之后足够多，它会去出发相应的callback，这个callback回调会最终把数据交给录制程序。

所谓的AudioLoopbackStream是chrome当中一个特殊的数据，它称为回环音频流，它会把chrome当中所有输出的Audio Streams进行合成，然后把合成的结果转换成一个输入流。

具体在Render端是怎么实现混音的过程我们在这个地方就不展开描述了。

服务端 Web 录制引擎

接下来我们聊一聊在服务端进行WEB录制它所需要的一些需求，主要有几点。

一个是无UI模式，我们在服务端进行页面内容的采集，它通常是跑在一个无桌面的linux的服务环境下，同时它采集的格式需要满足实现流媒体格式。因为传统的媒体格式往往是存储单个的文件，一旦服务端发生了故障，它之前所录制视频内容很有可能会丢失。同时录制引擎也需要去指定一些录制参数。比如说页面渲染的分辨率，最大的视频录制帧率，音频采样率、音频编码率，包括流媒体文件切片的时长等等。由于我们的Web Engine是一个开放的平台，理论上它是可以运行所有的Web应用的。有一些Web应用可能性能开销会非常大，所以在服务端Web应用录制的过程当中我们需要对整个应用的开销进行监测。对于可能产生系统资源过度使用的HTML5组件来进行一些控制。同时对引擎内部运行的一些状态进行监测，发生错误要能进行上报。

我们声网在实现相应的Web云录制引擎当中针对这四点也做了大量的工作，主要是Headless模式我们是基于Chromium Headless模式实现的，它不需要像Xvfb这样的虚拟X Server环境作为页面的渲染目标。

另外由于我们整个录制过程是一个无交互的过程，我们需要允许引擎能够令这个音视频内容在无交互的情况下进行自动播放。

另外很重要一点是我们的录制引擎是不提供Web API的，不需要Web应用主动发起录制的请求。页面的录制结果是一个所见即所得的过程。Web引擎当中渲染了什么内容，它就会做出相应的录制。

对于录制格式方面我们主要支持TS和M4A两种流媒体格式，同时会输出相应的M3U8的文件列表，在编码器方面我们可以选用Openh264、X264、声网自研的a264编码器来对录制内容进行编码。

我们整个录制过程是一个动态帧率的编码过程，只有当页面发生变化的时候，输出新的video frame的时候我们才会对它进行采集和录制。

在音频部分我们使用的是刚才介绍过的AudioLoopbackStream来进行混音，对混音的数据进行采集再进行编码。音频的编码我们使用AAC格式，因为像ts这种流媒体格式当中opus编码格式是不受支持的，AAC格式通常在更多的媒体文件类型下能得到更好的支持。

我们提供的参数主要有这些（如上图），视频输出的路径包括日志的路径，同时可以指定音频的采样率是41000或者48000赫兹，录制的声道数，录制的音频的码率，视频编码的码率，以及视频的录制帧率，我们页面渲染的尺寸高度或者宽度，流媒体HRS文件它切片的时长等等都可以进行设定。

同时也会对H5的一些性能开销比较大的组件进行一些控制，比如说像WebGL、Web Assembly ，同时对于一些比较大的尺寸的视频，对它的播放进行一些控制。

在性能和安全性方面，其实刚才也提到了，主要会对Web GL、Web Assembly包括高分辨率的视频进行播放的时候会进行一些开关。然后我们引擎本身也会对CPU、内存、带宽等等系统资源进行自我监测和上报，对于一些文件操作，比如说像文件下载，包括对file://scheme访问会进行限制。在URL加载异常的时候会对异常以及异常的原因会进行一个上报，对页面音视频的采集过程以及编码的状态也会进行上报，这些内容会上报到我们服务端的应用框架当中，服务端应用框架收到这些上报信息之后会做相应的处理。

引擎对外发出的一些通知，主要有录制的开始结束，包括文件切片的开始以及完毕，有音视频编码器的初始化成功或者失败，还有采集到第一帧音频的时候或者第一帧视频的时候都会发出相应的通知，还会在音频编码失败的时候和视频编码失败的时候发出一些通知。录制引擎还会周期性的去监测我们距离上一帧采集到音频或者视频的时间间隔。

当URL访问出现异常的时候会对URL异常的原因进行上报。最后Recording Prof，会对CPU、内存、带宽使用率进行通知。

刚才介绍了服务端Web录制引擎的一些特征，包括声网在实现Web录制引擎当中做的一些事情。

服务端Web录制引擎性能优化

接下来我们聊一聊Web录制引擎性能优化，Web录制引擎它的整个的过程本质上是一个从视频解码、音频解码到页面渲染、页面合成再到视频音频编码的过程。它整个过程的开销实际上是非常大的。

我们目前主要有几点对Web录制引擎进行优化。第一点就是chrome本身它在使用OpenH264的时候，出于平台兼容性的考虑，它没有启用AVX2指令来做CPU的优化，AVX2指令是在intel haswell平台之后推出的AVX指令的扩展，它扩展了原来AVX的指令计算数据的位宽，从128位扩展到了256位，能够有更好的向量运算的性能。

另外一个优化点就是使用GPU来做编解码的加速，我们知道limux平台上面通常它的显示驱动或者设备,性能一般不是太好，或者有各种问题，出于这个原因chromium把linux平台的硬件加速的视频编解码列入了黑名单，也就是说它只用软件的方式来进行音视频的编解码。

由于我们的整个系统是运行在服务端，这个平台是确定的，在保证这个平台的图形的驱动稳定的情况下，我们可以去把这个视频编解码从黑名单中移除来启用它的硬件加速。同时我们在对视频进行编码的时候可使用ffmpeg加VAAPI来进行硬件加速。

第三个就是对页面渲染性能本身的一个优化，chrome headness一些特殊的条件下，可以在limux服务器上去使用OpenGL进行硬件加速，但是它要求我们的整个服务端的环境必须是在桌面系统上，也就是基于X11的OpenGL去进行硬件加速。

由于我们的录制引擎通常是部署在multi user模式下的linux服务器上面，它是没有桌面环境的，在这个时候我们可以在chromium当中使用ozone图形中间层，结合DRM后端来实现脱离X11的OpenGL硬件加速。ozone是ChromiumOS上面默认所采用的图形子系统，它是一个中间层。它的后端可以有各种不同的实现，比如说有基于X11，Wayland, 或者基于GBM/DRM的，基于DRM的实现它可以脱离桌面环境，这样我们可以在headness multi user模式的来enable硬件加速。

最后的一个优化过程是对web引擎渲染流程流程本身的一个优化，刚才我讲到整个的Web录制过程实际上是音视频解码—页面渲染—合成—编码的过程，性能开销非常的大。

对于整体的渲染流程我们可以来进行一些优化，比如说业务高峰时期在实时处理的时候，我们接收到视频数据之后可以不进行解码也不进行播放，直接把接收到的视频流进行转储，存储为相应的视频文件。

在页面当中视频的区域我们使用空白来进行占位，同时对区域的位置进行记录，以及对这个视频的播放状态，是播放还是暂停、停止来进行一个记录。

我们知道页面当中如果没有视频的渲染的话，通常它的FPS都是比较低的，这就意味着我们从这个浏览器当中采集出来的video frame的帧率会很低，甚至是静止，这样它的编码开销就很小。我们把没有视频部分的page进行编码进行录制来生成文件之后就能得到页面部分的文件。以及从Media stream（流媒体）转储的视频文件以及视频的一些状态信息，有了这三个信息之后，我们可以在业务低谷时间进行视频的合成，来有效的降低我们在业务高峰时段的服务器的压力。以上就是服务端的录制引擎的性能优化。

最后，我们来进行一个总结，主要有以下几点。

当前主流的浏览器对Web录制的支持并不能满足我们的业务需求。
我们所需要的业务能力和可用性可以通过定制chromium浏览器来实现。
Web云录制作为一种新的技术和业务形态，它面对性能和安全性的双重挑战。
我们针对目标硬件平台来进行CPU和GPU的优化能够比较有效的缓解性能的问题。
通过对Web引擎渲染流程进行特殊优化能够有效的降低我们的服务在业务高峰时的性能压力。

以上就是我的分享，非常感谢。

回顾更多演讲，可访问：rteconf.com/look-back

你可能感兴趣的:(编程语言,java,xhtml,大数据,人工智能)

JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统 2401_89605681 嗖微miui52086 java 小程序开发语言微信小程序 uni-app
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统源码_V_saaskw 嗖微miui52086 java 小程序开发语言 uni-app 微信小程序微信公众平台
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA打手俱乐部护航陪玩小程序+APP+公众号+h5 源码陪玩系统狂团商城小师妹嗖微miui52086 java 小程序开发语言微信小程序 javascript
万亿游戏社交蓝海：JAVA打手俱乐部护航陪玩系统源码解析（小程序+APP+H5全端覆盖）在电竞产业爆发与社交需求升级的双重驱动下，全球游戏陪玩市场规模突破120亿美元（2025年Newzoo数据），而传统平台面临信任危机、匹配低效、变现单一等痛点。JAVA打手俱乐部护航陪玩系统源码以SpringBoot+MyBatisPlus+MySQL为核心，通过Uni-app跨端开发实现小程序/APP/公众号
JAVA无人系统台球室源码自助开台约球交友系统源码小程序
全域无人化运营革命：JAVA无人系统台球室源码解析（支持茶室/棋牌/KTV多业态）在共享经济与无人化浪潮的推动下，全球自助娱乐市场规模突破千亿美元，传统台球室、棋牌室面临人力成本高、运营效率低、用户粘性弱等痛点。JAVA无人系统台球室源码以SpringBoot+MyBatisPlus+MySQL为核心技术栈，通过Uni-app跨端开发实现小程序/H5/APP全渠道覆盖，集成AI裁判、社交裂变、多支
游戏陪玩陪练系统:JAVA游戏陪玩陪练高端小程序源码APP源码H5公众号源码电竞系统比心源码
JAVA游戏陪玩陪练高端系统：引领电竞陪练新风尚在电竞产业蓬勃发展的今天，游戏陪玩陪练服务已成为连接玩家与高手之间的桥梁，不仅满足了玩家提升游戏技能的需求，也为电竞爱好者提供了一个展示自我、实现价值的平台。我们精心打造的JAVA游戏陪玩陪练高端系统，涵盖了小程序、APP、H5及公众号等多个用户入口，旨在为用户提供一站式、高品质的电竞陪练服务。一、功能性：全面覆盖，满足多样化需求本系统集成了游戏陪玩
JUC工具类
在黑马点评项目实战中使用Redis实现全局秒杀的课程中，提到了一个名词JUC，在测试生成随机id的有效性时使用到了JUC的工具类：CountDownLatch，这里简单进行一个介绍和了解，想学习更具体的有关多线程与并发编程的内容，可以去看黑马有专门的JUC教程。一、CountDownLatch：多线程协调工具类CountDownLatch是Java并发包（JUC）中的一个同步辅助类，主要用于协调多
python爬虫技术——基础知识、实战南瓜AI python 爬虫 scrapy
参考文献：Python爬虫入门(一)（适合初学者）-CSDN博客一、常用爬虫工具包Scrapy语言:Python特点:高效、灵活的爬虫框架，适合大型爬虫项目。BeautifulSoup语言:Python特点:用于解析HTML和XML，简单易用。Selenium语言:Python/Java/C#特点:支持浏览器自动化，适合处理JavaScript渲染的网页。Requests语言:Python特点:简
对象的本质：OOP编程核心揭秘止观止计算机科学 OOP 面对对象编程
引言面向对象编程（OOP）革命性地重塑了软件开发，其核心在于“对象”——一种模拟现实实体的计算模型。对象不仅是数据容器，更是封装了状态和行为的自治单元，使程序从指令序列转变为交互网络。通过本解析，我们将层层递进，揭示对象在OOP中的根本角色：从定义延伸到设计实践，帮助读者跨越语言差异（如Java、Python或C++），掌握这一范式的精髓。章节构建遵循技术演进：先解剖对象本质，再关联OOP支柱，最
《前端基础核心知识笔记：HTML、CSS、JavaScript 及 BOM/DOM》萌新小白的逆袭前端笔记 html javascript
html前端三剑客的介绍：HTML:页面内容的载体Css：用来美化和指定页面的显示效果JavaScript：页面显示的过程中，可以动态改变页面的内容重点属性type="text"文本输入type="password"密码输入SerlvertC超链接type="radio"value="值"单选框type="checkbox"value="值"多选框在作用设置编码格式 action是跳转的界面met
@Override注解 oliveira-time java java 开发语言
`@Override`是Java语言中的一个注解（Annotation），用于表示一个方法声明打算覆盖其父类中的另一个方法。当你在一个子类中的方法上使用`@Override`注解时，它告诉编译器这个方法是特意用来覆盖父类中的一个具有相同名称和参数列表的方法。####使用`@Override`注解的好处：1.**明确意图**：使用`@Override`可以清楚地表明你的意图是要覆盖父类中的方法，这有
Prompt：开启与AI高效对话的钥匙
解密Prompt：开启与AI高效对话的钥匙一、什么是Prompt？——AI的“使用说明书”想象一下，你正在指挥一位无所不知但毫无主动性的“实习生”——人工智能（AI）。你不能指望它“心领神会”，你必须给出清晰、具体的指令，它才能准确地完成你想要的任务。这个指令，就是Prompt（提示或提示词）。简单来说，Prompt是你向AI（如大型语言模型LLM）发出的文本或问题，用以引导它生成特定的、高质量的
CSS面试题及详细答案140道之（101-120）还是大剑师兰特前后端面试题 css 大剑师 CSS面试题
《前后端面试题》专栏集合了前后端各个知识模块的面试题，包括html，javascript，css，vue，react，java，Openlayers，leaflet，cesium，mapboxGL，threejs，nodejs，mangoDB，MySQL，Linux…。前后端面试题-专栏总目录文章目录一、本文面试题目录101.解释`text-indent`属性的作用。102.如何在CSS中实现响应
Java内存模型十丈_红尘
一谈谈对Java内存模型的理解1️⃣线程私有补充知识点:1.内存简介32位:2^32的可寻址范围;64位:2^64的可寻址范围;2.地址空间的划分内核空间:指操作系统程序和C运行时的空间,包括调度程序等;用户空间:Java程序运行时实际使用的空间;3.Java内存模型JDK1.84.程序计数器 1.当前线程所执行的字节码的行号指示器; 2.改变计数器的值来选取下一条需要执行的字节码指令; 3.和线
AI人工智能中Actor - Critic算法的深入解析与应用场景 AI智能探索者 AI Agent 智能体开发实战人工智能算法 ai
AI人工智能中Actor-Critic算法的深入解析与应用场景关键词：Actor-Critic、强化学习、策略梯度、价值函数、深度强化学习、马尔可夫决策过程、A2C/A3C摘要：本文将深入解析Actor-Critic算法的核心原理，从基础概念到数学推导，再到实际应用场景。我们将通过生动的比喻解释这一强化学习中的重要算法，展示其Python实现代码，并探讨它在游戏AI、机器人控制等领域的应用。最后，
AI人工智能领域多模态大模型的发展历程回顾 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
AI人工智能领域多模态大模型的发展历程回顾关键词：AI人工智能、多模态大模型、发展历程、技术演变、应用场景摘要：本文旨在全面回顾AI人工智能领域多模态大模型的发展历程。通过对不同阶段核心概念、算法原理、数学模型等方面的深入剖析，结合实际项目案例，探讨其在各个领域的应用场景。同时，推荐相关的学习资源、开发工具和重要论文著作，最后总结多模态大模型的未来发展趋势与挑战，并对常见问题进行解答。1.背景介绍
AI人工智能领域Actor - Critic算法的可视化分析 AI智能探索者 AI Agent 智能体开发实战人工智能算法 ai
AI人工智能领域Actor-Critic算法的可视化分析关键词：Actor-Critic算法、强化学习、策略梯度、价值函数、可视化分析、神经网络、马尔可夫决策过程摘要：本文深入浅出地讲解Actor-Critic算法的核心原理，通过生活化的比喻和可视化分析，帮助读者理解这一强化学习中的重要算法。我们将从基础概念入手，逐步剖析算法架构，并通过Python代码实现和可视化演示，展示算法在实际问题中的应用
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
Java——SpringBoot系列【1】
本篇就围绕Java中的Spring框架做一些讲解吧【大部分都是SpringBoot的】1、什么是SpringBoot？多年来，随着新功能的增加，spring变得越来越复杂。只需访问https://spring.io/projects页面，我们就会看到可以在我们的应用程序中使用的所有Spring项目的不同功能。如果必须启动一个新的Spring项目，我们必须添加构建路径或添加Maven依赖关系，配置应
头歌实践JAVA项目开发实战入门--第10阶段【Linux操作系统】
开始更新头歌了！！！有需要的小伙伴自取吧；有什么好的建议也可以评论区留言，大家一起共勉！Linux操作系统一、Linux初体验#!/bin/bash#在以下部分写出完成任务的命令#*********begin*********#cd/ls-a#*********end*********#二、Linux常用命令#!/bin/bash#在以下部分写出完成任务的命令#*********begin****
头歌实践Java项目开发入门实战第三阶段【Java高级特性】 Y_03 头歌实践题 java 开发语言
本文来自头歌实践平台的Java项目实战入门【只有编程题】，如需访问其他阶段的文章，请自行阅读主页其他文章制作不易，请留下一个免费的点赞以及关注吧！！！一、Java高级特性-IO流2、字节流-输入输出packagestep2;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileOutputStream;importja
Java Future注意事项泓礼
1.Future是否可以执行完确保对结果的处理，如果漏掉了一种情况，比如返回值为空时的处理，会导致程序阻塞，这样的bug还是很难调试的本质上是对全集的处理不好导致的问题，这种问题夹杂在future场景下，更难处理
Java框架入门——SpringBoot框架初尘屿风 java 初尘屿风 SpringBoot java spring spring boot maven vue
文章目录前言一、SpringBoot是什么？二、请求与响应介绍二、springBoot之helloWorld总结前言Spring都包含了哪些部分呢？主要包含SpringBoot、SpringFramework、SpringData、SpringCloud、SpringCloudDataFlow、SpringSecurity、SpringBatch等众多项目。在spring的官网中对其有详细的介绍。
Java——SpringBoot搭建（二）
文章目录Java成长中，学习记录一、SpringBoot二、controller控制层三、entity实体类四、mapper持久层五、service业务逻辑层总结Java成长中，学习记录小白记录学习springboot项目的过程，后续内容在专栏持续更新一、SpringBootspringboot可分为4层1.controller控制层2.entity实体类3.mapper持久层4.service业
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
Actor - Critic：AI人工智能领域的新宠儿
Actor-Critic：AI人工智能领域的新宠儿关键词：强化学习、Actor-Critic、策略梯度、价值函数、深度强化学习、A2C、A3C摘要：Actor-Critic是强化学习领域的一种重要算法框架，它结合了策略梯度方法和价值函数方法的优点，成为近年来人工智能领域的热门研究方向。本文将用通俗易懂的方式介绍Actor-Critic的核心概念、工作原理、实现方法以及实际应用，帮助读者理解这一强大
探索AI人工智能中遗传算法的进化奥秘 AI学长带你学AI 人工智能 ai
探索AI人工智能中遗传算法的进化奥秘关键词：遗传算法、自然选择、基因编码、适应度函数、群体进化、交叉变异、优化问题摘要：本文将用生物进化视角解读人工智能中的遗传算法原理。通过达尔文进化论的生活化比喻，结合Python代码实例演示如何模拟基因遗传、自然选择等过程，揭示遗传算法在路径规划、参数优化等场景的应用奥秘。最后探讨遗传算法的局限性与未来发展方向。背景介绍目的和范围本文旨在用通俗易懂的方式解析遗
深度剖析AI人工智能领域多模态大模型 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能 ai
深度剖析AI人工智能领域多模态大模型关键词：AI人工智能、多模态大模型、模型架构、算法原理、应用场景摘要：本文旨在对AI人工智能领域的多模态大模型进行深度剖析。首先介绍多模态大模型的背景知识，包括目的、预期读者等。接着阐述核心概念，分析其架构和原理，并给出相应的流程图。通过Python代码详细讲解核心算法原理和具体操作步骤，同时用数学模型和公式进一步阐释。在项目实战部分，给出实际案例及详细代码解读
Open AI在AI人工智能领域的创新之路 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能 ai
OpenAI在AI人工智能领域的创新之路关键词：OpenAI、人工智能、创新之路、技术突破、应用场景摘要：本文深入探讨了OpenAI在AI人工智能领域的创新之路。首先介绍了OpenAI的背景信息，包括其成立目的、发展历程等。接着详细阐述了OpenAI的核心概念，如强化学习、生成式对抗网络等，并通过示意图和流程图展示其原理和架构。然后讲解了相关核心算法原理，结合Python代码进行具体说明。同时，给
探索AI人工智能领域Actor - Critic的无限潜力
探索AI人工智能领域Actor-Critic的无限潜力关键词：AI人工智能、Actor-Critic、强化学习、策略网络、价值网络摘要：本文将深入探索AI人工智能领域中Actor-Critic方法的无限潜力。我们会先介绍其背景知识，接着用通俗易懂的方式解释核心概念，包括Actor和Critic的含义及它们之间的关系，然后阐述其核心算法原理和具体操作步骤，还会给出数学模型和公式并举例说明。通过项目实
AI人工智能领域多模态大模型的技术瓶颈与解决方案 AI学长带你学AI 人工智能 ai
AI人工智能领域多模态大模型的技术瓶颈与解决方案关键词：多模态大模型、技术瓶颈、跨模态对齐、计算效率、数据稀缺、模型泛化、解决方案摘要：本文深入探讨了AI人工智能领域多模态大模型发展过程中面临的主要技术瓶颈，包括跨模态对齐困难、计算资源消耗巨大、高质量多模态数据稀缺、模型泛化能力不足等问题。针对这些挑战，我们提出了系统性的解决方案，涵盖算法优化、架构创新、数据增强等多个维度。文章通过理论分析、数学
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_