Lewin～

音视频基础及海思sample_venc解读

1、sample的整体架构

(1)sample其实是很多个例程，所以有很多个main

(2)每一个例程面向一个典型应用，common是通用性主体函数，我们只分析venc

(3)基本的架构是：venc中的main调用venc中的功能函数，再调用common中的功能函数，再调用mpp中的API，再调用HI3518E内部的硬件单元。

(4)sample的配置和编译，重点注意很多环境变量，目录结构不要乱动。

2、sample代码学习的关键

(1)得理解很多基础概念，譬如图像采集原理、模拟数字、通道、绑定、组、视频缓冲池、在线/离线模式等等

(2)得从宏观上理解整个视频采集、内部传递、处理、编码输出、网络传输等的过程。

(3)得反复看代码，熟才能生巧，才能帮助理解整个代码。

(4)得查阅mpp手册，熟悉海思这一套API的规矩和一般用法。

3、sample_venc的大体分析

(1)从main入手，main的传参分析

(2)几个重要的基本概念：

H.264 H.265 MJPEG 视频编码规范标准

1080P、720P、VGA、D1 视频分辨率（清晰度）

fps（frame per second）帧率：每秒多少帧

4、图像像素格式深度理解

4.1、颜色的学问

(1)颜色是主观还是客观存在？是主观存在的，颜色的本质是光的波长，这些不同波长的光映射到人的眼中就成了不同的颜色，正因为有人去看才有了颜色这个概念

(2)颜色的三个关键：亮度、色度、饱和度

(3)人的眼睛并非理想完美的颜色识别器件，图像表达也有清晰度和质量高低的差异

(4)科学研究如何定义（或者表达、记录、计算）一种颜色？色彩空间的概念

色彩空间：如何用数字表达一种颜色，例如rgb888，rgb565等

4.2、rawRGB和图像采集过程

(1)图像采集的过程：光照在成像物体被反射->镜头汇聚->Sensor光电转换->ADC为rawRGB

光照到成像物体上被反射到镜头汇聚起来传到焦点，Sensor就在焦点处，Sensor是一个平面，被分成很多区域，每一个最小区域就是一个像素，这一路像素就是一路单独的光电转换器，转出来的电信号是一个模拟值，光照到每个像素上就生成了这个像素的模拟电压。

Sensor有个参数叫做分辨率，或者说叫做像素个数，比如买手机时经常说多少w像素，指的就是这里的意思。

这些模拟电信号再由ADC转换成数字的电信号（rawRGB）

(2)sensor上每个像素只采集一种颜色的光，因此sensor每个像素只能为R或G或B

也就是说手机摄像头上一个像素点是rgb的一个颜色。

而手机的LCD显示屏，一个像素点里面有三个小灯，rgb。

也就是说光电转换只能转换一种颜色分量，不可能一个点转换R、G、B三种分量。

(3)rawRGB和RGB都是用来描述图像的，图像采集时RGB是由rawRGB计算而来的

由rawRGB进行联合附近的分量进行加权平均计算得到RGB

(4)因为图像颜色本身有一定连贯性，而且人眼是非理想的，因此图像采集和再显示给人这整个构成中有三个要素：sensor分辨率、pitch（两个像素点中心的距离）、观看距离

(5)如果是视频，质量好坏还要加上帧率framerate

(6)图像的表达、压缩、修整等相关技术，就发生在rawRGB进来以后的各个环节

表达：rgb565、rgb888、1080p等

压缩：bmp、jpg、png等

修整：锐化、曝光等

5、RGB和YUV详解

5.1、RGB方式表示颜色

(1)RGB有RGB565和RGB888，ARGB等多种子分类

(2)RGB的本质：将色度分解为R、G、B三部分，然后记录下亮度数据，也就是说RGB没有记录颜色的色度，色度是固定的红绿蓝。

(3)RGB的优势：方便数字化表达，广泛用于数字化彩色显示器，计算机编程等领域。

(4)RGB的劣势：和传统的灰度图兼容不好，表达颜色的效率不高

灰度图只有亮度，没有颜色，而RGB又默认分解成三种基色，所以会兼容不好

5.2、YUV

(1)YUV是一种色彩空间，Y表示亮度，U和V表示色度。只有Y就是黑白图像，也就是灰度图，再加上UV就是彩色图像了。YUV的一个好处就是让彩色系统和传统黑白系统很好的兼容。

(2)YUV和RGB的相同点是：都是用来表达颜色的数学方法；不同点是：对颜色的描述思路和方法不同。RGB将一个颜色拆解为3个纯色的亮度组合，YUV将一个颜色分解为一个亮度和2个色度的组合。

(3)RGB和YUV之间可以用数学方法互相换算，是个典型的浮点运算过程。

(4)YUV和YCbCr几乎可以看做一个概念，详细的区分以后再去慢慢体会。

(5)YUV格式分为packed和planar两种。具体参考：http://blog.csdn.net/sunnylgz/article/details/7580628

(6)有多种YUV相关的概念需要弄清楚（以下均为planar格式）

YUV

YUV422(YUYV)

YUV420(YUV411)

YUV422 planar(YUV422P)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8]，[U1,U2,U3,U4]，[V1,V2,V3,V4]

YUV420 Planar(YUV420P)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8]，[U1,U2]，[V1,V2]

YUV422 semi planar(YUV422SP)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8]，[U1,V1]，[U2,V2]，[U3,V3]，[U4,V4]

YUV420 semi Planar(YUV420SP)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8]，[U1,V1]，[U2,V2]

参考：http://blog.csdn.net/bingqingsuimeng/article/details/50716390
和https://www.2cto.com/kf/201303/198023.html

6、海思MPP功能模块和视频缓存池

6.1、MPP功能模块框图

(1)找到MPP手册

麦克风声电转换AD转换采样-》AI音频输入并降噪-》AENC编码-》音频码流

音频码流-》ADEC解码-》AO音频输出-》喇叭放大

镜头-》Sensor光电转换得到模拟电信号-》AD转换得到rawRGB-》VI视频输入-》VPSS接收并输出多路分辨率不同的图像-》VENC编码成H.264码流

(2)详见系统概述1.3部分

6.2、sample中SAMPLE_VENC_1080P_CLASSIC函数开始看

(1)PAYLOAD_TYPE_E

(2)PIC_SIZE_E

(3)VB_CONF_S

7、视频缓存池

7.1、什么是视频缓冲池

(1)视频的本质是多帧图片，图片的本质是RGB或rawRGB数据，要占用一段连续内存

(2)视频的裁剪、缩放、修正处理（马赛克）等各种操作，本质上就是对内存中的数据进行运算

(3)视频缓存池(VB, video buffer)就是一段很大，又被合理划分和管理的内存，用来做视频数据的暂存和运算场地

(4)公共视频缓存池的公共2字，可以理解为全局变量，也就是各个模块都能访问的一段内存

(5)看似视频缓存块在各个模块之间流转，实际上并没有内存复制，而是指针在传递

(6)视频缓存池的内存由MPP来维护，我们在系统启动时就把整个SDRAM分成了2部分：系统部分（由linux kernel来维护管理）和mpp部分（由mpp系统来维护管理）

(7)缓存池需要几个，每个中包含几个缓存块，每个缓存块多大，都是可以由用户程序设置好参数，然后调用MPP的相应API来向MPP申请分配的。

7.2、相关的数据结构和API

(1)VB_CONF_S结构体

(2)HI_MPI_VB_SetConf
(3)HI_MPI_VB_Init

8、VI部分知识要点

(1)常用Sensor的接口有三种：MIPI、LVDS、DC
(2)WDR宽动态：一副图像里面，局部曝光和其它地方是不一样的
(3)isp就是image signal process，图像信号处理。
(4)HI3518E内部的ISP单元是隶属于VI模块的。VI模块就包含3大部分：第一部分是和Sensor对接的部分（Sensor是什么接口的，mipi，dc等，怎么去操作），第二部分就是ISP，第三部分就是VI dev和channel
dev：就是用来采集图像的一个硬件单元

9、VPSS部分知识要点

9.1、VPSS的手册部分解读

VI/VPSS 离/在线模式
VI 和 VPSS 的协作模式分为以下 2 种（模式切换由 load 脚本参数控制，对应 sys 模块
参数 vi_vpss_online）：

VI/VPSS 离线模式是指 VI 进行时序解析后将图像数据写出到 DDR，VPSS 从
DDR 中载入 VI 采集的数据进行图像处理，是传统 Hi3518/Hi3520D 等芯片的
VI/VPSS 的协作模式。

VI/VPSS 在线模式是指 VI 进行时序解析后直接在芯片内部将数据传递到 VPSS，
中间无 DDR 写出的过程。在线模式可以省一定的带宽和内存，降低端到端的延
时。需要注意的是，在线模式时，因为 VI 不写出数据到 DDR，无法进行
CoverEx、OverlayEx、Rotate、LDC 等操作，需要在 VPSS 各通道写出后再进行
Rotate/LDC 等处理，而且有些功能只在离线下能支持，比如 DIS。

总结：
离线模式：公共视频缓冲池-》VI模块处理缓冲池那一份-》复制到DDR-》VPSS处理DDR中的那一份
在线模式：公共视频缓冲池-》VI模块处理缓冲池那一份-》VI模块将缓冲池的指针传递给VPSS，VPSS处理缓冲池中的那一份

10、VENC部分知识要点

有了以上，VENC部分代码就很简单

学习博文：

LCD常用接口：
https://blog.csdn.net/wocao1226/article/details/23870149

yuv格式：
http://blog.csdn.net/sunnylgz/article/details/7580628
http://blog.csdn.net/bingqingsuimeng/article/details/50716390
https://www.2cto.com/kf/201303/198023.html

图像编码原理：
http://blog.csdn.net/newchenxf/article/details/51693753

Qp：
http://blog.csdn.net/u013354805/article/details/51988171

VI、VPSS、VENC数据流向图

海思示例代码函数调用关系

sample_venc.c
main
	SAMPLE_VENC_1080P_CLASSIC
		SAMPLE_COMM_VI_GetSizeBySensor（step1）		//获取Sensor采集图像的大小---》720P
		SAMPLE_COMM_SYS_CalcPicVbBlkSize			//计算缓冲块大小---》1280 * 768 * 1.5+HeaderSize		1.5是yuv420图像中一个像素的大小
			SAMPLE_COMM_SYS_GetPicSize		//获取Sensor图像的大小---》1280 * 720
			VB_PIC_HEADER_SIZE			//计算图像头的大小---》HeaderSize	
		SAMPLE_COMM_SYS_Init（step2）			//MPP系统初始化
			HI_MPI_SYS_Exit				//去除 MPP 系统。禁用一切模块
			HI_MPI_VB_Exit				//去除 MPP 视频缓存池
			HI_MPI_VB_SetConf				//设置 MPP 视频缓存池属性---》最大缓冲池个数为128，实际缓冲池个数为16，每个缓冲块的大小和个数
			HI_MPI_VB_Init				//初始化 MPP 视频缓存池
			HI_MPI_SYS_SetConf				//配置系统控制参数---》64字节对齐
			HI_MPI_SYS_Init				//初始化 MPP 系统
		SAMPLE_COMM_VI_StartVi（step3）			//启动vi dev & CHN进行捕获
			IsSensorInput				//传感器输入是 电视或Sensor
			SAMPLE_COMM_VI_StartIspAndVi		//启动Isp
				SAMPLE_COMM_VI_StartMIPI（1）					//mipi接口的配置---》3.3V
					SAMPLE_COMM_VI_SetMipiAttr				//mipi接口的配置
						fd = open("/dev/hi_mipi", O_RDWR);				//打开mipi的设备文件
						ioctl(fd, HI_MIPI_SET_DEV_ATTR, pstcomboDevAttr)		//应用层操作Sensor的驱动，对Sensor做一些必要的初始化
				SAMPLE_COMM_ISP_Init（2）		//配置传感器和ISP(包括WDR宽动态模式)。  目的是启动3518e芯片内部的ISP单元
					sensor_register_callback	//传感器寄存器回调
					HI_MPI_AE_Register		//注册AE库，自动曝光
					HI_MPI_AWB_Register	//注册AWB库，自动白平衡
					HI_MPI_AF_Register		//注册AF库，自动对焦
					HI_MPI_ISP_MemInit	//初始化 ISP 外部寄存器
					HI_MPI_ISP_SetWDRMode	//设置 ISP 宽动态的模式---》不启用
					HI_MPI_ISP_SetPubAttr	//配置 ISP 属性---》rawRGB的排列顺序---GRBG、帧率为30、图像区域的起始点、图像区域的宽和高
					HI_MPI_ISP_Init		//初始化ISP系统
				SAMPLE_COMM_ISP_Run（3）	//运行isp线程  
					pthread_create(&gs_IspPid, &attr, (void* (*)(void*))Test_ISP_Run, NULL)	//创建线程
						Test_ISP_Run		//线程函数
							HI_MPI_ISP_Run	//开始运行ISP系统
				SAMPLE_COMM_VI_StartDev（4）	//配置并打开Dev
					HI_MPI_VI_SetDevAttr	//配置 Dev的属性---》接口模式为DC，单路工作方式，图像的扫描模式是逐行扫描，转换成yuv420，使用内部ISP，输入数据类型为RGB，不启用数据逆向
					HI_MPI_ISP_GetWDRMode	//获取 ISP 宽动态模式
					HI_MPI_VI_SetWDRAttr	//配置 WDR宽动态模式的 工作属性---》都不开启
					HI_MPI_VI_EnableDev	//启用Dev
				SAMPLE_COMM_VI_StartChn（5）	//配置并打开通道chn(最多1个)
					HI_MPI_VI_SetChnAttr	//设置 VI 通道chn属性---》通道支持的图像属性是720P，像素存储格式是yuv420sp，原始图像不镜像不翻转，不进行帧率控制，不压缩
					HI_MPI_VI_SetRotate	//设置 VI 图像旋转属性--》图像从通道中出来后的旋转角度---不旋转
					HI_MPI_VI_EnableChn	//启用通道chn			
		SAMPLE_COMM_SYS_GetPicSize（step4）		//获取Sensor图像的大小---》1280 * 720
		SAMPLE_COMM_VPSS_StartGroup			//启动VPSS的Group
			HI_MPI_VPSS_CreateGrp			//创建Group
			HI_MPI_VPSS_GetNRParam			//获取 vpss 3DNR 参数
			HI_MPI_VPSS_SetNRParam			//设置 vpss 3DNR 参数
			HI_MPI_VPSS_StartGrp			//启用Group
		SAMPLE_COMM_VI_BindVpss				//Group绑定VI模块中的Dev0中的chn0
			SAMPLE_COMM_VI_Mode2Param		//获取VI的参数---》是有1个Dev和chn
			HI_MPI_SYS_Bind				//VI通道chn0 绑定 vpss组Group0
		SAMPLE_COMM_VPSS_EnableChn			//在Group内部创建几路自己所用的chn
			HI_MPI_VPSS_SetChnAttr			//设置 VPSS 通道属性---》不进行帧率控制
			HI_MPI_VPSS_SetChnMode			//设置 VPSS 通道工作模式---》VPSS通道工作模式为USER模式，目标图像的像素格式是yuv420sp，目标图像的宽度是720，目标图像的高是1280，设置 256byte 段式压缩
			HI_MPI_VPSS_EnableChn			//打开chn
		SAMPLE_COMM_VENC_Start（step5）			//启动venc流模式(h264, mjpeg)  
			SAMPLE_COMM_SYS_GetPicSize		//获取Sensor图像的大小---》1280x720
			HI_MPI_VENC_CreateChn			//创建VENC chn---》编码通道的宽度是720、高度是1280，要编码的图片的宽度是720、高度是1280，流缓冲区的大小是1280x720，编码出的视频流的图像质量是高清还是啥啥，获取流的模式是切片模式，不支持B帧，设置码率控制模式：CBR、FIXQF、VBR，以及码率控制相关的参数；
			HI_MPI_VENC_StartRecvPic			//开始接收图片
		SAMPLE_COMM_VENC_BindVpss			//VENC的Dev绑定VPSS的chn
			HI_MPI_SYS_Bind				//VENC的Dev绑定VPSS的chn
		SAMPLE_COMM_VENC_StartGetStream（step6）		//获取流，然后将其保存到文件。 
			SAMPLE_COMM_VENC_GetVencStreamProc	//线程函数
				HI_MPI_VENC_GetChnAttr		//获取编码通道的编码属性。
				SAMPLE_COMM_VENC_GetFilePostfix	//获取文件名后缀--->.h.264
				HI_MPI_VENC_GetFd		//mpp内部把VENC编码好的视频流数据做成文件，然后把文件描述符通过这个API获取
				HI_MPI_VENC_Query		//查询编码通道状态---》判断当前这帧图像的码流包个数是否为0，为0则退出程序
				HI_MPI_VENC_GetStream		//获取编码码流。
				SAMPLE_COMM_VENC_SaveStream	//将帧保存到文件
					SAMPLE_COMM_VENC_SaveH264
						fwrite
				HI_MPI_VENC_ReleaseStream		//释放码流缓存。
		SAMPLE_COMM_VENC_StopGetStream（step7）		//退出程序

【unity游戏开发——网络】网络游戏通信方案——强联网游戏（Socket长连接）、弱联网游戏（HTTP短连接）向宇it 【unity游戏开发——网络】网络 unity 游戏游戏引擎 c#编辑器 http
注意：考虑到热更新的内容比较多，我将热更新的内容分开，并全部整合放在【unity游戏开发——网络】专栏里，感兴趣的小伙伴可以前往逐一查看学习。文章目录一、联网游戏类型划分二、核心通信协议对比三、开发选择指南专栏推荐完结一、联网游戏类型划分类型通信特点代表游戏技术本质弱联网游戏按需连接，单次请求后立即断开消消乐、卡牌类（如《刀塔传奇》）短连接通信强联网游戏持续连接，实时双向数据交换《王者荣耀》《和平
大语言模型LLM原理篇
大模型席卷全球，彷佛得模型者得天下。对于IT行业来说，以后可能没有各种软件了，只有各种各样的智体（Agent）调用各种各样的API。在这种大势下，笔者也阅读了很多大模型相关的资料，和很多新手一样，开始脑子里都是一团乱麻，随着相关文章越读越多，再进行内容梳理，终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的，因为毕竟对大模型的研究有限，缺乏深度。但是，还是觉得有必要记录一下学习理解心得，
大语言模型（LLM）笔记笑衬人心。大模型学习语言模型笔记人工智能
一、什么是大语言模型（LLM）？LLM（LargeLanguageModel）是基于Transformer架构构建，并在海量文本语料上训练出的具备自然语言理解和生成能力的深度神经网络模型。其本质任务是**预测下一个token（词/字/符号）**的概率分布，但通过大规模参数和数据的支持，表现出类人智能的行为。二、核心架构：Transformer由Google在2017年提出，是目前LLM的主流架构。
我的第一个开源项目：用Python搭建轻量级静态网页服务器—— 零基础也能实现的Web开发初体验
一、为什么选择静态服务器？极简高效：无需数据库或复杂后端逻辑，适合展示简历、作品集等静态内容学习曲线平缓：是理解HTTP协议和Web服务原理的最佳入门方式资源消耗低：单文件Python脚本即可运行，内存占用小于10MB二、完整开发流程（含代码逐行解析）第一步：创建项目结构PWS/#项目根目录├──static/#静态资源文件夹│├──index.html#主页│├──style.css#样式表│└
Svelte学习笔记六：谈谈双向绑定的使用月半叫做胖 Svelte 前端学习 svelte 前端框架
表单元素的双向绑定1.input受控绑定使用bind关键字进行绑定，svelte通过bind关键字来完成类似v-model的双向绑定textcheckboxnumberrangeselectletquestions=[{id:1,text:'question1'},{id:2,text:'question2'},{id:3,text:'question3'}];letselected=1;{#ea
Milvus向量数据库入门指南 longfei.li milvus 数据库人工智能
一、Milvus简介Milvus是一个开源的向量数据库，专为AI应用和向量相似度搜索而设计，以加速非结构化数据的检索。自2019年创建以来，Milvus专注于存储、索引和管理由深度神经网络和其他机器学习模型生成的海量嵌入向量。其能够处理万亿级别的向量索引任务。Milvus的核心优势在于其高效的索引机制，它支持多种索引类型，包括FLAT、IVF_FLAT、IVF_SQ8、IVF_PQ和HNSW等。这
svelte笔记艾小逗 web 笔记
svelte特性编译过程使用场景创建项目问题1：build报错基本语法响应式变量if语句for循环await加载数据Event组件通信父子组件跨组件通信storeslot插槽生命周期tickonMountonDestroySvelteKit与Svelte的区别项目结构路由+page+page.svelte+page.js/ts+error+layout+layout.sveltelayout.se
常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？努力毕业的小土博^_^ 机器学习基础算法优质笔记2 深度学习学习笔记迁移学习人工智能机器学习
【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？文章目录【深度学习|学习笔记】如何在深度学习中使用正则化技术进行模型压缩、稀疏建模和迁移学习调优？✅一、使用正则化进行模型压缩（ModelCompression）目标：方法：L1正则化促使权重稀疏化代码示例：后续压缩步骤
Java高并发系统限流算法的应用赵广陆 arithmetic java 算法开发语言
目录1概述2计数器限流2.1概述2.2实现2.3结果分析2.4优缺点2.5应用3漏桶算法3.1概述3.2实现3.3结果分析3.4优缺点4令牌桶算法4.1概述4.2实现4.3结果分析4.4应用5滑动窗口5.1概述5.2实现5.3结果分析5.4应用想学习架构师构建流程请跳转：Java架构师系统架构设计1概述在开发高并发系统时有三把利器用来保护系统：缓存、降级和限流。限流可以认为服务降级的一种，限流是对
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
(SERIES1) MacOS Terminal远程SSH连接Aliyun ECS服务器纯命令行模式下部署DM8教程（服务器环境Ubuntu 20.04LTS ） Ender-Shadows 达梦数据库 ubuntu macos 阿里云
1DM数据库版本介绍1.1版本区别 DM8目前的版本主要包括标准版、企业版、安全版和开发版。前三项的比较如表1-1所示。以适用场景为角度进行分类，标准版适用于小型应用开发，企业版适合生产环境级应用，安全版则在具备所有企业版基础上加入了对四权分立、强制访问控制、审计和实时侵害检测等功能上的补全，在安全性方面实现了更加全面完善的安全策略；至于开发版则专供开发者学习、测试、开发用途，有1年免费试用期，
Python|读取word文档表格内容算法与编程之美算法之美编程语言人工智能 python 数据挖掘数据可视化
本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。引言在日常生活里，不管是办公、学习还是制作邀请函、请柬、简历等等，我们都会使用一个软件MicrosoftOfficeWord，OfficeWord是微软公司的一个收费文字处理应用程序，是最流行的文字处理程序之一，它虽功能强大，但简学易懂，但同时也有一个缺点，当一个Word文档储存的内容特别庞大的时候，使用者想要提取自己想要
记忆力锻炼方法穗余记忆力计算机视觉人工智能深度学习
记忆力锻炼的核心在于科学方法、持续训练和健康生活习惯的结合。通过重复训练、关联记忆、充足睡眠等方式，可有效提升大脑信息处理与存储能力。关键在于长期坚持，并结合多种技巧形成适合自己的记忆策略。一、科学记忆方法重复训练与间隔复习大脑通过重复强化神经连接，但机械重复效率低。建议采用间隔重复法，例如学习新知识后，在1天、3天、1周等间隔复习，利用“遗忘曲线”规律巩固记忆。关联记忆法将新信息与已知内容关联，
让AI自己学会“怎么学”——元学习，才是高效训练的终极武器！ Echo_Wish Python 进阶人工智能学习
让AI自己学会“怎么学”——元学习，才是高效训练的终极武器！朋友们，今天咱不聊ChatGPT，不聊大模型黑魔法，也不玩Prompt咒语。我想聊一个比“怎么训模型”更底层、更值得思考的问题：如果我们能让模型自己学会怎么更快、更聪明地学习，是不是就能少走很多弯路？这，就是元学习（MetaLearning）要解决的事儿。说白了，元学习是AI给AI上培训课的过程。咱们天天琢磨怎么喂模型数据、调超参、搞迁移
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
PHP学习笔记（十二）
访问控制（可见性）对属性或方法的访问控制（PHP7.1后支持常量），是通过在前面添加关键字public（公有）、protected、private来实现。公有的任意可见，受保护的可被自身及其子类和父类访问，私有的只能被其定义所在的类访问属性的访问控制类属性可以定义为public，private或者protected。在没有任何访问控制关键字的情况下，属性声明为public不对称属性可见性从PHP8
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
鸿蒙HarmonyOS 5.0开发实战：自定义安全键盘实现案例炫酷盖茨猫先生鸿蒙5.0开发鸿蒙应用开发案例 harmonyos 华为前端 android ArkUI ArkTS 鸿蒙系统
往期鸿蒙5.0全套实战文章必看：（文中附带鸿蒙5.0全栈学习资料）鸿蒙开发核心知识点，看这篇文章就够了最新版！鸿蒙HarmonyOSNext应用开发实战学习路线鸿蒙HarmonyOSNEXT开发技术最全学习路线指南鸿蒙应用开发实战项目，看这一篇文章就够了（部分项目附源码）自定义安全键盘案例
第八章：LeRobot摄像头配置与应用指南贾全实战具身智能机器人深度学习人工智能算法机器学习机器人
引言在机器人学习系统中，视觉感知是至关重要的组成部分。摄像头作为机器人的"眼睛"，为系统提供环境信息，使机器人能够理解周围世界并做出相应的决策。LeRobot作为一个完整的机器人学习框架，提供了灵活且强大的摄像头支持系统，能够适配多种类型的摄像头设备。本章将详细介绍LeRobot的摄像头配置和使用方法，帮助读者掌握如何在机器人学习项目中有效地集成和使用视觉系统。8.1LeRobot摄像头系统架构L
LeRobot环境搭建与安装（简洁版）贾全 LeRobot系列教程机器人人工智能机器学习 ai
一、引言在上一篇文章（LeRobot入门：开启AI机器人开发之旅）中，我们全面了解了LeRobot的基本概念、核心优势和应用场景。现在，是时候动手实践了！本文将详细指导你完成LeRobot开发环境的搭建，确保你能够顺利开始LeRobot的学习和开发之旅。为了保证易读性，对文章进行了大幅精简，如果需要更加详细的介绍，可以查看详解篇：《LeRobot开发环境搭建详解》，二、准备工作创建专用虚拟环境虚拟
Android-ThreadLocal并发安全与内存泄漏原理详解
你生来一无所有，何惧从头再来---勉励自己ThreadLocal是如何实现线程隔离的?为什么ThreadLocal会造成内存泄露?如何解决？本篇文章主要是针对这两个问题进行剖析，确保每个小伙伴都能读懂，深刻理解，篇幅较长，请耐心阅读。大家如果还有什么难点，欢迎在评论区留言，小编将和大家一起学习。定义：ThreadLocal提供线程局部变量，通过为每个线程提供不同的局部变量副本，实现线程之间的数据隔
单片机开发全攻略：从零开始，迈向嵌入式开发高手之路 DTcode7 学习提升单片机 mongodb 嵌入式硬件
单片机开发全攻略：从零开始，迈向嵌入式开发高手之路一、单片机开发基础1.1单片机概述1.2开发环境搭建1.3编程语言与框架二、实战案例：LED闪烁2.1硬件准备2.2代码示例2.3解释三、高级应用：温度监控系统3.1硬件扩展3.2代码实现3.3解释四、开发技巧与问题排查4.1优化内存使用4.2问题排查思路4.3调试工具五、相关项目积分资源5.1在线学习资源5.2社区与论坛5.3开源项目结语与讨论在
PHP语法基础篇(五)：流程控制 zorro_z php手记实战 php
任何PHP脚本都是由一系列语句构成的。一条语句可以是一个赋值语句，一个函数调用，一个循环，一个条件语句或者甚至是一个什么也不做的语句（空语句）。语句通常以分号结束。此外，还可以用花括号将一组语句封装成一个语句组。语句组本身可以当作是一行语句。本篇文章将记录流程控制的学习过程。目录一、条件语句1、if语句2、if...else语句3、if...elseif...else语句4、switch语句4.1
linux深度学习问题汇总不想改代码备忘录 linux python 深度学习 pytorch 人工智能 1024程序员节
目录一、异常问题1.segementationfault(coredump)2.Illegalinstruction(coredumped)3.死锁4.掉卡二、通用方法1.查看重启记录2.系统性能监控3.后台执行命令4.异常日志三、深度学习技术1.普通网络改DDP训练，单机多卡，pytorch四、专业内容方法1.微调diffusion类模型本文记录一些在使用linux服务器进行深度学习时遇到的问题
学习如何让STM32在运行时改变PWM频率和占空比 ZERONG_H 嵌入式 stm32 嵌入式硬件单片机
前言最近有个需求是关于调节占空比去控制风扇实现三挡风力大小的。由于硬件供电和控制成本等原因，普通的芯片支撑不起几个风扇同时转起来，于是就沿用了一个神奇的电路方案，但是这个方案在输出占空比的时候达不到真正的占空比（这里解释不清），因为电机类需要特别注意频率的大小，频率太高或者太低或多或少都会让人耳接受不了，反正是需要在运行时同时改变PWM频率和占空比，本文着重于应用，不讲原理。一、定时器介绍使用的是
PHP基础语法讲解程序员小羊！杂文 php
大家好，我是程序员小羊！前言：PHP（HypertextPreprocessor）是一种常用于网页开发的服务器端脚本语言，易于学习并且与HTML紧密结合。以下是PHP的基础语法详细讲解。1.PHP基础结构1.1PHP脚本结构PHP代码通常嵌入到HTML文件中，并且用特殊的标记或短标记包围：是结束标记。PHP代码可以放在HTML代码中间，服务器解析时只执行PHP代码，输出结果会生成标准HTML页面。
第三届“传智杯”全国大学生IT技能大赛（初赛B组） START_GAME 实战笔记
第三届“传智杯”全国大学生IT技能大赛（初赛B组）链接：https://www.luogu.com.cn/contest/38442#description也直接洛谷进入———————————————————————————————笔记：前三题不难。卡在第四题（提交了18次才过-_-）,测试点二就是过不了。变量创建的位置改一下就过了，非常不明白为什么。虽然最后5题都过了，估计还是凉凉300+。T1
DS18B20温度传感器的Verilog初始化程序实战指南北海有座岛
本文还有配套的精品资源，点击获取简介：DS18B20是一款适用于宽温度范围的高精度数字温度传感器，采用Verilog语言实现其初始化程序，以便能够正确地在系统中运行。本指南详细介绍了DS18B20的初始化过程，包括电源配置、分辨率选择、报警阈值设定等，并解释了如何使用Verilog来控制和通信DS18B20传感器，对于嵌入式系统设计和硬件描述语言的学习具有重要价值。1.DS18B20传感器概述1.
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。