hjhyxq2014

VTM10.0代码学习1：DecApp_decode()

此系列是为了记录自己学习VTM10.0的过程和锻炼表达能力，主要是从解码端进行入手。由于本人水平有限，出现的错误恳请大家指正，欢迎与大家一起交流进步。

1.初始化

int                 poc;//picture order count
PicList* pcListPic = NULL;//存有图片的线性表
ifstream bitstreamFile(m_bitstreamFileName.c_str(), ifstream::in | ifstream::binary);//c_str()将string类型转换为c语言的字符串，in代表输入，binary代表为二进制模式。创建一个文件输入比特流。
InputByteStream bytestream(bitstreamFile);//将比特流转为字节流
// 创建解码器类
xCreateDecLib();
//舍弃RAP的前置图像中为RASL，更新the last displayed POC？
m_iPOCLastDisplay += m_iSkipFrame;      // set the last displayed POC correctly for skip forward.
bool loopFiltered[MAX_VPS_LAYERS] = {
      false };//标记是否已进行环路滤波
bool bPicSkipped = false;//表示是否跳过解码图像
bool isEosPresentInPu = false;//表示前一个NALU所在的PU是否是Eos

poc：帧的播放顺序

pcListPic：存放着解码出来的帧

bitstreamFile和bytestream：解码端的输入码流，一个是以比特为单位，另一个是以字节为单位

xCreateDecLib()：函数包含着解码器类的创建和初始化，存在ROM上变量的初始化，量化和变换相关的初始化

m_iPOCLastDisplay += m_iSkipFrame ：不确定

loopFiltered：标记是否已经环路滤波

bPicSkipped：是否跳过解码上一个NALU所在的图像

isEosPresentInPu：判断前一个NALU是否是EOS

2.循环进行NALU解码

  while (!!bitstreamFile)
  {
     
    //创建NALU类
    InputNALUnit nalu;
    nalu.m_nalUnitType = NAL_UNIT_INVALID;
      
    bool bNewPicture = m_cDecLib.isNewPicture(&bitstreamFile, &bytestream);//将要解码的NALU是否是图像中的第一个NALU
    bool bNewAccessUnit = bNewPicture && m_cDecLib.isNewAccessUnit( bNewPicture, &bitstreamFile, &bytestream );//将要解码的NALU是否是新的一帧中的第一个NALU，同时也是新的AU中的第一个NALU
      
    if(!bNewPicture)
    {
     //分支1
    }
      
    if ((bNewPicture || !bitstreamFile || nalu.m_nalUnitType == NAL_UNIT_EOS) && !m_cDecLib.getFirstSliceInSequence(nalu.m_nuhLayerId) && !bPicSkipped)
    {
     //分支2
     //满足不是跳过解码的图像，同时满足不是sequence中的第一个slice，同时满足以下至少一个条件：1)将要解码的NALU是图像中的第一个NALU；2）比特流文件eof？；3）上一个NALU的类型是EOS
    }
    else if ( (bNewPicture || !bitstreamFile || nalu.m_nalUnitType == NAL_UNIT_EOS ) &&
      m_cDecLib.getFirstSliceInSequence(nalu.m_nuhLayerId))//在下一个NALU所在的slice将是sequence中的第一个slice的情况下，同时满足以下至少一个条件：1)将要解码的NALU是图像中的第一个NALU；
    {
                                                           //2）比特流文件eof？；3）上一个NALU的类型是EOS。则下一个NALU所在的slice也是picture中的第一个slice。
      m_cDecLib.setFirstSliceInPicture (true);
    }
      
    if( pcListPic )
    {
     //分支3
    }
      
    if( bNewPicture )
    {
     
    }
      
    if (bNewPicture || !bitstreamFile || nalu.m_nalUnitType == NAL_UNIT_EOS)
    {
     
    }
      
    if (bNewAccessUnit || !bitstreamFile)
    {
     
    }
      
    if(bNewAccessUnit)
    {
     
    }
  }

进入循环只要bitstreamFile有效，就进行NALU解码

这里有两个重要的flag，bNewPicture和bNewAccessUnit

bNewPicture：将要解码的NALU是否是一帧中的第一个NALU

bNewAccessUnit：将要解码的NALU是否是AU中第一个NALU

bNewPicture为false进入第一个分支，具体参考2.1节

本节分支2：满足以下条件之一

要解码的NALU是一帧中的第一个NALU
eof
上一个NALU的类型是EOS

如果同时满足目前的解码过程不处于CLVS中的第一个slice且上一个NALU所处的帧未被跳过解码则进行一些操作，具体参考2.2节

如果同时满足目前的解码过程处于CLVS中的第一个slice则标志着解码过程进入一帧中的第一个slice。

说明：m_cDecLib.setFirstSliceInPicture (true)会使bNewPicture判断为False

本节分支3：存储的帧不为空，则进行一些操作，具体参考2.3节

之后还有四个分支和之前两个flag有关，由于能力有限就不展开了

2.1 if(!bNewPicture)

只要解码的NALU不是一帧中的第一个NALU就可进入此分支

AnnexBStats stats = AnnexBStats();//JVET-S2001中AnnexB有关的信息
// 将字节流的下一个NALU的所有比特流信息存入NALU类中的m_Bitstream的m_fifo，将统计信息存入stats，具体过程可以参考JVET-S2001中的AnnexB
byteStreamNALUnit(bytestream, nalu.getBitstream().getFifo(), stats);

// 读取NALU头信息，参考JVET-S2001 7.3.1.2 P83
read(nalu);

// 判断是否是IDR图像中的第一个slice
if(m_cDecLib.getFirstSliceInPicture() &&//是否是图片中的第一个slice，在解码器类初始化时设置为true
        (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_W_RADL ||
         nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_N_LP))
{
     //分支1
 m_newCLVS[nalu.m_nuhLayerId] = true;   // m_newCLVS标记是否是一个新的CLVS
 xFlushOutput(pcListPic, nalu.m_nuhLayerId);//将pcListPic中存有的图片清空，并写入文件
}

if (m_cDecLib.getFirstSliceInPicture() && nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_CRA && isEosPresentInPu)
{
     //分支2
 // 在EOS后面紧接着的CRA图像是CLVSS
 m_newCLVS[nalu.m_nuhLayerId] = true;
}
else if (m_cDecLib.getFirstSliceInPicture() && nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_CRA && !isEosPresentInPu)
{
     
 // 如果CRA图像前面不是EOS，那CRA图像就不是CLVSS
 m_newCLVS[nalu.m_nuhLayerId] = false;
}

// temporal_id应该小于cfg中的m_iMaxTemporalLayer，同时nuh_layer_id应该在cfg的m_targetDecLayerIdSet中
if( ( m_iMaxTemporalLayer < 0 || nalu.m_temporalId <= m_iMaxTemporalLayer ) && xIsNaluWithinTargetDecLayerIdSet( &nalu ) )
{
     //分支3
}
else//不满足条件，跳过解码此图像
{
     
 bPicSkipped = true;
}

if (nalu.m_nalUnitType == NAL_UNIT_EOS)
{
     //分支4
 isEosPresentInPu = true;//当NALU的类型为EOS，将isEosPresentInPu设置为true
 m_newCLVS[nalu.m_nuhLayerId] = true;  //The presence of EOS means that the next picture is the beginning of new CLVS
}

byteStreamNALUnit()：主要是将字节流掐头去尾，详细过程参考JVET-S2001中AnnexB一章，这里不再展开

read():读取NALU的头信息，相应格式在JVET-S2001 7.3.1.2 P83

本小节分支1：判断是否进入IDR图像中的第一个slice解码过程中，主要是由解码器类来决定。如果是则意味着进入新的CLVS，并将之前缓存的帧清除

本小节分支2：只有当前一个NALU是EOS(end of sequence)时，当前CRA图像才意味着进入新的CLVS

本小节分支3：是整个函数中最重要的分支，包含调用解码器类解码的过程。但是需要满足NALU的时域层在输出范围内，多图像层也在输出范围内。不满足就跳过解码。具体参考2.1.1节

本小节分支4：当前解码NALU为EOS类型时，就将isEosPresentInPu设置为true。并意味着下一个NALU就是CLVS的开始

2.1.1 分支3

if (bPicSkipped)
{
     
    if ((nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_TRAIL) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_STSA) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_RASL) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_RADL) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_W_RADL) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_IDR_N_LP) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_CRA) || (nalu.m_nalUnitType == NAL_UNIT_CODED_SLICE_GDR))
    {
     //满足前一个NALU所在的图像是被跳过解码的，且当前NALU的nal_unit_type属于VCL（除去保留的）
     //分支1
        if (m_cDecLib.isSliceNaluFirstInAU(true, nalu))//图片中的第一个VCL类型的NALU是否是AU中的第一个VCL类型的NALU
        {
     
            //清除一些AU相关的缓存信息
            m_cDecLib.resetAccessUnitNals();
            m_cDecLib.resetAccessUnitApsNals();
            m_cDecLib.resetAccessUnitPicInfo();
        }
        bPicSkipped = false;
    }
}

m_cDecLib.decode(nalu, m_iSkipFrame, m_iPOCLastDisplay, m_targetOlsIdx);//调用解码器类进行解码NALU

if (nalu.m_nalUnitType == NAL_UNIT_VPS)//如果NALU类型是VPS，则提取一些信息
{
     //分支2
    m_cDecLib.deriveTargetOutputLayerSet( m_targetOlsIdx );
    m_targetDecLayerIdSet = m_cDecLib.getVPS()->m_targetLayerIdSet;//更新需要解码图片的nuh_layer_id集
    m_targetOutputLayerIdSet = m_cDecLib.getVPS()->m_targetOutputLayerIdSet;//更新需要输出图片的nuh_layer_id集
}

本小节的分支1：前一个NALU所在的图像是被跳过解码的，当前要解码NALU所在的图像不是被跳过解码的。当前NALU的类型又恰巧是VCL(除去保留的)，又很恰巧这是AU中第一个VCL类型的NALU。那么就要调用解码器类进行以下三步操作

resetAccessUnitNals()
resetAccessUnitApsNals()
resetAccessUnitPicInfo()

都是跟AU相关的，没有跟进去看，具体啥作用也不知道。同时也要把bPicSkipped设置为false。

m_cDecLib.decode():调用解码器类进行解码的函数，需要另开篇幅仔细描述的。

本小节分支2：如果解码过的NALU类型是VPS(video parameter set),还需要提取一些信息。

2.2 if((bNewPicture || !bitstreamFile || nalu.m_nalUnitType == NAL_UNIT_EOS)…)

      if (!loopFiltered[nalu.m_nuhLayerId] || bitstreamFile)
      {
     //满足以下至少一个条件：1）eof且还未进行环路滤波？；2）将要解码的NALU是图像中的第一个NALU；3）上一个NALU的类型是EOS
        m_cDecLib.executeLoopFilters();//调用解码器类进行环路滤波
        m_cDecLib.finishPicture(poc, pcListPic, INFO, m_newCLVS[nalu.m_nuhLayerId]);//一张图像解码完后的一些操作？
      }

      loopFiltered[nalu.m_nuhLayerId] = (nalu.m_nalUnitType == NAL_UNIT_EOS);//如果NALU的类型为EOS，则将loopFiltered设置为true
      if (nalu.m_nalUnitType == NAL_UNIT_EOS)
      {
     
        m_cDecLib.setFirstSliceInSequence(true, nalu.m_nuhLayerId);//如果NALU的类型为EOS，下一个NALU所在的slice将是sequence中的第一个slice
      }

	  //图像解码完成后有关于IRAP和GDR的操作
      m_cDecLib.updateAssociatedIRAP();
      m_cDecLib.updatePrevGDRInSameLayer();
      m_cDecLib.updatePrevIRAPAndGDRSubpic();

只要不是eof并且已经滤波那么执行以下操作

m_cDecLib.executeLoopFilters()：调用解码器类进行环路滤波
m_cDecLib.finishPicture():结束编码一帧并放入pcListPic中

如果上一个NALU的类型是EOS，那还需要将loopFiltered设置为true，并标记解码过程处于CLVS中的第一个slice

之后还有一些与IRAP和GDR相关的操作，没有跟进去看，具体啥作用也不知道。

2.3 if( pcListPic )

      if( !m_reconFileName.empty() && !m_cVideoIOYuvReconFile[nalu.m_nuhLayerId].isOpen() )//存在m_reconFileName，且m_cVideoIOYuvReconFile不能使用
      {
     //分支1
		// 使用pcListPic中的第一张图的BitDepths作为m_outputBitDepth
        const BitDepths &bitDepths=pcListPic->front()->cs->sps->getBitDepths(); 
        for( uint32_t channelType = 0; channelType < MAX_NUM_CHANNEL_TYPE; channelType++ )
        {
     
            if( m_outputBitDepth[channelType] == 0 )
            {
     
                m_outputBitDepth[channelType] = bitDepths.recon[channelType];
            }
        }
        
        std::string reconFileName = m_reconFileName;
        if( ( m_cDecLib.getVPS() != nullptr && ( m_cDecLib.getVPS()->getMaxLayers() == 1 || xIsNaluWithinTargetOutputLayerIdSet( &nalu ) ) ) || m_cDecLib.getVPS() == nullptr )
        {
     //要么不存在VPS，要么当VPS存在的时候满足以下条件之一：1）最大允许层等于1；2）上一个NALU的nuh_layer_id在m_targetOutputLayerIdSet中
          m_cVideoIOYuvReconFile[nalu.m_nuhLayerId].open( reconFileName, true, m_outputBitDepth, m_outputBitDepth, bitDepths.recon ); // 将文件流设置为write mode
        }
      }

      // write reconstruction to file
      if( bNewPicture )//如果要解码的NALU是图像中的第一个NALU，将重构图像写入文件
      {
     
        xWriteOutput( pcListPic, nalu.m_temporalId );
      }
      if (nalu.m_nalUnitType == NAL_UNIT_EOS)//如果上一个NALU类型是EOS，将重构图像写入文件，将m_bFirstSliceInPicture设置为false
      {
     
        xWriteOutput( pcListPic, nalu.m_temporalId );
        m_cDecLib.setFirstSliceInPicture (false);
      }
      // write reconstruction to file -- for additional bumping as defined in C.5.2.3
      if (!bNewPicture && ((nalu.m_nalUnitType >= NAL_UNIT_CODED_SLICE_TRAIL && nalu.m_nalUnitType <= NAL_UNIT_RESERVED_IRAP_VCL_12)
        || (nalu.m_nalUnitType >= NAL_UNIT_CODED_SLICE_IDR_W_RADL && nalu.m_nalUnitType <= NAL_UNIT_CODED_SLICE_GDR)))
      {
     
        xWriteOutput( pcListPic, nalu.m_temporalId );
      }

本节分支1：如果存在输出文件名，且输出文件流未打开。则取pcListPic中的第一张图的BitDepths作为以后输出的比特位数。然后打开相应的输出文件流

之后三个分支都与将重构图像写入文件有关，分别是当：

如果要解码的NALU是图像中的第一个NALU
上一个NALU类型是EOS
是C.5.2.3定义的情况

第二种情况还要标记解码过程未进入一帧中的第一个slice

3. 收尾

  xFlushOutput( pcListPic );//结束解码，清空pcListPic

  // get the number of checksum errors
  uint32_t nRet = m_cDecLib.getNumberOfChecksumErrorsDetected();

  // delete buffers
  m_cDecLib.deletePicBuffer();
  // destroy internal classes
  xDestroyDecLib();

  destroyROM();//清除存放在ROM的变量

xFlushOutput():清空之前的缓存帧

m_cDecLib.getNumberOfChecksumErrorsDetected()：统计checksum errors的数量，并将其返回

m_cDecLib.deletePicBuffer()：清除解码器类的picture buffer

xDestroyDecLib()：摧毁解码器类

destroyROM()：清除存放在ROM的变量

【代码学习】扩散模型原理+代码李加号pluuuus CV基础代码学习扩散模型机器学习算法学习
来源：超详细的扩散模型（DiffusionModels）原理+代码-知乎(zhihu.com)代码：drizzlezyk/DDPM-MindSpore(github.com)DDPM1.Unet1.1正弦位置编码classSinusoidalPosEmb(nn.Cell):def__init__(self,dim):super().__init__()half_dim=dim//2#将给定的维度除
在Carla上应用深度强化学习实现自动驾驶（一）寒霜似karry 自动驾驶人工智能机器学习
carla环境下基于强化学习的自动驾驶_哔哩哔哩_bilibili本篇文章是小编在pycharm上自己手敲代码学习自动驾驶的第一篇文章，主要讲述如何在Carla中控制我们自己生成的汽车并且使用rgb摄像头传感器获取图像数据。以下代码参考自：（如有侵权，请联系我将立即删除）使用Carla和Python的自动驾驶汽车第2部分——控制汽车并获取传感器数据-CSDN博客1、导入carla（其中的路径根据自
VTK着色器MarbleShader代码学习(4) 点PY 三维渲染着色器学习
代码链接https://examples.vtk.org/site/Cxx/Shaders/MarbleShader/这段代码是一个使用VTK（VisualizationToolkit）实现的复杂着色器渲染示例，主要用于在3D模型上模拟大理石纹理效果。下面是对代码的详细解析：1.核心功能程序实现了一个基于Perlin噪声的大理石纹理着色器，主要特点包括：动态静脉纹理生成多级噪声叠加几何扭曲效果参数
VSCode+Vue代码调试设置
这几天整了个Springboot+VUE的学生管理系统代码学习，自己也建了个项目边学习边开发，用VSCode调试VUE前端代码时，两个项目出现了不同情况的无法打断点的问题，现在这里记录一下解决办法。首先是买的这个代码，调试环境launch.json等就不说了，网上一大堆，主要问题是配置好调试环境后，打断点都显示未绑定到代码，后来查到是要添加源映射，都说要在index.js或者vue.config.
跟着论文代码学习编码第一天：main.py 程程不爱学习爱摸鱼 pytorch代码学习学习 pytorch
根据ESRT和LBNet的代码学习编码。首先看main.py。1.args模块B站小侯学府的args讲解需要三步，创建argparse.ArgumentParser解释器，添加add_argument参数，解析参数parse_args:#创建argparse.ArgumentParser解析器parser=argparse.ArgumentParser(description='LBNet')#添
【Python】科研代码学习：十三 Accelerate 溢流眼泪【科研代码】python 学习开发语言
【Python】科研代码学习：十三AccelerateAccelerate统一的加速接口修改训练代码(torch.nn)更简单的使用Accelerate【HF官网-Doc-Accelerate：API】HFAccelerate是一个库，能够让PyTorch代码添加几行代码之后，就能在分布式配置中运行（比如多Gpus卡）前言：建议Python3.8+pipinstallaccelerate统一的加速
从代码学习深度学习 - 情感分析及数据集 PyTorch版飞雪白鹿€ #自然语言处理深度学习 pytorch
文章目录前言1.认识数据集：aclImdb基本信息数据结构特点2.解压与读取数据2.1解压文件2.2读取评论与标签3.预处理数据集3.1词元化与构建词汇表3.2分析评论长度3.3截断与填充4.创建数据迭代器5.整合所有步骤总结前言欢迎来到“从代码学习深度学习”系列！今天，我们将深入探讨自然语言处理（NLP）中的一个核心任务：情感分析。随着互联网的普及，从产品评论、社交媒体到论坛讨论，我们每天都在产
从代码学习深度学习 - 预训练BERT PyTorch版飞雪白鹿€ #自然语言处理深度学习 pytorch
文章目录前言一、数据准备：为BERT量身打造“教科书”1.1数据处理工具函数(`utils_for_data.py`)1.2加载数据二、模型构建：从零搭建BERT2.1模型工具函数(`utils_for_model.py`)2.2初始化模型和设备三、训练过程：让BERT开始学习3.1训练辅助工具(`utils_for_train.py`&`utils_for_huitu.py`)3.2损失计算与训
从代码学习深度强化学习 - REINFORCE 算法 PyTorch版飞雪白鹿€ 深度强化学习 pytorch版 pytorch DRL
文章目录前言**一、理论基础：什么是策略梯度？****1.1基于价值vs.基于策略****1.2策略梯度（PolicyGradient）****1.3REINFORCE算法：蒙特卡洛策略梯度****1.4REINFORCE算法流程****二、PyTorch代码实践****2.1环境与辅助函数****2.2核心算法实现****2.3训练与结果****总结**前言欢迎来到“从代码学习深度强化学习”系列
从代码学习深度学习 - 词的相似性和类比任务 PyTorch版飞雪白鹿€ #自然语言处理深度学习 pytorch
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言加载预训练词向量TokenEmbedding类详解预训练词向量简介(GloVe)具体含义总结建议应用预训练词向量词相似度knn函数get_similar_tokens函数相似词查找示例词类比get_analogy函数词类比任务示例总结前言词向量（WordEmbeddings）是自然语言处理（NLP）中的基石之一。它们是将词
Diffusers代码学习：Stable Video Diffusion duhaining1976 AIGC
稳定视频扩散（SVD）是一种强大的图像到视频生成模型，可以根据输入图像生成2-4秒的高分辨率（576x1024）视频。有此模型的两个变体，SVD和SVD-XT。SVDCheckpoint被训练以生成14帧视频，并且SVD-XTCheckpoint点被进一步微调以生成25帧视频。下面将在本指南中使用SVD-XTCheckpoint。importosos.environ["HF_ENDPOINT"]=
从代码学习深度学习 - 预训练word2vec PyTorch版飞雪白鹿€ #自然语言处理深度学习 pytorch
文章目录前言辅助工具1.绘图工具(`utils_for_huitu.py`)2.数据处理工具(`utils_for_data.py`)3.训练辅助工具(`utils_for_train.py`)预训练Word2Vec-主流程1.环境设置与数据加载2.跳元模型(Skip-gramModel)2.1.嵌入层(EmbeddingLayer)2.2.定义前向传播3.训练3.1.二元交叉熵损失3.2.初始化
从代码学习深度学习 - 语义分割和数据集 PyTorch版飞雪白鹿€ #计算机视觉深度学习 pytorch
文章目录前言什么是语义分割？图像分割和实例分割PascalVOC2012语义分割数据集PascalVOC2012语义分割数据集介绍基本信息语义分割部分特点数据格式评价指标应用价值数据集获取使用提示辅助工具代码(`utils_for_huitu.py`)读取数据预处理数据自定义语义分割数据集类读取数据集整合所有组件总结前言大家好！欢迎来到“从代码学习深度学习”系列。今天，我们将深入探讨计算机视觉中一
H.266/VVC变换代码学习：xT函数涵小呆 VVC/H.266 H.266/VVC
H.266/VVC的变换代码中，xT函数是进行主变换的函数，主要是先进行水平和垂直变换核选择然后分别进行水平和垂直变换。基本流程如下：通过调用getTrTypes()函数获取垂直和水平变换核类型（默认为DCT-2）；根据垂直和水平变换核类型以及宽度和高度确定SkipWidth和SkipHeight（主要是用来进行高频调零操作：对于使用DCT2的大尺寸(64)变换块进行高频调零，只保留低频系数(32
从代码学习深度学习 - 目标检测前置知识(二) PyTorch版飞雪白鹿€ #计算机视觉深度学习 pytorch
文章目录前言一、多尺度目标检测1.1多尺度锚框1.2绘图工具函数(`utils_for_huitu.py`)1.3可视化多尺度锚框1.4多尺度检测（理论）二、自定义目标检测数据集2.1读取数据2.2创建Dataset类2.3创建DataLoader2.4验证数据加载2.5可视化数据集样本总结前言大家好！欢迎来到“从代码学习深度学习-目标检测前置知识”的第二部分，我们将继续深入探讨目标检测的前置知识
从代码学习深度学习 - 微调 PyTorch 版飞雪白鹿€ #计算机视觉深度学习 pytorch
文章目录前言一、迁移学习与微调概念二、微调步骤解析三、实战案例：热狗识别3.1数据集准备3.2图像增强处理3.3加载预训练模型3.4模型重构3.5差异化学习率训练3.6对比实验分析总结前言深度学习模型训练通常需要大量数据，但在实际应用中，我们往往难以获得足够的标记数据。例如，如果我们想构建一个识别不同类型椅子的系统，收集和标记数千甚至数万张椅子图像将耗费大量时间和资金。这种情况下，迁移学习特别是微
ardupilot罗盘校准代码分析魔城烟雨 ardupilot学习
目录文章目录目录摘要第一节：原理图学习第二节：飞控代码学习如何启动罗盘校准？1.通过地面站开启罗盘校准2.通过遥控器开启罗盘校准第三节：如何获取采样数据？第四节：如何进行罗盘校准？第五节：校准后的偏移量如何参与计算偏航第六节：如何提示校准数据到地面站1.发送校准进程2.发送校准结果摘要本节主要学习ardupilot如何实现罗盘校准，采用的飞控硬件是pixhawk_v5，软件代码版本3.6.8,欢迎
chinaUnix中的linux源代码学习 yazhouren 别人的技术路 linux linux内核代码分析安全相关文档 linker
原文地址：http://bbs.chinaunix.net/thread-1930079-1-1.html大家好：内核源码版对本版块的精华帖进行了分类汇总。所有的精华帖分为十大类。各个分类的精华帖相关信息分布在该贴2~11楼。每个分类各占1楼，均可从下面分类列表点击进入：1.内核学习方法，编译、调试等常见问题2.进程管理与进程间通信、模块间通信等3.内存管理及地址相关4.中断相关5.文件系统方面6
代码学习总结（三）空白II C++代码练习算法学习代码总结
代码学习总结（三）这个系列的博客是记录下自己学习代码的历程，有来自平台上的，有来自笔试题回忆的，主要基于C++语言，包括题目内容，代码实现，思路，并会注明题目难度，保证代码运行结果1判断并构造eleme型字符串简单eleme型字符串判断与构造小红有一个长度为n的字符串，字符串仅包含elm三种字符。如果一个字符串满足，不存在连续的ee、lm、ml、ll、mm子串则称这个字符串为eleme型字符串。小
241105_Pycharm切换jupyter环境（jupyter报缺失包） xiandong20 工具 pycharm jupyter python conda
241105_Pycharm切换jupyter环境（jupyter报缺失包）使用jupyternotebook进行代码学习往往是一种效率很高的方法，我们可以随时查看变量的内容。在使用conda管理虚拟环境时，往往我们在终端新建好虚拟环境并安装好所需要的包之后，在右下角把虚拟环境切换成所需的虚拟环境，jupyternotebook中仍然会报没有相关包的错误，原因是我们的内核没有成功切换问题复现急急国
从代码学习深度学习 - RNN PyTorch版飞雪白鹿€ 深度学习-pytorch版深度学习 pytorch
文章目录前言一、数据预处理二、辅助训练工具函数三、绘图工具函数四、模型定义五、模型训练与预测六、实例化模型并训练训练结果可视化总结前言循环神经网络（RNN）是深度学习中处理序列数据的重要模型，尤其在自然语言处理和时间序列分析中有着广泛应用。本篇博客将通过一个基于PyTorch的RNN实现，结合《TheTimeMachine》数据集，带你从零开始理解RNN的构建、训练和预测过程。我们将逐步剖析代码，
从代码学习深度学习 - NLP之文本预处理 PyTorch版飞雪白鹿€ 深度学习-pytorch版深度学习 pytorch
文章目录前言1.文本预处理理论知识1.1文本清洗与标准化1.2分词（Tokenization）1.3词频统计与词汇表构建1.4序列表示与批次生成1.5预处理的意义2.文本预处理的核心代码解析2.1读取数据集：`read_time_machine`2.2分词处理：`tokenize`2.3词频统计：`count_corpus`2.4构建词表：`Vocab`类2.5加载语料库：`load_corpus
从代码学习深度学习 - 残差网络（ResNet）PyTorch版飞雪白鹿€ 深度学习-pytorch版深度学习 pytorch
文章目录前言一、残差网络（ResNet）介绍1.1.背景与动机1.2.核心思想：残差学习残差块（ResidualBlock）1.3.ResNet的网络架构ResNet-18架构不同深度的ResNet瓶颈块（BottleneckBlock）1.4.优势与特点1.5.应用场景二、代码解析与实现2.1.数据加载2.2.模型定义2.3.训练工具函数2.4.可视化工具三、模型训练与结果分析3.1.训练模型3
从代码学习深度学习 - 含并行连结的网络（GoogLeNet）PyTorch版飞雪白鹿€ 深度学习-pytorch版深度学习 pytorch
文章目录前言一、GoogLeNet的理论基础1.1背景与创新点1.2.Inception模块的工作原理二、完整代码实现与解析2.1.环境准备与工具函数2.2.数据加载-Fashion-MNIST2.3.Inception模块设计2.4.GoogLeNet完整模型2.5.训练函数2.6.运行训练三、训练结果与分析3.1.性能分析3.2.可视化结果3.3.模型局限性四、扩展与改进建议总结前言深度学习近
从代码学习数值优化算法-McCormick包络方法python版飞雪白鹿€ 数学优化算法-python版算法 python
文章目录前言一、McCormick包络方法的理论基础1.1定义与目的1.2工作原理1.3核心步骤1.4应用与优势二、Python实现与示例2.1示例问题2.2代码示例三、结合分支定界法：从下界到全局最优解3.1为什么需要分支定界？3.2工作原理3.3Python实现与示例示例问题Python代码3.4两种方法的比较总结前言欢迎阅读本博客，我们将深入探讨McCormick包络方法，这是一种在数值优化
网盘代码学习计划孤独的程序员dis1500 新技术 c++
可以参考这个代码写一个这种软件electron做界面+libmysql.dll加nodeaddon模块
CTF 代码学习日记 PHP ianozo 学习 php java
基础2字符串连接可以使用点号（.）3.$_：在PHP中，以$_开头的变量（如$_GET、$_POST、$_COOKIE等）是超级全局变量。超级全局变量的特点是它们在PHP脚本的任何地方（包括函数内部、类内部等）都可以访问，不需要使用global关键字来声明其可访问性。这些变量主要用于获取来自不同数据源的用户输入或者服务器环境相关信息。例如：$_SERVER用途：包含了服务器和执行环境相关的信息。例
Android 提示 Cannot resolve symbol ‘AppCompatActivity‘ 问题解决，亲测可用流萤灯 android 项目 android studio android
今天从gihub上clone别人的代码学习，发现publicclassMainActivityextendsAppCompatActivityAppCompatActivity一直报错Cannotresolvesymbol'AppCompatActivity’就算已经import了对应的包，import语句也是灰的，不起作用importandroid.support.v7.app.AppCompa
【Python】科研代码学习：十七模型参数合并，safetensors / bin 溢流眼泪【科研代码】python 学习开发语言
【Python】科研代码学习：十七模型参数合并，safetensors/bin前言解决代码知识点：safetensors和bin的区别？知识点：save_pretrained还会新增的文件知识点：在保存模型参数时，大小发生了成倍的变化前言众所周知，LLM的模型参数一般保存在.safetensors或者.bin结尾的大文件但是通过一个RLHF的一个训练后，使用了FSDP分布式训练器所以把文件参数保存
视频编解码标准中的 Profile 和 Level 码流怪侠 AV1-libaom 视频编解码 Profile Level H264 HEVC H266 AV1
视频编解码标准中的Profile和Level在视频编码标准（如H.264/AVC、HEVC/H.265、H.266/VVC、AV1）中，Profile（配置文件）和Level（级别）是两个重要的概念，它们用于定义编码器和解码器支持的特性、功能以及视频质量与编码效率之间的权衡。Profile（配置文件）Profile是对编码器特性的一种抽象，定义了编码过程中使用的一组工具或特性。不同的Profile
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &