学数学的懒哥

计算机视觉（北邮鲁鹏）学习记录

基本题型：
题型：选择、填空、简答、分析
绝大多数内容参考自PPT

一、线性分类器

基本了解内容：每个过程都有些啥
图像表示：二进制图像、灰度图像、彩色图像。（将矩阵转为列向量）3072维
分类模型：
- 线性分类模型。是神经网络和支持向量机的基础。。
- 线性分类模型是一种线性映射，将输入的图像特征映射成类别分数。
- 决策规则：f_i(x)>f_j(x)，对任意的j!=i。
- 线性分类器的矩阵表示：
- 线性分类器的权值：可以看成模板、输入图像与评估模板的匹配程度越高，分类器输出的分数就越高。
- 线性分类器的决策边界：W控制着线的方向，b控制线的偏移，箭头方向表示分类器的正方向。沿着箭头方向距离决策面越远分数就越高
损失函数：是一个函数，用于度量给定的分类器的预测值和真实值的不一致程度，其输出通常是一个非负值。其输出的非负值可以作为反馈信号来对分类器参数进行调整，以降低当前示例对应的损失值，提升分类器的分类效果。
- 损失函数的一般定义：
- 多类支撑向量机损失：
- 正则项与超参数：R(w)是一个与权值有关，跟图像数据无关的函数。
优化算法：参数优化是机器学习的核心步骤之一，它利用损失函数的输出值作为反馈信号来调整分类器参数，以提升分类器对训练样本的预测性能。
- 基本优化目标：
- 优化方法：梯度下降算法、随机梯度下降算法及小批量梯度下降算法。
- 梯度下降算法：往负梯度方向走，走多远由步长决定。
- 梯度计算方法：
  - 数值法：计算量大，不精确。
  - 解析法：精确，速度快，导数函数推导易错。
  - 数值梯度作用：求梯度时一般使用解析梯度，而数值梯度主要用于解析梯度的正确性校验（梯度检查）。
- 梯度下降算法计算效率：利用所有样本计算损失并更新梯度，当N很大时，权值梯度计算量很大。
- 随机梯度下降算法：每次随机选择一个样本计算损失更新梯度，单个样本的训练可能会带来很多噪声，不是每次迭代都向着整体最优化方向。。
- 小批量随机梯度下降：
- 三种方法伪代码:
训练过程：
- 数据划分：
  - 训练集：寻找最优分类器。
  - 测试集：评测泛化能力。
  - 验证集：选择超参数。
- K折交叉验证：
- 数据预处理：
  - 1.去均值，归一化。
  - 去相关（协方差矩阵是对角矩阵），白化（协方差矩阵是单位矩阵）

二、全连接神经网络

了解每个过程有啥：
图像表示：展成列向量
分类模型：
- 全连接神经网络：全连接神经网络级联多个变换来实现输入到输出的映射。非线性操作是不可以去掉。去掉后相当于还是线性分类模型。
- 全连接神经网络的权值：
- 激活函数：
  - 为什么需要非线性操作？答：如果网络中缺少了激活函数，全连接神经网络将变成一个线性分类器。
  - 常见激活函数：
损失函数：
- Softmax函数（激活函数）：Softmax函数和交叉熵经常一起使用，它是一个具有任意实数值的K维向量压缩到范围在0~1之间的K维向量，使得向量中的每个元素表示对应的类别的概率。
- 交叉熵损失：衡量两个分布之间的差异性的损失函数。常用于分类问题。
- 计算图：
- 再看激活函数：
  - Sigmoid激活函数：
  - Tanh激活函数：
  - TeLU激活函数：
  - Leakly ReLU激活函数：
  - 梯度爆炸：
  - 激活函数选择：
- 梯度算法的改进：
  - 梯度算法存在的问题：
  - 动量法：
  - 自适应梯度法：
  - Adam优化器：
训练过程：
- 权值初始化：
  - 全零初始化：
  - 随机初始化：
  - Xavier初始化：（每层神经元激活值的方差基本相同！）不太适合ReLU激活函数
  - He初始化：
- 批归一化：直接对神经元的输出进行批归一化，如果每一层的每个神经元进行批归一化，就能解决前向传递过程中的信号消失问题。经常插入到全连接层后，非线性激活前。
  - 算法伪代码：
- 过拟合现象：
  - 出现过拟合，得到的模型在训练集上的准确率很高，但在真实的场景中识别率确很低。
- 神经网络中的超参数：

三、卷积与图像去噪

卷积：可以实现：图像的平移、平滑、锐化
平均卷积核与高斯卷积核：
图像噪声与中值滤波器：
- 噪声：
- 中值滤波器：
- 去噪：

边缘提取：
- 奇葩噪声：可以先平滑后再高斯一阶偏导。
- 高斯偏导一阶卷积核方差变化：
- Canny边缘检测器：
  - 非极大值抑制：
  - Canny边缘检测器：
卷积神经网络：
- 基于卷积核组的图像表示：
- 卷积网络中的卷积操作：特征响应图深度等于卷积核个数。

池化操作：（没有参数）
图像增强方法：图像翻转、随机缩放、色彩抖动、平移、旋转、拉伸。

四、经典网络解析

4.1 AlexNet

Alexnet主体贡献：
Alexnet网络结构：
- MaxPOOL作用：降低特征图尺寸，对抗轻微的目标偏移带来的影响。步长为2作用：重叠有助于对抗过拟合
- 局部响应归一化层作用（NORM）：
- FC6之前会进行拉平操作：变成9216*1的列向量。
- Alexnet运用的重要技巧：

4.2 ZFnet

Alexnet到ZFnet的改进：

4.3 VGG

VGG网络基本结构：
问题一：VGG用了多个小卷积核作用：
答：1.多个小尺寸卷积核串联可以得到与大尺寸卷积核相同的感受野；2.使用小卷积核串联构建的网络深度更深、非线性更强、参数也更少。
问题二：为什么VGG网络前四段里，每经过一次池化操作，卷积核个数就增加一倍？
答：1.池化操作可以减小特征图尺寸，降低显存占用。2.增加卷积核个数有助于学习更多的结构特征，但会增加网络参数数量以及内存消耗。3.一减一增的设计平衡了识别精度与存储、计算开销。4.最终提升了网络性能！
问题3：为什么卷积核个数增加到512后就不再增加了？
答：1.第一个全连接层含102M参数，占总参数个数的74%；2. 这一层的参数个数是特征图的尺寸与个数的乘积； 3. 参数过多容易过拟合，且不易被训练。

4.4 GoogLeNet

Googlenet网络结构：（网络的输入做了去均值处理，RGB三通道）
串联结构（如VGG）存在的问题：后面的卷积层只能处理前层输出的特征图;前层因某些原因（比如感受野限制）丢失重要信息，后层无法找回。
Inception模块：
网络的后面几层：
Googlenet的辅助分类输出层
平均池化向量化与直接展开向量化有什么区别？
Googlenet的1*1卷积会损失信息吗？（通常不会）

4.5 Resnet

一个思考：
残差模块：
其他关键点：
问题：为什么残差网络性能这么好？
总结：

五、图像分割&目标检测

视觉识别基本任务：
- 分类：目标：将图像分为不同的类别或标签。这涉及将图像映射到预定义的类别，例如识别图像中的动物种类或区分数字手写体的数字。
- 语义分割：目标：对图像中的每个像素进行分类，将其标记为属于特定类别。这意味着将图像分成多个区域，并为每个像素分配一个语义标签，从而理解图像中不同部分的内容。
- 实例分割：目标：与语义分割类似，但更进一步，它不仅对图像进行像素级别的分类，而且还能够区分同一类别中不同物体的个体实例。这意味着能够在图像中准确地识别并分割出不同的物体实例。
- 目标检测：目标：检测图像中存在的物体，并确定它们的位置和类别。通常采用边界框来框出每个物体，同时标识其所属的类别。
语义分割任务
- 基本思路：滑动窗口
- 存在的问题：效率太低！重叠区域的特征反复被计算。
- 解决方法：全卷积，让整个网络只包含卷积层，一次性输出所有像素的类别预测。
- 全卷积引起的新问题：处理过程一直保持原始分辨率，对显存的需求比较高。
- 解决方法：让整个网络只包含卷积层，并在网络中嵌入下采样与上采样的过程。
- 思考：下采用可以直接进行卷积或池化就可以，如何进行上采样？
  - 方法1：反池化
  - 反池化操作：近邻法、0填充、原始位置映射。
  - 方法2：反卷积(转置卷积)
  - 例子：
目标检测：
- 单目标检测：多任务损失两个损失（分类：交叉熵损失、回归：均方误差MSE）
- 框架图：
- 多目标检测：难点：多少个目标，要画多少个框？
- 困境：CNN需要对图像中所有可能的区域（不同位置、尺寸、长宽比）进行分类，计算量巨大。
- 生成区域狂方法：区域建议（Selective Search）:可以快速生成2000个候选区
- 方法1：R-CNN
  - 第一步：利用区域建议方法生成2000个感兴趣的区域
  - 第二步：对区域进行缩放（224*224）
  - 第三步：将图像区域送入卷积神经网络进行特征提取
  - 第四步：使用支持向量机对区域进行分类
  - 存在的问题：计算效率低，每一张图大于2000个区域需要卷积神经网络进行特征提取，重复区域反复计算。
- 方法2：Fast R-CNN
  - 第一步：利用卷积神经网络对全图提取特征。（可以使用：Alexnet、VGG、Resnet等等）
  - 第二步：利用区域建议方法产生2000个候选区域框。
  - 第三步：对前面产生的区域框进行裁剪核特征缩放。
  - 第四步：新特征图放入全连接层进行分类和回归。
  - 需要注意的点：
    - 候选区域是在原始图像上生成的。
    - 候选区域投影到特征图上不一定落到网格交点需要进行裁剪Pol Pool.
  - 区域裁剪：Rol Pool
    - 第一步：投影：将候选区域投影到特征图上。
    - 第二步：规整：将区域顶点规整到网格交点上。
    - 第三步：分割：将候选区域划分为固定大小的子区域。
    - 第四步：池化：对每个子区域进行池化操作（最大池化）
    - 第五步：尺寸统一：将所有子区域提取的特征进行尺寸统一。
    - 存在的问题：处理后的区域特征会有轻微的对不齐！也就是还是存在一定的精度偏差。
  - 区域裁剪：Rol Align（前面方法的改进版）：是一种改进的区域裁剪方法，旨在解决 RoI Pooling 存在的精度损失问题。在目标检测和区域分类任务中，RoI Pooling 的精度损失主要源于两个方面：像素级别的空间错位和信息损失。（不进行规则操作）
    - 改进点1：更精修的插值：RoI Align 使用双线性插值（bilinear interpolation）或类似的更精细插值方法来从特征图上的位置更准确地采样特征。这有助于减少像素级别的错位，提高区域的准确性。
    - 改进点2：子像素对齐：RoI Align 在计算每个输出位置的特征时，更精确地将输入 RoI 映射到特征图上的子像素级别，而不是使用简单的取整操作。这提供了更精确的位置对齐，减少了信息损失。
  - Fast R-CNN存在的问题：候选区域产生过程耗时过高，几乎等于单张图片的检测时间。
- 方法3：Faster R-CNN：
  - 基本框架图：
  - 第一步：特征提取：输入图像经过卷积神经网络进行特征提取。（可以使用VGG，Resnet等等）
  - 第二步：候选区域的生成：使用区域建议（Region Proposal Network）在特征图上生成候选区域。PRN利用特征图上的滑动窗口和锚框提出可能包含目标的候选区域。
  - 第三步：区域裁剪与特征对齐：对每个候选框，使用Rol Align或Rol Pooling从特征图上提取固定大小的特征。
  - 第四步：分类和回归：对提取的特征进行分类和边界框回归。
  - 区域建议（Region Proposal Network）是用于目标检测的神经网络组件，通常与 Faster R-CNN 结构一起使用。它的主要功能是在输入图像的特征图上生成可能包含目标的候选区域。基本框架：
    - 基本原理步骤如下：
      - 滑动窗口与锚框：RPN在最后的feature map上每个位置生成多个候选区域。如上图即15*20=300区域，每个区域生成k个锚框（anchor boxes）一共300k个。
      - 特征提取：RPN使用卷积神经网络（通常是与整个目标检测网络共享的卷积部分）从输入图像中提取特征。
      - 分类和回归：对于每个窗口位置上的每个锚框，RPN同时进行二分类（目标/非目标）和边界框回归（用于调整锚框以更好地匹配目标边界）
      - 生成最终候选区域：根据网络输出的分类分数和边界框回归的效果，通过非极大值抑制等方法筛选和合并候选区域，按得分高低进行综合排序，选取前300个最终候选区域。
  - Faster R-CNN最终框架：
  - 两阶段图示：
  - 新问题：是否必须采用两个阶段范式完成目标检测？
- 方法4：一阶段目标检测：YOLO/SSD/RetinaNet:
  - 经验性结论：Faster R-CNN速度偏慢，精度高；SSD速度快，但精度有所欠缺。主干网络越宽、深度越深，对性能的帮助就越大。
  - 基础框架：两阶段：Faster R-CNN；一阶段：YOLO/SSD；混合：R-CNN
实例分割：
- 经典网络：Mask R-CNN：
- Faster R-CNN的终极形态：Mask R-CNN （应该不考这个）
  - 改进：在Faster R-CNN的基础上加了一个用于实例分割的新分支。就是上图中的mask network掩码网络。
- 基本步骤：
  - 第一步：生成建议区域：像 Faster R-CNN 一样，使用区域提议网络（RPN）生成候选目标区域。然后，这些建议区域被送入卷积网络。
  - 第二步：RolAlign：引入 RoIAlign 操作来对特征图进行精准的裁剪和对齐，保留每个区域内部的空间信息。
  - 第三步：Mask Head（掩码头部）：RoIAlign 的输出被送入掩码头部，产生与提议区域大小相匹配的像素级别的二值掩码，这些掩码指示了目标的精确边界。
  - 第四步：生成掩码：掩码头部的输出是一个分割掩码图，它与提议区域的大小相匹配。这些掩码通常是二进制的，每个像素点表示是否属于对象的一部分。在一些模型中，也可以输出多类别的分割掩码，每个类别一个掩码。

六、生成模型

有监督模型与无监督模型对比：
- 有监督模型：
  - 训练数据有标签，目标：学习X->Y
  - 例子：分类、回归、目标检测、语义分割、实例分割等等。算法：SVM，K近邻，决策树等
- 无监督模型：
  - 数据没有标签（数据获取成本低），目标：找出隐含在数据里的模式或结构。
  - 例子：聚类，降维、特征学习、密度估计等，算法k-means，PCA等
生成模型：给定训练集，产生与训练集同分布的新样本。
三种典型的生成模型：
- PixelRNN and PixelCNN 像素级循环神经网络、像素级卷积神经网络
- Variational Autoencoders(VAE) 变分自编码器
- Generative Adversarial Networks(GAN) 生成对抗网络
PixelRNN与PixelCNN
- 基本思路：
- PixelRNN：
- PixelCNN：
- 优缺点：
  - 优点：似然函数可以精确计算，利用似然函数的值可以有效地评估模型的性能。
  - 缺点：序列产生非常慢
Variational Autoencoders(VAE)变分自编码器
- 自编码器：无监督的特征学习，其目标是利用无标签数据找到一个有效地低维的特征提取器。
  - 自编码器的学习：自编码器利用重构损失来训练低维的特征表示。
  - 编码器部分：可以使用一般的卷积神经网络（VGG、Resnet）特征降维的过程。
  - 解码器部分：
    - 早期方法：（Linear + 非线性激活函数）通常由全连接层构成，每个全连接层后接非线性激活函数（如 sigmoid、tanh 等）
    - 卷积神经网络流行之前：可能采用多层全连接神经网络，也称为深度全连接网络。
    - 卷积神经网络流行后：使用卷积层和激活函数（如 ReLU）的卷积神经网络结构。
    - 更高级的结构和技术：转置卷积、自注意力机制、跳跃连接等等。
  - 训练好后：移除解码器，已训练完毕的编码器可以作为有监督学习的初始特征特征提取模型。然后利用少量有标签数据，在编码器上训练根据误差损失值对编码器的参数进行微调，训练最终网络。
  - 缺陷：传统自编码器学习到的潜在表示空间通常是离散和无结构的，假设给两张图片，分别是全月和残月。自编码器无法啊生成中间的半圆月。
- VAE变分自编码器：
  - 相较于自编码器的改进：VAE引入了潜在的空间连续性，这使得其在潜在空间中进行插值和采样变得可能，允许通过线性或非线性插值在空间中生成新的，具有连续变化的样本。即前面说的半圆月。
  - 基本框架图：
  - 基本原理
    - 基本结构和自编码器类似。编码器将输入数据映射到潜在空间中的潜在变量（latent variable）或潜在表示。解码器则将潜在变量映射回原始数据空间，重构输入数据。
    - 引入了潜在空间的分布假设：VAE假设潜在变量服从某种先验分布（通常是高斯分布），例如均值为0，方差为1的标准正态分布。编码器不直接输出潜在变量的值，而是输出这些分布的参数。通常是输出潜在变量的均值和方差（或者对数方差）。
    - 损失函数和潜在变量采样：VAE的训练过程涉及，即最大化数据的对数似然，同时最小化潜在变量的 KL 散度（Kullback-Leibler divergence）。KL 散度衡量了编码器输出的潜在分布与先验分布之间的差异，帮助模型学习合理的潜在表示。在训练中，通过对编码器输出的分布进行采样（通常是从正态分布中采样），得到潜在变量的实际值，然后将这些值输入到解码器进行数据的重构。
    - 潜在空间的连续性和采样性质：由于VAE中的潜在变量是从分布中采样得到的，因此潜在空间具有连续性和采样性质，使得在潜在空间中进行插值和采样能够生成新的样本。
  - 问题：如果只有重构误差会如何？答：如果只考虑自编码器的重构误差而不考虑潜在空间的连续性和分布性质，会导致模型可能仅仅学习到对训练数据进行简单的复制，而没有学习到有意义的潜在表示。
  - 变分自编码器存在的问题：没有真的在尝试模仿真实的图片，貌似记住的存在的图片。
  - 变分自编码器（VAE）总结：
  - 总结一句话：不如GANs
- Generative Adversarial Networks(GAN)生成对抗网络：
  - 问题：希望从训练样本分布中采样新数据，但这个分布不仅维度高而且还很复杂，难以直接实现。
  - 解决方案: 对一个简单的分布采样，比如均匀分布；然后，学习一种映射将其变换到训练样本分布
  - 用什么方法实现这个复杂的映射：神经网络！
  - 输入：随机噪声；输出：采样自训练样本分布的图片。
  - 基本形式：
  - 两个玩家的游戏：生成器和对抗器
  - Minmax训练方式解释：
    - 先训练判别器ʘd，最大化目标函数，使D(x)接近1（真实样本），而D(G(z))接近于0（假2样本）。旨在最大化判别器对真实样本和生成样本的辨别能力
    - 再训练生成器ʘg，最小化目标函数，使得D(G(z))尽量接近1，即希望判别器认为生成器产生的图像G(z)为真实图片。
    - 训练结束：如果生成的图片已经足够逼真和多样可以停止，判别器精度达到某个阈值，损失值收敛等等。
    - Minmax训练方式的弊端：生成样本非常糟糕时，判别器输出值都会很小，生成器损失函数梯度很小，使得生成器学习很慢，相反，当生成样本比较好时，判别器输出值都会比较大，生成器损失函数在此处的梯度很大，生成器更新较大。
    - 解决方法：将生成器训练目标函数转化为最大化情况，上面的情况就可以对调过来，即：生成样本很糟糕时，生成器损失梯度高，加快生成器学习，当样本比较好时，生成器梯度低，生成器更新较小，逐渐收敛。如下图：
    - 总结：

七、Gan网络

卷积生成对抗网络DCGAN：
- 基本结构：
GAN优化问题：
- 分布不重叠时JS散度固定值log2会导致GAN训练出现下面问题：
  - 训练困难： 当生成器（Generator）产生的分布和真实数据分布没有重叠时，JS散度为常数 log⁡2。这可能会导致梯度消失或梯度爆炸，使得模型难以学习和收敛。
  - 缺乏梯度信号： JS散度的常数值意味着梯度信息受限。在这种情况下，生成器很难根据梯度信号进行调整，导致训练不稳定。
  - 模式崩溃（Mode Collapse）： 当生成器无法从梯度中获得有用的信息时，可能导致模式崩溃的情况，即生成器只生成少量或单一类型的样本，而不是多样化的结果。
- D判别器过于强大：
- JS散度问题解决方法：
- 基于Wasserstein的GAN即使两个分布没有重合（这事经常发生），也能准确的衡量分布的差异。
- 条件GAN：

你可能感兴趣的:(期末学习分享,计算机视觉,学习,人工智能)

分库分表之实战-sharding-JDBC绑定表配置实战
大家好，我是工藤学编程一个正在努力学习的小博主，期待你的关注实战代码系列最新文章C++实现图书管理系统（QtC++GUI界面版）SpringBoot实战系列【SpringBoot实战系列】Sharding-Jdbc实现分库分表到分布式ID生成器Snowflake自定义wrokId实战环境搭建大集合环境搭建大集合(持续更新）分库分表分库分表之实战-sharding-JDBC水平分库+水平分表配置实战
机器学习-K近邻算法 shy_snow python 机器学习机器学习近邻算法人工智能
k-近邻分类算法，即物以类聚的思想，通过已知分类中的点和未知分类的点距离最近的前k个点的分类来预测未知点的分类。kNN.pyfromnumpyimport*importoperatordefcreateDataSet():group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])labels=['A','A','B','B']returngroup,label
使用Python调用C++：简单易学的方法程序员杨弋 Python全栈工程师学习指南 python c++开发语言
Python是一种易于学习和理解的编程语言，而C++是强大的编程语言。Python代码可以在很短的时间内编写出来，但如果涉及到大量的计算或需要高性能，则需要使用更快、更高效的编程语言。在这种情况下，Python调用C++是一种常见的方法，因为它可以提供C++的高速性能和Python的便捷性。在本文中，我们将介绍如何使用Python调用C++。首先，需要创建C++函数库（DLL），并确保该库包含需要
从数据到智慧：AI原生知识库构建的完整技术栈解析 AI天才研究院 Agentic AI 实战 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 大数据 ai
从数据到智慧：AI原生知识库构建的完整技术栈解析关键词AI原生知识库、知识图谱、向量数据库、大语言模型、RAG技术、知识工程、智能问答系统摘要在人工智能飞速发展的今天，构建能够真正理解、组织和应用知识的系统已成为企业数字化转型的核心竞争力。本文将深入剖析AI原生知识库的完整技术栈，从数据采集与预处理，到知识表示与建模，再到存储架构与检索增强生成技术，全方位解读如何将原始数据转化为可行动的智慧。我们
【人工智能】大比拼：文心一言 VS ChatGPT —— 禅与计算机程序设计艺术亲自测评 AI天才研究院 ChatGPT 人工智能文心一言 chatgpt
收到了百度“文心一言”的内测邀请，现在给大家亲身体验测评一下！禅与计算机程序设计艺术先说结论：文心一言表现基本符合预期。与ChatGPT有一定差距，应该在几个月左右。但是禅与计算机程序设计艺术，挺期待ChatGLM-130B版本的效果的。因为，ChatGLM-6B在本地测评的效果，还是非常不错的！目录文心一言写一篇论文介绍一下你自己，从技术原理、应用场景、未来发展、当前不足等方面，不少于3000字
Python vars() 函数：探索对象的内部程序员喵哥 Python python 开发语言
更多Python学习内容：ipengtao.comPython是一门具有强大而灵活的编程语言，可以访问和探索对象的内部属性。vars()函数是Python标准库中的一个强大工具，它可以获取对象的属性和属性值，并以字典的形式返回它们。在本文中，将深入研究vars()函数，探讨它的用途、示例和适用场景。前言在Python中，对象是一切。对象可以是数字、字符串、列表、字典、函数、类实例等等。每个对象都可
AI技术正在深度重构全球产业格局，其影响已超越工具属性，演变为推动行业变革的核心引擎。
一、AI如何重塑AI的工作与行业（AI助手领域）能力升级理解与生成：基于LLM（大语言模型），AI能处理开放式问题、撰写报告、翻译代码，替代部分人类知识工作。个性化交互：通过用户历史对话分析，提供定制化建议（如学习计划、投资策略）。多模态扩展：结合图像/语音识别（如GPT-4V），实现图文分析、医学影像解读等跨模态任务。行业变革客服行业：AI客服处理70%+常规咨询（如阿里小蜜），人力转向复杂问题
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
如何在 Linux 上使用 cURL 下载文件？| cURL 命令详解 vvw& 开源项目推荐 Linux 技术文章 linux 运维服务器 ubuntu 开源 curl wget
简介如果你正在寻找快速答案，那么curl-O命令可让你使用curl命令行实用程序下载文件。当然，关于使用curl下载文件，除了-O参数之外，还有很多东西需要学习。我们将展示如何使用curl在Linux上下载文件，并提供多个curl下载命令的示例，你可以使用这些命令来满足不同的要求。如果你不熟悉curl，我们建议你通读本文。如果你熟悉curl但只需要快速回顾一下，请随意跳转到特定部分。什么是curl
【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
MySQL窗口函数学习小菜0-o mysql 学习 java
视频链接基本语法窗口限定一个范围，它可以理解为满足某些条件的记录集合，窗口函数也就是在窗口范围内执行的函数。基本语法窗口函数有over关键字，指定函数执行的范围，可分为三部分:分组子句(partitionby)，排序子句(orderby)，窗口子句(rows)over(partitionbyorderbyrowsbetweenand)窗口函数适用于在不破坏原有表结构的基础上，新增一列窗口的确定分组
大模型——什么是 Vibe Coding？从零开始学习 AI 辅助编程不二人生大模型学习人工智能大模型辅助编程
大模型——什么是VibeCoding？从零开始学习AI辅助编程VibeCoding：代码消失，直觉驱动的软件开发新浪潮？生成式人工智能的指数级增长正不断重塑各个行业，软件开发领域也不例外。大约在2025年初，一股源自美国硅谷的新思潮开始引起关注：开发者似乎可以借助AI工具，在几乎不直接编写代码的情况下构建产品。这种依赖直觉、跳脱传统编码苦役的开发方式，被赋予了一个颇具时代感的名字——VibeCod
【无标题】Python ---Day2 复合类型之序列类型、映射类型和集合类型的学习！！！
系列文章目录文章目录系列文章目录前言一、复合类型初识1.1列表类型1.1.1列表创建1.1.2列表运算1.1.3列表访问1.1.3.1索引1.1.3.2反向索引1.1.3.3切片1.1.4列表操作1.1.4.1添加数据1.1.4.2修改数据1.1.4.3删除数据1.2元组类型1.2.1元组创建1.2.2元组操作1.2.2.2查看元组1.2.2.3解包技能1.2.3元组运算1.2.4元组不可变二、映
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
KTO（Kahneman-Tversky Optimization）技术详解与工程实现 DK_Allen 大模型深度学习 pytorch 人工智能 KTO
KTO（Kahneman-TverskyOptimization）技术详解与工程实现一、KTO核心思想KTO是基于行为经济学前景理论（ProspectTheory）的偏好优化方法，突破传统偏好学习需要成对数据的限制，仅需单样本绝对标注（好/坏）即可优化模型。其创新性在于：损失函数设计：将人类对"收益"和"损失"的非对称心理反应量化数据效率：无需构建偏好对（y_w>y_l），直接利用松散标注二、KT
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
大型语言模型中的提示工程系统综述：技术与应用 AI专题精讲 Paper阅读语言模型人工智能自然语言处理
摘要提示工程已成为扩展大型语言模型（LLMs）和视觉语言模型（VLMs）能力的不可或缺的技术。这种方法利用任务特定的指令（称为prompt），在不修改核心模型参数的情况下增强模型效能。与更新模型参数不同，prompt仅通过给定指令即可引出所需的模型行为，从而实现预训练模型在下游任务中的无缝集成。prompt可以是提供上下文以引导模型的自然语言指令，也可以是激活相关知识的学习向量表示。这一新兴领域已
[C语言初阶]指针初阶
目录一、指针是什么？二、指针与指针类型三、野指针及其避免方法3.1什么是野指针？3.2野指针产生的原因：3.3如何避免野指针？四、指针运算4.1应用：实现strlen函数五、指针与数组六、二级指针七、指针数组指针是C语言的灵魂所在，也是许多初学者感到困惑的概念。本文将带你系统学习指针的基础知识，从指针的本质到指针运算，再到指针与数组的关系，最后介绍二级指针和指针数组的概念。通过本文的学习，你将建立
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
蓝牙协议栈低功耗之安全管理协议层(SMP) 写代码的无赖的猴子 BLE低功耗蓝牙协议栈网络信息与通信物联网
逻辑链路控制和适配协议层L2CAPSMP层阶段一阶段二Legacyparing安全连接交换公匙鉴权阶段1鉴权阶段2阶段三LElegacypairing：LESecureConnections交叉密匙特性配对PDU类型Hello，我是无赖的猴子，一个蓝牙爱好者，分享蓝牙相关的知识，关注我，学习蓝牙：蓝牙文章链接直达：1.profile层（待更新）2.属性协议层(ATT)（待更新）3.安全管理协议层(
在实训云平台上配置云主机酒城译痴无心剑 Spark基础学习笔记（2）实训云云主机远程连接
文章目录零、学习目标一、实训云升级二、实训云登录（一）登录实训云（二）切换界面语言（三）规划云主机实例三、创建网络三、创建路由器四、连接子网五、创建虚拟网卡六、管理安全组规则七、创建云主机（一）云主机规划（二）创建ied云主机（三）创建其它云主机八、本机利用FinalShell连接虚拟机（一）连接ied云主机（二）连接其它云主机九、配置云主机（一）配置ied云主机1、查看IP地址2、配置主机名3、
企业内网系统：从传统开发到智能赋能的进化之路飞算JavaAI开发助手科技人工智能大数据 java
在当今数字化浪潮中，企业内网系统作为支撑日常运营的核心基础设施，其开发效率与质量直接关系到企业的竞争力。传统开发模式下，程序员需要手动完成需求分析、架构设计、代码编写、测试调试等全流程工作，不仅耗时费力，还容易因人为疏忽导致质量隐患。而随着人工智能技术的突破性进展，以飞算JavaAI为代表的智能开发工具正在重塑企业内网系统的开发范式，为程序员提供从设计到落地的全链路智能支持。一、传统企业内网系统开
Java基础学习笔记2 qichi333 学习笔记 java eclipse
今天是Java基础学习第二天，加油！！！下面是我今天记的一些笔记。（有点懒惰了，爬虫今天没学，因为赖床了(bushi)，但我会勤奋起来的^_^，一定一定！明天不能偷懒了天！！）一、运算符例子：inta=10;intb=20;intc=a+b;其中，“+”是运算符，且是算术运算符；“a+b”是表达式，且是算术表达式。1.算术运算符例1：publicclassdemo3{publicstaticvoi
西门子PLC 1500联合Factory io进行液位控制PID仿真
西门子PLC1500联合Factoryio进行液位控制PID仿真项目调试视频地址：点击查看考虑到大家都是学习用到的，我把仿真的所有资源还是打包上传到了网盘，链接放到了文章的最后，大家自行下载吧！希望我的作品能起到抛砖引玉的效果，期待大家更好的作品！内容总览1.项目构思2.电气图纸设计3.仿真环境硬件组态（FactoryIo）4.PLC程序组态(TIAV15.1)5.触摸屏程序组态(TP1200)6
学习threejs，使用自定义GLSL 着色器，生成漂流的3D能量球 gis分享者 gis工程师 threejs threejs GLSL ShaderMaterial 3D 能量球着色器
‍⚕️主页：gis分享者‍⚕️感谢各位大佬点赞收藏⭐留言加关注✅!‍⚕️收录于专栏：threejsgis工程师文章目录一、前言1.1☘️GLSL着色器1.1.1☘️着色器类型1.1.2☘️工作原理1.1.3☘️核心特点1.1.4☘️应用场景1.1.5☘️实战示例二、使用自定义GLSL着色器，生成漂流的3D能量球1.☘️实现思路2.☘️代码样例一、前言本文详细介绍如何基于threejs在三维场景中自
最近AI领域大火的MCP到底是什么？
文章目录AI领域的MCP（ModelContextProtocol）入门详解1.MCP是什么？2.为什么需要MCP？3.MCP的架构与运作方式4.MCP的核心优势5.实际应用场景6.MCP与相关技术的区别7.MCP开发实战：如何编写一个MCPServer？核心步骤小白也能用的工具8.MCP与区块链的深度融合为什么需要区块链？具体结合方式9.MCP的潜在挑战技术难点现实问题10.未来展望与学习路径M
颠覆人机交互！多模态 AI Agents 大模型如何用 5 大模式开启智能新时代？
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】GPT多模态大模型与AIAgent智能体书籍本章配套视频课程【陈敬雷】文章目录GPT多模态大模型与AIAgent智能体系列七颠覆人机交互！多模态AIAgents大模型如何用5大模式开启智能新时代？一、从“单一感知”到“多模态融合”：A
python进程线程协程区别_Python：线程、进程与协程(1)——概念 weixin_39989159 python进程线程协程区别
最近的业余时间主要放在了学习Python线程、进程和协程里，第一次用python的多线程和多进程是在两个月前，当时只是简单的看了几篇博文然后就跟着用，没有仔细去研究，第一次用的感觉它们其实挺简单的，最近这段时间通过看书，看Python中文官方文档等等相关资料，发现并没有想想中的那么简单，很多知识点需要仔细去理解，Python线程、进程和协程应该是Python的高级用法。Python的高级用法有很多
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多