Cedric.

OpenCV中的图像金字塔(高斯金字塔、拉普拉斯金字塔)

最近在看关于数字图像的知识点，目前在图像金字塔部分，实在是懒得用手作笔记了，就以其中比较出名的“高斯金字塔”和“拉普拉斯金字塔”为例，基于OpenCV的源代码作解析存个档；毕竟属于基础部分，以后有需要就当接口调用吧；有写的不对需要改正的地方，还请大家指出，谢谢。

一、金字塔

1.何为图像金字塔？

图像金字塔是图像中多尺度表达形式的之一，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构。图像金字塔最初用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状从低(下)到高(上)排列的，分辨率逐步降低的图像集合。

具体以下示例图和流程图：

图像金字塔分层模板金字塔流程图

2.何为高斯金字塔？

高斯金字塔顾名思义，基于模板金字塔的构建的方式引入指定的低通高斯滤波（空间域）并结合下采样的迭代方式进行层次之间的计算；（高斯金字塔底部是第0级）

而拉普拉斯金字塔恰好与高斯金字塔相反，拉普拉斯金字塔依赖于高斯金字塔构建的图层；当高斯金字塔形成之时，我们需要对高斯金字塔的每一层进行上采样，形成该图层对应的近似预测图像，求去它们之间的差值，得到就是拉普拉斯金字塔该层次的图像；也就是说，高斯金字塔由下至上构建，而拉普拉斯金字塔又上至下构建（高斯金塔要比拉普拉斯金字塔多构建一次，用于顶层差值求取）；得到的拉普拉斯金字塔起到预测残差的作用。

具体以下示例图和流程图：

高斯金字塔高斯金字塔和拉普拉斯金字塔流程图

二、金字塔构建流程

1. 高斯金字塔的构建

将原始图像与低通高斯滤波矩阵做卷积处理

利用基数为2的下采样（删除偶数行和偶数列）得到维数减半的上一级图像

1.1 低通高斯滤波

"滤波"一词借用于频率域处理，"滤波"是指接受（通过）或拒绝一定的频率的成分。低频的滤波器成为低通滤波器，其最终的效果是模糊（平滑）一幅图像。

数值图像处理中，低通高斯滤波可以以不同的形式作用于空间域（线性）和频率域。第一种是属于空间滤波器（也被称为高斯模板、高斯核、高斯掩模、高斯窗口），第二种方法是通过傅里叶变换后进行操作。本文涉及到的是第一种平滑空间滤波器。

常用的平滑线性空间滤波器有均值滤波以及高斯滤波等。均值滤波使用模板内所有像素的平均值代替模板中心像素灰度值，这种方法易收到噪声的干扰，不能完全消除噪声，只能相对减弱噪声，且存在着不希望有的边缘模糊负面效应；为了减少平滑处理中的模糊效应，得到更加自然的平滑效果，需要适当加大模板中心点的权重；随着距离中心点的距离来增减控制权重占比大小，基于这样的考虑形成的模板即为高斯模板。

常用的高斯模板核通常是3×3，5×5的奇数矩阵，根据OpenCV提供的代码为例，采用5×5的模板如下（令右侧矩阵为M，左侧为归一化系数 $1/\sum M(i,j)$ ）：

该高斯模板核矩阵中的参数是通过二维高斯函数，即二维正态分布密度函数求得的，回忆一下（由一维延伸到二维），具体如下。

一维高斯函数，形式如下：

一维高斯函数

二维高斯函数，形式如下：

二维高斯函数（均值u=0）

1.2 高斯模板的实现

高斯模板正是将连续的二维高斯函数的离散化表示，因此任意大小的高斯模板都可以通过建立一个的矩阵M(m×n)，得到其位置的参数可如下确定：

$M(i,j)=\frac{1}{2\pi \sigma ^{2}}\exp (-\frac{(i-k-1)^{2}+(j-k-1)^{2}}{2\sigma ^{2}})$

此公式基于Matlab的实现，因此i和j的起始为1非0（数组索引必须为正整数或逻辑值）；基于VS的实现，i和j的起始为0（不要带入-1的参数）；k为每个方向距离该方向中心的距离，即 $k=\frac{m-1}{2}=\frac{n-1}{2}$ 。

获取OpenCV中smooth.dispatch.cpp的getGaussianKernel函数的源码：

Mat getGaussianKernel(int n, double sigma, int ktype)
{
    CV_Assert(n > 0);
    const int SMALL_GAUSSIAN_SIZE = 7;
    static const float small_gaussian_tab[][SMALL_GAUSSIAN_SIZE] =
    {
        {1.f},                                                                     //1×1
        {0.25f, 0.5f, 0.25f},                                                      //3×3
        {0.0625f, 0.25f, 0.375f, 0.25f, 0.0625f},                                  //5×5
        {0.03125f, 0.109375f, 0.21875f, 0.28125f, 0.21875f, 0.109375f, 0.03125f}   //7×7
    };

    const float* fixed_kernel = n % 2 == 1 && n <= SMALL_GAUSSIAN_SIZE && sigma <= 0 ?
        small_gaussian_tab[n>>1] : 0;

    CV_Assert( ktype == CV_32F || ktype == CV_64F );
    Mat kernel(n, 1, ktype);
    float* cf = kernel.ptr();
    double* cd = kernel.ptr();

    double sigmaX = sigma > 0 ? sigma : ((n-1)*0.5 - 1)*0.3 + 0.8;
    double scale2X = -0.5/(sigmaX*sigmaX);
    double sum = 0;

    int i;
    for( i = 0; i < n; i++ )
    {
        double x = i - (n-1)*0.5;
        double t = fixed_kernel ? (double)fixed_kernel[i] : std::exp(scale2X*x*x);
        if( ktype == CV_32F )
        {
            cf[i] = (float)t;
            sum += cf[i];
        }
        else
        {
            cd[i] = t;
            sum += cd[i];
        }
    }

    CV_DbgAssert(fabs(sum) > 0);
    sum = 1./sum;
    for( i = 0; i < n; i++ )                            //归一化
    {
        if( ktype == CV_32F )
            cf[i] = (float)(cf[i]*sum);
        else
            cd[i] *= sum;
    }

    return kernel;
}

代码实现矩阵：

#include
#include

using namespace cv;
using namespace std;

int main()
{
	Mat g, g1, g2;
	g= getGaussianKernel(5, 0, CV_32F);    //size,sigma,type
	g1 = g * g.t();                        //g * g的转置得到二维高斯卷积核
	cout << g1 << endl;
	g2 = g * g.t() * 256;                  //归一化右侧整数矩阵
	cout << g2 << endl;
	cin.get();
	return 0;
}

计算出来的高斯模板参数为：

高斯模板矩阵和矩阵M

当第二个参数sigma的取值为0时，getGaussianKernel函数中已经指定了1，3，5，7这四个模板的参数，为的是调用常用模板取固定整型参数，去除小数点也方便运算；

当第二个参数sigma的取值不为0时，getGaussianKernel函数将按照指定sigma值代入下两行代码运算：

double x = i - (n-1)*0.5;          //相当于式中 i-k=i-(n-1)/2
double t = fixed_kernel ? (double)fixed_kernel[i] : std::exp(scale2X*x*x);

上两行代码对应了上述二维高斯函数（不带参数-1）的实现，其中滤去了系数 $1/2 \pi \sigma ^{2}$ ，是因为在下面代码作归一化处理时，可以消除该权重，因此可以省去加快计算速度。

获取Matlab中的fspecial函数：

 filter=fspecial('gaussian',5,0.5);    //mood,size,sigma

取sigma=0.5

*关于标准差 $\sigma$ (sigma)的取值和归一化处理做个两个注释：

1. 标准差 $\sigma$ (sigma)

当标准差 $\sigma$ 取不同的值时，二维高斯函数的形状会有很大的变化：如果标准差 $\sigma$ 选择过小，偏离中心的所有像素的权重将会非常小，相当于加权和影响基本不考虑邻域像素的作用，这样滤波操作退化为图像的点运算，无法起到平滑噪声的作用；相反如果标准差 $\sigma$ 选择过大，而邻域相对较小，这样在邻域内高斯模板将会退化为平均模板；因此在实际应用中选择合适的标准差 $\sigma$ 非常重要。

取sigma=0.5 取sigma=5

2.归一化

不难看出，在矩阵核的左边存在一个系数，它是归一化的象征 $1/\sum M(i,j)$ ;归一化的目的：对灰度级为常数的图像区域，高斯模板的响应和必须为1。若小于1，像素值发生偏移，产生了误差，邻域像素之间的差值将减小；若大于1，存在超过像素上限（255）的可能，形成局部亮度。因此要对初始形成的模板进项归一化处理，且也存在提高整体像素精度的作用。

2.1 图像卷积

我们依然采用延伸的思维从一维过渡到二维图像卷积，先来看下连续信号的卷积：

1.连续信号的卷积

对于任意波形的信号都可以分割成许多相邻的矩阵脉冲， $\Delta$ 代表了脉冲的宽度，对于 $t=n\Delta$ 时刻的矩形脉冲，其高度即的值为 $x(n\Delta )$ 。

用窄脉冲之和近似表示任意信号门函数以及高度（强度）为1的门函数

无穷多个矩形脉冲的叠加可用来近似原信号，即

$x(t)\approx \sum_{n=-\infty }^{\infty }x(n\Delta )g_{\Delta }(t-n\Delta )\Delta$

显然，当脉冲宽度越窄，近似程度就越高，就越逼近原信号（类似于高数中的经典积分思想）；当 $\Delta \rightarrow 0$ 极限的情况下，高度在上升，但面积始终保持为1，因此们函数可表示为由强度形式表达的单位冲激函数 $\delta (t)$ ,上式变换为

$x(t)=\lim_{\Delta \rightarrow 0}\sum_{n=-\infty }^{\infty }x(n\Delta )\delta (t-n\Delta )\Delta$

我们用 $d\tau$ 表示 $\Delta$ ， $\tau$ 表示 $n\Delta$ ，求和变成连续新变量 $\tau$ 的卷积积分

$x(t)=\int_{-\infty }^{\infty }x(\tau )\delta (t-\tau )d\tau$

表明任意波形的信号可以表示为无限多个强度为 $x(\tau )d\tau$ 的单位冲激信号 $[x(\tau )d\tau]\delta (t-\tau)$ 的积分

表明任意波形的信号都可以分解为连续的加权（延迟）单位冲激信号之和

对于连续信号而言，卷积是一种特殊的积分运算，它的整个过程就是一个函数固定不动，另一个函数先以y轴为对称轴翻转，然后不断执行相乘，积分

2.离散信号的卷积

离散时间信号是连续时间信号经过离散化（即取样）的结果，即连续卷积积分离散化为

$x(k)=\sum_{n=-\infty }^{\infty }x(n)\delta (k-n)=x(k)\ast h(k)$

表明任一离散信号均可表示为单位函数 $\delta (k)$ 的延时加权和的形式

根据线性时不变系统的零状态响应叠加性和时不变性，则离散系统对 $x(n)\delta (k-n)$ 零状态响应为,把得到的零状态响应称为卷积和或离散卷积，记为

$x(k)=\sum_{n=-\infty }^{\infty }x(n)h(k-n)=x(k)\ast h(k)$

对于上式离散信号求卷积和而言，它的整个过程就是一个一维序列点集合和另一个一维序列点集合反向（翻转）对应乘积的和

在此基础之上，拓展到二维（有限范围k内），便有了二维离散卷积，即图像卷积 $g(x,y)=\sum_{m=-k}^{k}\sum_{n=-k}^{k}w(m,n)f(x-m,y-n)=w(x,y)\ast f(x,y)$

3.图像卷积

在执行线性空间滤波时，存在两个近似的概念：一个是"相关"，另一个是"卷积"。

"相关"是滤波器模板移过图像并计算每个位置乘积之和的处理

"卷积"是模板先旋转180°，再将滤波器模板移过图像并计算每个位置乘积之和的处理

"卷积"的基本特性是与单位函数 $\delta (k)$ 的卷积和仍然是本身，即

$x(k)=x(k)\ast \delta (k)$

基于以上这一点，我们延伸到二维图像中作卷积(mode:same)，我们令模板与同模板尺寸大小，除中心点像素点为1，其余点为0的矩阵进行"相关"运算，得到的结果是在中心点位产生该模板的一个旋转180°的版本。因此，如果我们预先旋转模板，并执行相同的滑动乘积求和的操作，就能得到希望的结果（中心点为模版矩阵），也契合公式的求取。但如果滤波器模板是对称的，那么作"相关"和"卷积"运算将得到相同的结果，高斯模板正是如此。

图像卷积公式和图像卷积运算（same mode）

我们也可以从另一个角度举例说明，图像卷积的模板需要先旋转180°；将二维卷积公式展开代入求取特定的值，有

原图像坐标和未旋转的3×3的模板坐标

通过展开式和上图明显能看出要想实现滑动乘积求和，要先将模板w旋转180°即可；对于超出原图像边界的像素值默认赋0。

3.1 下采样

下采样用于减半计算得到的近似及上一层空间维数的图像，下采样操作可视为删除偶数行和偶数列的像素点，赋给新的矩阵序列

根据OpenCV官方提供的代码，pyrDown()函数专门用于图像的下采样计算（包含了高斯模糊的卷积运算，模板参数大小默认为5×5的）：

pyrDown()函数原型
1.  void cv::pyrDown(InputArray src,                       //待下采样的图像 
2.                   OutputArray dst,                      //输出下采样后的图像
3.                   const Size & dstsize = Size(),        //输出图像尺寸（限制），默认是N/2
4.                   int borderType = BORDER_DEFAULT)      //像素边界外推方式，默认即可

至此，我们反复的迭代计算（一般金字塔4~5层），便形成了高斯金字塔（具体图片与拉普拉斯金字塔一并给出）。

2. 拉普拉斯金字塔的构建

利用基数为2的上采样（在偶数行和偶数列补0）作用在高斯N+1级图像上（尺寸与N级高斯图像一致）

对上采样后图像进行高斯模糊（高斯模板核*4）

将模糊后的图像与原N级高斯图像作差值运算，得到第N级的拉普拉斯图像

2.1 上采样

上采样用于翻倍计算得到的近似同下一层空间维数的图像，下采样操作可视为在偶数行和偶数列的像素值赋0（与下采样形成互补操作），赋给新的矩阵序列

根据OpenCV官方提供的代码，pyrUp()函数专门用于图像的上采样计算（包含了高斯模糊的卷积运算，5×5的模板参数*4）：

pyrUp()函数原型
1.  void cv::pyrUp(InputArray src,                       //待上采样的图像 
2.                 OutputArray dst,                      //输出上采样后的图像
3.                 const Size & dstsize = Size(),        //输出图像尺寸（限制），默认是N*2
4.                 int borderType = BORDER_DEFAULT)      //像素边界外推方式，默认即可

至此，我们反复的迭代计算，记得作减法运算，便形成了拉普拉斯金字塔。

*关于模板核*4和模板插值滤波器做个两个注释：

1.模板核*4

对于上采样后需要模糊的高斯模板核*4，很多博主都没详细说明，我的理解是：符合归一化。采用5×5的模板参数落在对应的像素点上，其中存在大量赋值为0的像素点（这些点的权重相当于不作用），无论是对应原矩阵中奇0偶数、偶0奇数、奇数偶0、偶数奇0，非0像素点对应的权重和一定满足 $\sum M(i,j)=64$ ，所以将原有归一化系数*4=1/64，满足归一化的作用。

2.模板插值滤波器

对于内插滤波器，常用的包括最邻近插值法、双线性插值法、双三次插值法，其效果也是呈明显的递增，消除了锯齿特征也保留了图像的细节，毕竟拟合的点数增多了随之而来的是计算时间也增加了；在OpenCV大部分内嵌插值法的函数中和商业用途中多采用双线性插值法，这也是在计算时间和质量之间寻求到的不错的折中选择。

3种插值法示意图

最后，给出高斯金字塔和拉普拉斯金字塔作为完结（附上最经典的Lena图吧，哈哈哈）。

高斯金字塔

拉普拉斯金字塔

三、金字塔实现代码

略(●'◡'●)

参考文献：

1.https://www.cnblogs.com/shine-lee/p/9671253.html

2.https://blog.csdn.net/naruhina/article/details/104729037/

3.数字图像处理（冈萨雷斯）

4.数字图像处理和机器视觉（Visual C++与Matlab实现）

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
《大清方方案》| 第二话谁佐清欢
和珅究竟说了些什么？竟能令堂堂九五之尊龙颜失色！此处暂且按下不表；单说这位乾隆皇帝，果真不愧是康熙从小带过的，一旦决定了要做的事，便杀伐决断毫不含糊。他当即亲自拟旨，着令和珅为钦差大臣，全权负责处理方方事件，并钦赐尚方宝剑，遇急则三品以下官员可先斩后奏。和珅身负皇上重托，岂敢有半点怠慢，当夜即率领相关人等，马不停蹄杀奔江汉。这一路上，和珅的几位幕僚一直在商讨方方事件的处置方案。有位年轻幕僚建议快刀
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
走向以教育叙事为载体的教育叙事研究 666小飞鱼
今天我读了吴松超老师的《给教师的68条建写作建议》中的第23条《如何通过教育叙事走向研究》，吴老师在文中与我们分享了一个德育案例，这是一个反面的案例，意在告知我们在处理问题时，不能就考虑的点太窄，思考要全面。走向教育叙事研究，教师要有敏锐的“感知力”，这个感知力来自于背后专业知识的支撑，思维能力以及广阔的视野和见识等。所以对于同一件事处理方法不同，这个就是教师背后“敏锐力”的不同造成的，也就是说是
ARM中断处理过程落汤老狗嵌入式linux
一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T
番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro