人工智能技术与咨询

一种基于伪标签半监督学习的小样本调制识别算法

人工智能技术与咨询

来源：《西北工业大学学报》，作者史蕴豪等

摘要：针对有标签样本较少条件下的通信信号调制识别问题，提出了一种基于伪标签半监督学习技术的小样本调制方式分类算法，通过优选人工特征集、设计高性能分类器以及基于输出概率的伪标签数据选择方法，构建高效的伪标签标注系统，然后通过该伪标签标注系统与基于深度学习的信号分类方法配合，实现在少量有标签样本和大量无标签样本条件下的调制方式分类。仿真结果表明，对6种数字信号进行调制识别，在信噪比大于5 dB时，伪标签算法可将模型识别性能提高5%～10%，该算法设计简单，具有较大应用价值。

关键词：调制识别; 伪标签; 半监督学习

通信信号调制方式识别是通信侦察、认知电子战领域的关键技术之一，在实际战场环境中，由于敌我双方的非协作特性，使得在还原敌方通信信号、获取敌方情报信息之前必须进行调制方式识别，此外，通信信号调制方式识别也为后续的信号解调、比特流分析、协议识别、信号解密、灵巧干扰等提供了重要支撑。

调制识别技术发展至今，已逐渐形成两大类基于似然比的调制识别方法和基于特征的调制识别方法。基于似然比的调制识别方法主要是通过计算似然概率模型估计不同调制方式的概率，然后将各个信号代入检验，最后判定似然概率最大的为识别结果。基于似然比的调制识别算法主要分为3类[1-3]，但该类方法普适性差的缺点较为明显，由于概率密度函数都是针对特殊环境提出来的，因此参数微小的偏差和模型失配都会导致识别率大幅降低。基于特征的调制识别方法通过提取信号不同特征搭配分类算法从而做到对信号的识别，如文献[4]使用高阶累积量对8种数字信号进行识别，文献[5]混合高阶累积量与循环谱特征对信号进行分类，文献[6-7]使用信号熵特征对不同调制信号进行分类。但是基于人工提取特征的调制识别算法中，对特征区分度要求较高，一旦特征对于不同信号辨别性能差，识别模型效果就会显著下降，因此有必要对自动提取特征的方法进行研究。

近年来，深度学习在模式识别、计算机视觉等领域取得了显著突破，利用深度学习的方法自动提取信号特征并对信号调制方式进行识别也已经取得了不错的效果，O′Shea等[8-9]最早于2016年利用有监督深度学习技术实现调制方式识别，该论文直接使用卷积祌经网络(convolutional neural network,CNN)构建端到端的学习模型，成功对包括WBFM、DSB、BPSK、16QAM在内的11种数字或模拟调制方式进行了识别。Jeong等[10]学者在论文中提出了一种算法，利用短时傅里叶变换(short-time Fourier transform,STFT)将信号从时域转换为时频域，并通过深度卷积神经网络提取时频域特征，最终完成了对2-FSK、4-FSK、8-FSK等7种调制识别方式的识别，其在-4 dB的信噪比下仍有90%以上的识别正确率。Meng等[11]学者提出了一种联合噪声估计的调制识别算法，该研究提出了一种巧妙的网络结构，同时将原始信号数据和信噪比作为神经网络的输入，仿真结果显示这种算法在不同信噪比下、不同频偏下的识别成功率已经非常接近理论识别率的上限。文献[12]提出利用时频图的纹理信息进行调制识别，在大样本条件下，可取得良好的分类效果。Zhang等[13]利用卷积神经网络提取信号SPWVD时频图特征和BJD时频图特征并与大量手工特征融合对BPSK、QPSK，OFDM等8种调制方式进行识别，在-4 dB时仍有92.5%的识别准确率。

虽然基于深度学习的调制识别方法已经取得了非常显著的成果，但是国内外专家的研究重点都偏向于有监督深度学习方法，而有监督深度学习方法需要大量有标签信号样本作为支撑。但在实际应用中，一些敏感的军用通信信号由于受敌方保密要求的限制以及地理环境条件的制约，在平时只能获取十分有限的信号样本，而这些信号真正到了战场又会大量出现。因此，如何利用少量有标签信号结合大量无标签信号的小样本调制方式识别逐渐成了大家关注的重点方向之一。现阶段，国内外针对小样本调制识别的研究尚处于起步阶段，但在其他领域已有一些半监督学习算法出现。半监督学习解决的就是有标签样本数量较少情况下如何提升模型性能的问题，其核心思想为结合无标签数据进行优化。尽管无标签数据没有标签信息但是它们和有标签数据一样都是从相同的数据源独立同分布采样得到的，因此它们包含的关于数据分布的信息对优化模型大有裨益[14]。半监督学习方法主要包括自训练学习方法[15]、生成式学习方法[16]以及半监督支持向量机等[17]。

为了充分利用无标签信号解决小样本调制识别问题，本文提出了一种基于伪标签半监督学习的小样本调制识别模型。该模型通过优选人工特征集结合高性能分类器为无标签信号进行预测打上伪标签，然后利用深度学习类方法联合训练带标签样本与伪标签样本从而实现小样本调制识别。

1 小样本识别模型

本文采用基于伪标签的半监督学习方法，在仅有少量有标签信号样本的条件下进行调制方式识别。基于伪标签的半监督学习是一种增量算法，算法流程图如图1所示，在分类器训练部分，首先通过少量有标签样本提取优选人工特征送入高性能分类器中进行训练，将信号识别准确率提升到一个较高水准，此时若环境中存在大量无标签样本，则进入伪标签生成部分，利用训练好的高性能分类器对无标签样本进行预测，通过预测的概率对无标签样本进行排序，给可靠的无标签样本打上伪标签并加入到训练集中，但该过程并非选择所有的无标签样本均加入训练集，因为全部无标签样本内包含的错误标签样本会严重干扰模型收敛。当环境中无标签样本不足时，也可利用分类器训练部分模块直接进行信号分类。

图1 算法流程图

伪标签算法不断迭代增加有标签样本数量，当有标签样本数量满足迭代要求时，进入深度学习训练部分，将所有带标签的样本数据组合新的训练集，使用分类能力更强的深度学习类方法对所有标签样本进行联合训练，最后利用训练好的模型对测试信号进行预测。本文选取BP神经网络作为生成伪标签的高性能分类器，选取CNN卷积神经网络作为深度学习方法训练真实标签样本与伪标签样本的合集。

2 信号人工特征

本文选取多类具有良好区分性能的人工特征作为BP神经网络输入，这些特征均已被证明具有良好的区分能力，其中包括高阶累积量特征、熵特征以及时频特征。

2.1 信号高阶累积量特征

在调制识别技术领域，高阶累积量是应用非常广泛的特征之一，其具有较强的周期分量，可用于准确识别不同的数字调制信号。为了提取高阶累积量，首先要计算信号的高阶矩，信号高阶矩由(1)式计算：

Mpq=E[x(n)p-q(x*(n))q]

(1)

通过信号各高阶矩便可计算得到许多高阶累积量,本文选择下列高阶累积量,这些累积量均已被证明在调制样式分类中有较好鉴别性能[18-19]

2.2 信息熵特征

熵是用于评价信号或系统状态平均不确定性的指标。在信息论领域,熵用于衡量信息的信息量大小,信息的不确定程度越大,则其熵值越大,因此信息熵理论为我们提供了一个很好的信号特征描述方法。本文提取信号的功率谱熵、奇异谱熵和能量谱熵,以此作为信号的特征[20-21]。

2.2.1 功率谱熵

假设时间序列X长为L,对其进行离散傅里叶变换,变换结果为

(9)

式中：

表示傅里叶变换后的第k个频谱；N表示变换点数,一般要求N为2的整数幂且接近序列X的长度。计算频谱序列Y在y(k)处的功率谱

(10)

记

(11)

将(11)式代入香农熵计算公式,可得到功率谱香农熵。香农熵计算公式为:

式中,H表示熵值;pi表示信号概率分布。

2.2.2 奇异谱熵

奇异谱分析是近年来非常流行的一种研究非线性时间序列数据的强大方法,它结合相空间重构和奇异值分解对时间序列维数进行估计。若一段离散时间序列为

X=[x1,x2,x3…xN]

首先将信号分段,假设分段长度为m,在奇异谱分析过程中,m最好为信号周期的整数倍且不宜超过信号序列长度的1/3,重构后的序列轨迹矩阵为

(12)

对(12)式矩阵进行奇异值分解,可得

(13)

式中：U和V均为正交矩阵；U为左奇异矩阵；V为右奇异矩阵;Σ矩阵可化为对角阵

式中,σk表示矩阵M的奇异值且除对角线上元素以外其余值均为零,对角线上的非零元素便构成了序列的奇异值谱,即

σ={σ1,σ2,…σi,…σj|j

记pi表示非零奇异值σi占所有非零奇异值之和的比值

(14)

将(14)式代入香农熵计算公式,即可得到奇异值香农熵。

将(14)式带入指数熵计算公式,即可得到奇异谱指数熵。指数熵的计算公式为:H=E[e1-pi]=∑pie1-pi。式中,H表示熵值;pi表示信号概率分布。

2.2.3 能量谱熵

对于序列信号X={x1,x2…xN},其能量谱定义为

(15)

式中,X(ω)表示序列X的离散傅里叶变换。记pi为

(16)

将(16)式代入指数熵计算公式,即可得到信号能量谱指数熵。

2.3 时频特征

2.3.1 归一化中心瞬时振幅功率密度最大值

归一化中心瞬时振幅的功率密度最大值可在一定程度上反应不同信号的谱特征,其定义如下[22]:

式中：Ns表示信号序列长度；ma表示信号瞬时幅度的均值。

2.3.2 归一化中心瞬时振幅绝对值的标准差

序列信号归一化中心瞬时振幅绝对值的标准差可由(18)式求得,其定义如下

(21)

3 网络结构

本节将对选择的BP网络与CNN卷积神经网络作详细介绍。选用BP网络主要原因是BP网络具有学习能力,可以自动学习各个特征对分类结果影响的权重,即送入网络的特征中若有部分在分类方面作用不明显那么其所属权重就会减小。因此对于BP网络而言,其对输入的特征会自动进行“特征筛选”,这在一定程度上可以减轻对先验信息的依赖,此外,由于深度神经网络等模型参数庞大、权重太多,在小样本条件时模型过拟合现象非常严重,因此浅层BP网络用作小样本阶段训练具有明显优势。

BP网络的训练过程如图2所示,在开始训练时,由于仅有少量的有标签信号样本,训练出的模型泛化能力弱,而人工特征不依赖于训练数据,可以弥补训练数据量较少时特征表达能力不足的问题,因此本文设计的BP网络模型输入为已具备分类能力的优选特征集。首先对信号进行归一化处理,然后计算信号熵特征、高阶累积量特征和时频特征,将所有特征组合后一起送入BP网络训练,最后利用softmax分类器输出信号预测概率。

图2 网络训练过程

BP网络结构如图3所示,本文设计的BP网络由1层输入层,4层全连接层以及softmax分类器构成,输入层大小为1*13,分别代表13种人工提取的特征,各全连接层神经元个数分别为16,32,64,32,各神经元均采用ReLU激活函数。为提升网络的泛化能力,在第三、四层全连接层后使用dropout技术干扰训练以防止网络过拟合,以提高网络在测试样本上的泛化能力,但干扰只发生在网络训练阶段,在网络模型生成伪标签时则停止干扰,Dropout比率设置为0.5。BP网络训练产生的损失函数如下所示:

图3 BP神经网络结构

(22)

式中:

表示有标签信号产生的分类损失；表示伪标签信号产生的分类损失；N表示有标签信号数量；N′伪标签信号数量,μ用于控制2类损失的比重。

在利用伪标签算法迭代训练BP网络过程中,有时难免给无标签信号样本打上错误的伪标签,因此伪标签的准确性对网络最终的识别率有决定性影响。由于softmax分类器输出的是各个类别的预测概率,因此本文提出可靠条件为

p2+p3≤p1

(23)

式中：p1表示softmax分类器输出的最大概率；p2，p3依次表示softmax分类器输出的第二大、第三大概率。即只有softmax输出的最大概率大于第二大概率与第三大概率之和时,才会给该无标签信号打上伪标签,通过此基于输出概率的样本选择算法便可在一定程度上保证伪标签的可靠性。

无标签样本标注伪标签结束后,将真实标签样本与伪标签样本联合起来送入CNN卷积神经网络训练,CNN结构如图4所示。为充分发挥卷积神经网络的特征提取能力,本文直接将IQ信号输入卷积神经网络,信号输入网络前,将其转换为二维数据,即若信号长为L,则转换后的数据格式为[2,L],两路分别代表I路数据与Q路数据。网络共包含3层卷积层和3层全连接层,其中第一个卷积层卷积核个数为64,核尺寸为2*4,第二个卷积层卷积核个数为32,核尺寸为1*4,第三个卷积层卷积核个数为16,核尺寸为1*4。卷积层完成对序列数据的特征提取,将提取后的特征转换为一维序列送入全连接层,3层全连接层的维度分别为64,32,16,将第三个全连接层输出的特征送入softmax分类器进行分类,输出预测结果,并通过反向传播不断优化网络参数。

图4 卷积神经网络结构图

4 仿真结果及分析

本文选用的调制信号集为{BPSK,4PAM,4PSK,8PSK,16QAM,64QAM},共计6种数字调制信号,信号序列长度L=100,信噪比从-10至20 dB,间隔为2 dB。训练集每类信号生成4 000个信号样本,信噪比随机,共计24 000个样本。测试集每类信号每个信噪比点生成500个信号,共计48 000个信号,所有信号均由MATLABR2016a仿真生成。

网络训练均基于Python下的Keras深度学习框架实现,硬件平台为Intel(R)Core(TM)i7-8700CPU,GPU为NVIDIA GeForce 1060Ti。

4.1 信号特征提取分析

本节对6类数字信号在-10至20 dB间每个信噪比点生成500个样本,提取信号13种特征并取平均值,取其中具有代表性的特征并绘图,得到图5所示的特征曲线图。在进行信号奇异谱分析时,由于信号序列长度L=100,且基带序列为随机生成无周期特性,因此设置分段长度m=33;在计算序列离散傅里叶变换时,由于要求傅里叶变换点数靠近序列长度且为2的整数幂,因此设置傅里叶变换点数

图5 信号特征曲线图

N=128。

图5a)至5e)分别代表信号功率谱香农熵、高阶累积量C40、高阶累积量C61、奇异谱指数熵、功率谱峰值和瞬时幅度标准差随信噪比变化的曲线。可以看出,随着信噪比的不断上升,各类信号特征间的差异越来越大,代表着特征的区分能力越来越强,但每个特征均有无法区分的调制信号,因此本文选择综合13类特征一起作为分类特征。

4.2 伪标签算法可行性分析

本节对比3类识别算法在不同训练样本总量下的识别性能,分别为人工提取特征结合BP神经网络、时序IQ序列结合CNN卷积神经网络、时序IQ序列结合LSTM循环神经网络,LSTM网络为KERAS框架下的CuDNNLSTM。3类算法均迭代200次,使用Adam函数优化。当不同样本量条件下进行调制方式识别时,各算法在测试集上的性能如图6所示,从仿真结果可以看出,当训练样本数量有限时,例如图6a)所示总样本量为600个,通过人工提取特征结合BP神经网络的识别率要远高于CNN卷积神经网络的识别率以及LSTM循环神经网络的识别率。但随着样本数量的不断增加,人工提取特征结合BP神经网络的识别率变化不大,而CNN卷积神经网络的识别率和LSTM网络的识别率则上升的非常快,当总样本量达到6 000时,CNN的最高识别性能已经优于人工提取特征结合BP网络的性能,其最高识别率可以达到85%以上,当总样本量达到24 000时,网络的最高识别率可以达到95%以上。因此,利用人工特征结合BP神经网络在样本量较少的情况下采用伪标签增量算法增加训练数据总样本量,而后采用CNN卷积神经网络进行训练是可行的。

图6 不同样本总量下各算法识别率曲线

4.3 伪标签算法识别率分析

通过4.2节中的仿真结果可分析出,在样本量充足的条件下本文提出的CNN深度卷积神经网络模型性能优于CuDNNLSTM网络,因此本文选用CNN作为训练模型对打伪标签后的样本集进行训练。

假设初始条件为有每类调制信号有100,500,1 000个带标签样本,共600,3 000,6 000个带标签样本以及48 000个无标签样本,首先通过人工提取特征结合BP神经网络对600,3 000,6 000个带标签样本进行训练,而后通过伪标签增量算法对无标签样本打伪标签,最后利用CNN对有标签样本、伪标签样本的IQ序列进行联合训练。在CNN网络训练过程中,由于真实标签样本与测试集样本分布相同且标签准确,因此本文选用真实标签样本作为验证集,以此提升网络在测试集上的识别性能。

当使用600个真实标签样本对大量无标签样本预测伪标签时,样本数随迭代次数的变化如表1所示。

表1 600个真实样本

从表1的结果可以看出,随着迭代次数的不断增加,伪标签数量不断提升,但由于设置了可靠条件,所以伪标签样本总量并未达到48 000。将所有真实标签样本和伪标签样本一并送入CNN卷积神经网络进行训练,共计29 520个样本,测试集的识别率如图7所示。

图7 伪标签算法识别率对比

当训练样本总量为29 520时,算法各部分运行时间如表2所示,当使用3 000个真实标签样本对大量无标签样本预测伪标签时,样本数随迭代次数的变化如表3所示,从表3的结果可以看出,随着迭代次数的不断增加,伪标签数量不断提升,经过5次迭代后训练样本数总数可达36 566个,测试集的识别率如图8所示,当训练样本总量为36 566个时,算法各部分运行时间如表4所示。

表2 算法运行时间单位：s

表3 3 000个真实样本

表4 算法运行时间单位：s

图8 伪标签算法识别率对比

当使用6 000个真实标签样本对大量无标签样本预测伪标签时,样本数随迭代次数的变化如表5所示。从表5的结果可以看出,随着迭代次数的不断增加,伪标签样本数量不断提升,经过5次迭代后训练样本数总数可达41 063个,测试集的识别率如图9所示。

表5 6 000个真实样本

图9 伪标签算法识别率对比

当训练样本总量为41 063时,算法各部分运行时间如表6所示。

表6 算法运行时间单位：s

通过仿真结果可以看出,在小样本条件下,利用伪标签增量算法对传统特征结合BP神经网络的识别性能有一定的提升,当信噪比大于5 dB时,本文提出的伪标签CNN的网络识别率相较于BP神经网络结合人工特征的识别率可提高约5%～10%。

实际上本文提出的伪标签半监督模型,其性能与生成伪标签所用的人工特征集以及分类器密切相关,通过大量实验发现，如果伪标签标注分类器不能很好区分信号类型,那么能够获得的有效伪标签样本就会较少,总体识别准确率就会偏低,但如果能进一步提升伪标签分类器的识别率，将其控制到90%以上,那么整体算法的识别率甚至可以接近100%。在实际应用过程中,一方面可以实时监控伪标签样本数量分布,从而掌握深度学习类方法是否有足够的样本量支撑,另一方面还可以不断改进特征集和分类器,继续研究更具区分能力的特征并选择更复杂的模型作为伪标签生成器,这样深度学习类方法的性能也会不断提升。

5 结论

本文针对战场信号调制识别领域可能出现的小样本情况进行研究,设计了基于人工优选特征集与BP神经网络的信号伪标签标注方法,并结合基于CNN的通信信号分类模型,形成了小样本条件下通信信号分类新的解决方案,通过大量的实验验证了方案的可行性,在单个信号类型的带标签样本量为100以上时,本文模型就可有效工作,且在不同标签样本量条件下,其总体性能均比常规方法有明显提升。

我们的服务类型

公开课程

人工智能、大数据、嵌入式

内训课程

普通内训、定制内训

项目咨询

技术路线设计、算法设计与实现（图像处理、自然语言处理、语音识别）

你可能感兴趣的:(人工智能,机器学习,算法)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

一种基于伪标签半监督学习的小样本调制识别算法

一种基于伪标签半监督学习的小样本调制识别算法

1 小样本识别模型

2 信号人工特征

2.1 信号高阶累积量特征

2.2 信息熵特征

2.3 时频特征

3 网络结构

4 仿真结果及分析

4.1 信号特征提取分析

4.2 伪标签算法可行性分析

4.3 伪标签算法识别率分析

5 结 论

你可能感兴趣的:(人工智能,机器学习,算法)

5 结论