sunbow0

Spark MLlib Deep Learning Deep Belief Network (深度学习-深度信念网络)2.2

http://blog.csdn.net/sunbow0

第二章Deep Belief Network (深度信念网络)

2基础及源码解析

2.1 Deep Belief Network深度信念网络基础知识

1）综合基础知识参照：

http://tieba.baidu.com/p/2895759455

http://wenku.baidu.com/link?url=E8eett6R-mpVL-5AtO1yRNZR4DdEhW7YkQhDKY2CoYCiCQQYqdmWgrHQed2rsJZ8H2rwobpTgyjuXhdakD5QRv0OBWCUB8B2UA2iSNTcGeO

2）原著资料参照：

《Learning Deep Architectures for AI》

http://wenku.baidu.com/link?url=suD736_WyPyNRj_CEcdo11mKBNMBoq73-u9IxJkbksOtNXdsfMnxOCN2TUz-zVuW80iyb72dyah_GI6qAaPKg42J2sQWLmHeqv4CrU1aqTq

《A Practical Guide to Training Restricted Boltzmann Machines》

http://wenku.baidu.com/link?url=d4xrQntJn86xyMpbJA6dHEWs68_y3m9m-yola8r79MvJDtvjw1VqeHr_yU8Hs4NeRmJmcDQt_m9RY4AnT4Y2fIoIgdDMSEq_h0n_6oNAB4e

2.2 Deep Learning DBN源码解析

2.2.1 DBN代码结构

DBN源码主要包括：DBN，DBNModel两个类，源码结构如下：

DBN结构：

DBNModel结构：

2.2.2 DBN训练过程

2.2.3 DBN解析

(1) DBNweight

/**

* W：权重

* b：偏置

* c：偏置

caseclass DBNweight(

W: BDM[Double],

vW: BDM[Double],

b: BDM[Double],

vb: BDM[Double],

c: BDM[Double],

vc: BDM[Double])extendsSerializable

DBNweight：自定义数据类型，存储权重。

(2) DBNConfig

/**

*配置参数

caseclassDBNConfig(

size: Array[Int],

layer: Int,

momentum: Double,

alpha: Double)extends Serializable

DBNConfig：定义参数配置，存储配置信息。参数说明：

size:神经网络结构

layer:神经网络层数

momentum: Momentum因子

alpha:学习迭代因子

(3) InitialWeight

初始化权重

/**

* 初始化权重

* 初始化为0

def InitialW(size: Array[Int]): Array[BDM[Double]] = {

// 初始化权重参数

// weights and weight momentum

// dbn.rbm{u}.W = zeros(dbn.sizes(u + 1), dbn.sizes(u));

valn = size.length

valrbm_W = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i), size(i - 1))

rbm_W += d1

}

rbm_W.toArray

}

(4) InitialWeightV

初始化权重vW

/**

* 初始化权重vW

* 初始化为0

def InitialvW(size: Array[Int]): Array[BDM[Double]] = {

// 初始化权重参数

// weights and weight momentum

// dbn.rbm{u}.vW = zeros(dbn.sizes(u + 1), dbn.sizes(u));

valn = size.length

valrbm_vW = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i), size(i - 1))

rbm_vW += d1

}

rbm_vW.toArray

}

(5) Initialb

初始化偏置向量

/**

* 初始化偏置向量b

* 初始化为0

def Initialb(size: Array[Int]): Array[BDM[Double]] = {

// 初始化偏置向量b

// weights and weight momentum

// dbn.rbm{u}.b = zeros(dbn.sizes(u), 1);

valn = size.length

valrbm_b = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i -1),1)

rbm_b += d1

}

rbm_b.toArray

}

(6) Initialvb

初始化偏置向量

/**

* 初始化偏置向量vb

* 初始化为0

def Initialvb(size: Array[Int]): Array[BDM[Double]] = {

// 初始化偏置向量b

// weights and weight momentum

// dbn.rbm{u}.vb = zeros(dbn.sizes(u), 1);

valn = size.length

valrbm_vb = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i -1),1)

rbm_vb += d1

}

rbm_vb.toArray

}

(7) Initialc

初始化偏置向量

/**

* 初始化偏置向量c

* 初始化为0

def Initialc(size: Array[Int]): Array[BDM[Double]] = {

// 初始化偏置向量c

// weights and weight momentum

// dbn.rbm{u}.c = zeros(dbn.sizes(u + 1), 1);

valn = size.length

valrbm_c = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i),1)

rbm_c += d1

}

rbm_c.toArray

}

(8) Initialvc

初始化偏置向量

/**

* 初始化偏置向量vc

* 初始化为0

def Initialvc(size: Array[Int]): Array[BDM[Double]] = {

// 初始化偏置向量c

// weights and weight momentum

// dbn.rbm{u}.vc = zeros(dbn.sizes(u + 1), 1);

valn = size.length

valrbm_vc = ArrayBuffer[BDM[Double]]()

for (i <-1 ton - 1) {

vald1 = BDM.zeros[Double](size(i),1)

rbm_vc += d1

}

rbm_vc.toArray

}

(8) sigmrnd

Gibbs采样

/**

* Gibbs采样

* X = double(1./(1+exp(-P)) > rand(size(P)));

def sigmrnd(P: BDM[Double]): BDM[Double] = {

vals1 =1.0 / (Bexp(P * (-1.0)) +1.0)

valr1 = BDM.rand[Double](s1.rows,s1.cols)

vala1 =s1 :>r1

vala2 =a1.data.map { f =>if (f ==true)1.0else0.0 }

vala3 =new BDM(s1.rows,s1.cols,a2)

}

/**

* Gibbs采样

* X = double(1./(1+exp(-P)))+1*randn(size(P));

def sigmrnd2(P: BDM[Double]): BDM[Double] = {

vals1 =1.0 / (Bexp(P * (-1.0)) +1.0)

valr1 = BDM.rand[Double](s1.rows,s1.cols)

vala3 =s1 + (r1 *1.0)

}

(9) DBNtrain

对神经网络每一层进行训练。

/**

* 深度信念网络（Deep Belief Network）

* 运行训练DBNtrain

def DBNtrain(train_d: RDD[(BDM[Double], BDM[Double])], opts: Array[Double]): DBNModel = {

// 参数配置广播配置

valsc = train_d.sparkContext

valdbnconfig = DBNConfig(size,layer,momentum, alpha)

// 初始化权重

vardbn_W = DBN.InitialW(size)

vardbn_vW = DBN.InitialvW(size)

vardbn_b = DBN.Initialb(size)

vardbn_vb = DBN.Initialvb(size)

vardbn_c = DBN.Initialc(size)

vardbn_vc = DBN.Initialvc(size)

// 训练第1层

printf("Training Level: %d.\n",1)

valweight0 =new DBNweight(dbn_W(0),dbn_vW(0),dbn_b(0),dbn_vb(0),dbn_c(0),dbn_vc(0))

valweight1 = RBMtrain(train_d, opts,dbnconfig,weight0)

dbn_W(0) =weight1.W

dbn_vW(0) =weight1.vW

dbn_b(0) =weight1.b

dbn_vb(0) =weight1.vb

dbn_c(0) =weight1.c

dbn_vc(0) =weight1.vc

// 训练第2层至 n层

for (i <-2 todbnconfig.layer -1) {

// 前向计算x

// x = sigm(repmat(rbm.c', size(x, 1), 1) + x * rbm.W');

printf("Training Level: %d.\n",i)

valtmp_bc_w =sc.broadcast(dbn_W(i -2))

valtmp_bc_c =sc.broadcast(dbn_c(i -2))

valtrain_d2 = train_d.map { f =>

vallable = f._1

valx = f._2

valx2 = DBN.sigm(x *tmp_bc_w.value.t +tmp_bc_c.value.t)

(lable, x2)

}

// 训练第i层

valweighti =new DBNweight(dbn_W(i -1), dbn_vW(i -1),dbn_b(i -1),dbn_vb(i -1),dbn_c(i -1),dbn_vc(i -1))

valweight2 = RBMtrain(train_d2, opts,dbnconfig,weighti)

dbn_W(i -1) =weight2.W

dbn_vW(i -1) =weight2.vW

dbn_b(i -1) =weight2.b

dbn_vb(i -1) =weight2.vb

dbn_c(i -1) =weight2.c

dbn_vc(i -1) =weight2.vc

new DBNModel(dbnconfig,dbn_W,dbn_b, dbn_c)

}

(10) RBMtrain

神经网络训练执行代码。

/**

* 深度信念网络（Deep Belief Network）

* 每一层神经网络进行训练rbmtrain

def RBMtrain(train_t: RDD[(BDM[Double], BDM[Double])],

opts: Array[Double],

dbnconfig: DBNConfig,

weight: DBNweight): DBNweight = {

valsc = train_t.sparkContext

varStartTime = System.currentTimeMillis()

varEndTime = System.currentTimeMillis()

// 权重参数变量

varrbm_W = weight.W

varrbm_vW = weight.vW

varrbm_b = weight.b

varrbm_vb = weight.vb

varrbm_c = weight.c

varrbm_vc = weight.vc

// 广播参数

valbc_config =sc.broadcast(dbnconfig)

// 训练样本数量

valm = train_t.count

// 计算batch的数量

valbatchsize = opts(0).toInt

valnumepochs = opts(1).toInt

valnumbatches = (m /batchsize).toInt

// numepochs是循环的次数

for (i <-1 tonumepochs) {

StartTime = System.currentTimeMillis()

valsplitW2 = Array.fill(numbatches)(1.0 / numbatches)

varerr =0.0

// 根据分组权重，随机划分每组样本数据

for (l <-1 tonumbatches) {

// 1 广播权重参数

valbc_rbm_W =sc.broadcast(rbm_W)

valbc_rbm_vW =sc.broadcast(rbm_vW)

valbc_rbm_b =sc.broadcast(rbm_b)

valbc_rbm_vb =sc.broadcast(rbm_vb)

valbc_rbm_c =sc.broadcast(rbm_c)

valbc_rbm_vc =sc.broadcast(rbm_vc)

// 2 样本划分

valtrain_split2 = train_t.randomSplit(splitW2, System.nanoTime())

valbatch_xy1 =train_split2(l -1)

// 3 前向计算

// v1 = batch;

// h1 = sigmrnd(repmat(rbm.c', opts.batchsize, 1) + v1 * rbm.W');

// v2 = sigmrnd(repmat(rbm.b', opts.batchsize, 1) + h1 * rbm.W);

// h2 = sigm(repmat(rbm.c', opts.batchsize, 1) + v2 * rbm.W');

// c1 = h1' * v1;

// c2 = h2' * v2;

valbatch_vh1 =batch_xy1.map { f =>

vallable = f._1

valv1 = f._2

valh1 = DBN.sigmrnd((v1 *bc_rbm_W.value.t +bc_rbm_c.value.t))

valv2 = DBN.sigmrnd((h1 *bc_rbm_W.value +bc_rbm_b.value.t))

valh2 = DBN.sigm(v2 *bc_rbm_W.value.t +bc_rbm_c.value.t)

valc1 =h1.t *v1

valc2 =h2.t *v2

(lable, v1,h1,v2,h2,c1,c2)

}

// 4 更新前向计算

// rbm.vW = rbm.momentum * rbm.vW + rbm.alpha * (c1 - c2) / opts.batchsize;

// rbm.vb = rbm.momentum * rbm.vb + rbm.alpha * sum(v1 - v2)' / opts.batchsize;

// rbm.vc = rbm.momentum * rbm.vc + rbm.alpha * sum(h1 - h2)' / opts.batchsize;

// W 更新方向

valvw1 =batch_vh1.map {

case (lable,v1,h1,v2,h2,c1,c2) =>

c1 -c2

}

valinitw = BDM.zeros[Double](bc_rbm_W.value.rows,bc_rbm_W.value.cols)

val (vw2,countw2) =vw1.treeAggregate((initw,0L))(

seqOp = (c, v) => {

// c: (m, count), v: (m)

valm1 = c._1

valm2 =m1 + v

(m2, c._2 +1)

combOp = (c1, c2) => {

// c: (m, count)

valm1 = c1._1

valm2 = c2._1

valm3 =m1 + m2

(m3, c1._2 + c2._2)

})

valvw3 =vw2 /countw2.toDouble

rbm_vW = bc_config.value.momentum *bc_rbm_vW.value +bc_config.value.alpha *vw3

// b 更新方向

valvb1 =batch_vh1.map {

case (lable,v1,h1,v2,h2,c1,c2) =>

(v1 -v2)

}

valinitb = BDM.zeros[Double](bc_rbm_vb.value.cols,bc_rbm_vb.value.rows)

val (vb2,countb2) =vb1.treeAggregate((initb,0L))(

seqOp = (c, v) => {

// c: (m, count), v: (m)

valm1 = c._1

valm2 =m1 + v

(m2, c._2 +1)

combOp = (c1, c2) => {

// c: (m, count)

valm1 = c1._1

valm2 = c2._1

valm3 =m1 + m2

(m3, c1._2 + c2._2)

})

valvb3 =vb2 /countb2.toDouble

rbm_vb = bc_config.value.momentum *bc_rbm_vb.value +bc_config.value.alpha *vb3.t

// c 更新方向

valvc1 =batch_vh1.map {

case (lable,v1,h1,v2,h2,c1,c2) =>

(h1 -h2)

}

valinitc = BDM.zeros[Double](bc_rbm_vc.value.cols,bc_rbm_vc.value.rows)

val (vc2,countc2) =vc1.treeAggregate((initc,0L))(

seqOp = (c, v) => {

// c: (m, count), v: (m)

valm1 = c._1

valm2 =m1 + v

(m2, c._2 +1)

combOp = (c1, c2) => {

// c: (m, count)

valm1 = c1._1

valm2 = c2._1

valm3 =m1 + m2

(m3, c1._2 + c2._2)

})

valvc3 =vc2 /countc2.toDouble

rbm_vc = bc_config.value.momentum *bc_rbm_vc.value +bc_config.value.alpha *vc3.t

// 5 权重更新

// rbm.W = rbm.W + rbm.vW;

// rbm.b = rbm.b + rbm.vb;

// rbm.c = rbm.c + rbm.vc;

rbm_W = bc_rbm_W.value +rbm_vW

rbm_b = bc_rbm_b.value +rbm_vb

rbm_c = bc_rbm_c.value +rbm_vc

// 6 计算误差

valdbne1 =batch_vh1.map {

case (lable,v1,h1,v2,h2,c1,c2) =>

(v1 -v2)

}

val (dbne2,counte) =dbne1.treeAggregate((0.0,0L))(

seqOp = (c, v) => {

// c: (e, count), v: (m)

vale1 = c._1

vale2 = (v :* v).sum

valesum =e1 + e2

(esum, c._2 +1)

combOp = (c1, c2) => {

// c: (e, count)

vale1 = c1._1

vale2 = c2._1

valesum =e1 + e2

(esum, c1._2 + c2._2)

})

valdbne =dbne2 /counte.toDouble

err += dbne

}

EndTime = System.currentTimeMillis()

// 打印误差结果

printf("epoch: numepochs = %d , Took = %d seconds; Average reconstruction error is: %f.\n",i, scala.math.ceil((EndTime -StartTime).toDouble /1000).toLong,err / numbatches.toDouble)

}

new DBNweight(rbm_W,rbm_vW,rbm_b, rbm_vb,rbm_c,rbm_vc)

}

2.2.4 DBNModel解析

(1) DBNModel

DBNModel：存储DBN网络参数，包括：config配置参数，dbn_W权重，dbn_b偏置，dbn_c偏置。

class DBNModel(

valconfig: DBNConfig,

valdbn_W: Array[BDM[Double]],

valdbn_b: Array[BDM[Double]],

valdbn_c: Array[BDM[Double]])extends Serializable {

}

(2) dbnunfoldtonn

dbnunfoldtonn：将DBN网络参数转换为NN参数。

/**

* DBN模型转化为NN模型

* 权重转换

defdbnunfoldtonn(outputsize: Int): (Array[Int], Int, Array[BDM[Double]]) = {

//1 size layer 参数转换

valsize =if (outputsize >0) {

valsize1 =config.size

valsize2 = ArrayBuffer[Int]()

size2 ++= size1

size2 += outputsize

size2.toArray

} elseconfig.size

vallayer =if (outputsize >0)config.layer +1elseconfig.layer

//2 dbn_W 参数转换

varinitW = ArrayBuffer[BDM[Double]]()

for (i <-0 todbn_W.length -1) {

initW += BDM.horzcat(dbn_c(i),dbn_W(i))

}

(size, layer,initW.toArray)

}

转载请注明出处：

http://blog.csdn.net/sunbow0

你可能感兴趣的:(spark,NetWork,MLlib,deep,深度学习,Belief)

【深度学习】python之人工智能应用篇——图像生成技术（一） @我们的天空人工智能技术人工智能深度学习 python 计算机视觉 tensorflow 图像处理
说明：两篇文章根据应用场景代码示例区分，其他内容相同。图像生成技术（一）：包含游戏角色项目实例代码、图像编辑和修复任务的示例代码和图像分类的Python代码示例图像生成技术（二）：包含简化伪代码示例、使用GAN生成医学图像代码示例和使用GAN生成产品展示图代码示例图像生成是计算机视觉和计算机图形学领域的一个重要研究方向，它指的是通过计算机算法和技术生成或合成图像的过程。随着深度学习、生成模型等技术
【NLP笔记】预训练+微调范式之OpenAI Transformer、ELMo、ULM-FiT、Bert.. `AllureLove 自然语言处理自然语言处理笔记 bert
文章目录OpenAITransformerELMoULM-FiTBert基础结构Embedding预训练&微调【原文链接】：BERT:Pre-trainingofDeepBidirectionalTransformersforLanguageUnderstanding【本文参考链接】TheIllustratedBERT,ELMo,andco.(HowNLPCrackedTransferLearni
VBA脚本将DeepSeek嵌入Word中教程有限无限资料库 word c#开发语言
一、获取API-Key目前我们可以直接只用官网的API来实现，申请这一步是关键也可以直接访问官网的API平台：https://platform.deepseek.com/，没注册的注册完登录一下，我们点击到左侧菜单的“APIKeys”按钮，然后点击右侧的“创建APIKey”在弹出的对话框中备注一下，以防忘记，点击创建，这样我们就获得了一个APIKey了。记得先将密钥复制存放一下。一旦关闭就无法复制
DeepSeek入门指南：计算机视觉应用10大核心功能，大师级思维养成大模型本地部署计算机视觉人工智能数据分析 excel agi 大模型 deepseek
嘿，AI玩家们！今天我要手把手教你玩转DeepSeek的计算机视觉黑科技。这可不是普通的图像处理，而是能让你瞬间从小白进化成视觉算法大佬的终极武器！1、图像分类：秒懂照片背后的秘密想知道一张照片里到底有啥？DeepSeek分类简直是行家！比如你随手拍了一张街景，它能立刻告诉你：#图像分类示例defclassify_image(image_path)：result=deepseek.vision_c
前端面试宝典总结4-手搓代码JavaScript（场景篇）水煮白菜王前端面试 JavaScript 前端面试 javascript
前端面试宝典总结4之手写代码JavaScript（场景篇）本文章对各大学习技术论坛知识点，进行总结、归纳自用学习，共勉上一篇:前端面试宝典总结4-手搓代码JavaScript（基础篇）1.深拷贝:当你需要完全复制一个对象，包括它的嵌套对象时，避免引用造成的数据篡改。functiondeepClone(obj,hash=newWeakMap()){if(obj==null)returnobj;//处
深度剖析现阶段的多模态大模型做不了医疗 AI程序猿人人工智能 ai大模型大语言模型医疗大模型多模态大模型计算机技术 AGI
导读在人工智能的这波浪潮中，以ChatGPT为首的大语言模型（LLM）不仅在自然语言处理（NLP）领域掀起了一场技术革命，更是在计算机视觉（CV）乃至多模态领域展现出了令人瞩目的潜力。这些先进的技术，以其强大的数据处理能力和深度学习算法，正在被广泛应用于医疗影像分析、辅助诊断、个性化治疗计划制定等多个方面。相信大多数小伙伴都坚定不移地认为大语言模型（LLM）和图文多模态大模型的崛起无疑为医疗领域带
多模态大模型在目标检测领域的最新进展辰% python 人工智能语言模型
1.技术融合创新多模态数据融合：传感器融合：整合图像、激光雷达（LiDAR）、毫米波雷达等数据，提升检测精度和鲁棒性。例如，在自动驾驶中，通过融合视觉与LiDAR数据，实现三维目标检测精度提升。特征级融合：利用深度学习自动提取多模态特征并融合，生成更强大的特征表示。如Fusion-Mamba方法通过改进的Mamba机制和门控策略，减少模态间差异，增强特征一致性。端到端学习框架：统一建模：开发整合的
训练优化技术：混合精度训练（Mixed Precision Training）彬彬侠大模型混合精度训练 Mixed Precision 训练优化 AMP pytorch python 大模型
混合精度训练（MixedPrecisionTraining）是一种优化深度学习训练过程的技术，通过结合使用不同精度的数据类型（例如，32位浮动精度和16位浮动精度），在保证模型性能的同时，显著减少内存消耗，并加速训练过程。一、混合精度训练的基本概念在传统的深度学习训练中，模型权重和计算通常使用32位浮动精度（FP32）。虽然这种方式在精度上没有问题，但由于大模型的计算量和内存需求非常大，使用FP3
很透彻！50个Pytorch核心操作！！！我不是小upper 机器学习数据科学数据挖掘 pytorch 人工智能 python
大家好，我不是小upper。今天，咱们一起来深入探讨Pytorch。Pytorch官网为https://pytorch.org，这里能找到最新且最完整的语法解释，是学习和使用Pytorch的重要资源宝库。现阶段来说，无论是在职场拼搏的专业人士，还是在校潜心钻研的学生，依据NeurIPS、ICML等顶级学术会议论文的统计数据，超过70%的深度学习研究代码是基于PyTorch实现的，这一比例远超Ten
VPN是什么、类型、使用场景、工作原理程序员小雨Y php web安全安全网络安全系统安全职场和发展网络
前言VPN是VirtualPrivateNetwork（虚拟专用网络）的缩写，它是一种通过公共网络（例如互联网）创建私密连接的技术。根据使用的协议和实现方式，VPN可以分为多种类型，包括以下几种常见的：1.远程访问VPN：用于连接远程用户与企业内部网络之间的安全通信。远程用户可以通过公共网络访问私有网络资源，同时数据传输通过加密和隧道技术保证安全性。2.网站对网站VPN：也被称为站点对站点VPN，
吴恩达深度学习（17）独热编码|回归树简介 wgc2k #深度学习深度学习回归人工智能
独热编码（One-HotEncoding）简介在之前看到的示例中，每个特征只能取一个或两个可能的值，比如耳朵形状只有尖或，胡须只有有或无。但如果特征可以有两个以上的取值该需要特殊处理。以宠物收养中心应用程序的新训练集为例，除了耳朵形状特征外，其他数据都相同。此时耳朵形状不再只有尖和松软两种，还可以是椭圆形，即耳朵形状（ESHI）特征仍是分类值特征，但从有两个可能值变为有三个可能值。当基于这个特征进
YOLOv8 改进：添加 DiverseBranchBlock 并引入 C2f 结构鱼弦人工智能时代 YOLO
YOLOv8改进：添加DiverseBranchBlock并引入C2f结构引言现代目标检测模型，如YOLO（YouOnlyLookOnce），在精准度和速度上都取得了显著成就。然而，为了进一步提升性能，研究者们不断探索新的架构改进。DiverseBranchBlock是一种多样化特征提取模块，可以融合不同的卷积操作，提高网络的表达能力。结合C2f（CrossStagePartialNetworks
虚实共生时代的情感革命：AI恋爱陪伴的兴起、困境与未来晓晓不觉早人工智能
一、虚拟对象：从技术奇观到情感刚需在5G网络编织的比特洪流中，AI驱动的虚拟恋人正突破次元壁障。通过深度学习算法解析3000万段真实对话的语料库，结合VR设备提供的多模态交互，当代虚拟对象已能实现瞳孔微表情的精确模拟与声线情感的颗粒化呈现。日本Gatebox公司研发的全息伴侣系统，其用户留存率高达82%，平均每日互动时长突破3.2小时，印证着技术奇观正蜕变为情感刚需的现实。二、解构爆火现象的社会心
深度学习（花书）--概率与信息论 orient2019 深度学习深度学习机器学习
深度学习（花书）–概率与信息论基本概念随机变量：可以随机地取不同值的变量。离散：拥有有限或者可数的无限状态连续：伴随着实数值概率分布：用来描述随机变量或一簇变量在每一个可能取值的状态的可能性的大小。概率质量函数(probabilitymassfunction,PMF)用来描述离散变量的概率分布概率质量函数用于多种随机变量，被称为联合概率分布(jointprobabilitydistribution
一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层程序猿李巡天人工智能架构云原生设计模式 react.js 语言模型自然语言处理
AI大模型技术架构全景图AI大模型已经在具体的业务场景落地实践，本文通过梳理AI大模型技术架构的全景视图，让你全面了解AI大模型技术的各个层次，从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层，如下图所示，揭示AI大模型如何在不同的层面上协同工作，推动产业应用的落地。一、基础设施层AI大模型技术发展离不开坚实的基础设施支持，涵盖了GPU、CPU、RAM、HDD、Network等关键硬件
TensorFlow深度学习实战（11）——风格迁移详解盼小辉丶深度学习 tensorflow 人工智能
TensorFLow深度学习实战（11）——风格迁移详解0.前言1.风格迁移原理1.1内容损失1.2风格损失2.模型分析3.使用TensorFlow实现神经风格迁移小结系列链接0.前言风格迁移是用于训练神经网络创作艺术作品的深度学习技术，同时也是一种有趣的神经网络应用，提供了一种用于深入理解神经网络的方式。在本节中，我们将学习神经风格迁移算法。在神经风格迁移中，我们需要一个内容图像和一个风格图像，
TensorFlow深度学习实战（12）——词嵌入技术详解盼小辉丶深度学习 tensorflow 自然语言处理
TensorFlow深度学习实战（12）——词嵌入技术详解0.前言1.词嵌入基础2.分布式表示3.静态嵌入3.1Word2Vec3.2GloVe4.使用Gensim构建词嵌入5.使用Gensim探索嵌入空间6.动态嵌入小结系列链接0.前言在本节中，我们首先介绍词嵌入的概念，然后介绍两种实现词嵌入的方式：Word2Vec和GloVe，学习如何使用Gensim库从零开始构建语料库的词嵌入，并探索所创建
TensorFlow深度学习实战（7）——分类任务详解盼小辉丶深度学习 tensorflow 分类
TensorFlow深度学习实战（7）——分类任务详解0.前言1.分类任务1.1分类任务简介1.2分类与回归的区别2.逻辑回归3.使用TensorFlow实现逻辑回归小结系列链接0.前言分类任务(ClassificationTask)是机器学习中的一种监督学习问题，其目的是将输入数据(特征向量)映射到离散的类别标签。广泛应用于如文本分类、图像识别、垃圾邮件检测、医学诊断等多种领域。1.分类任务1.
【深度学习与大模型基础】第11章-Bernoulli分布，Multinoulli分布 lynn-66 深度学习与大模型基础概率论
一、Bernoulli分布1.基本概念想象你抛一枚硬币：正面朝上（记为1）概率是p（比如0.6）。反面朝上（记为0）概率是1-p（比如0.4）。这就是一个Bernoulli分布：只有两种可能结果的事件（成功/失败、是/否、开/关等），且概率固定。2.数学表示Bernoulli分布的概率公式：P(X=1)=p（比如“硬币正面”概率）P(X=0)=1-p（比如“硬币反面”概率）3.机器语言例子（Pyt
DeepSeek金句生成提示词库及金句示例（国企事业体制内专用）奔向理想的星辰大海技术研发人工智能机器学习深度学习
一、体制内专用提示词结构分析1.三维度组合公式：工作领域（主题场景）+关键政策（方法论/价值观）+目标人群（执行/受益者）二、分类金句示例▌基层治理类1.网格化管理+群众路线+社区工作者"小网格兜住大民生，铁脚板走出鱼水情"2.矛盾纠纷调解+枫桥经验+调解员"解千结不解法理情，化纠纷要化心间冰"3.物业管理+红色物业+业委会"管车库先管民心库，换门禁不换鱼水亲"▌乡村振兴类4.厕所革命+人居环境整
DeepSeek作词作曲成为全能音乐人奔向理想的星辰大海云原生人工智能机器学习深度学习
DeepSeek这样的纯文本大语言模型，它是只能处理文字，没办法直接输出图片，甚至音频的。如果你让它给你写首歌，它只会巴拉巴拉给你写歌词，不可能给你画五线谱，更不可能直接给你播放音乐。让DeepSeek写歌只会写歌词难道DeepSeek真的只会写歌词吗？在DeepSeek预训练模型的数据中，应当是训练了大量跟乐理和作曲相关的资料的。例如，你问DeepSeek一些乐理知识，它是能答上来的：DeepS
利用python从零实现Byte Pair Encoding(BPE) accurater python 开发语言
喜欢可以到我的主页订阅专栏哟(＾Ｕ＾)ノ~ＹＯ第一章：自然语言处理与分词技术基础1.1自然语言处理的核心挑战自然语言处理（NaturalLanguageProcessing,NLP）作为人工智能领域的重要分支，其核心目标是实现计算机对人类语言的理解与生成。在深度学习技术快速发展的今天，NLP面临着三大基础性挑战：语言的非结构化特性：自然语言具有复杂的语法结构、多变的语义表达和丰富的上下文依赖关系数
视频分析技术知识：如何评估视频分析深度学习模型的性能？ Oliverro 视频分析技术深度学习人工智能音视频网络科技
随着人工智能技术的飞速发展，深度学习在视频分析领域的应用日益广泛，其在安防监控、智能交通等多个行业展现出巨大的潜力与价值。准确评估视频分析深度学习模型的性能，对于优化模型结构、提升模型泛化能力、保障实际应用效果具有重要意义。本文将从多个维度，详细探讨视频分析深度学习模型性能评估的关键指标与方法。一、如何评估视频分析深度学习模型的性能1、分类任务的评估指标1）准确率（Accuracy）：表示模型正确
DeepSeek-R1的推理能力是如何一步一步提升的？——从R0到R1的推理能力跃迁之路大F的智能小课人工智能语言模型
本文我们仅聚焦在指标上分析推理能力是如何提升的。目录模型演进三阶段1.1R0：基础模型的能力奠基1.2蒸馏阶段：知识传递的艺术1.3R1-Zero：强化学习的突破尝试核心评测指标解析2.1AIME：数学竞赛的试金石2.2MATH-500：大学数学的全景扫描2.3GPQADiamond：跨学科思维的终极考场2.4LiveCodeBench：代码能力的实战检验关键技术抉择3.1蒸馏vs强化学习的路线之
使用deepseek时有哪些高阶技巧 zhaoyqcsdn 深度学习人工智能
使用DeepSeek时，掌握以下高阶技巧可以显著提升效率与输出质量：1.精准提示工程（PromptEngineering）角色设定：通过前置指令明确模型角色，如：“你是一名资深网络安全专家，用技术语言分析以下漏洞...”结构化指令：使用分点、格式标记增强逻辑性：“按以下结构回答：1.核心问题；2.根本原因；3.解决方案（分三步）”思维链引导：对复杂问题添加“请逐步推理并解释关键步骤”以激活深度分析
spark python编程林子雨_林子雨编著《Spark编程基础(Python版)》教材第5章的命令行和代码... weixin_39790168 spark python编程林子雨
林子雨、郑海山、赖永炫编著《Spark编程基础(Python版)》(教材官网)教材中的代码，在纸质教材中的印刷效果，可能会影响读者对代码的理解，为了方便读者正确理解代码或者直接拷贝代码用于上机实验，这里提供全书配套的所有代码。查看所有章节代码第5章SparkSQLfrompysparkimportSparkContext,SparkConffrompyspark.sqlimportSparkSes
spark编程基础python版实验报告_Spark课后实验报告 weixin_39714191
一、兼容问题Spark运行在Java8+，Python2.7+/3.4+和R3.1+上。对于ScalaAPI，Spark2.4.2使用Scala2.12。您需要使用兼容的Scala版本(2.12.x)。请注意，自Spark2.2.0起，对2.6.5之前的Java7，Python2.6和旧Hadoop版本的支持已被删除。自2.3.0起，对Scala2.10的支持被删除。自Spark2.4.1起，对S
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
【AI大模型】Cherry Studio和Deepseek模型搭建本地知识库+硅基流动API调用+本地ollama模型调用 JinSu_ 学习体会人工智能 Cherry Studio Deepseek模型硅基流动API调用本地ollama模型调用
背景说明1.知识管理需求与AI技术的融合在信息爆炸时代，个人与企业面临知识存储碎片化、检索效率低、多模态数据处理复杂等挑战。传统知识库依赖人工整理和规则化检索，难以应对动态增长的非结构化数据（如文档、图片、语音等），而AI大模型通过自然语言理解、推理能力及多模态分析，可实现智能化的知识提取、关联与交互，成为构建新一代知识库的核心技术支撑。2.DeepSeek-R1的核心技术优势作为近期备受关注的国
元模型与动态哲学：数字世界的“道”与编程新范式编程
使用deepkseekv3生成的，v3更新后好像强了不少。理论和哲学也让AI生成不少了，后面要开始发具体应用方面的了。一、重新思考编程的本质传统的编程语言建立在静态类型、预定义类和编译时约束的基础上，而动态模型提出了一种全新的编程范式：先有对象，后有类：在动态模型中，事物（对象）可以先存在，之后再通过描述者（类）来定义其行为和结构，这与现实世界的认知方式更为接近。万物皆可执行：任何模型都可以转化为
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key