南鸢北折

【浙江大学机器学习胡浩基】04 人工神经网络

第一节神经元的数学模型

MP模型

第二节感知器算法

感知器算法

1.一个事实

2.感知器算法收敛定理

3.感知器算法收敛定理的证明

第三节感知器算法的意义

1.感知器算法首先提出了一套机器学习算法的框架

2.训练数据的复杂度应该和预测函数的复杂度相匹配

3.感知器算法的优势

第四节第一次寒冬

图像在计算机中的存储

1.灰度图

2.彩色图

3.二值图

4.连通图的分类问题

第五节多层神经网络

1.多层神经网络结构（以两层为例）

2.阶跃函数

第六节梯度下降算法

1.设计网络结构的两个准则

2. 梯度下降法

第七节后向传播算法（上）

后向传播算法

第八节后向传播算法（下）

现总结一般情况下的后向传播算法流程

第九节后向传播算法的应用

1.对非线性函数的改进

对非线性函数的改进：使用SIGMOID函数。其在0处可求导，且导函数形式简洁

对非线性函数的改进：使用双曲正切函数

对目标函数的改进：使用基于SOFTMAX和交叉熵的目标函数

2.对梯度下降法的改进：随机梯度下降法(SGD)

第十节兵王问题

第十一节参数设置

1.激活函数

2.6个训练神经网络的建议

3.训练神经网络的各种经验

目标函数的选择

训练数据的归一化

ω和b的初始化

Batch Normalization

参数更新策略

第一节神经元的数学模型

MP模型

用向量形式表达

实际上，这是对某个复杂函数的一阶泰勒近似

第二节感知器算法

如何求出权重ω和偏置b？

假设输入为（Xi，yi），i=1~N

其中Xi为训练数据，yi为对应标签

我们需要找出合适的权重ω和偏置b，使得以下式子成立

若以上式子成立，则称此训练数据获得了平衡。否则，称未获得平衡

显然，此任务和支持向量机的任务是完全一致的。训练数据可以获得平衡等价于数据集线性可分。但是，感知器算法寻找ω和b的方法不同于支持向量机

感知器算法

第二种情况同理

通过不断迭代，使得X越来越接近平衡状态

一个事实

只要训练数据线性可分，循环一定可以最终停止，并达到平衡状态

下面证明此事实

定义增广向量：对于某个Xi。定义其增广向量如下

原任务为

通过使用增广向量得到原任务的简化表达

下图是基于增广向量的感知器算法

基于增广向量的感知器算法和原算法是等价的

感知器算法收敛定理

（注：以上条件完全等价于训练数据集线性可分）

使用上述增广向量的感知器算法，一定可以

（注：此时找到的ω不一定是ωopt）

现证明感知器算法收敛定理

感知器算法收敛定理的证明

由于

所以

定义ω(k)为第k次改变后的权重向量值，存在以下两种情况

第一种

第二种

将等式两边同时减去aωopt

将等式两边取模并平方，右边展开得到

又由于

于是，我们得到

这意味着w每更新一次，它离aωopt的距离至少减少1个单位

假设W的初值为w(0)

记k等于

则最多经过k次迭代后

W的值收敛至aωopt。证明完毕。下面是完整证明过程

第三节感知器算法的意义

感知器算法首先提出了一套机器学习算法的框架

其中

假设X的维度是m，则θ的维度是m+1

训练数据的复杂度应该和预测函数的复杂度相匹配

图一：模型欠拟合，指训练数据的复杂度比预测函数的复杂度更高的情况

图三：模型过拟合，指预测函数的复杂度比训练数据的复杂度更高的情况

感知器算法的优势

相比于支持向量机算法，感知器算法消耗的内存和计算资源非常少

第四节第一次寒冬
图像在计算机中的存储
灰度图

此图像在计算机中为一个512*512的矩阵

像素值是0~255的整数，其中0代表纯黑色，255代表纯白色

彩色图

此图像在计算机中为三个512*512的矩阵

分别代表红色(R)、绿色(G)、蓝色(B)

二值图

每个像素要么是白色，要么是黑色

0代表白色 1代表黑色

假设原图的长为M宽为N

将图片的像素矩阵按列逐一排列

得到一个维度为MN的列向量X

y为标签

y=+1表示X是连通图

Y=-1表示X是非连通图

连通图的分类问题

下面证明识别连通图问题是非线性可分的

用反证法。假设这个问题是线性可分的，那么一定存在(W，b)使得

以上五张图中，最左侧的图片是对各边的编号情况

标注为图一图二的是连通图，图三图四是非连通图

由于图一是连通图，它所对应的y=+1

即(1)+(2)+(3)+(5)+(6)+b>0

其中(1)代表编号为①的边上的像素值分别乘以W相应分量然后再求和的结果，其他同理，得到以下四个式子

图一：(1)+(2)+(3)+(5)+(6)+b>0 ①

图二：(1)+(2)+(3)+(4)+(7)+b>0 ②

图三：(1)+(2)+(3)+(4)+(5)+b<0 ③

图四：(1)+(2)+(3)+(6)+(7)+b<0 ④

①+②得到

2*[(1)+(2)+(3)+b]+(4)+(5)+(6)+(7)>0

③+④得到

2*[(1)+(2)+(3)+b]+(4)+(5)+(6)+(7)<0

矛盾！因此连通图非线性可分

1969-1980年，人工神经网络的第一次寒冬

第五节多层神经网络
多层神经网络结构（以两层为例）

即

待求参数一共有9个

注意该结构中的非线性函数φ是必须的。如果没有非线性函数，将得到

此时仍然是加权求和再加偏置的形式，与单个神经元模型没有本质区别。这也就意味着，多层神经网络的层与层之间如果不加非线性函数φ，将会退化为感知机模型。

那么，加入的非线性函数是什么呢？

阶跃函数

为什么要用阶跃函数作为多层神经网络层与层之间的非线性函数？

实际上，有以下定理：

如果非线性函数采用阶跃函数，那么三层神经网络可以模拟任意的非线性函数

下面证明此定理

假设一个特征空间为二维的二分类问题，非线性函数将平面划分出一个三角区域

假设三条直线的方程如下图标注

假定对三条直线的任意一条来说，对于平面上的任意一点，如果和C1区域在直线的同侧，则代入方程后的值大于0。这是一定可以做到的，因为w和b同取相反数，表示的直线是不变的。

现在构造一个两层的神经网络来实现在三角形得内输出大于，在三角形外输出小于0

如果一点在三角形内部，即C1区域，则第一层的三个神经元输出的a1、a2、a3均大于0，经过阶跃函数后输出的z1、z2、z3均为1。如果一点在三角形外，即C2区域，则a1、a2、a3中至少有一个小于0，经过阶跃函数后输出的z1、z2、z3至少有一个等于0。因此，将第二层神经网络的所有权重设置为1，偏置设置为-2.5，即可满足某点在三角形得内输出大于，在三角形外输出小于0

同理，如果C1区域为平面四边形，只需在神经网络的第一层增加一个神经元，第二层的所有权重设置为1，偏置设置为-3.5即可

以此类推，对于C1区域为任意的多边形的情况，都可以使用二层神经网络来解决二分类问题

当C1区域为平面上的封闭曲线时，可以用多边形对其进行逼近，当边数不断增加，多边形可以以任意精度逼近

现考虑有三角形区域A和三角形区域B，即两个三角形区域的情形

在两个三角形区域中的任意一个时，有两种情况

C1=1，C2=0或者C1=0，C2=1

当不在两个三角形区域当中时

C1=C2=0

此时只需将第三层神经网络的所有权重设置为1，偏置设置为-0.5，即可满足要求

第六节梯度下降算法
设计网络结构的两个准则

如果问题是简单的，神经网络的结构也可以简单一点。如果问题是复杂的，神经网络的结构也应更复杂。这里的复杂程度指的是神经网络的层数以及每层神经网络的个数

如果训练样本很多，可以适当增加神经网络的复杂度。如果训练样本很少，神经网络的复杂度不能设置的过高。

如何解神经网络中待求的参数？

下图是一个两层神经网络的简单例子

为了使y和标签Y尽可能接近，定义目标函数为

其中E(X，Y)表示遍历训练样本及标签的数学期望

由于y是非凸函数，因此无法像支持向量机算法一样求出唯一的全局最值。我们采用梯度下降法求局部极小值。

梯度下降法

步骤如下

先以一维情况为例。泰勒公式如下

将如下式子带入泰勒公式

得到

α被称为学习率，这是人工神经网络中最重要的超参数之一

当α设置过大时，得不到局部极值点

当α设置过小时，收敛速度过慢，而且可能会卡在小的“凹陷”之中

接下来说明二维情况。将二维函数E(ω，b)泰勒展开

将以下式子带入泰勒公式

得到

如果两个偏导数不全为零，则

以上是一维和二维的情况。多维的情形同理。

第七节后向传播算法（上）

此二层神经网络模型中，待估计的参数有9个

目标函数如下

可以设置为

而

现在需要求出如下9个偏导数

后向传播算法

首先求出红色圈中的三个偏导数，即枢纽变量的偏导数

显然

根据链式求导法则，得到

因此

而其中

最终整理得到

同理

至此，枢纽变量的偏导数已经全部求出。分别为

接下来根据上面的三个重要结果，求其它偏导数

由于y=ω1z1+ω2z2+b，则

由于

得到

同理，由于

得到

最终得到9个偏导数为

接下来总结人工神经网络后向传播算法的步骤（二层）

第八节后向传播算法（下）

如上图的多层神经网络，结构很复杂。可以用矩阵形式来简化表示

接下来我们要求E对各参数的偏导函数。类似于上一节的求导方式，我们先要求出E对于枢纽变量的偏导。

我们设置枢纽变量为

先计算最后一层，即l层

第m+1层的枢纽变量通过以下的方式求出第m层的枢纽变量

其中Sm+1表示第m+1层的神经元个数。计算化简得到第m层的枢纽变量等于如下式子

接下来求

第m层和第m+1层的神经元关系图如下

根据图示，显然可以得到

将以上结果带入之前的递推公式，最终可以得到

因此，可以由第l层的枢纽变量的偏导，递推至第m层的枢纽变量的偏导

易求出

现总结一般情况下的后向传播算法流程

第九节后向传播算法的应用

对非线性函数的改进

阶跃函数存在的问题：X=0处无法求导，但是在上一节中得到的递推公式中，需要对非线性函数进行求导

对非线性函数的改进：使用SIGMOID函数。其在0处可求导，且导函数形式简洁

对非线性函数的改进：使用双曲正切函数

其导数的形式也很简洁，如下

对目标函数的改进：使用基于SOFTMAX和交叉熵的目标函数

其中向量z为多层神经网络最后一层的输出

其中SOFTMAX的函数形式为

显然

基于交叉熵的目标函数为

交叉熵反应的是两个概率分布Y与y的相似程度

有以下两个事实

利用此目标函数并使用后向传播算法时

对梯度下降法的改进：随机梯度下降法(SGD)

一般梯度下降法存在的问题

如果对于每个训练样本都要更新一次参数，训练速度将会非常慢

如果某个训练数据存在较大误差，则此误差将会传导至每一个参数中去

随机梯度下降法的要点

按照BATCH遍历所有训练样本一次，我们称为一个EPOCH。在实际训练中，我们根据BATCH多次遍历所有训练样本，即训练不止一个EPOCH。对于每一个EPOCH，我们需要随机打乱所有的训练样本的次序，从而增加BATCH中训练样本的随机性

第十节兵王问题

vec = zeros(6,1);
xapp = [];
yapp = [];
while ~feof(fid)
    string = [];
    c = fread(fid,1);
    flag = flag+1;
    while c~=13
        string = [string, c];
        c=fread(fid,1);
    end;
    fread(fid,1);  
    if length(string)>10
        vec(1) = string(1) - 96;
        vec(2) = string(3) - 48;
        vec(3) = string(5) - 96;
        vec(4) = string(7) - 48;
        vec(5) = string(9) - 96;
        vec(6) = string(11) - 48;
        xapp = [xapp,vec];
        if string(13) == 100
            yapp = [yapp,[1,0]'];%独热向量
        else
            yapp = [yapp,[0,1]'];%独热向量

        end;
    end;
end;
fclose(fid);

[N,M] = size(xapp);
p = randperm(M); %Shuffle the network
ratioTraining = 0.15; %训练数据集所占比例
ratioValidation = 0.05;%验证数据集所占比例
ratioTesting = 0.8;%测试数据集所占比例
xTraining = [];
yTraining = [];
for i=1:floor(ratioTraining*M)
    xTraining  = [xTraining,xapp(:,p(i))];
    yTraining = [yTraining,yapp(:,p(i))];
end;
xTraining = xTraining';
yTraining = yTraining';

[U,V] = size(xTraining);
avgX = mean(xTraining);
sigma = std(xTraining);
xTraining = (xTraining - repmat(avgX,U,1))./repmat(sigma,U,1);%归一化：减去均值，除以方差

xValidation = [];
yValidation = [];
for i=floor(ratioTraining*M)+1:floor((ratioTraining+ratioValidation)*M)
    xValidation  = [xValidation,xapp(:,p(i))];
    yValidation = [yValidation,yapp(:,p(i))];
end;
xValidation= xValidation';
yValidation = yValidation';

[U,V] = size(xValidation);
xValidation = (xValidation - repmat(avgX,U,1))./repmat(sigma,U,1);%归一化：减去均值，除以方差


xTesting = [];
yTesting = [];
for i=floor((ratioTraining+ratioValidation)*M)+1:M
    xTesting  = [xTesting,xapp(:,p(i))];
    yTesting = [yTesting,yapp(:,p(i))];
end;
xTesting = xTesting';
yTesting = yTesting';
[U,V] = size(xTesting);
xTesting = (xTesting - repmat(avgX,U,1))./repmat(sigma,U,1);%归一化：减去均值，除以方差

%create a neural net
clear nn;

nn = nn_create([6,10,10,10,10,10,10,10,10,10,10,2],'active function','relu','learning rate',0.005, 'batch normalization',1,'optimization method','Adam', 'objective function', 'Cross Entropy');
%创建神经网络。其中[6,10,10,10,10,10,10,10,10,10,10,2]代表输入输出的维度和神经网络每一层的神经元个数。由于输入是6个维度，因此神经网络第一层的神经元个数为6。其中输入是6个维度，输出是两个维度
%relu为神经网络的激活函数
%学习率learning rate=0.005
%目标函数objective function为交叉熵

%train
option.batch_size = 100;%每个mini-BATCH中有100个训练样本
option.iteration = 1;

iteration = 0;
maxAccuracy = 0;
totalAccuracy = [];
maxIteration = 10000;%最大的训练轮次为10000轮
while(iteration<=maxIteration)
    iteration = iteration +1; 
    nn = nn_train(nn,option,xTraining,yTraining);
    totalCost(iteration) = sum(nn.cost)/length(nn.cost);%平均损失
    [wrongs,accuracy] = nn_test(nn,xValidation,yValidation);%验证集上测试识别率
    totalAccuracy = [totalAccuracy,accuracy];
    if accuracy>maxAccuracy
        maxAccuracy = accuracy;
        storedNN = nn;
    end;
    cost = totalCost(iteration);
    accuracy
    cost
end;
[wrongs,accuracy] = nn_test(storedNN,xTesting,yTesting);%在测试集上测试最后的训练效果

第十一节参数设置
激活函数

6个训练神经网络的建议

1.一般情况下，在训练集上的目标函数的平均值会随着训练的深入而不断减小。如果这个指标有增大情况，停下来。

一般有两种情况

①采用的模型不够复杂，以至于不能在训练集上完全拟合

②已经训练得很好了

2.分出一些验证集，训练的本质目标是在验证机上获取最大的识别率

因此在训练一段时间后，必须在验证集上测试识别率，保存使得验证集上识别率最大的模型参数，作为最后的结果。

3.注意调整学习率，如果刚刚训练几步损失函数就增加，一般来说是学习率太高了。如果每次损失函数的值变化很小，说明学习率太低

4.Batch Normalization 比较好用，用了这个后，对学习率、参数更新策略等不敏感。建议如果用Batch Normalization, 更新策略用最简单的SGD即可，我的经验是加上其他反而不好。

5.如果不用Batch Normalization, 我的经验是，合理变换其他参数组合，也可以达到目的。

6.由于梯度累积效应，AdaGrad, RMSProp, Adam三种更新策略到了训练的后期会很慢，可以采用提高学习率的策略来补偿这一效应。

训练神经网络的各种经验

目标函数的选择

可以加入正则项

如果是分类问题，F(W)可以采用SOFTMAX函数和交叉熵的组合

训练数据的归一化

保证数据的每个维度都落在相对固定的区间

ω和b的初始化

Batch Normalization

参数更新策略

你可能感兴趣的:(【浙江大学机器学习胡浩基】,人工智能,算法,神经网络)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
今日联对0306 诗图佳得
自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.1、试对肖老师联：烟销皓月临江浒，夜笼寒沙梦晚舟。耀哥求正2、试对萧老师联:烟销浩月临江浒，雾散乾坤解汉城。秀霞习作请各位老师校正3、自对联：烟销皓月临江浒，水漫金山荡塔裙。一一肖士平2020.3.6.4、试对肖老师垫场联：烟销皓月临江浒，雾锁寒林缈葉丛。小智求正[抱拳]5、试对肖老师联：烟销皓月临江浒；风卷乱云入峰巅。一一五品6
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
2019-08-16 希望在东方
《春游荣华山》春游荣华山，乍暖还寒。青苔路，石阶险。山路弯上弯！为寻古寺往幽探。细雨已润江南岸，初春芳草现。老树新芽冒枝端，人间又过到新年。今游荣华山，树茂参天，古寺悠闲。细雨飘落发端！三眼井旁，投币许心愿，并祷一世安然。更喜大女明事端，应心安，放开颜。修竹静默，雨中吐心愿。待得春风浩吹时，春笋节节攀。图片发自App图片发自App图片发自App
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
渝婧感恩日记第68天梁渝婧lydia
1.哇！我真是太幸福啦！感恩奇迹感恩训练营毕业典礼，让我能共振到同学们的喜悦和能量，感谢！感谢！感谢！2.哇！我真是太幸福啦！感恩每天早起，运动3公里！这个星期又做到连续三天，不间断！感谢亲爱的渝婧！你真的是非常的棒！加油，继续坚持！感谢！感谢！感谢！3.哇！我真是太幸福啦！感恩曾正波班主任给我们分享的艾宾浩斯的记忆曲线255学习法，让我蠢蠢欲试，感谢！感谢！感谢！4.哇！我真是太幸福啦！感恩胜利
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
准备胡珊珊乐平九小
尊敬的各位领导、各位同仁们：大家上午好！我是来自乐平九小的胡珊珊。今天很高兴能有机会给大家做“智慧作业”应用培训。说到“智慧作业”我感触颇多，我是在智慧作业中成长起来的，我也时常以自己是一名“智慧作业人”自居。早在2020年疫情期间，学校电教处周光杰主任在学校群里发出智慧作业抢题通知，我看了有些心动，一节微课相当于一次省级公开课，这对于我们普通老师是多么难得的机会啊。但想归想，我也不会用软件啊，再
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
2021-11-18 安安303
刘红雅中原焦点团队分享第135天筑基第4课社会心理学接上一课，心理现象。需要和动机所有的动机行为受需要的影响，现在的孩子很多方面不需要，是因为得到的太多需要使机体内部不平衡的状态，现在很多需要满足的过多，是“厌”，孩子要越用越有用，没有用到自己，自己没有价值感成就感，他就不需要开发自己的潜力。对自己和孩子的生活留白不断的学习成长，实现自己。所有有情绪的地方是触动了需求，需求没有被满足，当一个人知道
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

【浙江大学机器学习胡浩基】04 人工神经网络

第一节 神经元的数学模型

MP模型

第二节 感知器算法

感知器算法

一个事实

感知器算法收敛定理

感知器算法收敛定理的证明

第三节 感知器算法的意义

感知器算法首先提出了一套机器学习算法的框架

训练数据的复杂度应该和预测函数的复杂度相匹配

感知器算法的优势

第四节 第一次寒冬

图像在计算机中的存储

灰度图

彩色图

二值图

连通图的分类问题

第五节 多层神经网络

多层神经网络结构（以两层为例）

阶跃函数

第六节 梯度下降算法

设计网络结构的两个准则

梯度下降法

第七节 后向传播算法（上）

后向传播算法

第八节 后向传播算法（下）

现总结一般情况下的后向传播算法流程

第九节 后向传播算法的应用

对非线性函数的改进

对非线性函数的改进：使用SIGMOID函数。其在0处可求导，且导函数形式简洁

对非线性函数的改进：使用双曲正切函数

其导数的形式也很简洁，如下

对目标函数的改进：使用基于SOFTMAX和交叉熵的目标函数

对梯度下降法的改进：随机梯度下降法(SGD)

第十节 兵王问题

第十一节 参数设置

激活函数

6个训练神经网络的建议

训练神经网络的各种经验

目标函数的选择

训练数据的归一化

ω和b的初始化

Batch Normalization

参数更新策略

你可能感兴趣的:(【浙江大学机器学习胡浩基】,人工智能,算法,神经网络)

第一节神经元的数学模型

第二节感知器算法

第三节感知器算法的意义

第四节第一次寒冬

第五节多层神经网络

第六节梯度下降算法

第七节后向传播算法（上）

第八节后向传播算法（下）

第九节后向传播算法的应用

第十节兵王问题

第十一节参数设置