winds_lyh

李宏毅机器学习作业2

学习打卡内容：

理解偏差和方差
学习误差为什么是偏差和方差而产生的，并且推导数学公式
过拟合，欠拟合，分别对应bias和variance什么情况
学习鞍点，复习上次任务学习的全局最优和局部最优
解决办法有哪些
梯度下降
学习Mini-Batch与SGD
学习Batch与Mini-Batch，SGD梯度下降的区别
如何根据样本大小选择哪个梯度下降(批量梯度下降，Mini-Batch）
写出SGD和Mini-Batch的代码
学习交叉验证
学习归一化
学习回归模型评价指标

1. 偏差与方差

1.1. 学习误差为什么是偏差和方差而产生的，并且推导数学公式

对测试样本 $x$ ,令 $y_D$ 为 $x$ 在数据集中的标记，y为x的真实标记， $f (x; D)$ 为训练集D上学得模型f在x上的预测输出。
方差：度量了同样大小的训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响，以回归任务为例，学习算法的期望预测为 $E_D[\bar{f}(x;D)]$ 使用样本数相同的不同训练集产生的方差为 $E_D[(f(x;D) - \bar{f}(x))^2]$
噪声：表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界，即刻画了学习问题本身的难度。噪声是指样本在数据集中的标记与真实标记的偏差。
$\varepsilon^2 = E_D[(y_D-y)^2]$
偏差: 度量了学习算法的期望预测与真实结果的偏离程度，即刻画了学习算法本身的拟合能力。期望输出与真实标记的差别称为偏差，即
$bias^2(x) = (\bar{f}(x) - y)^2$
泛化误差
对算法的期望平均预测误差，定义为：
$E(f;D) = E_D[(f(x;D) - y_D)^2]$

下面对算法的期望泛化误差进行分解：
$\begin{aligned} E(f;D) &= E_D[(f(x;D) - y_D)^2] \\ &=E_D[(f(x;D) - \bar{f}(x) + \bar f(x) -y_D)^2] \\ &=E_D[(f(x;D) - \bar{f}(x))^2] + E_D[( \bar f(x) -y_D)^2] + E_D[2(f(x;D) - \bar{f}(x))( \bar f(x) -y_D)] \\ &= E_D[(f(x;D) - \bar{f}(x))^2] + E_D[( \bar f(x) -y_D)^2] \\ &=E_D[(f(x;D) - \bar{f}(x))^2] + E_D[( \bar f(x) -y+y- y_D)^2] \\ &= E_D[(f(x;D) - \bar{f}(x))^2] + E_D[(\bar f(x) -y)^2] + E_D[(y- y_D)^2] + 2E_D[(\bar f(x) - y)(y - y_D)]\\ & = E_D[(f(x;D) - \bar{f}(x))^2] + E_D[(\bar f(x) -y)^2] + E_D[(y- y_D)^2] \end{aligned}$
于是， $bias^2(x) + var(x) + \varepsilon^2$

1.2 过拟合，欠拟合，分别对应bias和variance什么情况

过拟合：指模型在训练集上具有很好的效果，在测试集上效果却不好。说明有较大的variance
欠拟合：指模型不能很好的拟合训练数据，说明有较大的bias。

1.3 解决过拟合和欠拟合的方法

过拟合：
（1）从数据入手，增加更多的训练数据。
（2）降低模型复杂度
（3）正则化方法
（4）集成学习方法

欠拟合：
（1）添加新的特征。
（2）增加模型复杂度
（3）减小正则化系数。

2 梯度下降

2.1 SGD与mini-Batch

SGD:
经典的梯度下降法采用所有训练数据的平均损失来近似目标函数，在每次对模型参数进行更新时，需要遍历所有的训练数据。当M很大时，需要很大的计算量，耗费很长的计算时间，在时间应用中基本不可行。
为了解决该问题，采用随机梯度下降法，即用单个训练数据对模型的参数进行一次更新，大大加快了收敛速率，该方法也非常适用于数据源源不断到来的在线更新场景。
Min-Batch Gradient Descent:小批量梯度下降法
每次同时处理若干训练数据对模型的参数进行一次更新。这种方法能够降低随机梯度的方差，从而使得迭代算法更加稳定。假设需要同时处理m个训练数据 ${(x_{i_1},y_{i_1}),...,(x_{i_m},y_{i_m})}$ ，则目标函数及其梯度为
$L(\theta) = \frac{1}{m}\sum_{j=1}^m L(f(x_{i_j},\theta),y_{i_j})$ $\nabla L(\theta) = \frac{1}{m}\sum_{j=1}^m \nabla L(f(x_{i_j},\theta),y_{i_j})$

2.2 学习Batch与Mini-Batch，SGD梯度下降的区别

假设样本为M,
Batch：每次选择所有样本来对模型参数进行更新
SGD:每次选择一个训练样本来对模型参数进行更新，
min-Batch: 每次选择m 批量：单次迭代过程中用于求梯度下降法的样本总数
对于样本非常大的情况，批量越大，花的时间就越多，而且出现数据冗杂的情况越高
Batch：噪音少一些，幅度大一些。缺点：每次对整个训练集进行处理，那么数量集很大的时候耗费时间就会比较长。
SGD：从数据集中随机选择1个样本，迭代次数足够多，可以通过小得多的数据集估算（尽管过程非常杂乱）出较大的平均值。因为每次只对一个样本进行梯度下降，所以大部分时候是向着最小值靠近的，但也有一些是离最小值越来越远，因为那些样本恰好指向相反的方向，所以看起来会有很多噪音，但整体趋势是向最小值逼近。但SGD永远不会收敛，它只会在最小值附近不断的波动，不会到达也不会在此停留。SGD的噪音可以通过调节学习率来改善，但它有个很大的缺点，就是不能通过进行向量化来进行加速，因为每次都只是第一个样本进行处理。

Mini-Batch: 通常随机选取10~1000个样本，介于全批量梯度下降和随机梯度下降法之间。可以减少 SGD 中的杂乱样本数量，但仍然比全批量更高效。速度比BSD快，比SGD慢；精度比BSD低，比SGD高。
该方法有两个优点：一个是可以进行向量化，另一个是不同用等待整个训练集训练完就可以进行后续工作。

2.3 如何根据样本大小选择哪个梯度下降(批量梯度下降，Mini-Batch）

如果训练集较小，一般小于2000的，就直接使用Batch gradient descent
当样本非常大或数据源源不断到来时，建议使用mini-Batch.一般Mini Batch gradient descent的m取2的幂次时能够充分利用矩阵运算操作，所以可以在2的幂次中挑选最优的取值，例如32、64、128、256等。

2.4 写出SGD和Mini-Batch的代码

## SGD(随机梯度下降算法)


def gen_line_data(sample_num = 100):
    """
    y = 3*x1 + 4*x2
    return:
    """
    x1 = np.linspace(0,9,sample_num)
    x2 = np.linspace(4,13,sample_num)
    x = np.concatenate(([x1],[x2]),axis=0).T
    y = np.dot(x, np.array([3,4]).T)
    return x, y

def sgd(samples,y, step_size=0.01, max_iter_count=10000):
    """
    随机梯度下降法
    param samples:样本
    y: 结果值
    step_size:每一次迭代的步长
    max_iter_count: 最大迭代次数
    batch_size： 随机选取的相对于总样本的大小
    return
    """
    sample_num, dim = samples.shape
    y = y.flatten()
    w = np.ones((dim,),dtype = np.float32)
    loss = 10
    iter_count = 0
    while loss > 0.001 and iter_count < max_iter_count:
        loss = 0
        error = np.zeros((dim,), dtype=np.float32)
        for i in range(sample_num):
            predict_y = np.dot(w.T, samples[i])
            for j in range(dim):
                error[j] = (y[i] - predict_y)*samples[i][j]
                w[j] +=step_size * error[j]/sample_num
                
        for i in range(sample_num):
            predict_y = np.dot(w.T,samples[i])
            error = (1/(sample_num * dim)) * np.power((predict_y-y[i]),2)
            loss += error
            
        print('iter_count:' ,iter_count, "the loss:",loss)
        iter_count += 1
        
    return w

if __name__ == '__main__':
    samples, y = gen_line_data()
    w = sgd(samples, y)
    print(w)

# MBGD  小批量梯度下降法
import numpy as np
import random

def gen_line_data(sample_num = 100):
    """
    y = 3*x1 + 4*x2
    """
    x1 = np.linspace(0,9,sample_num)
    x2 = np.linspace(4,13,sample_num)
    x = np.concatenate(([x1],[x2]),axis = 0).T
    y = np.dot(x,np.array([3,4]).T)
    return x,y

def mbgd(samples, y,step_size = 0.01,max_iter_count=10000, batch_size=0.2):
    sample_num,dim = samples.shape
    y = y.flatten()
    w = np.ones((dim,),dtype=np.float32)
    loss = 10
    iter_count=0
    while loss > 0.001 and iter_count < max_iter_count:
        loss = 0
        error = np.zeros((dim,), dtype=np.float32)
        
        index = random.sample(range(sample_num), int(np.ceil(sample_num * batch_size)))
        batch_samples = samples[index]
        batch_y = y[index]
        
        for i in range(len(batch_samples)):
            predict_y = np.dot(w.T, batch_samples[i])
            for j in range(dim):
                error[j] += (batch_y[i] - predict_y)*batch_samples[i][j]
        for j in range(dim):
            w[j] += step_size * error[j]/sample_num
            
        for i in range(sample_num):
            predict_y = np.dot(w.T, samples[i])
            error = (1/(sample_num * dim))*np.power((predict_y - y[i]), 2)
            loss += error
            
        iter_count += 1
    return w
    
if __name__ == '__main__':
    samples, y = gen_line_data()
    w = mbgd(samples, y)
    print(w)

2.5 交叉验证

k-fold交叉验证：
首先将全部样本划分成k个大小等的样本子集，依次遍历这k个子集，每次把当前子集作为验证集，其余所有子集作为训练集，进行模型的训练和评估；最后把k次评估指标的平均值作为最终的评估指标。在实际实验中，k经常取10.

留一验证：
每次留下1个样本作为验证集，其余所有样本作为测试集。样本总数为n，依次对n个样本进行遍历，进行n次验证，再将评估指标求平均值得到最终的评估指标。在样本总数较多的情况下，留一验证法的时间开销极大。事实上，留一验证是留p验证的特例。留p验证hi每次留下p个样本作为验证集，而从n个元素中选择p个元素有 $C_n^p$ 种可能，因此它的时间开销更是远远高于留一验证，故而很少在实际工程中被应用。

2.6 归一化

为了消除数据特征之间的量纲影响，我们需要对特征进行归一化处理使得不同指标之间具有可比性。
对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内，最常用的方法主要有以下两种：
（1）线性函数归一化（Min-Max Scaling）它对原始数据进行线性变换，使结果映射到[0,1]范围，实现对原始数据的等比缩放。归一化公式如下： $X_{norm}= \frac{X-X_{min}}{X_{max} - X_{min}}$ 其中 $X$ 为原始数据， $X_{max}$ 、 $X_{min}$ 分别为数据最大值和最小值。
（2）零均值归一化（Z-Score Normalization）。它会将原始数据映射到均值为0、标准差为1的分布上。具体来说，假设原始特征的均值为 $\mu$ ，标准差为 $\sigma$ ，那么归一化公式定义为 $\frac{x-\mu}{\sigma}$
数据归一化并不是万能的。在实际应用中，通过梯度下降法求解的模型通常是需要归一化的，包括线性回归，逻辑回归，支持向量机、神经网络等模型。但对于决策树模型则并不适用。

2.7 学习回归模型评价指标

RMSE(平方根误差)经常被用来衡量回归模型的好坏。RMSE的计算公式为 $\sqrt{\frac{\sum_{i=1}^n(y_i - \hat{y_i})^2}{n}}$ 其中， $y_i$ 是第 $i$ 个样本点的真实值， $\hat{y_i}$ 是第i个样本点的预测值，n是样本点的个数。
一般情况下，RMSE能够很好的反映回归模型预测值与真实值的偏离程度，但在实际问题中，如果存在个别偏离程度非常大的离群点时，即使离群点数量非常少，也会让RMSE指标变得很差。
针对这个问题，可以从三个角度来思考。第一，如果这些离群点是噪声点，就需要在数据预处理的阶段把这些噪声点过滤掉，第二、如果不认为这些离群点时噪声点，就需要进一步提高模型的预测能力，将离群点产生的机制建模进去。第三，可以最后一个更适合的指标来评估该模型。关于评估指标，其实是存在比RMSE的鲁棒性更好的指标，比如平均绝对百分比误差（MAPE），它定义为： $\sum_{i=1}^n|\frac{y_i - \hat{y_i}}{y_i}| \times \frac{100}{n}$ 相比RMSE、MAPE相当于把每个点的误差进行了归一化，降低了个别离群点带来的绝对误差的影响。

NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
2025年大模型学习新攻略！掌握未来AI的关键技能 AI大模型-大飞人工智能产品经理程序员 Agent AI 大模型大模型教程
1.公开课（视频）：李宏毅机器学习斯坦福CS336：从零开始构建语言模型卡内基梅隆大学【多模态机器学习】RAGFromScratchHuggingFaceNLP课程2.机器学习和编程基础：pytorch官方中文教程[中英字幕]吴恩达机器学习李宏毅机器学习3.Attention机制：论文:《AttentionIsAllYouNeed》Transformer论文逐段精读【论文精读】-跟李沐学AIzhi
李宏毅机器学习——类神经网络训练不起来怎么办？ JustNow_Man 机器学习神经网络人工智能
https://www.bilibili.com/video/BV1Wv411h7kN?spm_id_from=333.788.videopod.episodes&vd_source=779fe6f5ae2ab98c0dc9480ff4ae61a3&p=201.局部最小值（localminima）与鞍点（saddlepoint）criticalpoint：hessian矩阵：1.1判断点类型：1.
李宏毅机器学习31——GAN（3） zeng-233
摘要：这节课学习条件生成下GAN的应用(CGAN)。conditionalGAN是指在有生成条件的前提下，通过对抗生成网络的方法，进行图像的生成。首先文字生成图片为例，加入GAN的方法，将文字和生成图片联系起来，输入到生成式中。这样解决了传统方法下，生成的图片不够真实的问题。之后又对这个方法进行了改进，将生成式的输入和输出同时输入到判别式，使文字和图片作为一对数据联系起来。之后又提出了一种新的判别
李宏毅机器学习笔记——反向传播算法小陈phd 机器学习机器学习算法神经网络
反向传播算法反向传播（Backpropagation）是一种用于训练人工神经网络的算法，它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数，从而最小化损失函数。反向传播是深度学习中最重要的算法之一，通常与梯度下降等优化算法结合使用。反向传播的基本原理反向传播的核心思想是利用链式法则（ChainRule）来高效地计算损失函数相对于每个参数的梯度。以下是反向传播的基本步骤：前向传播（Forwa
机器学习第二十五周周报 ConvLSTM 沽漓酒江机器学习人工智能
文章目录week25ConvLSTM摘要Abstract一、李宏毅机器学习二、文献阅读1.题目2.abstract3.网络架构3.1降水预报问题的建模3.2ConvolutionalLSTM3.3编码-预测结构4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Moving-MNISTDataset4.3.2雷达回波数据集4.4结论三、基于pytorch实现ConvLST
李宏毅机器学习——回归实验 migugu
importnumpyasnpimportmatplotlib.pyplotaspltfrompylabimportmpl#matplotlib没有中文字体，动态解决plt.rcParams['font.sans-serif']=['Simhei']#显示中文mpl.rcParams['axes.unicode_minus']=False#解决保存图像是负号'-'显示为方块的问题x_data=[3
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
李宏毅机器学习（二十）无监督学习Neighbor Embedding近邻嵌入 ca8519be679b
ManifoldLearning我们有时候的特征其实是低维度的放到高纬度上去，比如地球表面是2维的，但是被放到了3维空间，比如左下的S曲面，其实可以展开到2维平面上去，接下来就方便我们进一步计算分类等等插图1我们有如下几个降维方法LocallyLinearEmedding(LLE)局部线性嵌入具体是是怎么做的呢，我们点x和周围的点xj，给xj每个点加权wij求和，使其和xi最接近，然后投影到向量z
李宏毅pm2.5作业【转载】言糙 python numpy 机器学习
李宏毅机器学习PM2.5作业使用pyCharm2022.2.1版本，python10.0python也不会，计算机也不会，啥都不会，只带了个脑子考了计算机研究生。研究生选了人工智能方向。看来注定是漫长的学习之旅。PM2.5作业，我是一个字都看不懂。所以我采用了直接看答案的方案。把答案看懂也是一种本事。把答案CV上来。文章目录前言一、pandas是什么？二、使用步骤1.引入库2.提取TEST数据集3
Python 学习工具及资源 Lanlan_78d1
小甲鱼Python基础学习到P19（函数）之前image.png菜鸟语法查询Anaconda安装教学Jupyter教学*李宏毅机器学习
Transformer 代码补充 Karen_Yu_ python 深度学习 pytorch transformer
本文是对Transformer-Attentionisallyouneed论文阅读-CSDN博客以及【李宏毅机器学习】Transformer内容补充-CSDN博客的补充，是对相关代码的理解。先说个题外话，在之前李宏毅老师的课程中提到multi-headattention是把得到的qkv分别乘上不同的矩阵，得到更多的qkv。实际上，这里采用的方法是直接截取，比如这里有两个头，那么q^i就被分成两部分
【李宏毅机器学习】Transformer 内容补充 Karen_Yu_ 自然语言处理人工智能 transformer
视频来源：10.【李宏毅机器学习2021】自注意力机制(Self-attention)(上)_哔哩哔哩_bilibili发现一个奇怪的地方，如果直接看ML/DL的课程的话，有很多都是不完整的。开始思考是不是要科学上网。本文用作Transformer-Attentionisallyouneed论文阅读-CSDN博客的补充内容，因为发现如果实操还是有不能理解的地方，所以准备看看宝可梦老师怎么说×Sel
【LLM | 基础知识】自注意力机制 Self-attention [李宏毅机器学习] XMUJason 大语言模型LLM chatgpt 笔记 nlp
⭐引言本文主要参考李宏毅老师对于自注意力机制的讲解内容，但在此基础之上进行了一定的补充和删减，文中大部分插图来源于李宏毅老师的课件。本文的主要目的是梳理清楚自注意力机制的基本原理，理解什么是自注意力机制，不关注代码实现和具体的数学运算。本文尽可能把内容只控制在自注意力机制的基本框架上，不进行过多的相关概念的扩展，以免被其他相关内容转移注意力。1.从“单向量输入”到“多向量输入”在之前的机器学习方法
李宏毅机器学习（二十三）无监督学习Deep Generative Model(二) ca8519be679b
内容衔接上一讲，上节我们讲到VAE，我们为什么用VAE而不用auto-encoder呢，直觉上的原因是如果是auto-encoder，我们期待的是输入满月解码后还是满月，输入半月输出还是半月，但是我们能保证中间状态时候我们的输出是3/4月吗，结果往往不是；如果是VAE，我们就会引入一定的噪声，使得一定范围内输出都是满月，一定范围内输出都是半月，中间的公共部分由于我们要Minimize2者的误差，所
李宏毅机器学习——深度学习训练的技巧 migugu
神经网络训练的技巧优化失败的原因:局部最小值或鞍点，可以通过对H矩阵特征值正负性进行判断batch：加快梯度的计算，更新参数的速度比较快momentum:越过局部最小值或鞍点learningrate:自动调整学习率如RMSProp等normalizationdropout
李宏毅机器学习——初识深度学习 migugu
深度学习简介深度学习的历史1958:Perceptron(linearmodel)1969:Perceptronhaslimitation1980s:Multi-layerperceptronDonothavesignificantdifferencefromDNNtoday1986:BackpropagationUsuallymorethan3hiddenlayersisnothelpful19
李宏毅机器学习第一周_初识机器学习 Nyctophiliaa 机器学习人工智能深度学习
目录摘要一、机器学习基本概念1、MachineLearning≈LookingforFunction2、认识一些专有名词二、预测YouTube某天的浏览量一、利用Linearmodel二、定义更复杂的函数表达式三、ReLU函数四、Sigmoid函数与ReLU函数的对比三、反向传播(Backpropagation)一、反向传播的基本思想(正向计算-误差计算-梯度计算-参数更新)二、计算过程总结摘要在
李宏毅机器学习_卷积神经网络(CNN) Nyctophiliaa 机器学习 cnn 深度学习
目录摘要Abstract一、什么是CNN二、ImageClassification三、Observation1一、Simplification1四、Observation2五、BenefitofConvolutionalLayer六、ConvolutionalLayer七、MultipleConvolutionalLayers八、ComparisonofTwoStories九、Observatio
李宏毅机器学习第十六周周报NAT&HW5 沽漓酒江机器学习人工智能
文章目录week16Non-autoregressiveSequenceGeneration摘要Abstract一、李宏毅机器学习Non-autoregressiveSequenceGeneration1.问题阐述1.1Autoregressivemodel1.2Non-autoregressivemodel(mostlybyTransformer)2.Solution2.1VanillaNAT(
2023春季李宏毅机器学习笔记 02 ：机器学习基本概念女王の专属领地机器学习深度学习 #李宏毅2023机器学习机器学习笔记人工智能
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、機器學習基
2023春季李宏毅机器学习笔记 03 ：机器如何生成文句女王の专属领地 #李宏毅2023机器学习机器学习深度学习笔记机器学习人工智能深度学习
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、大语言模型
Chat GPT4来了，它和3.5区别在哪？李宏毅机器学习笔记抱抱小杠杠机器学习人工智能笔记
听说GPT4模型更大、参数更多，功能更强，具体它好在哪里？GPT4真的能看懂图片吗？官方回答：不太能~~下面这张图片是将两个不存在的网址输入进GPT4，问它看到了什么，结果发现GPT真的会胡言乱语，它会根据网址中出现了“man”这个单词，就说他看到了“一个拿着手枪的男人。。。巴拉巴拉”明显就是在胡编乱造！而如果网址中出现了“girl”这个单词，GPT又会说他看到了“一个穿着校服的女孩子。。。巴拉巴
李宏毅机器学习-PCA Zhuanshan_ 机器学习人工智能
视频链接：李宏毅2020机器学习深度学习(完整版)国语用最直观的方式告诉你：什么是主成分分析PCA【中字】主成分分析法（PCA）|分步步骤解析看完你就懂了！无监督学习做什么无监督学习主要做两件事情：聚类&降维：比如说下图的树木，只有输入图片，没有标签，我们希望通过一个函数抽象的表达他们，于是抽出一个更抽象的表述生成器：也就是无中生有，我们有很多图片，但不知道是怎么生成的，于是需要一个好的函数，将刚
2023春季李宏毅机器学习笔记 05 ：机器如何生成图像女王の专属领地 #李宏毅2023机器学习机器学习笔记人工智能机器学习李宏毅 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、图像生成常
李宏毅机器学习第二十二周周报GAN理论2 沽漓酒江机器学习生成对抗网络人工智能
文章目录week22TheorybehindGAN2摘要Abstract一、李宏毅机器学习0.上周内容概述1.GAN的训练过程2.生成器与分辨器的算法细节3.整体算法描述4.原文中生成器目标函数的实现方式二、文献阅读1.题目2.abstract3.网络架构3.1无数据生成方法3.2Data-EnrichingGAN(DeGAN)4.文献解读4.1Introduction4.2创新点4.3实验过程4
李宏毅机器学习第二十周周报GAN4 沽漓酒江机器学习人工智能
文章目录week20GAN4摘要Abstract一、李宏毅机器学习——GAN41.LearningfromUnpairedData2.CycleGAN3.Application二、文献阅读1.题目2.abstract3.网络架构3.1损失函数3.1.1对抗性损失3.1.2循环一致性损失3.1.3整体目标3.1.4identityloss3.2网络结构3.3训练细节3.4网络架构3.4.1生成器部分
李宏毅机器学习第二十一周周报GAN理论沽漓酒江机器学习生成对抗网络人工智能
文章目录week21TheorybehindGAN摘要Abstract一、李宏毅机器学习——TheorybehindGAN1.Generation2.最大似然估计3.Generator3.Discriminator二、文献阅读1.题目2.abstract3.网络架构3.1SequenceGenerativeAdversarialNets3.2SeqGANviaPolicyGradient3.3Th
李宏毅机器学习第十八周周报GAN2 沽漓酒江机器学习人工智能
文章目录week18GAN2摘要Abstract一、TheorybehindGAN1.训练目的2.Wassersteindistance二、文献阅读1.题目2.abstract3.网络架构3.1WassersteinDistance3.2WasserteinGANs3.3Gradientpenalty4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Difficulti
李宏毅机器学习第十九周周报GAN3 沽漓酒江机器学习人工智能 gan
文章目录week19GAN3摘要Abstract一、李宏毅机器学习——GAN31.Introduce2.DifficultyinGANtraining3.EvaluationofGeneration4.ConditionalGeneration二、文献阅读1.题目2.abstract3.文章主要内容3.1基于GANs的双时间尺度更新规则3.2Adam确保TTUR收敛3.2.1使用Adam以降低收敛
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23