winds_lyh

李宏毅机器学习作业1

学习打卡任务内容：

了解什么是Machine learning
学习中心极限定理，学习正态分布，学习最大似然估计
- 推导回归Loss function
- 学习损失函数与凸函数之间的关系
- 了解全局最优和局部最优
学习导数，泰勒展开
- 推导梯度下降公式
- 写出梯度下降的代码
学习L2-Norm，L1-Norm，L0-Norm
- 推导正则化公式
- 说明为什么用L1-Norm代替L0-Norm
- 学习为什么只对w/Θ做限制，不对b做限制

machine learning

机器学习，就是“根据所给数据，寻找一个函数，给出适当输出”。通过这个函数，我们可以给它一个输入，得到理想的、正确的输出。我们通常需要给它数据，训练一个机器的学习能力。

机器学习三部曲

Step1： model --a set of function
建立一个模型，该模型中会包含成千上万的function
Step2: Goodness of function
根据某个规则来评价模型的好坏
Step3: pick a best of function
挑选一个最好的模型

Regression

线性回归的定义是：对应输入的数据，能够找到一个函数使得输出值与原来输出值非常接近，输出值是数值型的。

中心极限定理

中心极限定理：
样本的平均值约等于总体的平均值。
不管总体是什么分布，任意一个总体的样本平均值都会围绕在总体的整体平均值周围，并且呈正态分布。

线性回归的loss function推导

假设线性回归的方程式为 $y^{(i)} = \theta^Tx^{(i)}+\varepsilon^{(i)}$ 其中 $y^{(i)}$ 为第 $i$ 个样本预测值， $x^{(i)}$ 为第 $i$ 个样本输入值， $\theta^T$ 为参数， $\varepsilon^{(i)}$ 为第 $i$ 个样本误差项。
我们假设误差 $\varepsilon^{(i)}$ 是独立同分布的，服从均值为0，方差 $\sigma$ 为的Gaussion分布。则有 $\varepsilon^{(i)} \sim N(0,\sigma^2)$ ，则 $\varepsilon^{(i)}$ 的密度函数为 $p(\varepsilon^{(i)}) =\dfrac{1}{\sqrt{2\pi}\sigma} exp(-\dfrac{(\varepsilon^{(i)})^2}{2\sigma^2})$ 由于 $\varepsilon^{(i)}=y^{(i)}-\theta^Tx^{(i)}$ ，则有 $p(y^{(i)}|x^{(i)};\theta) =\dfrac{1}{\sqrt{2\pi}\sigma} exp(-\dfrac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2})$
由于每个样本是独立同分布的，下面采用极大似然估计来估计 $\theta$ 值，
则有似然函数为
$L(\theta)=p(Y|X;\theta)=\prod_{i=1}^n \dfrac{1}{\sqrt{2\pi}\sigma} exp(-\dfrac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2})$ ,
对两边取log有：
$\begin{aligned} l(\theta)&=lnL(\theta) \\ &= ln \prod_{i=1}^np(y^{(i)}|x^{(i)};\theta) \\ &=\sum_{i=1}^n \dfrac{1}{\sqrt{2\pi}\sigma} exp(-\dfrac{(y^{(i)}-\theta^Tx^{(i)})^2}{2\sigma^2}) \\ &=nln\dfrac{1}{\sqrt{2\pi}\sigma} -\dfrac{1}{\sigma^2}* \dfrac{1}{2}\sum_{i=1}^n(y^{(i)}-\theta^Tx^{(i)})^2 \end{aligned}$

则对 $l(\theta)$ 最大化转换成对 $\dfrac{1}{2}\sum_{i=1}^n(y^{(i)}-\theta^Tx^{(i)})^2$ 的最小化。记 $J(\theta) = \dfrac{1}{2}\sum_{i=1}^n(y^{(i)}-\theta^Tx^{(i)})^2$ 为线性回归的损失函数。

求gradient descent

根据题图下降的公式可以得出： $\theta_j :=\theta_j - \alpha \dfrac{\partial}{\partial x}J(\theta)$
这里需要对损失函数求偏导数
$\begin{aligned} \dfrac{\partial}{\partial \theta_j}J(\theta) &= \dfrac{1}{2} *\sum_{i=1}^n2(y^{(i)}-\theta^Tx^{(i)}) x_j^{(i)} \\ & =\sum_{i=1}^n(y^{(i)}-\theta^Tx^{(i)}) x_j^{(i)} \end{aligned}$
带入上面梯度下降的公式可得：
$\theta_j :=\theta_j - \alpha \sum_{i=1}^n(y^{(i)}-\theta^Tx^{(i)}) x_j^{(i)}$

logistic Regression的loss function推导

linear Regression得到的预测值是连续的，即 $\in(-\infty,\infty)$ ,而对于分类问题不适用，为了解决这个问题，我们引入sigmoid函数： $\frac{1}{1+e^{-z}}, \forall z \in(-\infty,\infty)$ 令 $\vec{w}\cdot \vec x+b=\sum_{i=1}^nw_ix_i+b$ 有 $h_{\theta}(x)=g(\theta^Tx)=\frac{1}{1+e^{-\theta^Tx}}$
假设 $p(y=1|x;\theta) = h_{\theta}(x)$ $p(y=0|x;\theta) = 1-h_{\theta}(x)$ 则有 $p(y|x;\theta) =(h_{\theta}(x))^y(1-h_{\theta}(x))^{1-y}$ 我们可以写出似然函数： $L(\theta) = \prod_{i=1}^np(y^{(i)}|x^{(i)};\theta) = \prod_{i=1}^n(h_{\theta}(x^{(i)}))^{y^{(i)}}(1-h_{\theta}(x^{(i)}))^{1-y^{(i)}}$
对上面式子两边求 $\ln$ :
$\begin{aligned}l(\theta) &= lnL(\theta) \\ &= \sum_{i=1}^n[{y^{(i)}}ln(h_{\theta}(x^{(i)}))+{(1-y^{(i)})(1-h_{\theta}(x^{(i)}))}] \end{aligned}$
对 $l(\theta)$ 求最大化可以转化成对 $-l(\theta)$ 求最小化：
$arg\max_{\theta}l(\theta) = arg\min_{\theta}-l(\theta)$
因此可以定义损失函数： $J(\theta) =- \sum_{i=1}^n[{y^{(i)}}ln(h_{\theta}(x^{(i)}))+{(1-y^{(i)})(1-h_{\theta}(x^{(i)}))}]$

求梯度下降

损失函数：
$L(\theta) = -\sum_{i=1}^n [y^{(i)}lnh_\theta(x^{(i)}) + (1-y^{(i)})ln(1-h_\theta(x^{(i)}))]$
下面对损失函数求导：
$\begin{aligned} \dfrac{\partial}{\partial \theta_j}J(\theta) &= -\sum_{i=1}^n[\dfrac{y^{(i)}}{g(\theta^Tx^{(i)})}*\dfrac{dg(\theta^Tx^{(i)})}{d\theta}-\dfrac{1-y^{(i)}}{1-g(\theta^Tx^{(i)})}*\dfrac{dg(\theta^Tx^{(i)})}{d\theta}] \\ &=-\sum_{i=1}^n[\dfrac{y^{(i)}}{g(\theta^Tx^{(i)})}-\dfrac{1-y^{(i)}}{1-g(\theta^Tx^{(i)})}]*\dfrac{dg(\theta^Tx^{(i)})}{d\theta} \\ &=-\sum_{i=1}^n[\dfrac{y^{(i)}}{g(\theta^Tx^{(i)})}-\dfrac{1-y^{(i)}}{1-g(\theta^Tx^{(i)})}]*g(\theta^Tx^{(i)})*(1-g(\theta^Tx^{(i)})) *x_j^{(i)}\\ &= -\sum_{i=1}^n[y^{(i)}*(1-g(\theta^Tx^{(i)}))-(1-y^{(i)})*g(\theta^Tx^{(i)})] *x_j^{(i)}\\ &= -\sum_{i=1}^n(y^{(i)}-g(\theta^Tx^{(i)}))*x_j^{(i)}\\ \end{aligned}$
则有梯度下降公式： $\theta_j :=\theta_j - \alpha \sum_{i=1}^n(y^{(i)}-g(\theta^Tx^{(i)})) x_j^{(i)}$

梯度下降代码实现：

def gd(x,y,n_iterations,alpha,learning_rate):
    W = np.random.randn(x.shape[1])
    for i in range(n_iterations): 
        # LINEAR REGRESSION
        y_pred = np.dot(x,W) 
        error = y_pred - y 
        # L2 LOSS,MSE
        loss = np.mean(0.5 *(error **2) + alpha * 0.5 * np.dot(W.T,W))
        print("Iteration {0} | loss is {1}".format(i,loss))
        # GRADIENT
        grad = np.dot(x.T,error) + alpha * W
        # UPDATE WEIGHTS
        W = W - learning_rate * grad
    return W

正则化

范数是衡量某个向量空间（或矩阵）中的每个向量以长度或大小。范数的一般化定义：对实数p>=1，范数定义如下： $\left \| x \right \|_p := (\sum_{i=1}^{n} \left | x_i \right |^p)^{\frac{1}{p}}$
当p=1时，是L1范数，其表示某个向量中所有元素绝对值的和。
当p=2时，是L2范数，表示某个向量中所有元素平方和再开根号。

L1 范数是指向量中各个元素绝对值之和，也叫“稀疏规则算子”（Lasso regularization）。范数作为正则项，会让模型参数θ稀疏化，既让模型参数向量里为0的元素尽量多。在支持向量机（support vector machine）学习过程中，实际是一种对于成本函数(cost function)求解最优，得出稀疏解。

L2 范数作为正则项式让模型参数尽量小，但不会为0，尽量让每个特征对预测值都有一些小的贡献，得出稠密解。
在梯度下降算法的迭代过程中，实际上是在成本函数的等高线上跳跃，并最终收敛在误差最小的点上（此处为未加正则项之前的成本误差）。而正则项的本质就是惩罚。模型在训练的过程中，如果没有遵守正则项所表达的规则，那么成本会变大，即受到了惩罚，从而往正则项所表达的规则处收敛。成本函数在这两项规则的综合作用下，正则化后的模型参数应该收敛在误差等值线与正则项等值线相切的点上。

正则化一般具有如下形式：
$\min \frac{1}{n}\sum_{i=1}{n}L(y^{(i)},f(x^{(i)}))+\lambda J(f)$

说明为什么用L1-Norm代替L0-Norm

一是因为L0范数很难优化求解（NP难问题），二是L1范数是L0范数的最优凸近似，而且它比L0范数要容易优化求解。

为什么只对w/Θ做限制，不对b做限制

首先正则化主要是为了防止过拟合，而过拟合一般表现为模型对于输入的微小改变产生了输出的较大差异，这主要是由于有些参数w过大的关系，通过对||w||进行惩罚，可以缓解这种问题。而如果对||b||进行惩罚，其实是没有作用的，因为在对输出结果的贡献中，参数b对于输入的改变是不敏感的，不管输入改变是大还是小，参数b的贡献就只是加个偏置而已。举个例子，如果你在训练集中，w和b都表现得很好，但是在测试集上发生了过拟合，b是不背这个锅的，因为它对于所有的数据都是一视同仁的（都只是给它们加个偏置），要背锅的是w，因为它会对不同的数据产生不一样的加权。或者说，模型对于输入的微小改变产生了输出的较大差异，这是因为模型的“曲率”太大，而模型的曲率是由w决定的，b不贡献曲率（对输入进行求导，b是直接约掉的）。

链接：https://www.zhihu.com/question/66894061/answer/653496474

你可能感兴趣的:(李宏毅机器学习)

NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
2025年大模型学习新攻略！掌握未来AI的关键技能 AI大模型-大飞人工智能产品经理程序员 Agent AI 大模型大模型教程
1.公开课（视频）：李宏毅机器学习斯坦福CS336：从零开始构建语言模型卡内基梅隆大学【多模态机器学习】RAGFromScratchHuggingFaceNLP课程2.机器学习和编程基础：pytorch官方中文教程[中英字幕]吴恩达机器学习李宏毅机器学习3.Attention机制：论文:《AttentionIsAllYouNeed》Transformer论文逐段精读【论文精读】-跟李沐学AIzhi
李宏毅机器学习——类神经网络训练不起来怎么办？ JustNow_Man 机器学习神经网络人工智能
https://www.bilibili.com/video/BV1Wv411h7kN?spm_id_from=333.788.videopod.episodes&vd_source=779fe6f5ae2ab98c0dc9480ff4ae61a3&p=201.局部最小值（localminima）与鞍点（saddlepoint）criticalpoint：hessian矩阵：1.1判断点类型：1.
李宏毅机器学习31——GAN（3） zeng-233
摘要：这节课学习条件生成下GAN的应用(CGAN)。conditionalGAN是指在有生成条件的前提下，通过对抗生成网络的方法，进行图像的生成。首先文字生成图片为例，加入GAN的方法，将文字和生成图片联系起来，输入到生成式中。这样解决了传统方法下，生成的图片不够真实的问题。之后又对这个方法进行了改进，将生成式的输入和输出同时输入到判别式，使文字和图片作为一对数据联系起来。之后又提出了一种新的判别
李宏毅机器学习笔记——反向传播算法小陈phd 机器学习机器学习算法神经网络
反向传播算法反向传播（Backpropagation）是一种用于训练人工神经网络的算法，它通过计算损失函数相对于网络中每个参数的梯度来更新这些参数，从而最小化损失函数。反向传播是深度学习中最重要的算法之一，通常与梯度下降等优化算法结合使用。反向传播的基本原理反向传播的核心思想是利用链式法则（ChainRule）来高效地计算损失函数相对于每个参数的梯度。以下是反向传播的基本步骤：前向传播（Forwa
机器学习第二十五周周报 ConvLSTM 沽漓酒江机器学习人工智能
文章目录week25ConvLSTM摘要Abstract一、李宏毅机器学习二、文献阅读1.题目2.abstract3.网络架构3.1降水预报问题的建模3.2ConvolutionalLSTM3.3编码-预测结构4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Moving-MNISTDataset4.3.2雷达回波数据集4.4结论三、基于pytorch实现ConvLST
李宏毅机器学习——回归实验 migugu
importnumpyasnpimportmatplotlib.pyplotaspltfrompylabimportmpl#matplotlib没有中文字体，动态解决plt.rcParams['font.sans-serif']=['Simhei']#显示中文mpl.rcParams['axes.unicode_minus']=False#解决保存图像是负号'-'显示为方块的问题x_data=[3
李宏毅机器学习笔记 2.回归 Simone Zeng 机器学习机器学习
最近在跟着Datawhale组队学习打卡，学习李宏毅的机器学习/深度学习的课程。课程视频：https://www.bilibili.com/video/BV1Ht411g7Ef开源内容：https://github.com/datawhalechina/leeml-notes本篇文章对应视频中的P3。另外，最近我也在学习邱锡鹏教授的《神经网络与深度学习》，会补充书上的一点内容。通过上一次课1.机器
李宏毅机器学习（二十）无监督学习Neighbor Embedding近邻嵌入 ca8519be679b
ManifoldLearning我们有时候的特征其实是低维度的放到高纬度上去，比如地球表面是2维的，但是被放到了3维空间，比如左下的S曲面，其实可以展开到2维平面上去，接下来就方便我们进一步计算分类等等插图1我们有如下几个降维方法LocallyLinearEmedding(LLE)局部线性嵌入具体是是怎么做的呢，我们点x和周围的点xj，给xj每个点加权wij求和，使其和xi最接近，然后投影到向量z
李宏毅pm2.5作业【转载】言糙 python numpy 机器学习
李宏毅机器学习PM2.5作业使用pyCharm2022.2.1版本，python10.0python也不会，计算机也不会，啥都不会，只带了个脑子考了计算机研究生。研究生选了人工智能方向。看来注定是漫长的学习之旅。PM2.5作业，我是一个字都看不懂。所以我采用了直接看答案的方案。把答案看懂也是一种本事。把答案CV上来。文章目录前言一、pandas是什么？二、使用步骤1.引入库2.提取TEST数据集3
Python 学习工具及资源 Lanlan_78d1
小甲鱼Python基础学习到P19（函数）之前image.png菜鸟语法查询Anaconda安装教学Jupyter教学*李宏毅机器学习
Transformer 代码补充 Karen_Yu_ python 深度学习 pytorch transformer
本文是对Transformer-Attentionisallyouneed论文阅读-CSDN博客以及【李宏毅机器学习】Transformer内容补充-CSDN博客的补充，是对相关代码的理解。先说个题外话，在之前李宏毅老师的课程中提到multi-headattention是把得到的qkv分别乘上不同的矩阵，得到更多的qkv。实际上，这里采用的方法是直接截取，比如这里有两个头，那么q^i就被分成两部分
【李宏毅机器学习】Transformer 内容补充 Karen_Yu_ 自然语言处理人工智能 transformer
视频来源：10.【李宏毅机器学习2021】自注意力机制(Self-attention)(上)_哔哩哔哩_bilibili发现一个奇怪的地方，如果直接看ML/DL的课程的话，有很多都是不完整的。开始思考是不是要科学上网。本文用作Transformer-Attentionisallyouneed论文阅读-CSDN博客的补充内容，因为发现如果实操还是有不能理解的地方，所以准备看看宝可梦老师怎么说×Sel
【LLM | 基础知识】自注意力机制 Self-attention [李宏毅机器学习] XMUJason 大语言模型LLM chatgpt 笔记 nlp
⭐引言本文主要参考李宏毅老师对于自注意力机制的讲解内容，但在此基础之上进行了一定的补充和删减，文中大部分插图来源于李宏毅老师的课件。本文的主要目的是梳理清楚自注意力机制的基本原理，理解什么是自注意力机制，不关注代码实现和具体的数学运算。本文尽可能把内容只控制在自注意力机制的基本框架上，不进行过多的相关概念的扩展，以免被其他相关内容转移注意力。1.从“单向量输入”到“多向量输入”在之前的机器学习方法
李宏毅机器学习（二十三）无监督学习Deep Generative Model(二) ca8519be679b
内容衔接上一讲，上节我们讲到VAE，我们为什么用VAE而不用auto-encoder呢，直觉上的原因是如果是auto-encoder，我们期待的是输入满月解码后还是满月，输入半月输出还是半月，但是我们能保证中间状态时候我们的输出是3/4月吗，结果往往不是；如果是VAE，我们就会引入一定的噪声，使得一定范围内输出都是满月，一定范围内输出都是半月，中间的公共部分由于我们要Minimize2者的误差，所
李宏毅机器学习——深度学习训练的技巧 migugu
神经网络训练的技巧优化失败的原因:局部最小值或鞍点，可以通过对H矩阵特征值正负性进行判断batch：加快梯度的计算，更新参数的速度比较快momentum:越过局部最小值或鞍点learningrate:自动调整学习率如RMSProp等normalizationdropout
李宏毅机器学习——初识深度学习 migugu
深度学习简介深度学习的历史1958:Perceptron(linearmodel)1969:Perceptronhaslimitation1980s:Multi-layerperceptronDonothavesignificantdifferencefromDNNtoday1986:BackpropagationUsuallymorethan3hiddenlayersisnothelpful19
李宏毅机器学习第一周_初识机器学习 Nyctophiliaa 机器学习人工智能深度学习
目录摘要一、机器学习基本概念1、MachineLearning≈LookingforFunction2、认识一些专有名词二、预测YouTube某天的浏览量一、利用Linearmodel二、定义更复杂的函数表达式三、ReLU函数四、Sigmoid函数与ReLU函数的对比三、反向传播(Backpropagation)一、反向传播的基本思想(正向计算-误差计算-梯度计算-参数更新)二、计算过程总结摘要在
李宏毅机器学习_卷积神经网络(CNN) Nyctophiliaa 机器学习 cnn 深度学习
目录摘要Abstract一、什么是CNN二、ImageClassification三、Observation1一、Simplification1四、Observation2五、BenefitofConvolutionalLayer六、ConvolutionalLayer七、MultipleConvolutionalLayers八、ComparisonofTwoStories九、Observatio
李宏毅机器学习第十六周周报NAT&HW5 沽漓酒江机器学习人工智能
文章目录week16Non-autoregressiveSequenceGeneration摘要Abstract一、李宏毅机器学习Non-autoregressiveSequenceGeneration1.问题阐述1.1Autoregressivemodel1.2Non-autoregressivemodel(mostlybyTransformer)2.Solution2.1VanillaNAT(
2023春季李宏毅机器学习笔记 02 ：机器学习基本概念女王の专属领地机器学习深度学习 #李宏毅2023机器学习机器学习笔记人工智能
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、機器學習基
2023春季李宏毅机器学习笔记 03 ：机器如何生成文句女王の专属领地 #李宏毅2023机器学习机器学习深度学习笔记机器学习人工智能深度学习
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、大语言模型
Chat GPT4来了，它和3.5区别在哪？李宏毅机器学习笔记抱抱小杠杠机器学习人工智能笔记
听说GPT4模型更大、参数更多，功能更强，具体它好在哪里？GPT4真的能看懂图片吗？官方回答：不太能~~下面这张图片是将两个不存在的网址输入进GPT4，问它看到了什么，结果发现GPT真的会胡言乱语，它会根据网址中出现了“man”这个单词，就说他看到了“一个拿着手枪的男人。。。巴拉巴拉”明显就是在胡编乱造！而如果网址中出现了“girl”这个单词，GPT又会说他看到了“一个穿着校服的女孩子。。。巴拉巴
李宏毅机器学习-PCA Zhuanshan_ 机器学习人工智能
视频链接：李宏毅2020机器学习深度学习(完整版)国语用最直观的方式告诉你：什么是主成分分析PCA【中字】主成分分析法（PCA）|分步步骤解析看完你就懂了！无监督学习做什么无监督学习主要做两件事情：聚类&降维：比如说下图的树木，只有输入图片，没有标签，我们希望通过一个函数抽象的表达他们，于是抽出一个更抽象的表述生成器：也就是无中生有，我们有很多图片，但不知道是怎么生成的，于是需要一个好的函数，将刚
2023春季李宏毅机器学习笔记 05 ：机器如何生成图像女王の专属领地 #李宏毅2023机器学习机器学习笔记人工智能机器学习李宏毅 AI产品
资料课程主页：https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.phpGithub：https://github.com/Fafa-DL/Lhy_Machine_LearningB站课程：https://space.bilibili.com/253734135/channel/collectiondetail?sid=2014800一、图像生成常
李宏毅机器学习第二十二周周报GAN理论2 沽漓酒江机器学习生成对抗网络人工智能
文章目录week22TheorybehindGAN2摘要Abstract一、李宏毅机器学习0.上周内容概述1.GAN的训练过程2.生成器与分辨器的算法细节3.整体算法描述4.原文中生成器目标函数的实现方式二、文献阅读1.题目2.abstract3.网络架构3.1无数据生成方法3.2Data-EnrichingGAN(DeGAN)4.文献解读4.1Introduction4.2创新点4.3实验过程4
李宏毅机器学习第二十周周报GAN4 沽漓酒江机器学习人工智能
文章目录week20GAN4摘要Abstract一、李宏毅机器学习——GAN41.LearningfromUnpairedData2.CycleGAN3.Application二、文献阅读1.题目2.abstract3.网络架构3.1损失函数3.1.1对抗性损失3.1.2循环一致性损失3.1.3整体目标3.1.4identityloss3.2网络结构3.3训练细节3.4网络架构3.4.1生成器部分
李宏毅机器学习第二十一周周报GAN理论沽漓酒江机器学习生成对抗网络人工智能
文章目录week21TheorybehindGAN摘要Abstract一、李宏毅机器学习——TheorybehindGAN1.Generation2.最大似然估计3.Generator3.Discriminator二、文献阅读1.题目2.abstract3.网络架构3.1SequenceGenerativeAdversarialNets3.2SeqGANviaPolicyGradient3.3Th
李宏毅机器学习第十八周周报GAN2 沽漓酒江机器学习人工智能
文章目录week18GAN2摘要Abstract一、TheorybehindGAN1.训练目的2.Wassersteindistance二、文献阅读1.题目2.abstract3.网络架构3.1WassersteinDistance3.2WasserteinGANs3.3Gradientpenalty4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Difficulti
李宏毅机器学习第十九周周报GAN3 沽漓酒江机器学习人工智能 gan
文章目录week19GAN3摘要Abstract一、李宏毅机器学习——GAN31.Introduce2.DifficultyinGANtraining3.EvaluationofGeneration4.ConditionalGeneration二、文献阅读1.题目2.abstract3.文章主要内容3.1基于GANs的双时间尺度更新规则3.2Adam确保TTUR收敛3.2.1使用Adam以降低收敛
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他