Only_Wolfy

coursera 吴恩达机器学习 machine learning 作业/习题归纳 + 脚本测试 (ex12345678)

记录一下做作业的时候遇到的问题。
coursera吴恩达机器学习网站

PS：这里代码片没写啥语言，可以查，懒得了，发现不写的话，我这里显示的是品红色（看吴恩达发现这红叫品红hhh），还是挺好看的：

用的是谷歌浏览器，然后下了个 “dark reader” 的插件，真的是完美保护狗眼，之前对着白屏真的要瞎了。
后来补充：发现只是编辑的时候是这个品红色，阅读的时候发现是白色。。

点击传送：
Ex1
Ex2
Ex3
Ex4
Ex5
Ex6
Ex7
Ex8

Ex1

零零碎碎的笔记：

nx1,或1xn的叫vector，向量，记作 $R^n$ ，nxm的叫矩阵，记作 R^{n x m}

那个密码点了编程作业才看到的，看了视频之后想试试结果发现找不到那个密码。。。

1. warmUpExercise

A = eye(5);

视频也给了答案了，开门红，拿到我们第一个"Nice Work!"
注意的地方是加上分号吧，如果不用测试的话，不然一堆东西输出… 然后输出好像不影响结果，返回的东西对就可以了。

2. Computing Cost (for One Variable)

prediction = X*theta;
cost = (prediction - y).^2;
J = 1/(2*m)*sum(cost);

注意 .^2 加个 “.” 就是逐个元素的操作

3. Gradient Descent (for One Variable)

照公式写就可以了。

delta = X'*(X*theta - y); %X'可以不加括号
theta = theta - alpha/m*delta;

要注意矩阵的大小关系，比如 delta = X’ * (X * theta - y); 不能写成 (X*theta - y)*X’; 因为 X’ 是 20x2 的，一个是 20 x 1的，而delta（也就是theta的导数，大小跟theta一样）是 2x1，所以 X’ 要写在前面。这个问题手推式子的时候比较难发现。至于那些参数的长和宽是多少要用黑框打印来看看。

这个问题在第2周submitting programming assignments里面的阅读材料提到了，当时看还不知道是怎么回事。。。写完后偶然点到才发现原来在讲这个问题。

4. Feature Normalization
特征归一化处理，这里的normalize是 (x - 平均数) / 标准差。。。
写了个 (x - 平均数) / （max-min），一直wa。。。贴一发吧，不然白写了：

mu = mean(X_norm')
mu = mu' * ones(1,3);
sigma = std(X_norm');
X_norm = (X_norm-mu)./(max(X_norm')'*ones(1,3)-min(X_norm')'*ones(1,3))

主要是：这里的x是每行为一个例子（example），每列是一个特征（feature），所以调用mean、std、max函数的时候需要转置一下。。。因为它们应该是按一列一列计算的，在单行的vector里看不出，但是在矩阵上就看得出了。

5. Computing Cost (for Multiple Variables)
同 Computing Cost (for One Variable)，照贴就可以了。

6. Gradient Descent (for Multiple Variables)
同 Gradient Descent (for One Variable)，照贴就可以了。矩阵运算的魅力啊。

7. Normal Equations

theta = (pinv(X’ * X))*(X’) * y
逆矩阵的时候写了 -1 。。。不记得 X-1 代表什么了，也不是逆矩阵和转置矩阵= =

最后纪念一下 ex1 完成吧 ~

Ex2

1. Sigmoid Function

g = ones(size(z,1),size(z,2))./(1+exp(-z));

不容易注意的是点除（ ./ ）吧，然后注意一下分子不能写1，因为这个1是1x1维的，然后分母可以，因为 1和后面正确维度的exp(-z)相加，维度会合并到大的。

2. Logistic Regression Cost
哈哈，终于不得已看了一下submit文件，2和3都是调用costFunction的，不过一个检查J一个检查grad而已。然后发现3中的J写错了。其实3说得不对，J因为logistic的函数按照linear写下来的话不是凸函数，所以需要变一下形式：

很好办，找打就是了，矩阵相乘的大小也图中处理好了：

prediction = ones(size(X*theta,1),size(X*theta,2))./(1+exp(-X*theta));
cost = (prediction - y).^2;
%J = 1/(2*m)*sum(cost); Wrong!!!
J = 1/m*(-y'*log(prediction)-(1-y)'*log(1-prediction));
grad = X'*(prediction - y)/m;

3. Logistic Regression Gradient - costFunction
想做第二个的，结果通过的是第三个（？？？）

prediction = ones(size(X*theta,1),size(X*theta,2))./(1+exp(-X*theta));
cost = (prediction - y).^2
J = 1/(2*m)*sum(cost)
grad = X'*(prediction - y)/m

因为logistic的跟linear的cost（J）和 cost 的梯度计算式子是一样的，只要把prediction（z）换一换就行了。就前面代码复制粘贴一下。

4. Predict
突然发现一个文件夹（吧）里的函数可以互相调用。。

%X(1,:)
%theta
for i=1:m
  if sigmoid(X(i,:)*theta)>=0.5
    p(i) = 1;
  endif
endfor

注意的地方就是要看看X和theta的长和宽吧，要契合，i就是用来便利每行（每组）的X，然后都乘上theta就可以了，p(i)就是第i行（组）的结果。emmm，这里用了for循环，想不到怎么不用for来更新每行的p(i)。
刚写完就想到了（hh我真聪明），想起Python里面有 a = [X>0] … 差不多这种（语法好像是错的，ReLu的时候用的），大致就是把矩阵X里面每个元素判断一下，看看是否>0，然后赋给a（也是个矩阵）。然后这里在黑框里仿照了一下：

这波照葫芦画瓢很OK！所以继续仿照一下：

predict = sigmoid(X*theta)
p = predict>=0.5

就过了。不用for，直接到矩阵上运算。

5. &6. Regularized Logistic Regression Cost & Regularized Logistic Regression Gradient
测试的都是一个文件，合起来写了。

h = sigmoid(X*theta)
J = 1/m*(-y'*log(h)-(1-y)'*log(1-h))+lambda/2/m*(sum(theta.^2)-theta(1)*theta(1)) 
grad = X'*(h-y)/m + lambda/m*theta
grad(1) = grad(1) - lambda/m*theta(1)

J 的参照：

上面有说矩阵怎么算：

免掉了 Σ ，是因为 y是 mx1 ，yT是 1xm ，h是mx1，用 size() 打印一下就知道他们的长和宽就行了。
一开始交的是：

J = 1/m*(-y'*log(h)-(1-y)'*log(1-h))+lambda/2/m*sum(theta.^2)

就会弹出提示，说要注意θ(1)不用操作，然后改一改就行了。注意θ下标是1，而不是0，又报错了。
然后是grad的参照：网站：Regularized Linear Regression

看回昨天写的代码：

照葫芦画瓢一下：

grad = X'*(h-y)/m + lambda/m*theta
grad(1) = grad(1) - lambda/m*theta(1)

注意下标是1，然后grad(1)是不用正则化的，加上去就减掉好了。
想不出更简洁的方法，不过至少这样 J 和 grad 都不用for了，灵活运用矩阵乘法。

做完啦，最后截图纪念：

Ex3

1. Regularized Logistic Regression

h = sigmoid(X*theta);
J = 1/m*(-y'*log(h)-(1-y)'*log(1-h))+lambda/2/m*(sum(theta.^2)-theta(1)*theta(1)) ;
grad = X'*(h-y)/m + lambda/m*theta;
grad(1) = grad(1) - lambda/m*theta(1);

粘贴ex2的就过了… …

2. One-vs-All Classifier Training
卡了40分钟。。题目比较长，还有给了个fmincg不会用（该来的还是要来啊）：

initial_theta = zeros(n + 1, 1);
options = optimset('GradObj','on','MaxIter',50);
for c = 1:num_labels
  %initial_theta = zeros(n + 1, 1); 没有加上但是还是过了
  k = fmincg(@(t)(lrCostFunction(t,X,(y==c),lambda)),initial_theta,options)
  k';
  all_theta(c,:) = k';
  all_theta;
endfor

什么 iteration 就是 fmincg 跑了多少次，cost就是损失函数，脑抽了一开始还以为是报错。。。

题目思路就是跑num_labels遍，第x遍fmincg给出一个最佳的theta，放到all_theta的第x行，因为给的这个theta是个列向量，所以放到all_theta的某一行中就需要转置一下。

总结一下all_theta的第x行是用来存放第x个最佳的theta的，这个theta是针对 y 分别为1、2、3、4（因为num_labels = 4）的情况来得出的，这里x就是1~4。

为了方便转置，我用 k 来存一下列向量theta，然后转置一下 k，然后赋值给all_theta的某一行，也就是上面的代码，如果省掉一个参数 k 的话就是：

initial_theta = zeros(n + 1, 1);
options = optimset('GradObj','on','MaxIter',50);
for c = 1:num_labels
  %initial_theta = zeros(n + 1, 1); 没有加上但是还是过了
  all_theta(c,:) = fmincg(@(t)(lrCostFunction(t,X,(y==c),lambda)),initial_theta,options)'; %最后加上转置" ' "
endfor

由于没有考虑到转置的问题，一开始写的是：

for c = 1:num_labels
  all_theta(c) = fmincg(@(t)(lrCostFunction(t,X,(y==c),lambda)),all_theta(c),options)
endfor

可以说是错误百出了，首先( c )不是第c行，是矩阵按照列排下来后的第c个，然后后面 all_theta 应该是 initial_theta 。另外，细心点可以发现 initial_theta 每次遍历都没有清零，不过没有关系，因为这个 fmincg 算法足够强大，而且theta全设为0，不也不是最好的吗？

不过等等，真的需要 initial_theta 吗？all_theta 一开始不也是每一行都是 0 吗？于是我们还可以再省一个参数 initial_theta ！要做的只是把 all_theta 的行拿出来，然后稍稍转置一下，代替 initial_theta 的位置就可以了：

options = optimset('GradObj','on','MaxIter',50);
for c = 1:num_labels
  all_theta(c,:) = fmincg(@(t)(lrCostFunction(t,X,(y==c),lambda)),all_theta(c,:)',options)';
endfor

很棒，现在代码比一开始提交正确的代码要精简多了，而且也是正确的ヾ(≧∇≦*)ヾ

3. One-vs-All Classifier Prediction
老方法，用 size() 输出一下 all_theta 和 X 的长和宽，知道了 X 是 m x 3 维，all_theta 是 num_labels x 3 维（4 x 3），首先 max 函数有4种：

max(X) 找 X 中最大的元素
max( X , [] , 1 ) 找 X 每列最大的元素
max( X , [] , 2 ) 找 X 每行最大的元素
[ a , b ] = max (X) ，a 为 X 每列最大的元素，b 为 X 每列最大元素的下标
max( X , Y ) 为取 X 和 Y 矩阵每个位置上最大的元素

我们主要找的是 theta 乘上 X 之后，对于每一组（行），找出4种 y 谁的概率最大，得出那一种，存放在 p 对应的行中。然后用的 max 函数是得出每列的最大元素的下标，因此我们设想的是，因为有 4 种，所以搞 4 行出来，然后列就是这 4 种对应的概率，调用 max 函数的时候，就能得到每一列中，概率最大的那一种的下标。因此这个矩阵是 4 x m 大小的，所以是 all_theta * X’ 。凑出来之后得到最大概率的下标组成的行向量，转置一下就是 p 了：

t = all_theta*X';
[a,b] = max(t);
p = b';

对了，不加sigmoid激活，是因为θx本来就是递增的，sigmoid也是，大的越大，所以没有必要加

4. Neural Network Prediction Function
写的时候有点乱，不知道最终输出的矩阵是多少，看了一眼别人代码，发现隐藏层少了加了1，输入层记得，隐藏层忘记了：

X = [ones(m, 1) X];
z2 = sigmoid(X*Theta1');
size(z2);
a2 = [ones(m,1) z2];
a3 = a2*Theta2';
t = a3';
[a,b] = max(t);
p = b';

输入层矩阵是 m x 2 -> m x 3
隐藏层输入矩阵是 m x 3 * 3 x 4 = m x 4
隐藏层输出矩阵是 m x 4 - > m x 5
输出层矩阵是 m x 5 * 5 x 4 = m x 4
最终，m x 4（或者 4 x m）的意思是有m组输入，然后对应4组输出（的概率）
另外，过了之后看了下别人写的，原来还有[a,b] = max(A,[],2)这样的骚操作，意思差不多，不过一个针对行向量，一个针对列向量：

X = [ones(m, 1) X]
z2 = sigmoid(X*Theta1');
size(z2);
a2 = [ones(m,1) z2];
a3 = sigmoid(a2*Theta2');
[a,b] = max(a3,[],2);
p = b;

果然还是要看看别人代码，各取所长。

sigmod最后可加可不加，因为都是递增的，不过加了有 “概率” 的含义，还是加了。

磕磕绊绊吧，做完发现也不算难（万物真理：懂了就觉得不难），最后惯例截图纪念一下：

Ex4

Feedforward and Cost Function & Regularized Cost Function
因为复习很久没打了，生疏，卡了很久：
参考公式：

[hx,dummy] = predict(Theta1,Theta2,X);
Y = zeros(m,num_labels);
for i=1:m
  Y(i,y(i))=1;
endfor
t1 = log(hx).*Y + log(1-hx).*(1-Y);
sum_xita = sum(sum(Theta1(:,2:end).^2)) + sum(sum(Theta2(:,2:end).^2));
J = -1/m*sum(sum(t1)) + lambda/2/m*sum_xita;

% 不能够直接矩阵乘法，因为矩阵乘法的话，log(hx_k)和跟下一组y_k+1等乘在一起，是不对的
% 正确的理解应该是点乘，自己乘回自己，这里没有理解，卡了很久
% 然后theta点乘的时候，第一位是要省略不乘的，可以用语法简易截取

predict 是改了文件中的：

Sigmoid Gradient
根据公式：

g = sigmoid(z).*(1-sigmoid(z));

看了一下Sigmoid函数的求导证明。。有点难

Neural Network Gradient (Backpropagation) & Regularized Gradient
写到崩了，参考别人的
在nnCostFunction后面继续补上：

X = [ones(m,1) X];
for i=1:m
  a1 = X(i,:);  %1x3
  z2 = a1*Theta1'; %1x4
  a2 = [1 sigmoid(z2)];
  z3 = a2*Theta2';
  a3 = sigmoid(z3);
  deta3 = a3-Y(i,:); % 1 x 4
  deta3 = deta3'
  deta2 = Theta2(:,2:end)'*deta3.*sigmoidGradient(z2')
  size(z2)
  size(deta2)
  size(Theta2(:,2:end)')
  size(deta3)
  size(a2')
  Theta2_grad = Theta2_grad + deta3*a2; % 4 x 5
  Theta1_grad = Theta1_grad + deta2*a1; % 4 x 3
endfor
Theta1(:,1) = 0;
Theta2(:,1) = 0;
Theta1_grad = (Theta1_grad + lambda*Theta1)/m;
Theta2_grad = (Theta2_grad + lambda*Theta2)/m;

知识参考：

【详细过程的描述】
讲一下，写了一个下午踩了什么坑：

不清楚 a 和 z 分别是啥，搞了很久，又不看之前的笔记，刚刚贴图的时候才发现 pdf 有
然后第一层输入层是要加 x0 = 1的，呵呵
小写 delta（δ），那个是 $θ^T*δ$ ，我居然觉得无所谓，就写了 $δ^T*θ$ ，错到飞天
最后pdf里面D应该是△和λθ都除以 m

从上午十点写到下午五点多，什么坑都踩了，纪念一下吧：

ex4 写得磕磕绊绊的，有空看看论坛的问题。

Ex5

Regularized Linear Regression Cost Function & Regularized Linear Regression Gradient
参考图片：

脑抽了写了注释那部分，后来看了别人的发现不用乘x的i次方，过了一会才发现x的上标指的是第几个x，而不是x的幂。

然后就是计算梯度，grad
因为这里的grad要用regression，正则化。
看回Ex2的做题笔记：（这张水印有点难去）Regularized Linear Regression

然后蓝色框住那部分就是grad，即 J 对 θ 的梯度。
然后就是完整代码：

h = zeros(m,1);
h = X*theta;
J = 1/2/m*(sum((h-y).^2))+lambda/2/m*sum(theta(2:end).^2)
grad = X'*(h-y)/m + lambda/m*theta
grad(1) = grad(1) - lambda/m*theta(1)

记得第一个θ不需要正则化。

Learning Curve
要求是画出随着样本数目 i 增大，求出cross vailidation 的 error 和 trainning test 的 error 。并且画出这两个的图，通常情况是：（这里 N 是 i ）

然后发现个很透的问题：我不会用Octave画图。如果不是测试的话，就会画图，但是如果submit了的话，会迭代很多次，然后画的图也有问题，画出来的图就很乱。
有点烦，网上的教程都是 matlab 的，进度有点赶，又不想学matlab，考完试暑假再看看吧。
代码：（一开始没有理解，看了别人画的图，才知道是要干嘛（随着N增加话两个 error 的图））

for i = 1:m
  theta = trainLinearReg(X(1:i,:),y(1:i,:),lambda);
  error_val(i) = linearRegCostFunction(Xval,yval,theta,0);
  %theta = trainLinearReg(X,y,lambda)
  error_train(i) = linearRegCostFunction(X(1:i,:),y(1:i,:),theta,0);
endfor

Polynomial Feature Mapping
计算 X，变为 [X(i) X(i).^2 X(i).^3 … X(i).^p]，代码：

for i=1:size(X,1)
  for j=1:p
  X_poly(i,j) = X(i).^j; 
endfor

看别人文章的时候，发现可以更充分运用矩阵的性质：

X 
for i=1:p
  X_poly(:,i) = X.^i; 
endfor
X_poly

突然发现打印出来，跟我理解的很不同= = ，好吧，没有认真审题，看着式子就套两个for循环，但还是做对了。
贴个看matlab图片的博客：https://blog.csdn.net/weixin_40807247/article/details/81359042
最后惯例：

PS：我觉得这次做得不是很好= = ，有点没耐心读题，不通过，想了一会就去看别人的代码，也不是说不好，但是要读好题吧。

Ex6

Gaussian Kernel
计算高斯kernel的公式：

||u|| 的计算方法：（u为2维）

把 u 替换成 x1 - x2，正确代码：

t = x1-x2;
sim = exp(-sum(t.^2)/(2*sigma^2))

错误代码：

sim = exp(-(x1-x2).^2/(2*sigma^2))

显然没有理解公式。

Parameters (C, sigma) for Dataset 3
一脸懵逼，然后想起宿友说有个文档要下载的：

Life suck. 里面有脚本，还有介绍题目的pdf，（可能还有别的数据啥的），一开始叫我们下载的东东里面有的会没有。

不过宿友说感觉没啥用就介绍一下背景，所以我一直以来没有看那个"here"的文件，所以相安无事。

这次的作业就真的顶不住了，去看了下载的文件，发现其实提示了很多，包括没有提及的函数的用法啥的，课里没讲。

题意就是找出最好的C和sigma（方差 / σ），然后用 svmPredict ，其实用 svmPredict 的时候会发现要用 svmTrain，然后里面的第四个参数要用个@啥啥的，另外svmTrain的东西也要看回代码，看代码可以发现 x1、x2 是不用定义的，因为直接赋值是（1,0），也符合课上讲的。然后 pdf 里面也提示了 C 和 sigma 推荐的参数，两重循环暴力找就行了：

vec_C = [0.01;0.03;0.1;0.3;1;3;10;30];
vec_sigma = [0.01;0.03;0.1;0.3;1;3;10;30];
%x1 = [1 2 1 5 9 8]; x2 = [0 4 -1 7 6 5]; 见有人定义了x1 x2
%x1 x2这里怎么定义没所谓，因为svmTrain中kernelFunction的用法是(1,0)
vec_errors = 10000000;
for i=1:length(vec_C)
  for j=1:length(vec_sigma)
    model= svmTrain(X, y, vec_C(i), @(x1, x2) gaussianKernel(x1, x2, vec_sigma(j)));
    pred = svmPredict(model,Xval);
    error = mean(double(pred~=yval));    
    if (error < vec_errors)
      a = i;
      b = j;
      vec_errors = error;
    endif
  endfor
endfor
C = vec_C(a); % 注意要记得赋值
sigma = vec_sigma(b);
vec_errors;
model = svmTrain(X,y,vec_C(i),@(x1, x2) gaussianKernel(x1, x2, vec_sigma(j)));
visualizeBoundaryLinear(X,y,model); % 看ex6.m知道的，可以用来看图

Email Preprocessing
暴力比较就行：

    for i=1:size(vocabList)
      if (strcmp(str,vocabList(i,1)))
        word_indices = [word_indices;i];
        break;
      endif
    endfor

emailFeatures
同暴力：

for i = 1:size(word_indices)
  x(word_indices(i)) = 1;
endfor

感觉这次比较简单，可能由 pdf 看吧 hh，而且实现也不用自己写：

Ex7

Find Closest Centroids (k-Means)
注意一下是 X 某行减掉 centroids 某行（因为centroids（μ）是 X 中的一个点（吧）），所以维度一样。
而不是 X(i) - centroids(j)

m = size(X,1);
for i=1:m
  min = 1000000000;
  for j=1:K
    t = X(i,:) - centroids(j,:);
    s = sum(t.^2);
    if (s

 
   
  Compute Centroid Means (k-Means)
 可以用矩阵来运算，知道有个find但不是很熟悉，后来就用for了，看了别人的进行下修改： 
  %自己写的：
##for i=1:K
##  cnt = 0;
##  for j=1:m
##    if (idx(j)==i)
##      centroids(i,:) += X(j,:);    
##      cnt++;
##    endif
##  endfor
##  centroids(i,:) /= cnt;
##endfor

%别人用了find的，进行更改：
for i=1:K
  t = find(idx==i);
  centroids(i,:) = sum(X(t,:))/length(t);
endfor
 
  K-means 用于图像压缩
 至此，跑一下脚本ex7：
 
 感觉还不错，挺有趣的。 
  看到 pdf 里面有个关于图像压缩的，就是设置 K 个color（比如16色），然后跑 K-means。
 首先要写个 kMeansInitCentroids，文件里面有： 
  % randidx存的是大小为X的行数的，然后把用X(randidx(1:K),:)分出打乱后的前K行
randidx = randperm(size(X,1)); % Randomly reorder the indices of examples
centroids = X(randidx(1:K),:); % Take the first K examples as centroids
 
  关于 randperm 的用法测试如下。
 
 用一个变量保存一个向量，再用另一个矩阵把行关联到这个向量中，这种方法 / 过程用 C 写的话有点绕，但是这里完美运行（感觉Python这么写也行），虽然简短，但是编译器也懂你的想法，很方便。 
  然后命令窗口跑一下这个脚本：
 
 K = 16时：
 
 改一下脚本，K = 8：
 
 K = 1 ：
 
 K = 1024：
  
   
  PCA 
   
  开局一张图，代码全靠编： 
  sigma = X'*X/m;
[U,S,X] = svd(sigma);
 
  Project Data (PCA) 
  U = U(:,1:K);
Z = X*U; %懒得纸上算了，长宽瞎搞
 
  Recover Data (PCA) 
  X_rec = Z*U(:,1:K)'; % 看回projectData
 
  还有一次编程练习就结束啦！！！
  
   
   
  Ex8 
  Estimate Gaussian Parameters 
   
  mu = mean(X)';
t = mu'.*ones(m,n);
sigma2 = sum( (X-t).^2 )'/m;
 
  t 用来扩充一下矩阵，因为不想用 for
 
 看了一下别人代码： 
  X
mu = mean(X)
size(mu)
size(X)
sigma2=sum((X - mu) .^ 2)/m;
 
  emmm跑出来也是对的。。。
 发现 - 也跟乘一样，遵循横乘竖，我对代码还是不熟悉啊 = =
  
   
  Select Threshold
 照打就是了，注意 
  
    pval;
    yval;
    fp = sum((pval=epsilon)&(yval==1));

    prec = tp/(tp+fp);
    rec = tp/(tp+fn);

    F1 = 2*prec*rec/(prec+rec);
 
  
  
   
  Collaborative Filtering Cost & Collaborative Filtering Gradient
 没有regularized的cost和gradient： 
  % without regularization 
% version 1.0
J = sum(sum((X*Theta'-Y).^2.*R))/2;
for j=1:size(R,2)
  for i=1:size(R,1)
    if (R(i,j)==1)
      [i,j];
      X_grad(i,:) += (X(i,:)*Theta(j,:)'-Y(i,j))*Theta(j,:);
      Theta_grad(j,:) += (X(i,:)*Theta(j,:)'-Y(i,j))*X(i,:);
    endif
  endfor
endfor
 
  J 的参考：
 
 
 因为 Y 是 nm * nu 大小的矩阵，所以 X 和 Theta 要换一下位置，这里是  $X*Theta^T$ 
 然后用R来确定某个 i 行 j 列的位置是否有效，1为有效，0为无效，所以是点乘。
 最后因为 J 是个数字，所以要用两个 sum 求和一个 vector。 
  Gradient 的参考：
 
 大概瞄了一眼配套 pdf 里面的提示，说要用 for 循环，然后写不出来…
 最后还是去仔细思考矩阵的含义：（当然，X和X_grad含义一致（因为是梯度关系），Theta也同理）
 X 矩阵：每行表示一个电影（num_movies）（下图的x1 x2），每列表示一种特征（num_features）（romance和action的程度）
 Theta 矩阵：每行表示一个用户（num_users）（Alice Bob Carol Dave），每列表示一种特征（num_features）（给romance和action两个种类的喜爱程度）
 配合图看更清楚一点：（注：图的Theta矩阵是一列为一个用户，每行表示一个特征，第一行0是为了和没出现X0相乘，可以忽略）
 
 然后看回我们的定义：
 
 根据刚刚对矩阵的梳理和上面的公式，其实 X_grad 是每行每行地更新的，然后是（ Theta 的第 j 行的转置）和（ X 的第 i 行）相乘，注意：这里出来的是一个数字，不是矩阵。然后和 Theta 的第 j 行相乘，记得把答案累加，因为对于 i 行（第 i 个电影），有不同的分数（列 / feature），这里写的是两个循环，每次仅针对 i 行 j 列的数据，所以要把结果累加。
 然后 Theta_grad 也是同理啦，这里 R（ i , j ）表示的是" if the i-th movie was rated by the j-th user "，因此对于Theta_grad 来说，更新的是 j 行，X_grad 则是 i 行。 
  突然发现 pdf 下一页还有提示。。。讲如何找到 j:r(i,j)=1 的：
 
 照葫芦画瓢又有新的代码： 
  % without regularization 
% version 2.0
J = sum(sum((X*Theta'-Y).^2.*R))/2;
for i=1:size(R,1)
  idx = find(R(i,:)==1); % 即找出符合的 j; 
  X_grad(i,:) += (X(i,:)*Theta(idx,:)'-Y(i,idx))*Theta(idx,:);
endfor

for j=1:size(R,2)
  idx = find(R(:,j)==1); % 即找出符合的 i
  Theta_grad(j,:) += (X(idx,:)*Theta(j,:)'-Y(idx,j))'*X(idx,:);
endfor
 
  注意最后的Theta_grad计算式子中，- Y 的结果要转置一下，不然又报错：
 
 写完之后跑一下那个 ex8_cofi，得到一个图：
 
 不太知道是啥…
 Regularized Cost & Regularized Gradient
 这里添加上 regularization，然后就只在之前的基础上稍加修改就可以了。
 参考：
 
  
  % with regularization

J = sum(sum((X*Theta'-Y).^2.*R))/2 + lambda/2*sum(sum(Theta.^2))+ lambda/2*sum(sum(X.^2));
for i=1:size(R,1)
  idx = find(R(i,:)==1); % 即找出符合的 j; 
  X_grad(i,:) += (X(i,:)*Theta(idx,:)'-Y(i,idx))*Theta(idx,:)+lambda*X(i,:);
endfor

for j=1:size(R,2)
  idx = find(R(:,j)==1); % 即找出符合的 i
  Theta_grad(j,:) += (X(idx,:)*Theta(j,:)'-Y(idx,j))'*X(idx,:)+lambda*Theta(j,:);
endfor
 
  不过第一次的时候会超时不知道为啥。。。再submit一次就可以了：
 
 最后跑一下ex8_cofi，感觉怪怪的，评分都是5.0，但是题目又全通过了：
 
 最后一次编程作业啦，完结撒花！！！

七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
吴恩达机器学习全课程笔记第一篇亿维数组 Machine Learning 机器学习笔记人工智能
目录前言P1-P8监督学习无监督学习P9-P14线性回归模型成本（代价）函数P15-P20梯度下降P21-P24多类特征向量化多元线性回归的梯度下降P25-P30特征缩放检查梯度下降是否收敛学习率的选择特征工程多项式回归前言从今天开始，争取能够在开学之前（2.25）把b站上的【吴恩达机器学习】教程过一遍，并把笔记记录于此，本笔记将会把此课程每一p的重点内容及其截屏记录于此，以供大家参考和本人日后复
吴恩达机器学习全课程笔记第二篇亿维数组 Machine Learning 机器学习笔记人工智能学习
目录前言P31-P33logistics（逻辑）回归决策边界P34-P36逻辑回归的代价函数梯度下降的实现P37-P41过拟合问题正则化代价函数正则化线性回归正则化logistics回归前言这是吴恩达机器学习笔记的第二篇，第一篇笔记请见：吴恩达机器学习全课程笔记第一篇完整的课程链接如下：吴恩达机器学习教程（bilibili）推荐网站：scikit-learn中文社区吴恩达机器学习学习资料（gith
吴恩达机器学习—大规模机器学习魏清宇
学习大数据集数据量多，模型效果肯定会比较好，但是大数据也有它自己的问题，计算复杂如果存在100000000个特征，计算量是相当大的，在进行梯度下降的时候，还要反复求损失函数的偏导数，这样一来计算量更大。那么有没有简单的方法来应对大量的数据呢？我们可以采取随机抽样，比如，抽取1000个样本进行模型的构建。那么如何决定抽取多少样本呢？可以通过学习曲线获得，随着数据量的增加，无论是偏差和误差，都会趋向于
吴恩达机器学习—正则化魏清宇
过拟合问题欠拟合与过拟合当变量过少时，可能存在欠拟合；当变量过多时，会存在过拟合。过拟合可能对现有数据拟合效果较好，损失函数值几乎为零，但是不能进行泛化时，即不适于非训练集的其他数据。如何解决过拟合问题特征变量过多造成过拟合绘制假设模型图像，但当特征变量变多时，绘制很困难。当变量过多而训练数据较少时，容易出现过拟合。过拟合的解决办法解决过拟合问题，通常有两种方法：一种是减少特征的数量，可以通过人工
吴恩达机器学习—推荐系统魏清宇
问题规划引例—电影推荐假设已有的数据如上所示，洋红色线内的数据表示缺失数据，那么我们如何根据已有的评分数据来预测这些缺失的数据呢？基于特征的推荐算法基于内容的推荐系统已知数据如上，有四个人对于不同电影的评分，我们还有分别表示电影包含浪漫成分和动作片成分的多少。那么每一个电影都可以用一个向量来表示，如第一个电影可以表示为,其中第一个元素为常数。那么对于每一个用户j，我们可以用一个学习算法学习参数，然
【吴恩达机器学习】第八周—聚类降维Kmeans算法 Sunflow007
31.jpg1.聚类(Clustering)1.1介绍之前的课程介绍的都是监督学习、而聚类属于非监督学习，在一个典型的监督学习中，我们有一个有标签的训练集，我们的目标是找到能够区分正样本和负样本的决策边界，在这里的监督学习中，我们有一系列标签，我们需要据此拟合一个假设函数。与此不同的是，在非监督学习中，我们的数据没有附带任何标签，我们拿到的数据就是这样的：1.png在这里我们有一系列点，却没有标签
吴恩达机器学习笔记（2） python小白22
一.逻辑回归1.什么是逻辑回归？逻辑回归是一种预测变量为离散值0或1情况下的分类问题，在逻辑回归中，假设函数。2.模型描述在假设函数中，，为实数，为Sigmoid函数，也叫Logistic函数。模型解释：，即就是对一个输入，的概率估计。损失函数的理解：所谓最大似然估计，就是我们想知道哪套参数组合对应的曲线最可能拟合我们观测到的数据，也就是该套参数拟合出观测数据的概率最大，而损失函数的要求是预测结果
【Andrew Ng机器学习】单变量线性回归-模型描述 jenye_
课程：吴恩达机器学习一个监督学习的例子——房价预测使用的是一组俄勒冈州波特兰市的城市住房价格的数据。根据不同的尺寸的房间对应的不同售价，组成的数据集来画图。你有一个朋友想要卖房子，假设房子的大小是1250平方英尺，那么这套房可以卖多少钱？此时就可以进行模型拟合。根据这个模型，那么你可以告诉他这套房或许可以卖到220k。监督学习：每一个例子都有“正确的答案”，也就是说我们知道了数据集中卖出的房子的实
ML：2-2-3 多分类问题multicalss skylar0 分类机器学习人工智能
文章目录1.多分类问题的定义2.softmax3.神经网络的softmax输出【吴恩达机器学习65-67】1.多分类问题的定义classification问题可能的output大于2种。multiclass的预测图像可能是右侧这样的。2.softmaxsoftmaxregression算法是logisticregression的泛化（通用化）。【binaryclassification---->m
Coursera吴恩达机器学习课程笔记——神经网络: 学习（Neural Networks: Learning） yanglamei1962 机器学习笔记神经网络
9神经网络:学习（NeuralNetworks:Learning）9.1代价函数（CostFunction）神经网络的分类问题有两种：二元分类问题（0/1分类）只有一个输出单元（K=1K=1K=1）多元（KKK）分类问题输出单元不止一个（K>1K\gt1K>1）神经网络的代价函数公式：hΘ(x)=a(L)=g(Θ(L−1)a(L−1))=g(z(L))h_\Theta(x)=a^{(L)}=g(\
吴恩达机器学习笔记十二 Sigmoid激活函数的替代方案激活函数的选择为什么要使用激活函数爱学习的小仙女！机器学习机器学习人工智能
在需求预测案例中，awareness这个输入可能不是二元(binary)的，或许是一点(alittlebit)、有些(somewhat)或完全(extremely)，此时相比将awareness规定为0、1，不如考虑概率，认为它是一个0-1之间的数。激活函数可以采用ReLU函数(rectifiedlinearunit)三个常用的激活函数使用线性激活函数也可以看作是没有激活函数。激活函数的选择输出层
吴恩达机器学习笔记十神经网络 TensorFlow 人工智能爱学习的小仙女！机器学习神经网络人工智能深度学习
神经网络：说几层的时候是指隐藏层及输出层，不包含输入层。例如下图是一个四层神经网络。前向传播(forwardpropagation)越靠近输出层，该层的神经元数量越少TensorFlow（张量流）实现神经网络的搭建sequential（）把两层顺序连接起来；如果有新的x，用predict()人工智能
吴恩达机器学习- 正则化 YANWeichuan
过拟合和欠拟合定义和形态解决方法减少特征值数量正则化正则化惩罚θ系数线性回归正则化逻辑回归正则化
最强机器学习入门博客（吴恩达机器学习课程总结） PengHao666999 机器学习人工智能
机器学习的概述诞生现实生活许多领域的问题不能通过显式编程实现，比如制造自动驾驶汽车、智能工厂、规模农业、计算机视觉等等，一种好的实现方式是通过学习算法让计算机自己学习如何做。现在现在是学习机器学习最好的时机，因为机器学习在未来能产生巨大的价值未来机器学习在软件领域方面取得了巨大的价值，比如智能推荐，网络搜索，图像识别等机器学习在许多其他的领域仍有巨大的价值，比如未来在自动驾驶汽车，工厂，农业，医疗
在学习吴恩达机器学习课程中遇到的一些问题 ttyykx 学习机器学习 jupyter
C1_W1_Lab04_Cost_function_Soln中遇到的一些问题1、importnumpyasnp%matplotlibnotebookimportmatplotlib.pyplotaspltfromlab_utils_uniimportplt_intuition,plt_stationary,plt_update_onclick,soup_bowlplt.style.use('./d
吴恩达机器学习Coursera-week11 geekpy
PhotoOCR在此章的课程中，Andrew主要是想通过OCR问题的解决来阐释在实际项目中我们应该如何定义问题，并将一个大问题分解为多个小问题，并通过pipeline的方式将对这些小问题的解决方案串联起来，从而解决这个大问题。我认为这是解决实际问题的一个经典的方法论，有助于我们在实际工作和生活中更好地思考问题，分解问题，并最终解决问题。ProblemDescriptionandPipeline此小
吴恩达机器学习介绍第一章介绍清☆茶机器学习人工智能
1.机器学习的概念在进行特定编程的情况下，给予计算机学习的能力。机器学习是一种人工智能的分支，它关注如何通过计算机算法和模型来使计算机系统从数据中学习和改进。机器学习的目标是让计算机系统能够自动分析和理解数据，并根据数据的模式和规律做出预测和决策，而无需明确的编程指令。机器学习可以分为监督学习、无监督学习和强化学习三种类型。在监督学习中，计算机系统通过使用带有标签的训练数据来学习模式和规律，然后根
【Andrew Ng机器学习】单变量线性回归-梯度下降 jenye_
课程：吴恩达机器学习此篇我们将学习梯度下降算法，我们之前已经定义了代价函数J，梯度下降法可以将代价函数J最小化。梯度下降是很常用的算法，他不仅被用在线性回归上，还被广泛应用与机器学习的众多领域。之后，我们也会用到梯度下降法最小化其他函数，而不仅仅是最小化线性回归的额代价函数J。我们的问题我们有一个代价函数J(\theta_0|theta_1$)，可能是线性回归的代价函数，也可能是其他需要最小化的函
第八章正则化 tomas家的小拨浪鼓
该系列文章为，观看“吴恩达机器学习”系列视频的学习笔记。虽然每个视频都很简单，但不得不说每一句都非常的简洁扼要，浅显易懂。非常适合我这样的小白入门。本章含盖8.1过拟合问题8.2代价函数8.3线性回归的正则化8.4Logistic回归的正则化8.1过拟合问题在将线性回归和logistic回归应用到某些机器学习应用中时，会出现过度拟合问题，导致它们表现欠佳。正则化能够改善或者减少过度拟合问题。什么是
2022-12-14科研日志独孤西
今天主要学习了吴恩达机器学习的网课，又复习了一下机器学习；然后看了看VIO相关资料论文，今天看了几篇知网上搜到的关于VIO的硕士博士毕业论文和一篇20年的VIO综述，这方面的论文对于一个领域一般都有比较全面的描述。通过阅读我也了解了VIO领域的一些典型成果。VIO主流成果VIO是属于SLAM领域中的一个子课题，典型的VIO系统同样是由前端、后端、回环检测等几部分构成的。VIO的前端按是否提取特征点
吴恩达机器学习笔记-Logistic回归模型 Carey_Wu
回归函数在逻辑回归模型中我们不能再像之前的线性回归一样使用相同的代价函数，否则会使得输出的结果图像呈现波浪状，也就是说不再是个凸函数。代价函数的表达式之前有表示过,这里我们把1/2放到求和里面来。这里的求和部分我们可以表示为：很显然，如果我们把在之前说过的分类问题的假设函数带进去，即，得到的结果可能就是上述所说的不断起伏的状况。如果这里使用梯度下降法，不能保证能得到全局收敛的值，这个函数就是所谓的
吴恩达机器学习笔记（1） python小白22
一.初识机器学习1.监督学习在监督学习中，训练数据既有特征又有标签，通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。监督学习可以分为回归问题和分类问题。回归问题是利用训练出的模型，预测连续的数值输出；分类问题是预测离散值的输出。2.无监督学习无监督学习是给算法大量的数据，要求它找出数据的类型结构。无监督学习的数据没有标签，或是所有数据都是同一种标签
ML：2-2neural network layer skylar0 机器学习
文章目录1.神经网络层2.更复杂的神经网络3.神经网络的前向传播【吴恩达机器学习笔记p47-49】1.神经网络层【了解神经网络如何完成预测的】input：4个数字的向量。3个神经元分别做logisticregression。下角标：标识第i个神经元的值。上角标：表示第j层layer的值。这3个神经元所做的logisticregression的结果组成了一个向量a将传给ouputlayer。第1层的
ML：5-1 neural networks skylar0 机器学习
文章目录course2框架1.neuralnetworks（deeplearning）2.DemandPrediction【吴恩达机器学习p43-46】course2框架一、neuralnetworks-inference（预测）二、neuralnetworks-training三、practiceadviceforbuildingmachinelearningsystems四、decisiont
吴恩达机器学习笔记（1）——单变量线性回归机智的神棍酱
上一个笔记，我们大概了解了什么是机器学习以及机器学习的两个重要的分类，本篇笔记将带领大家了解机器学习的第一个模型——线性回归例题为了让大家更加直观的理解这个模型，我们引入一个例题，我们有一组波特兰市的城市住房的价格数据，我们要通过这些数据来找出一个函数，来预测任意面积下的房价，这就是一个简单的线性回归问题。这里给出的数据是一组房子面积对应的房价数据集其中m代表训练集，x是输入，y是输出。我们用（x
【吴恩达机器学习】第一周课程笔记 Estella_07 机器学习笔记人工智能
Hello，这里是小梁。下面是我近期学习机器学习的笔记，出发点是希望对自己起到一个督促和输出的作用如果你对我的笔记感兴趣欢迎Like，有不足之处也欢迎评论留言B站【2022吴恩达机器学习Deeplearning.ai课程】笔记参考【吴恩达《MachineLearning》精炼笔记】1机器学习的定义与分类1.1监督学习Supervisedlearning1.2无监督学习Unsupervisedlea
吴恩达机器学习笔记 AADGSEGA 机器学习
吴恩达机器学习笔记第一周基本概念监督学习分为回归算法和分类算法无监督学习事先没有正确答案。例如将客户群分成不同类，混合的声音区分开先在Octave或者matlab实现，可行，再尝试用Java或者python或者C++重新写出来只考虑两个变量的线性回归：例如找出一条函数拟合房价的那个例子里面的数据点。数据集：输入x[i]，输出y[i]，中间函数是h。使用成本函数（即方差误差，这里假设是只有房屋大小这
ML学习安排和资源链接 Nice night #ML吴恩达机器学习
第一阶段：学习前置数学知识机器学习的数学基础_二进制人工智能的博客-CSDN博客第二阶段：认知机器学习吴恩达机器学习【2022中文版教程全集】_哔哩哔哩_bilibili视频5h，看了一点发现后面没字幕了，这个(强推|双字)2022吴恩达机器学习Deeplearning.ai课程_哔哩哔哩_bilibili视频19h。但是这个是属于新课，所以还是先看第三阶段上：仔细了解机器学习视频链接：[中英字幕
深度学习学习顺序梳理陌上阳光深度学习深度学习人工智能
https://www.bilibili.com/video/BV1to4y1G7xq/?spm_id_from=333.999.0.0&vd_source=9607a6d9d829b667f8f0ccaaaa142fcb1.吴恩达机器学习课程已学完，时间较久了，后续可以重新听一遍，整理一下笔记2.白板推导读西瓜书统计学习方法看完了，时间也比较久了，重新看一遍整理笔记西瓜书，没看完过，后续再看3.
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

coursera 吴恩达机器学习 machine learning 作业/习题 归纳 + 脚本测试 (ex12345678)

Ex1

Ex2

Ex3

Ex4

Ex5

Ex6

Ex7

开局一张图，代码全靠编：

Ex8

你可能感兴趣的:(吴恩达机器学习)

coursera 吴恩达机器学习 machine learning 作业/习题归纳 + 脚本测试 (ex12345678)