树天先森

【深度之眼吴恩达机器学习第四期】笔记（九）

K均值

无监督学习的数据没有标签，希望计算机自行学习其中的知识。比如聚类模型会通过数据的内在性质，把数据划分为不同的关系紧密的子集。而K均值就是一个聚类模型。

聚类模型的用途：

市场分割
数据库中有各种客户的信息，希望将他们按照市场的不同进行划分，这样就能对不同的市场制定不同的销售策略或根据市场的不同进行服务改进。
社会网络分析
关注一些群体和他们的社交网和一些其他信息（如哪些人是你用邮件联系最频繁的人，而这些人用邮件联系最频繁的人又是谁），以此找到一个密切关联的群体。
组织计算机集群以及更好地组织数据集
在数据中心中，计算机集群经常协同工作，可以用K均值来重新组织资源，重新布局网络，优化数据中心以及通信数据。
了解银河系的构成
然后用这些构成信息来了解一些天文学的知识。

K均值算法

语言描述

假设我们有绿色的这些数据点，希望把这些数据点分为两个子集，应该怎么做？

随机生成两个点，这两点就叫聚类中心。生成两个点是因为想要分为两个聚类；
遍历数据，计算它们离两个聚类中心的距离，并把它们分配到距离最近的聚类中心。比如，图中红色的圆点离红色的聚类中心（红色的叉）比距离蓝色的聚类中心更近；
移动聚类中心。分别计算两种颜色的点的均值位置，并把新的聚类中心设置为计算出来的均值位置；
重复第二第三步，直到聚类中心不再移动，也就是说数据点的颜色不再改变；

如果在上述过程中出现一个没有点的聚类中心怎么办？最常见的做法是直接移除那个聚类中心。
但有时候的确需要K个聚类而不是K-1个聚类，那么就可以重新初始化这个聚类中心。

伪代码描述

算法的输入有两个：K（想要分几类）和训练数据，而且约定不使用x0=1。

cⁱ代表xⁱ离第i个聚类中心最近；
μ_k代表第k个聚类中心。

解决分离不佳的簇

有时候，我们遇到的数据并不都像左边的数据点那样各个聚类间有明显的分割，而是像右边的数据点一样看上去不容易分离。但是K均值算法依旧能够取得不错的结果。

K均值的损失函数

假设xⁱ和第5个聚类中心最近，那么cⁱ=5，μ_ci=μ₅。
K均值的优化目标：找到合适的cⁱ和μ_k，使得xⁱ和它被分到的聚类的中心（μ_ci）的距离最近。

可以证明在K均值算法中，第一步把xⁱ分到离它最近的聚类中心，其实就是调整cⁱ使得损失函数最小化；
第二步中重新计算新的聚类中心，其实就是调整μ_k使得损失函数最小化。

K均值初始化

Q：如何初始化K均值？
A：随机选择K个训练数据点作为初始化的聚类中心。

Q：K均值在不同的初始值下会有不同的结果，也就是说可能会陷入局部最优。如何避免陷入局部最优？
A：解决这个问题的方法是进行多次初始化。

一般来说，可以进行50到1000次随机初始化，然后计算每次的损失J，选择损失最小的模型。
多次随机初始化在K比较小的时候比较有用，比如K在2到10左右时，但是，如果K很大，比如成百上千，那么多次随机初始化可能并不会有太大的改善。

如何选择K

并没有一个很好的方法选择K，比如下图中的数据，有的人会把它分成两个聚类，也有人会把它分成四个聚类。

肘部法则：画出损失函数J随K的改变而改变的图，选择从急速下降到平缓下降的点（比如左边图中的K=3），但是有时候得到的图是右边的样子，并没有一个明确的点可供选择，这时候肘部法则就没什么用了。
总而言之，肘部法则是一个值得尝试的方法，但是不能期望它能解决所有问题。

通过下游目标确定。有时候，人们运用K均值算法是有一个目标的，比如可以考虑：如果把T-shirt分为3个尺码，它会买得怎么样？把它分为5个尺码会得到更高的销售量吗？这样就得到了K的数值。

主成分分析

另一种无监督学习是降维，降维不仅能使数据占用更少的内存，还能加速算法。

用途1：去除冗余特征

假设现在有一个二维的数据，两个维度的数据都是代表物体的长度，其中一维用厘米表示，另一个维度用英寸表示。我们可以让它们合并成一个特征。
这个例子有点勉强，但是在实际应用中，如果有成百上千个特征，就不容易知道哪些特征是冗余的。
假设有三个工程小组，第一个工程小组给你200个特征，第二个工程小组给你300个特征，第三个工程小组给你500个特征，总共有1000个特征。这时候就容易产生冗余数据。

这是一个三维数据点投影到二维平面的例子。

用途2：可视化数据

假设我们有关于各个国家的数据，每个国家有50个特征，我们怎么样才能看出这些国家之间的关联呢？

我们不可能画出50维的数据，但是如果我们能够把这50维的数据降到2维，并且保留数据的主要特征，那么我们就可以在二维的平面把它们画出来了。当然，直接看这个二维的数据可能并不知道每个特征表示的是什么。

当你把它们都画出来后，有可能就能知道每一维大概代表什么。

直观来理解主成分分析

主成分分析想要找到一个低维空间，使得数据点和它们在低维空间上投影的距离最短。
所以算法会选择投影到红色的线上而不是粉红色的线。

主成分分析与线性回归的区别

主成分分析看起来和线性回归很像，但是它们实际上是不同的：
线性回归中有一个特殊的分量y，而主成分分析中，每一个分量都是平等的。
而且线性回归中，数据到预测的y的距离是垂直于x轴的；而主成分分析中数据到投影点的距离是垂直于低维平面的。

在进行主成分分析之前，要对数据进行特征缩放（房子的面积和房间的数量相差较大）和归一化处理。

主成分分析想求的数据有两个：低维空间的坐标轴和数据点投影到低维空间后的坐标。

假设我们要把数据从n维降到k维，首先要求数据X间的协方差矩阵，然后对这个协方差矩阵进行奇异值分解，分解后能得到三个矩阵U,S,V，然后把U的前k个列向量取出来，记为U_reduce。

U_reduce就是降维后的空间坐标轴，降维后的数据坐标Z=U_reduce^TX

如何从降维后的数据重现原数据？
X≈X_approx=U_reduceZ，可以看到重现的数据完全是在一条直线上的。

选择要降到几维（K）

分别计算投影误差平方的平均值和数据的方差的平均值，我们会选择一个使得下图中的式子成立的k。也就是说，希望降维后的数据依旧保持原数据99%以上的方差。

一个直接的想法就是，从小到大选择k，计算U_reduce，Z，X_approx等，然后计算上面的等式是否成立，直到找到使等式成立的最小的k。
但是这个方法比较麻烦，有一个更简便的方法是计算下图右边的这个式子是否成立。比如说k=3时，计算奇异值分解得到的S的对角线上前3个元素的和比上对角线上所有元素的和，看看它是否大于等于99%，如果满足，k=3就是我们所要求的k。

降维用于加速算法

假设一个分类问题的输入X有10000维，我们可以把X拿出来，降维到1000维，然后用这个1000维的数据去进行训练。
注意，降维所需的矩阵U_reduce应该是在训练集里学到的，不应该使用验证集和测试集去学习U_reduce。当然，训练完的U_reduce验证集和测试集都是可以用的。

主成分分析的误用

主成分分析的一个误用是用于防止过拟合，这并不是正确的用法，并不是说这样做的结果不好，而是说主成分分析不会考虑y的取值，所以有可能丢失一些重要的信息。
一个正确防止过拟合的方法是使用正则化项，这种方法会考虑y的取值，而且效果也比较好。

另一个主成分分析的误用就是，人们在刚开始构造模型的时候就把主成分分析考虑进去，但是建议直接使用原数据进行训练。如果没有必要的理由（运行过慢或者占用内存过大等），就不应该使用主成分分析。

主成分分析应该被用在加速算法或可视化数据上。

编程

K均值

导包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sb
from skimage import io
from scipy.io import loadmat

找到离数据点最近的聚类中心

def find_closest_centroids(X, centroids):
# INPUT：数据X，初始聚类中心centroids
# OUTPUT：数据点应该被分到的类
    m = X.shape[0]
    k = centroids.shape[0]
    idx = np.zeros(m)    
    for i in range(m):
        min_dist = 1000000
        # 求离Xi最近的聚类中心，并保存在idx[i]
        for j in range(k):
            dist = np.sum((X[i]-centroids[j])**2)
            if dist < min_dist:
                min_dist = dist
                # 数据点Xi应该被分到第j类
                idx[i] = j
    return idx

# 测试一下上面的函数
data = loadmat('data/ex7data2.mat')
X = data['X']
initial_centroids = np.array([[3, 3], [6, 2], [8, 5]])
idx = find_closest_centroids(X, initial_centroids)
# array([0., 2., 1.])
idx[0:3]

展示原始数据

data2 = pd.DataFrame(data.get('X'), columns=['X1', 'X2'])
# 展示前五行数据
data2.head()

# 画出散点图
sb.set(context="notebook", style="white")
sb.lmplot('X1', 'X2', data=data2, fit_reg=False)
plt.show()

	X1	X2
0	1.842080	4.607572
1	5.658583	4.799964
2	6.352579	3.290854
3	2.904017	4.612204
4	3.231979	4.939894

计算新的聚类中心

def compute_centroids(X, idx, k):
# INPUT：数据X，聚类中心idx，簇的个数k
# OUTPUT：当前簇的聚类中心
    m, n = X.shape
    centroids = np.zeros((k, n))    

    for i in range(k):
        # 找到被分到第i个类的数据点的下标
        indices = np.argwhere(idx==i)
        centroids[i,:] = (np.sum(X[indices],axis=0))/len(indices)    
    return centroids

# array([[2.42830111, 3.15792418],
#       [5.81350331, 2.63365645],
#       [7.11938687, 3.6166844 ]])
compute_centroids(X, idx, 3)

实现K均值

def run_k_means(X, initial_centroids, max_iters):
# INPUT：数据X，初始化的聚类中心，最大迭代次数
# OUTPUT：当前簇的聚类中心
    # 初始化
    m, n = X.shape
    k = initial_centroids.shape[0]
    idx = np.zeros(m)
    centroids = initial_centroids
    
    # 迭代计算聚类中心和分配点到聚类中心
    for i in range(max_iters):
        idx = find_closest_centroids(X, centroids)
        centroids = compute_centroids(X, idx, k)    
    return idx, centroids

idx, centroids = run_k_means(X, initial_centroids, 10)

展示模型结果

# 划分三个聚类
cluster1 = X[np.where(idx == 0)[0],:]
cluster2 = X[np.where(idx == 1)[0],:]
cluster3 = X[np.where(idx == 2)[0],:]

fig, ax = plt.subplots(figsize=(12,8))
# 用不同颜色画出三个聚类的点
ax.scatter(cluster1[:,0], cluster1[:,1], s=30, color='y', label='Cluster 1')
ax.scatter(cluster2[:,0], cluster2[:,1], s=30, color='g', label='Cluster 2')
ax.scatter(cluster3[:,0], cluster3[:,1], s=30, color='b', label='Cluster 3')
# 画出聚类中心
ax.scatter(centroids[:,0],centroids[:,1], s=80, color = 'r', label='center')
# 显示数据点的含义
ax.legend()
plt.show()

在原始数据中随机选择K个作为初始化的聚类中心

def init_centroids(X, k):
    m, n = X.shape
    centroids = np.zeros((k, n))
    # m个样本点中任取k个
    idx = np.random.randint(0, m, k)    
    for i in range(k):
        centroids[i,:] = X[idx[i],:]    
    return centroids

# array([[3.81422865, 4.73526796],
#       [5.74036233, 3.10391306],
#       [2.68499376, 0.35344943]])
init_centroids(X, 3)

使用K均值压缩图片

from IPython.display import Image
Image(filename='data/bird_small.png')

image_data = loadmat('data/bird_small.mat')
image_data

A = image_data['A']
# (128, 128, 3)
A.shape

# 归一化数据
A = A / 255.
# 重置矩阵大小
X = np.reshape(A, (A.shape[0] * A.shape[1], A.shape[2]))
# (16384, 3)
X.shape

# 随机初始化聚类中心(16,3)，16个像素点，每个点RGB三原色
initial_centroids = init_centroids(X, 16)
# 运行之前写好的聚类算法，迭代10次
idx, centroids = run_k_means(X, initial_centroids, 10)
# 得到最终的聚类中心
idx = find_closest_centroids(X, centroids)
# 把每一个像素值分到各个聚类中心
X_recovered = centroids[idx.astype(int),:]
# (16384, 3)
X_recovered.shape

# 为了方便展示，转化回原始大小
X_recovered = np.reshape(X_recovered, (A.shape[0], A.shape[1], A.shape[2]))
# (128, 128, 3)
X_recovered.shape

pic = io.imread('data/bird_small.png') / 255.
fig, ax = plt.subplots(1, 2)
# 原图像
ax[0].imshow(pic)
# 压缩后的图像
ax[1].imshow(X_recovered)
plt.show()

看得出来，还是保留大量信息的。

使用sklearn来实现K均值

# 导入图像和初始化
pic = io.imread('data/bird_small.png') / 255.
io.imshow(pic)
plt.show()
# (128, 128, 3)
pic.shape
# 重置图像大小
data = pic.reshape(128*128, 3)
# (16384, 3)
data.shape

#导入k-means库
from sklearn.cluster import KMeans
model = KMeans(n_clusters=16, n_init=100, n_jobs=-1)
# Out[25]:KMeans(algorithm='auto', copy_x=True, init='k-means++', max_iter=300,
#       n_clusters=16, n_init=100, n_jobs=-1, precompute_distances='auto',
#       random_state=None, tol=0.0001, verbose=0)
model.fit(data)

centroids = model.cluster_centers_
# (16, 3)
print(centroids.shape)
C = model.predict(data)
# (16384,)
print(C.shape)
# (16384,3)
centroids[C].shape

compressed_pic = centroids[C].reshape((128,128,3))

fig, ax = plt.subplots(1, 2)
ax[0].imshow(pic)
ax[1].imshow(compressed_pic)
plt.show()

和上面自编程的比较，可以看到鸟嘴的颜色更丰富，而黑色羽毛的层次减少了。

主成分分析

加载并展示数据

data = loadmat('data/ex7data1.mat')
data
X = data['X']
fig, ax = plt.subplots(figsize=(12,8))
ax.scatter(X[:, 0], X[:, 1])
plt.show()

实现主成分分析

# 实现奇异值分解
def pca(X):
# INPUT：数据X
# OUTPUT：矩阵U，S，V

    # 归一化数据
    X = (X-X.mean())/X.std()    
    # 计算协方差矩阵
    X = np.matrix(X)
    cov = X.T@X    
    # 进行奇异值分解
    U, S, V = np.linalg.svd(cov)    
    return U, S, V

U, S, V = pca(X)
# (matrix([[-0.79241747, -0.60997914],
#         [-0.60997914,  0.79241747]]),
# array([71.79226819, 28.20773181]),
# matrix([[-0.79241747, -0.60997914],
#         [-0.60997914,  0.79241747]]))
U, S, V

# 使数据投影到低维空间
def project_data(X, U, k):
    # 取前k个列向量，因为低维空间的维数是k
    U_reduced = U[:,:k]
    return np.dot(X, U_reduced)

Z = project_data(X, U, 1)
Z

# 降维后的数据还原回高维空间
def recover_data(Z, U, k):
    U_reduced = U[:,:k]
    return np.dot(Z, U_reduced.T)

X_recovered = recover_data(Z, U, 1)
X_recovered

fig, ax = plt.subplots(figsize=(12,8))
ax.scatter(list(X_recovered[:, 0]), list(X_recovered[:, 1]))
plt.show()

可以看到，还原回高维空间后，数据都在一条直线上了，什么这个压缩是有损压缩（也就是说不能完全还原回原来的样子）。

使用主成分分析压缩图像

faces = loadmat('data/ex7faces.mat')
X = faces['X']
# (5000, 1024)
X.shape

face = np.reshape(X[3,:], (32, 32))
plt.imshow(face)
plt.show()

从1024维降到100维

U, S, V = pca(X)
Z = project_data(X, U, 100)

X_recovered = recover_data(Z, U, 100)
face_pca = np.reshape(X_recovered[3,:], (32, 32))
fig, ax = plt.subplots(1, 2)
ax[0].imshow(face)
ax[1].imshow(face_pca)
plt.show()

左边是原图像，右边是降维后再还原到高维的图像。

七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
吴恩达机器学习全课程笔记第一篇亿维数组 Machine Learning 机器学习笔记人工智能
目录前言P1-P8监督学习无监督学习P9-P14线性回归模型成本（代价）函数P15-P20梯度下降P21-P24多类特征向量化多元线性回归的梯度下降P25-P30特征缩放检查梯度下降是否收敛学习率的选择特征工程多项式回归前言从今天开始，争取能够在开学之前（2.25）把b站上的【吴恩达机器学习】教程过一遍，并把笔记记录于此，本笔记将会把此课程每一p的重点内容及其截屏记录于此，以供大家参考和本人日后复
吴恩达机器学习全课程笔记第二篇亿维数组 Machine Learning 机器学习笔记人工智能学习
目录前言P31-P33logistics（逻辑）回归决策边界P34-P36逻辑回归的代价函数梯度下降的实现P37-P41过拟合问题正则化代价函数正则化线性回归正则化logistics回归前言这是吴恩达机器学习笔记的第二篇，第一篇笔记请见：吴恩达机器学习全课程笔记第一篇完整的课程链接如下：吴恩达机器学习教程（bilibili）推荐网站：scikit-learn中文社区吴恩达机器学习学习资料（gith
吴恩达机器学习—大规模机器学习魏清宇
学习大数据集数据量多，模型效果肯定会比较好，但是大数据也有它自己的问题，计算复杂如果存在100000000个特征，计算量是相当大的，在进行梯度下降的时候，还要反复求损失函数的偏导数，这样一来计算量更大。那么有没有简单的方法来应对大量的数据呢？我们可以采取随机抽样，比如，抽取1000个样本进行模型的构建。那么如何决定抽取多少样本呢？可以通过学习曲线获得，随着数据量的增加，无论是偏差和误差，都会趋向于
吴恩达机器学习—正则化魏清宇
过拟合问题欠拟合与过拟合当变量过少时，可能存在欠拟合；当变量过多时，会存在过拟合。过拟合可能对现有数据拟合效果较好，损失函数值几乎为零，但是不能进行泛化时，即不适于非训练集的其他数据。如何解决过拟合问题特征变量过多造成过拟合绘制假设模型图像，但当特征变量变多时，绘制很困难。当变量过多而训练数据较少时，容易出现过拟合。过拟合的解决办法解决过拟合问题，通常有两种方法：一种是减少特征的数量，可以通过人工
吴恩达机器学习—推荐系统魏清宇
问题规划引例—电影推荐假设已有的数据如上所示，洋红色线内的数据表示缺失数据，那么我们如何根据已有的评分数据来预测这些缺失的数据呢？基于特征的推荐算法基于内容的推荐系统已知数据如上，有四个人对于不同电影的评分，我们还有分别表示电影包含浪漫成分和动作片成分的多少。那么每一个电影都可以用一个向量来表示，如第一个电影可以表示为,其中第一个元素为常数。那么对于每一个用户j，我们可以用一个学习算法学习参数，然
【吴恩达机器学习】第八周—聚类降维Kmeans算法 Sunflow007
31.jpg1.聚类(Clustering)1.1介绍之前的课程介绍的都是监督学习、而聚类属于非监督学习，在一个典型的监督学习中，我们有一个有标签的训练集，我们的目标是找到能够区分正样本和负样本的决策边界，在这里的监督学习中，我们有一系列标签，我们需要据此拟合一个假设函数。与此不同的是，在非监督学习中，我们的数据没有附带任何标签，我们拿到的数据就是这样的：1.png在这里我们有一系列点，却没有标签
吴恩达机器学习笔记（2） python小白22
一.逻辑回归1.什么是逻辑回归？逻辑回归是一种预测变量为离散值0或1情况下的分类问题，在逻辑回归中，假设函数。2.模型描述在假设函数中，，为实数，为Sigmoid函数，也叫Logistic函数。模型解释：，即就是对一个输入，的概率估计。损失函数的理解：所谓最大似然估计，就是我们想知道哪套参数组合对应的曲线最可能拟合我们观测到的数据，也就是该套参数拟合出观测数据的概率最大，而损失函数的要求是预测结果
【Andrew Ng机器学习】单变量线性回归-模型描述 jenye_
课程：吴恩达机器学习一个监督学习的例子——房价预测使用的是一组俄勒冈州波特兰市的城市住房价格的数据。根据不同的尺寸的房间对应的不同售价，组成的数据集来画图。你有一个朋友想要卖房子，假设房子的大小是1250平方英尺，那么这套房可以卖多少钱？此时就可以进行模型拟合。根据这个模型，那么你可以告诉他这套房或许可以卖到220k。监督学习：每一个例子都有“正确的答案”，也就是说我们知道了数据集中卖出的房子的实
ML：2-2-3 多分类问题multicalss skylar0 分类机器学习人工智能
文章目录1.多分类问题的定义2.softmax3.神经网络的softmax输出【吴恩达机器学习65-67】1.多分类问题的定义classification问题可能的output大于2种。multiclass的预测图像可能是右侧这样的。2.softmaxsoftmaxregression算法是logisticregression的泛化（通用化）。【binaryclassification---->m
Coursera吴恩达机器学习课程笔记——神经网络: 学习（Neural Networks: Learning） yanglamei1962 机器学习笔记神经网络
9神经网络:学习（NeuralNetworks:Learning）9.1代价函数（CostFunction）神经网络的分类问题有两种：二元分类问题（0/1分类）只有一个输出单元（K=1K=1K=1）多元（KKK）分类问题输出单元不止一个（K>1K\gt1K>1）神经网络的代价函数公式：hΘ(x)=a(L)=g(Θ(L−1)a(L−1))=g(z(L))h_\Theta(x)=a^{(L)}=g(\
吴恩达机器学习笔记十二 Sigmoid激活函数的替代方案激活函数的选择为什么要使用激活函数爱学习的小仙女！机器学习机器学习人工智能
在需求预测案例中，awareness这个输入可能不是二元(binary)的，或许是一点(alittlebit)、有些(somewhat)或完全(extremely)，此时相比将awareness规定为0、1，不如考虑概率，认为它是一个0-1之间的数。激活函数可以采用ReLU函数(rectifiedlinearunit)三个常用的激活函数使用线性激活函数也可以看作是没有激活函数。激活函数的选择输出层
吴恩达机器学习笔记十神经网络 TensorFlow 人工智能爱学习的小仙女！机器学习神经网络人工智能深度学习
神经网络：说几层的时候是指隐藏层及输出层，不包含输入层。例如下图是一个四层神经网络。前向传播(forwardpropagation)越靠近输出层，该层的神经元数量越少TensorFlow（张量流）实现神经网络的搭建sequential（）把两层顺序连接起来；如果有新的x，用predict()人工智能
吴恩达机器学习- 正则化 YANWeichuan
过拟合和欠拟合定义和形态解决方法减少特征值数量正则化正则化惩罚θ系数线性回归正则化逻辑回归正则化
最强机器学习入门博客（吴恩达机器学习课程总结） PengHao666999 机器学习人工智能
机器学习的概述诞生现实生活许多领域的问题不能通过显式编程实现，比如制造自动驾驶汽车、智能工厂、规模农业、计算机视觉等等，一种好的实现方式是通过学习算法让计算机自己学习如何做。现在现在是学习机器学习最好的时机，因为机器学习在未来能产生巨大的价值未来机器学习在软件领域方面取得了巨大的价值，比如智能推荐，网络搜索，图像识别等机器学习在许多其他的领域仍有巨大的价值，比如未来在自动驾驶汽车，工厂，农业，医疗
在学习吴恩达机器学习课程中遇到的一些问题 ttyykx 学习机器学习 jupyter
C1_W1_Lab04_Cost_function_Soln中遇到的一些问题1、importnumpyasnp%matplotlibnotebookimportmatplotlib.pyplotaspltfromlab_utils_uniimportplt_intuition,plt_stationary,plt_update_onclick,soup_bowlplt.style.use('./d
吴恩达机器学习Coursera-week11 geekpy
PhotoOCR在此章的课程中，Andrew主要是想通过OCR问题的解决来阐释在实际项目中我们应该如何定义问题，并将一个大问题分解为多个小问题，并通过pipeline的方式将对这些小问题的解决方案串联起来，从而解决这个大问题。我认为这是解决实际问题的一个经典的方法论，有助于我们在实际工作和生活中更好地思考问题，分解问题，并最终解决问题。ProblemDescriptionandPipeline此小
吴恩达机器学习介绍第一章介绍清☆茶机器学习人工智能
1.机器学习的概念在进行特定编程的情况下，给予计算机学习的能力。机器学习是一种人工智能的分支，它关注如何通过计算机算法和模型来使计算机系统从数据中学习和改进。机器学习的目标是让计算机系统能够自动分析和理解数据，并根据数据的模式和规律做出预测和决策，而无需明确的编程指令。机器学习可以分为监督学习、无监督学习和强化学习三种类型。在监督学习中，计算机系统通过使用带有标签的训练数据来学习模式和规律，然后根
【Andrew Ng机器学习】单变量线性回归-梯度下降 jenye_
课程：吴恩达机器学习此篇我们将学习梯度下降算法，我们之前已经定义了代价函数J，梯度下降法可以将代价函数J最小化。梯度下降是很常用的算法，他不仅被用在线性回归上，还被广泛应用与机器学习的众多领域。之后，我们也会用到梯度下降法最小化其他函数，而不仅仅是最小化线性回归的额代价函数J。我们的问题我们有一个代价函数J(\theta_0|theta_1$)，可能是线性回归的代价函数，也可能是其他需要最小化的函
第八章正则化 tomas家的小拨浪鼓
该系列文章为，观看“吴恩达机器学习”系列视频的学习笔记。虽然每个视频都很简单，但不得不说每一句都非常的简洁扼要，浅显易懂。非常适合我这样的小白入门。本章含盖8.1过拟合问题8.2代价函数8.3线性回归的正则化8.4Logistic回归的正则化8.1过拟合问题在将线性回归和logistic回归应用到某些机器学习应用中时，会出现过度拟合问题，导致它们表现欠佳。正则化能够改善或者减少过度拟合问题。什么是
2022-12-14科研日志独孤西
今天主要学习了吴恩达机器学习的网课，又复习了一下机器学习；然后看了看VIO相关资料论文，今天看了几篇知网上搜到的关于VIO的硕士博士毕业论文和一篇20年的VIO综述，这方面的论文对于一个领域一般都有比较全面的描述。通过阅读我也了解了VIO领域的一些典型成果。VIO主流成果VIO是属于SLAM领域中的一个子课题，典型的VIO系统同样是由前端、后端、回环检测等几部分构成的。VIO的前端按是否提取特征点
吴恩达机器学习笔记-Logistic回归模型 Carey_Wu
回归函数在逻辑回归模型中我们不能再像之前的线性回归一样使用相同的代价函数，否则会使得输出的结果图像呈现波浪状，也就是说不再是个凸函数。代价函数的表达式之前有表示过,这里我们把1/2放到求和里面来。这里的求和部分我们可以表示为：很显然，如果我们把在之前说过的分类问题的假设函数带进去，即，得到的结果可能就是上述所说的不断起伏的状况。如果这里使用梯度下降法，不能保证能得到全局收敛的值，这个函数就是所谓的
吴恩达机器学习笔记（1） python小白22
一.初识机器学习1.监督学习在监督学习中，训练数据既有特征又有标签，通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。监督学习可以分为回归问题和分类问题。回归问题是利用训练出的模型，预测连续的数值输出；分类问题是预测离散值的输出。2.无监督学习无监督学习是给算法大量的数据，要求它找出数据的类型结构。无监督学习的数据没有标签，或是所有数据都是同一种标签
ML：2-2neural network layer skylar0 机器学习
文章目录1.神经网络层2.更复杂的神经网络3.神经网络的前向传播【吴恩达机器学习笔记p47-49】1.神经网络层【了解神经网络如何完成预测的】input：4个数字的向量。3个神经元分别做logisticregression。下角标：标识第i个神经元的值。上角标：表示第j层layer的值。这3个神经元所做的logisticregression的结果组成了一个向量a将传给ouputlayer。第1层的
ML：5-1 neural networks skylar0 机器学习
文章目录course2框架1.neuralnetworks（deeplearning）2.DemandPrediction【吴恩达机器学习p43-46】course2框架一、neuralnetworks-inference（预测）二、neuralnetworks-training三、practiceadviceforbuildingmachinelearningsystems四、decisiont
吴恩达机器学习笔记（1）——单变量线性回归机智的神棍酱
上一个笔记，我们大概了解了什么是机器学习以及机器学习的两个重要的分类，本篇笔记将带领大家了解机器学习的第一个模型——线性回归例题为了让大家更加直观的理解这个模型，我们引入一个例题，我们有一组波特兰市的城市住房的价格数据，我们要通过这些数据来找出一个函数，来预测任意面积下的房价，这就是一个简单的线性回归问题。这里给出的数据是一组房子面积对应的房价数据集其中m代表训练集，x是输入，y是输出。我们用（x
【吴恩达机器学习】第一周课程笔记 Estella_07 机器学习笔记人工智能
Hello，这里是小梁。下面是我近期学习机器学习的笔记，出发点是希望对自己起到一个督促和输出的作用如果你对我的笔记感兴趣欢迎Like，有不足之处也欢迎评论留言B站【2022吴恩达机器学习Deeplearning.ai课程】笔记参考【吴恩达《MachineLearning》精炼笔记】1机器学习的定义与分类1.1监督学习Supervisedlearning1.2无监督学习Unsupervisedlea
吴恩达机器学习笔记 AADGSEGA 机器学习
吴恩达机器学习笔记第一周基本概念监督学习分为回归算法和分类算法无监督学习事先没有正确答案。例如将客户群分成不同类，混合的声音区分开先在Octave或者matlab实现，可行，再尝试用Java或者python或者C++重新写出来只考虑两个变量的线性回归：例如找出一条函数拟合房价的那个例子里面的数据点。数据集：输入x[i]，输出y[i]，中间函数是h。使用成本函数（即方差误差，这里假设是只有房屋大小这
ML学习安排和资源链接 Nice night #ML吴恩达机器学习
第一阶段：学习前置数学知识机器学习的数学基础_二进制人工智能的博客-CSDN博客第二阶段：认知机器学习吴恩达机器学习【2022中文版教程全集】_哔哩哔哩_bilibili视频5h，看了一点发现后面没字幕了，这个(强推|双字)2022吴恩达机器学习Deeplearning.ai课程_哔哩哔哩_bilibili视频19h。但是这个是属于新课，所以还是先看第三阶段上：仔细了解机器学习视频链接：[中英字幕
深度学习学习顺序梳理陌上阳光深度学习深度学习人工智能
https://www.bilibili.com/video/BV1to4y1G7xq/?spm_id_from=333.999.0.0&vd_source=9607a6d9d829b667f8f0ccaaaa142fcb1.吴恩达机器学习课程已学完，时间较久了，后续可以重新听一遍，整理一下笔记2.白板推导读西瓜书统计学习方法看完了，时间也比较久了，重新看一遍整理笔记西瓜书，没看完过，后续再看3.
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

【深度之眼吴恩达机器学习第四期】笔记（九）

目录

K均值

K均值算法

语言描述

伪代码描述

解决分离不佳的簇

K均值的损失函数

K均值初始化

如何选择K

主成分分析

用途1：去除冗余特征

用途2：可视化数据

直观来理解主成分分析

主成分分析与线性回归的区别

选择要降到几维（K）

降维用于加速算法

主成分分析的误用

编程

K均值

主成分分析

你可能感兴趣的:(吴恩达机器学习)