calmdownn

【吴恩达】机器学习作业ex8--异常检测和推荐系统（Python）

一.前言

此次作业也是分为俩大部分，第一部分是利用高斯分布来检测计算机中的异常行为，每个计算机有吞吐量和响应延迟俩个特征，此次数据集分为测试集和交叉验证集，交叉验证集中的yval集合是标注是否正常或者异常，测试集中并没有此标注，需要我们来找出异常，熟练之后，还要将其应用于更高维的数据集中，第二部分是推荐系统，给一个新用户推荐10部他有可能会喜欢的电影

二.异常检测

1.ex8data1.mat代码部分

1.1 导入工具包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.io import loadmat

1.2 导入数据

导入测试集和交叉验证集

data = loadmat('ex8data1.mat')
# print(data.keys())  # ['__header__', '__version__', '__globals__', 'X', 'Xval', 'yval']
Xtest = data['X']
Xval = data['Xval']
yval = data['yval']

Xtest,Xval,yval的维度如下：

1.3 图像分布

从图像可以看出，有几个点的布局有点离谱，这几个离谱点一般被认为是异常点

# 看一下图像分布
def plot_pic(Xtest):
    plt.figure(figsize=(13, 8))
    plt.scatter(Xtest[:, 0], Xtest[:, 1], c='purple', s=150)
    pass

# plot_pic(Xtest)
# plt.show()

1.4 获取高斯分布的参数（平均值和方差）

平均值和方差的求法如下图：简单说一下，平均值就是当前这一列特征值的所有行数据相加和再除以行数，得到的就是此特征值的平均值，方差也是同理，用当前这一列特征值的所有行数据减取当前特征值的平均值，开平方再加到一起，最后除以行数即可

说一下代码的思想，我用的是矩阵运算方法，这样可以减少运算时间，看着也更方便，这里平均值就是利用Xtest.sum(0)，意思就是对Xtest的每一列都求和，然后放入mean_matrix,这里mean_matrix矩阵的维度是1行2列（1，2），同理方差也是这个方法，套入公式返回到一个variance_matrix矩阵中，里面存放着每列特征值的方差，维度同样是1行2列（1，2）

# 获取一下高斯函数的参数
def get_gaussian_parameters(Xtest):
    X_rows, X_colums = Xtest.shape
    mean_matrix = Xtest.sum(0) * (1 / X_rows)  # sum0是列求和，sum1是行求和,这里得到的是每个特征值的平均值mu
    variance_matrix = np.power(Xtest - mean_matrix, 2).sum(0) * (1 / X_rows)  # 里面存放每个特征值的方差
    return mean_matrix, variance_matrix
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# print(mean_matrix,variance_matrix)

测试集（Xtest）的平均值和方差如下：

1.5 高斯函数

高斯分布的算法如下：

高斯分布也就是正态分布，通常我们认为x符合高斯分布， x ∼ N ( μ , σ 2 ) ，概率函数如下图，注意，下图的X可以看成是Xj，也就是第i个特征向量，同理 μ 和 σ2 也是属于第j个特征值的平均值和方差

下图可以看出，μ 和 σ2 对P(Xj)的影响，μ控制中心坐标，σ2控制宽度

下面这个公式就是给定一行数据，假如此数据有n个特征值，那么就要求出每个特征值的p(xj)，将这个数据所有特征值p(xj)进行练乘，就得到了最终的p(x)，p(x)在三维图像上代表的就是高度，概率越大高度越高，越贴近中心，反之也成立

# 高斯函数
def get_gaussian(mean_matrix, variance_matrix, Xtest):
    X_rows, X_colums = Xtest.shape
    front = np.power(2 * np.pi * np.power(variance_matrix, 1 / 2), 1 / 2 * (-1))  # 公式前一部分
    back = np.exp(-np.power(Xtest - mean_matrix, 2) / (2 * variance_matrix))  # 公式后一部分
    p = front * back
    p_matrix = np.prod(p, axis=1)  # 得到一个1*307的矩阵，每一列都是已经算好的，根据公式累乘就行
    return p_matrix
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# p_matrix = get_gaussian(mean_matrix,variance_matrix,Xtest)
# print(p_matrix)
# print(p_matrix.shape,p_matrix)

在这里简单说一下代码过程：我这里同样是直接用矩阵操作的，得到的p维度为307*2，行代表307行数据，2列就代表2个特征值所对应各自的概率值p(xj)，每行数据总的p(x)就是其每个特征值自己的p(xj)进行相乘，所以最好用了np.prod()函数，来将矩阵p的所有列相乘得到p_matrix最终矩阵

测试集返回的p矩阵数据如下：

1.6 画高等线图

画高等线图就是为了更直观的看到概率p(x)的分布情况，简单说一下画这个图的思想：

首先创建x,y为0-30分100段的俩个轴，因为高等线图是三维状态，所以我们得将x,y俩个轴绘制成一张大网格，可以把这个网格想象成地面，np.meshgrid()作用就是绘制成网格后，返回每个网格的横纵坐标，zz就是将网格的所有横纵坐标捏和到一起，将zz传入高斯分布函数中，返回的就是当前网格的概率p，前面说过了p(x)其实就是高度，小网格的概率p(x)越大，越靠近中心，高度也越高，正常点的概率更大，反之异常点的概率更大，但判断是否异常的分界点p需要在后面找

# 画一下高等线图
def plot_countour(mean_matrix, variance_matrix, Xtest):
    plt.figure(figsize=(13, 8))
    x = np.linspace(0, 30, 100)
    y = np.linspace(0, 30, 100)
    xx, yy = np.meshgrid(x, y)  # 将xy绘制成网格，xx,yy分别是网格的所有横纵坐标
    zz = np.c_[xx.ravel(), yy.ravel()]  # 将网格中每一个小网格的坐标都放入z中，然后进行高斯函数求值（10000，2）
    p = get_gaussian(mean_matrix, variance_matrix, zz)  # 高斯函数返回的是（10000，）维度的矩阵
    p = p.reshape(xx.shape)  # 重新绘制成网格的形态（100，100）
    cont_levels = [10 ** h for h in range(-20, 0, 3)]
    plt.contour(xx, yy, p, cont_levels)  # xx,yy代表的是底部平面，平面由网格组成，每个网格的值也就是P值，就是高度，高度越高代表概率越大
    plt.scatter(Xtest[:, 0], Xtest[:, 1], c='purple', s=100)
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# plot_countour(mean_matrix,variance_matrix,Xtest)
# plt.show()

图中一圈一圈的就是等高线，因为这是二维图片，所以在三维图中此线是高度，被揪起来的感觉，可以看到越外圈的等高线，概率越低，高度也越低，在外圈上的点作为异常点的概率也越大

1.7 构造一个评分函数

构造评分函数的目的：

在进行高斯分布算法之后会得到矩阵p(x)，里面存放着数据集集每行数据的概率，要判断是否是异常点，我们需要找出一个参数 ε ，以此作为分界点，比当前 ε 小的概率p就会被视为异常点，反之为正常点，但是这个参数 ε 需要不停的尝试才行，所以需要一个评分函数来对每一个 ε 进行评分，来取最适合的分界点

评分函数的过程：
此次用的是计算F1score的方法，需要将TP,FP,TN,FN都先计算好，注意这里计算它们一定要用交叉验证集当中的数据，因为只有交叉验证集中才有yval结果，才能进行判断操作。

下一步求出prec与rec:

最后将prec.rec带入下面公式求出f1即可

注意！！！：一定要注意分母为0的情况，将分母为0的情况做一个if 分支，不然会报错

# 下面构造一个评分函数，判断边界函数是否够好
def predict_score(p, yval, e):
    p = p.reshape(yval.shape)
    rows, columns = yval.shape
    TP = 0
    FP = 0
    TN = 0
    FN = 0
    prec = 0
    rec = 0
    F1 = 0
    # p ( x ) < ε 被认为异常（y = 1），p ( x ) < ε(y = 0) 被认为正常
    for i in range(rows):
        if (p[i, :] > e):  # 预测为0
            if (yval[i, :] == 0):
                TN += 1  # 实际为0
            else:
                FN += 1  # 实际为1
        if (p[i, :] < e):  # 预测为1
            if (yval[i, :] == 1):
                TP += 1  # 实际为1
            else:
                FP += 1  # 实际为0

    if (TP + FP):
        prec = TP / (TP + FP)
    if (TP + FN):
        rec = TP / (TP + FN)
    if (prec + rec):
        F1 = (2 * prec * rec) / (prec + rec)

    return F1
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# p_matrix = get_gaussian(mean_matrix,variance_matrix,Xval)
# F1 = predict_score(p_matrix,yval,p_matrix[0])

1.7 挑选边界 ε 值

下面就开始找最适合的参数 ε ，作为p矩阵的概率边界，这里参数范围我选择的p(x)矩阵最大值到最小值之间，分成1000段，依次带入评分函数进行评分，最后返回最好的预测分数以及参数 ε

# 下面构造select函数，用来选出最好的ε作为分解条件
def select_beste(p, yval):
    p_max = np.max(p)
    p_min = np.min(p)
    e_list = np.linspace(p_min, p_max, 1000)
    best_score = 0
    final_e = p_min
    for i in e_list:
        cur_score = predict_score(p, yval, i)
        if (cur_score > best_score):
            best_score = cur_score
            final_e = i
    return best_score, final_e

下面运行一下，注意取得平均值和方差是属于测试集的，对于高斯算法求出的概率矩阵p_matrix是属于交叉验证集的

# 取一下边界e
mean_matrix, variance_matrix = get_gaussian_parameters(Xtest)
p_matrix = get_gaussian(mean_matrix, variance_matrix, Xval)
best_score, final_e = select_beste(p_matrix, yval)
print(f"best_score:{best_score},final_e:{final_e}")

1.8 找出异常点并在图像上标出

上面通过交叉验证集已经得到了最好的参数 ε （final_e），接下来先获取测试集的概率矩阵p_matrix1,用np.where()函数去筛选所有比ε （final_e）小的数据行，将这些数据行在图片上表示出来即可

p_matrix1 = get_gaussian(mean_matrix,variance_matrix,Xtest)  # 这个p矩阵一定要是Xtest的
weird_point = np.where(p_matrix1 < final_e)[0]
plot_countour(mean_matrix,variance_matrix,Xtest)
plt.scatter(Xtest[weird_point,0],Xtest[weird_point,1],edgecolors='r',s=300,facecolors='none')
plt.show()

2. ex8data2代码部分（高维）

2.1 导入数据

data2 = loadmat('ex8data2.mat')
# print(data2.keys()) # ['__header__', '__version__', '__globals__', 'X', 'Xval', 'yval']
X2test = data2['X']
X2val = data2['Xval']
y2val = data2['yval']
# print(X2test.shape, X2val.shape, yval.shape)  # (1000, 11) (100, 11) (100, 1)

X2test,X2val,yval的维度如下：可以看出有11个特征值

2.2 找出异常点

过程还是一样的，先利用交叉验证集（X2val）找出最优的参数 ε（final_e），接下来获取测试集（X2test）的概率矩阵p_matrix1，找出异常点，展示异常点的个数

mean_matrix, variance_matrix = get_gaussian_parameters(X2test)
p_matrix = get_gaussian(mean_matrix, variance_matrix, X2val)
best_score, final_e = select_beste(p_matrix, y2val)
print(f"best_score:{best_score},final_e:{final_e}")
p_matrix1 = get_gaussian(mean_matrix,variance_matrix,X2test)
weird_point = np.where(p_matrix1 < final_e)[0]
print(len(weird_point))

可以看出异常点有117个

三.推荐系统

1.前言

此部分目的是给新用户推荐10个新电影，利用以往的用户对电影的评分，通过协同过滤算法来求出X与Theta矩阵，ex8movies.mat的数据集中存放着Y矩阵（1682行*943列数据），行列分别代表了1682篇电影与943个用户，矩阵中存放的是用户对电影的打分。其中还有R矩阵（1682，943），矩阵中只有0和1俩个值，0代表用户没有看过此电影，1代表看过并且打分

2.代码部分（ex8movies.mat/ex8movies.txt）

2.1 导入包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.io import loadmat
from scipy.optimize import minimize

2.2 导入数据

先导入ex8_movies.mat，将Y矩阵和R矩阵取出

data = loadmat('ex8_movies.mat')
# print(data.keys()) # ['__header__', '__version__', '__globals__', 'Y', 'R']
Y = data['Y']  # 不用用户对于不同电影的评分，行为电影数，列为用户数（维度：1682，943）
R = data['R']  # 判断是否有评分，维度与Y矩阵相同
# print(Y.shape,R.shape)

其次导入ex8_movieParams.mat,这个数据集分别存放着：用户的数量，电影数量，特征数量以及电影特征值矩阵（X）和用户特征值矩阵（Theta）

data2 = loadmat('ex8_movieParams.mat')
# print(data2.keys()) # ['__header__', '__version__', '__globals__', 'X', 'Theta', 'num_users', 'num_movies', 'num_features']
X = data2['X']  # 电影类型偏向的特征值
Theta = data2['Theta']  # 用户的特征值
num_users = int(data2['num_users'])  # 用户数量
num_movies = int(data2['num_movies'])  # 电影数量
num_features = int(data2['num_features'])  # 特征数量(X和Theta矩阵的)
# print(X.shape,Theta.shape)  # (1682, 10) (943, 10)
# print(num_users,num_movies,num_features)  # [943] [1682] [10]

2.3 序列化参数

这里说一下为什么要序列化参数，其实就是改变矩阵的形状，我们后面会用到opt.minimize()这个函数方法，这个优化方法里面需要的参数X0一定得是一维数组（nums，），所以这里将欲求的X与Theta矩阵进行序列化，将（1682，10）（943，10）维度的俩个矩阵变成（26250，）

再说一下np.r_函数，np.r_与np.c_都是对矩阵进行合并，np_r是以行为基准进行合并，可以理解为行叠加，上下组合，np_c正相反，它是以列为基准进行合并，列叠加，左右进行组合，有一点需要注意的是当内部是俩个一维度矩阵时，np_r是将第二个一维矩阵直接加在第一个一维矩阵的屁股后面,而np_c是将俩个一维矩阵先排成N行一列的矩阵，然后将俩个矩阵结合成N行俩列的矩阵

# 更改参数形状
def change_shape(X, Theta):
    return np.r_[X.flatten(), Theta.flatten()]  # np.r_函数对于1维数据，进行的就是合并的操作，和np.append作用相同，但是高维度就是行相加
    pass

2.4 解序列

上面合并成了一维数据，但在运算时候还是需要用到矩阵的四和运算，因为合并时候是电影在前用户在后，所以前（电影数量*特征数量）个数据是属于X矩阵的，剩下的为Theta矩阵

# 恢复参数形状
def recover_shape(coverage_XTheta, num_users, num_movies, num_features):
    X = coverage_XTheta[: num_movies * num_features].reshape(num_movies, num_features)
    Theta = coverage_XTheta[num_movies * num_features:].reshape(num_users, num_features)
    return X, Theta
    pass

2.5 代价函数

代价函数的公式如下，给定X求Theta的代价函数，给点Theta求X的代价函数，将他们结合

下面为结合之后的公式，俩项正则项，分别是X和Theta矩阵，其他地方相同

下面是我用矩阵来进行求解的过程

求出预测矩阵带入公式即可，因为只检测有评分的电影，所以最后直接与矩阵R进行点乘即可

# 代价函数
def cost_function(coverage_XTheta, num_users, num_movies, num_features, Y, R, lamda):
    X1, Theta1 = recover_shape(coverage_XTheta, num_users, num_movies, num_features)
    variance_part = np.power((X1 @ Theta1.T - Y) * R, 2).sum()  # [email protected]为所有预测的值偏差，与矩阵R进行点成，筛选出看过的电影
    reg1 = lamda * np.power(X1, 2).sum()
    reg2 = lamda * np.power(Theta1, 2).sum()
    return (variance_part + reg1 + reg2) * (1 / 2)
    pass

随便取些值看一下代价函数

users = 4
movies = 5
features = 2
X1 = X[:movies,:features]
theta1 = Theta[:users,:features]
coverage_1 = change_shape(X1,theta1)
Y1 = Y[:movies,:users]
R1 = R[:movies,:users]
print(cost_function(coverage_1,users,movies,features,Y1,R1,1))

2.6 梯度下降导数部分

这里只需要提供梯度下降的导数即可，opt.minimize()函数会用内部算法自动进行迭代更新

矩阵求法的推导过程与上面相似，有很多写的形式都可以，在Theta导数部分也可以将转质放到后面一起翻转，只要结构和结果对怎么都可以

# 下面是梯度下降的导数参数
def gradient_func(coverage_XTheta, num_users, num_movies, num_features, Y, R, lamda):
    X1, Theta1 = recover_shape(coverage_XTheta, num_users, num_movies, num_features)
    X_derivative = ((X @ Theta1.T - Y) * R) @ Theta1 + lamda * X1
    Theta_derivative = ((Theta1 @ X.T - Y.T) * R.T) @ X + lamda * Theta1
    return change_shape(X_derivative, Theta_derivative)
    pass

2.7 添加新用户

# 添加新的用户
my_ratings = np.zeros((num_movies, 1))
my_ratings[0] = 5
my_ratings[7] = 5
my_ratings[14] = 4
my_ratings[21] = 4
my_ratings[28] = 3
my_ratings[35] = 3
my_ratings[75] = 2
my_ratings[163] = 2
my_ratings[260] = 1
my_ratings[370] = 5
my_ratings[580] = 5
my_ratings[600] = 5
my_ratings[800] = 5

# print(Y.shape,R.shape)
Y = np.c_[Y, my_ratings]
R = np.c_[R, my_ratings != 0]
# print(Y.shape,R.shape)

添加一个新用户之后，Y矩阵与R矩阵的维度如下，列增加1

2.8 进行均值归一化

# 均值归一化
def formulization(Y, R):
    Y_mean = Y.sum(1) / R.sum(1)
    Y_formu = (Y - Y_mean.reshape(Y.shape[0], 1)) * R
    return Y_formu,Y_mean
    pass

2.9 初始化数据

这里np.random.random()是指随机初始化0-1之间的小数

Y_formu,Y_mean = formulization(Y, R)
num_movies, num_users = Y_formu.shape
num_features = 10
X = np.random.random((num_movies, num_features))
Theta = np.random.random((num_users, num_features))
# print(X.shape, Theta.shape)  # (1682, 10) (944, 10)
converage_XTheta = change_shape(X, Theta)
lamda = 10

下面进行计算X，Theta

res = minimize(fun=cost_function, x0=converage_XTheta, args=(num_users, num_movies, num_features, Y_formu, R, lamda),
               method='TNC', jac=gradient_func, options={'maxiter': 100})
X_res, Theta_res = recover_shape(res.x, num_users, num_movies, num_features)
print(X_res,Theta_res)

3.0 预测新用户未看过的电影评分

预测评分矩阵公式还是X @ Theta.T，要注意的是这里需要重新加上算出的Y每行的平均值，因为在归一化操作时被减掉了

还要注意的是np.argsort()这个函数是将矩阵从小到大排列，并返回排好序的元素下标，这里添加个负号，矩阵里面最大的元素就会变成最小的元素，去掉负号之后返回的坐标就是从大到小的数了，简单来说就是获得了从大到小的序列

之后我们取10个预测评分最高的电影序号

# 下面开始预测
prediction_matrix = X_res @ Theta_res.T + Y_mean.reshape(num_movies,1)
last_user = prediction_matrix[:,-1]
sort_list = np.argsort(-last_user)
top_ten = sort_list[:10]

3.1 导入电影名字

# 导入电影名字
movies = []  # 包含所有电影的列表
with open('movie_ids.txt','r', encoding='latin 1') as f:
    for line in f:
#         movies.append(' '.join(line.strip().split(' ')[1:]))
        movies.append(' '.join(line.strip().split(' ')[1:]))

取出推荐的10部电影

for i in top_ten:
    print(f"预测此电影评分为：{last_user[i]}   电影名字为：{movies[i]}")

四. 全部代码

1.异常检测代码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.io import loadmat

data = loadmat('ex8data1.mat')
# print(data.keys())  # ['__header__', '__version__', '__globals__', 'X', 'Xval', 'yval']
Xtest = data['X']
Xval = data['Xval']
yval = data['yval']


# print(Xtest.shape,Xval.shape,yval.shape)  # (307, 2) (307, 2) (307, 1)

# 看一下图像分布
def plot_pic(Xtest):
    plt.figure(figsize=(13, 8))
    plt.scatter(Xtest[:, 0], Xtest[:, 1], c='purple', s=150)
    pass


# plot_pic(Xtest)
# plt.show()

# 获取一下高斯函数的参数
def get_gaussian_parameters(Xtest):
    X_rows, X_colums = Xtest.shape
    mean_matrix = Xtest.sum(0) * (1 / X_rows)  # sum0是列求和，sum1是行求和,这里得到的是每个特征值的平均值mu
    variance_matrix = np.power(Xtest - mean_matrix, 2).sum(0) * (1 / X_rows)  # 里面存放每个特征值的方差
    return mean_matrix, variance_matrix
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# print(mean_matrix,variance_matrix)


# 高斯函数
def get_gaussian(mean_matrix, variance_matrix, Xtest):
    X_rows, X_colums = Xtest.shape
    front = np.power(2 * np.pi * np.power(variance_matrix, 1 / 2), 1 / 2 * (-1))  # 公式前一部分
    back = np.exp(-np.power(Xtest - mean_matrix, 2) / (2 * variance_matrix))  # 公式后一部分
    p = front * back
    p_matrix = np.prod(p, axis=1)  # 得到一个1*307的矩阵，每一列都是已经算好的，根据公式累乘就行
    return p_matrix
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# p_matrix = get_gaussian(mean_matrix,variance_matrix,Xtest)
# print(p_matrix)
# print(p_matrix.shape)


# 画一下高等线图
def plot_countour(mean_matrix, variance_matrix, Xtest):
    plt.figure(figsize=(13, 8))
    x = np.linspace(0, 30, 100)
    y = np.linspace(0, 30, 100)
    xx, yy = np.meshgrid(x, y)  # 将xy绘制成网格，xx,yy分别是网格的所有横纵坐标
    zz = np.c_[xx.ravel(), yy.ravel()]  # 将网格中每一个小网格的坐标都放入z中，然后进行高斯函数求值（10000，2）
    p = get_gaussian(mean_matrix, variance_matrix, zz)  # 高斯函数返回的是（10000，）维度的矩阵
    p = p.reshape(xx.shape)  # 重新绘制成网格的形态（100，100）
    cont_levels = [10 ** h for h in range(-20, 0, 3)]
    plt.contour(xx, yy, p, cont_levels)  # xx,yy代表的是底部平面，平面由网格组成，每个网格的值也就是P值，就是高度，高度越高代表概率越大
    plt.scatter(Xtest[:, 0], Xtest[:, 1], c='purple', s=100)
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# plot_countour(mean_matrix,variance_matrix,Xtest)
# plt.show()


# 下面构造一个评分函数，判断边界函数是否够好
def predict_score(p, yval, e):
    p = p.reshape(yval.shape)
    rows, columns = yval.shape
    TP = 0
    FP = 0
    TN = 0
    FN = 0
    prec = 0
    rec = 0
    F1 = 0
    # p ( x ) < ε 被认为异常（y = 1），p ( x ) < ε(y = 0) 被认为正常
    for i in range(rows):
        if (p[i, :] > e):  # 预测为0
            if (yval[i, :] == 0):
                TN += 1  # 实际为0
            else:
                FN += 1  # 实际为1
        if (p[i, :] < e):  # 预测为1
            if (yval[i, :] == 1):
                TP += 1  # 实际为1
            else:
                FP += 1  # 实际为0

    if (TP + FP):
        prec = TP / (TP + FP)
    if (TP + FN):
        rec = TP / (TP + FN)
    if (prec + rec):
        F1 = (2 * prec * rec) / (prec + rec)

    return F1
    pass


# mean_matrix,variance_matrix = get_gaussian_parameters(Xtest)
# p_matrix = get_gaussian(mean_matrix,variance_matrix,Xval)
# F1 = predict_score(p_matrix,yval,p_matrix[0])

# 下面构造select函数，用来选出最好的ε作为分解条件
def select_beste(p, yval):
    p_max = np.max(p)
    p_min = np.min(p)
    e_list = np.linspace(p_min, p_max, 1000)
    best_score = 0
    final_e = p_min
    for i in e_list:
        cur_score = predict_score(p, yval, i)
        if (cur_score > best_score):
            best_score = cur_score
            final_e = i
    return best_score, final_e

# # 图上找出异常点
# def find_weird(p,final_e,Xtest):
#     weird_point = []
#     for i in range(len(p)):
#         if (p[i] < final_e):
#             weird_point.append(Xtest[i,:])
#     return weird_point
#     pass


# 取一下边界e
# mean_matrix, variance_matrix = get_gaussian_parameters(Xtest)
# p_matrix = get_gaussian(mean_matrix, variance_matrix, Xval)
# best_score, final_e = select_beste(p_matrix, yval)
# print(f"best_score:{best_score},final_e:{final_e}")
# # ---------------------------------------------------------------
# p_matrix1 = get_gaussian(mean_matrix,variance_matrix,Xtest)  # 这个p矩阵一定要是Xtest的
# weird_point = np.where(p_matrix1 < final_e)[0]
# plot_countour(mean_matrix,variance_matrix,Xtest)
# plt.scatter(Xtest[weird_point,0],Xtest[weird_point,1],edgecolors='r',s=300,facecolors='none')
# plt.show()

# -----------------------------------------------------------------------
# 数据集ex7data2.mat
data2 = loadmat('ex8data2.mat')
# print(data2.keys()) # ['__header__', '__version__', '__globals__', 'X', 'Xval', 'yval']
X2test = data2['X']
X2val = data2['Xval']
y2val = data2['yval']
# print(X2test.shape, X2val.shape, yval.shape)  # (1000, 11) (100, 11) (100, 1)
mean_matrix, variance_matrix = get_gaussian_parameters(X2test)
p_matrix = get_gaussian(mean_matrix, variance_matrix, X2val)
best_score, final_e = select_beste(p_matrix, y2val)
print(f"best_score:{best_score},final_e:{final_e}")
p_matrix1 = get_gaussian(mean_matrix,variance_matrix,X2test)
weird_point = np.where(p_matrix1 < final_e)[0]
print(len(weird_point))

2.推荐系统代码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.io import loadmat
from scipy.optimize import minimize

data = loadmat('ex8_movies.mat')
# print(data.keys()) # ['__header__', '__version__', '__globals__', 'Y', 'R']
Y = data['Y']  # 不用用户对于不同电影的评分，行为电影数，列为用户数（维度：1682，943）
R = data['R']  # 判断是否有评分，维度与Y矩阵相同
# print(Y.shape,R.shape)

data2 = loadmat('ex8_movieParams.mat')
# print(data2.keys()) # ['__header__', '__version__', '__globals__', 'X', 'Theta', 'num_users', 'num_movies', 'num_features']
X = data2['X']  # 电影类型偏向的特征值
Theta = data2['Theta']  # 用户的特征值
num_users = int(data2['num_users'])  # 用户数量
num_movies = int(data2['num_movies'])  # 电影数量
num_features = int(data2['num_features'])  # 特征数量(X和Theta矩阵的)


# print(X.shape,Theta.shape)  # (1682, 10) (943, 10)
# print(num_users,num_movies,num_features)  # [943] [1682] [10]

# 更改参数形状
def change_shape(X, Theta):
    return np.r_[X.flatten(), Theta.flatten()]  # np.r_函数对于1维数据，进行的就是合并的操作，和np.append作用相同，但是高维度就是行相加
    pass

# print(change_shape(X,Theta).shape)

# 恢复参数形状
def recover_shape(coverage_XTheta, num_users, num_movies, num_features):
    X = coverage_XTheta[: num_movies * num_features].reshape(num_movies, num_features)
    Theta = coverage_XTheta[num_movies * num_features:].reshape(num_users, num_features)
    return X, Theta
    pass


# coverage_XTheta = change_shape(X,Theta)
# X1,Theta1 = recover_shape(coverage_XTheta,num_users,num_movies,num_features)
# print(X1.shape,Theta1.shape)

# 代价函数
def cost_function(coverage_XTheta, num_users, num_movies, num_features, Y, R, lamda):
    X1, Theta1 = recover_shape(coverage_XTheta, num_users, num_movies, num_features)
    variance_part = np.power((X1 @ Theta1.T - Y) * R, 2).sum()  # [email protected]为所有预测的值偏差，与矩阵R进行点成，筛选出看过的电影
    reg1 = lamda * np.power(X1, 2).sum()
    reg2 = lamda * np.power(Theta1, 2).sum()
    return (variance_part + reg1 + reg2) * (1 / 2)
    pass


# users = 4
# movies = 5
# features = 2
# X1 = X[:movies,:features]
# theta1 = Theta[:users,:features]
# coverage_1 = change_shape(X1,theta1)
# Y1 = Y[:movies,:users]
# R1 = R[:movies,:users]
# print(cost_function(coverage_1,users,movies,features,Y1,R1,1))


# 下面是梯度下降的导数参数
def gradient_func(coverage_XTheta, num_users, num_movies, num_features, Y, R, lamda):
    X1, Theta1 = recover_shape(coverage_XTheta, num_users, num_movies, num_features)
    X_derivative = ((X @ Theta1.T - Y) * R) @ Theta1 + lamda * X1
    Theta_derivative = ((Theta1 @ X.T - Y.T) * R.T) @ X + lamda * Theta1
    return change_shape(X_derivative, Theta_derivative)
    pass


# test1 = gradient_func(change_shape(X,Theta),num_users,num_movies,num_features,Y,R,1)
# print(test1)

# 添加新的用户
my_ratings = np.zeros((num_movies, 1))
my_ratings[0] = 5
my_ratings[7] = 5
my_ratings[14] = 4
my_ratings[21] = 4
my_ratings[28] = 3
my_ratings[35] = 3
my_ratings[75] = 2
my_ratings[163] = 2
my_ratings[260] = 1
my_ratings[370] = 5
my_ratings[580] = 5
my_ratings[600] = 5
my_ratings[800] = 5

# print(Y.shape,R.shape)
Y = np.c_[Y, my_ratings]
R = np.c_[R, my_ratings != 0]
# print(Y.shape,R.shape)

# 均值归一化
def formulization(Y, R):
    Y_mean = Y.sum(1) / R.sum(1)
    Y_formu = (Y - Y_mean.reshape(Y.shape[0], 1)) * R
    return Y_formu,Y_mean
    pass


Y_formu,Y_mean = formulization(Y, R)
num_movies, num_users = Y_formu.shape
num_features = 10
X = np.random.random((num_movies, num_features))
Theta = np.random.random((num_users, num_features))
# print(X.shape, Theta.shape)  # (1682, 10) (944, 10)
converage_XTheta = change_shape(X, Theta)
lamda = 10
#
res = minimize(fun=cost_function, x0=converage_XTheta, args=(num_users, num_movies, num_features, Y_formu, R, lamda),
               method='TNC', jac=gradient_func, options={'maxiter': 100})
X_res, Theta_res = recover_shape(res.x, num_users, num_movies, num_features)
# print(X_res,Theta_res)
#
# 下面开始预测
prediction_matrix = X_res @ Theta_res.T + Y_mean.reshape(num_movies,1)
last_user = prediction_matrix[:,-1]
sort_list = np.argsort(-last_user)
top_ten = sort_list[:10]
#
# 导入电影名字
movies = []  # 包含所有电影的列表
with open('movie_ids.txt','r', encoding='latin 1') as f:
    for line in f:
        movies.append(' '.join(line.strip().split(' ')[1:]))

for i in top_ten:
    print(f"预测此电影评分为：{last_user[i]}   电影名字为：{movies[i]}")

你可能感兴趣的:(吴恩达机器学习作业,人工智能,python,scipy,逻辑回归)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多