Liaojiajia2019

六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）

正则化线性回归和偏差\方差（ex5）

（一）正则化线性回归 Regularized Linear Regression

（1）可视化数据集 Visualizing the dataset
（2）正则化线性回归代价函数 Regularized linear regression cost function
（3）正则化线性回归梯度 Regularized linear regression gradient
（4）拟合线性回归 Fitting linear regression

（二）偏差与方差 Bias-variance

（1）学习曲线 Learning curves

（三）多项式回归 Polynomial regression

（1）学习多项式回归 Learning Polynomial Regression
（2）调整正则化参数 Adjusting the regularization parameter
（3）通过交叉验证集选择λ Selecting λ using a cross validation set
（4）计算测试集误差 Computing test set error

（一）正则化线性回归 Regularized Linear Regression

在练习的前半部分中，您将使用水库水位的变化来实现正则化线性回归，以预测大坝流出的水量。在后半部分中，您将对调试学习算法进行一些诊断，并检查偏差V.S方差的影响。

（1）可视化数据集 Visualizing the dataset

机器学习课程提供的数据集中，包含水位变化的历史记录 $X$ 和流出大坝的水量 $y$ 。

首先将数据集分成三个部分：

名称	参数
训练集（训练模型）	$X$ , $y$
交叉验证集（用于决定正则化参数）	$X v a l$ , $y v a l$
测试集（用于评估表现）	$X t e s t$ , $y t e s t$

跟之前一样，首先导入所需要的库：

# -*- coding: utf-8 -*-
import numpy as np
import matplotlib.pyplot as plt
import scipy.optimize as opt
from scipy.io import loadmat
from sklearn.metrics import classification_report #用于评价报告

载入数据集，以及可视化这些数据：

def load_mat(path):
    '''读取.mat数据'''
    data = loadmat(path)
    X, y = data['X'], data['y']
    Xval, yval = data['Xval'], data['yval']
    Xtest, ytest = data['Xtest'], data['ytest']
    #添加偏置单元
    X_1 = np.insert(X    ,0,1,axis=1)
    Xval = np.insert(Xval ,0,1,axis=1)
    Xtest = np.insert(Xtest,0,1,axis=1)
    print('X={},y={}'.format(X_1.shape, y.shape))
    print('Xval={},yval={}'.format(Xval.shape, yval.shape))
    print('Xtest={},ytest={}'.format(Xtest.shape, ytest.shape))

    return X,y,Xval,yval,Xtest,ytest

def plot_data():
    '''可视化数据'''
    plt.figure()
    plt.scatter(X[:,1:],y,c='r',marker='x')
    plt.xlabel('Change in water level (x)')
    plt.ylabel('Water flowing out of the dam (y)')
    plt.grid() #显示网格
    plt.show()

path = 'ex5data1.mat'
X,y,Xval,yval,Xtest,ytest = load_mat(path)
plot_data()

运行结果为： 显示数据集内所有数据的维度数

X=(12, 2),y=(12, 1)
Xval=(21, 2),yval=(21, 1)
Xtest=(21, 2),ytest=(21, 1)

可视化水位变化的历史纪录 $X$ 的数据集：
$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第1张图片$

（2）正则化线性回归代价函数 Regularized linear regression cost function

表达式为：
$J(\theta )=\frac{1}{2m}\left (\sum_{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)})^{2}\right )+\frac{\lambda }{2m}\left ( \sum_{j=1}^{n}\theta _{j}^{2}\right )$
函数代码为：

def reg_cost(theta, X, y, l):
    '''不需要正则化第一项theta0(即偏置单元)'''
    cost = np.sum((np.dot(X,theta) - y.flatten()) ** 2)
    regularized = l * (theta[1:] @ theta[1:])
    return (cost + regularized) / (2 * len(X))

theta = np.ones(X.shape[1])
print('regression cost function:',reg_cost(theta, X, y, 1))

计算结果：

Regularized linear regression cost function: 303.9931922202643

该结果与预测得到的结果相符，说明该代码正确。

（3）正则化线性回归梯度 Regularized linear regression gradient

数学公式为：
当 $j = 0$ 时，
$\frac{\partial J(\theta )}{\partial\theta _{0}}=\frac{1}{m}\sum_{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)})x^{(i)}_{j}$
当 $j \geq 1$ 时，
$\frac{\partial J(\theta )}{\partial\theta _{0}}=\left ( \frac{1}{m}\sum_{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)})x^{(i)}_{j} \right )+\frac{\lambda }{m}\theta _{j}$

正则化的梯度代码为：

def reg_gradient(theta, X, y, l):
    '''计算正则化的梯度'''
    #grad = np.sum(np.dot(np.dot(X,theta) - y.flatten(),X))
    grad = np.dot(np.dot(X,theta) - y.flatten(),X)
    regularized = l * theta
    regularized[0] = 0 #不需要正则化theta0
    return (grad + regularized) / len(X)

theta = np.ones(X.shape[1])
print('Regularized linear regression gradient:',reg_gradient(theta, X, y, 1))

计算结果：

Regularized linear regression gradient: [-15.30301567 598.25074417]

该结果与预测得到的结果相符，说明该代码正确。

（4）拟合线性回归 Fitting linear regression

编写拟合线的代码：

def Fitting_linear_regression(X, y, l):
    theta = np.zeros(X.shape[1])
    res = opt.minimize(fun = reg_cost,
                       x0 = theta,
                       args = (X,y,1),
                       method = 'TNC',
                       jac = reg_gradient,
                       options={'maxiter':400})
    return res.x

fit_lin_reg = Fitting_linear_regression(X, y, 1)
plot_data()
plt.plot(X[:,1:],np.dot(X,fit_lin_reg))

训练集上拟合的结果：
$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第2张图片$
这里把 $\lambda = 0$ （相当于不使用正则化）。由于原始输入只有1个特征，所以拟合效果不是很好，之后在原始输入特征的基础上增加多项式特征。

（二）偏差与方差 Bias-variance

机器学习中的一个重要概念是偏差与方差的权衡。具有高偏差的模型对于数据来说不够复杂，容易出现下溢现象（欠拟合），而具有高方差的模型则与训练数据过度匹配（过拟合）。总结：高偏差（欠拟合），高方差（过拟合）。

（1）学习曲线 Learning curves

为了绘制学习曲线，需要一个训练集和交叉验证集，并训练这两个集合的误差随着样本 $m$ 变化，通过变化情况来判断是否欠拟合或者过拟合。

具体来说，使用训练集的 $m$ 个子集来训练模型，得到不同的 $\theta$ 值，然后求 $m$ 个样本的训练集误差和交叉验证集误差（此时不使用正则化， $\lambda=0$ ）。注意的是，计算交叉验证代价时需要整个交叉验证集来计算，无需分为子集。

数据集的训练误差定义为：
$J_{train}(\theta )=\frac{1}{2m}\left [ \sum_{i=1}^{m}(h_{\theta }(x^{(i)})-y^{(i)}) ^{2}\right ]$

编写学习曲线的代码，并运行该函数代码：

def learning_curve(X, y, Xval, yval, l):
    '''绘制学习曲线，即交叉验证误差与训练误差随着样本数量的变化而变化'''
    XX = range(1, len(X) + 1) #至少有一个数
    err_train, err_val = [], []
    for i in XX:
        theta = Fitting_linear_regression(X[:i], y[:i], l)
        err_train_i = reg_cost(theta, X[:i], y[:i], 0)
        err_val_i = reg_cost(theta, Xval, yval, 0)
        err_train.append(err_train_i)
        err_val.append(err_val_i)
    plt.figure()
    plt.plot(XX,err_train,label = 'Training Cost')
    plt.plot(XX,err_val,label = 'Cross Validation Cost')
    plt.title('Learning curve for linear regression')
    plt.legend(['Train','Cross Validation'])
    plt.xlabel('Number of training examples')
    plt.ylabel('Error')
    plt.grid() #显示网格
    plt.axis([0,13,0,150])
    plt.show()

learning_curve(X, y, Xval, yval, 0)

根据训练集与交叉验证集所绘制的学习曲线：
$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第3张图片$
说明： 验证误差随样本增加不断减小，并趋于平缓；训练误差随样本增加不断增大，最后也趋于平缓；并且二者非常接近，交界处对应的误差比较大。根据学习曲线的特点，此时模型出现了高偏差（欠拟合）的情况。那么增加更多的训练样本作用并不大，因此，应该增加更多的输入特征。

（三）多项式回归 Polynomial regression

根据上一个例子产生的问题，线性模型对于有些数据来说太简单了，因此导致了欠拟合的情况，在这部分，添加一些特征来解决以上的不足。

多项式回归的假设函数定义为：
$\begin{aligned} h_{\theta }(x) &=\theta _{0}+\theta _{1}*(waterLevel)+\theta _{2}*(waterLevel)^{2}+\cdots +\theta _{p}*(waterLevel)^{p} \\ &=\theta _{0}+\theta _{1}x_{1}+\theta _{2}x_{2}+\cdots +\theta _{p}x_{p} \end{aligned}$

（1）学习多项式回归 Learning Polynomial Regression

把多项式高阶项看作特征，因此多项式回归其本质是多特征的线性回归。

首先进行数据预处理，把X，Xval，Xtest都添加多项式特征（分别都添加到6次方），并对数据进行标准化。

编写添加多项式以及处理数据的代码：

def polyFeatures(X, power):
    '''添加多项式特征，在array的最后一列添加第二列的i+2次方（第一列为偏置单元），
    从二次方开始添加（由于数据本身含有一列一次方）'''
    Xpoly = X.copy()
    for i in range(2, power + 1):
        Xpoly = np.insert(Xpoly, Xpoly.shape[1], np.power(Xpoly[:,1], i), axis=1)
    return Xpoly

def get_means_std(X):
    '''获取训练集的均值和误差，用来标准化所有训练集的数据'''
    means = np.mean(X, axis = 0)
    stds = np.std(X, axis = 0, ddof = 1) #ddof = 1,means样本标准差
    return means, stds

def feature_Normalize(myX, means, stds):
    '''归一化'''
    X_norm = myX.copy()
    X_norm[:,1:] = X_norm[:,1:] - means[1:]
    X_norm[:,1:] = X_norm[:,1:] / stds[1:]
    return X_norm

说明：数据处理是对数据进行归一化处理，即将所有数据集内的数据都用训练集的均值和样本标准差进行处理，所以要将训练集的均值和样本标准差储存起来，用于后面的数据处理。归一化的计算公式为： $x_{i}=\frac{x_{i}-mean}{std}$ 。这里用的是样本标准差，用np.std()中的ddof = 1表示样本标准差，默认ddof = 0是总体标准差。而pandas默认计算样本标准差。

编写增加特征后进行训练，并可视化拟合效果以及学习曲线的代码：

power = 6 #在实验中，将特征扩展到6次方
train_means,train_stds = get_means_std(polyFeatures(X, power))
X_norm = feature_Normalize(polyFeatures(X, power), train_means, train_stds)
Xval_norm = feature_Normalize(polyFeatures(Xval, power), train_means, train_stds)
Xtest_norm = feature_Normalize(polyFeatures(Xtest, power), train_means, train_stds)

def plot_fit(means, stds, l):
    '''绘制拟合曲线'''
    theta = Fitting_linear_regression(X_norm, y, l)
    X = np.linspace(-80,80,50)
    Xmat = X.reshape(-1,1)
    Xmat = np.insert(Xmat, 0, 1, axis = 1)
    x_mat = polyFeatures(Xmat, power)
    x_mat_norm = feature_Normalize(x_mat, means, stds)
    plot_data()
    plt.plot(X,np.dot(x_mat_norm,theta),'g--')

plot_fit(train_means, train_stds, 0)
learning_curve(X_norm, y, Xval_norm, yval, 0)

绘制拟合曲线以及学习曲线的结果：

$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第4张图片$

当 $\lambda=0$ 时，训练误差太小，产生过拟合的情况。

（2）调整正则化参数 Adjusting the regularization parameter

调整正则化的参数 $\lambda$ ，观察数据拟合情况。
当 $\lambda=1$ 时，拟合情况比较好一些。

plot_fit(train_means, train_stds, 1)
learning_curve(X_norm, y, Xval_norm, yval, 1)

$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第5张图片$
当 $\lambda=100$ 时，产生了欠拟合（高偏差）的情况。

plot_fit(train_means, train_stds, 100)
learning_curve(X_norm, y, Xval_norm, yval, 100)

效果如下：
$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第6张图片$

（3）通过交叉验证集选择λ Selecting λ using a cross validation set

使用不同 $\lambda$ 值，可视化训练误差和交叉验证误差的曲线：

def validation_curve(X, y, Xval, yval):
    '''使用不同的lambda值,并可视化曲线'''
    lambdas = np.array([0, 0.001, 0.003, 0.01, 0.03, 0.1, 0.3, 1, 3, 10])
    error_train, error_val = [], []
    for l in lambdas:
        theta = Fitting_linear_regression(X_norm, y, l)
        error_train.append(reg_cost(theta, X_norm, y, l))
        error_val.append(reg_cost(theta, Xval_norm, yval, l))
    plt.figure()
    plt.plot(lambdas,error_train,label='Train')
    plt.plot(lambdas,error_val,label='Cross Validation')
    plt.legend()
    plt.xlabel('lambda')
    plt.ylabel('Error')
    plt.grid(True)
    plt.show()
    
validation_curve(X, y, Xval, yval)

运行结果为： 可以看出在 $\lambda = 3$ 时，在该点取到代价最小值，交叉验证集的代价最小。

$六、【机器学习作业】正则化线性回归和偏差\方差（python版ex5）_第7张图片$

（4）计算测试集误差 Computing test set error

theta = Fitting_linear_regression(X_norm, y, 3)
print('test cost(l={}) = {}'.format(3, reg_cost(theta, Xtest_norm, ytest, 0)))

当power=6时，得到下面的数值：

test cost(l=3) = 4.755272015678817

当power=8时，得到与预测相符的数值：

test cost(l=3) = 3.8598814429362758

西南交通大学【机器学习实验1】
实验目的理解和掌握回归问题和分类问题模型评估方法，学会使用均方误差、最大绝对误差、均方根误差指标评估回归模型，学会使用错误率、精度、查全率、查准率、F1指标评价分类模型。实验内容给定回归问题的真实标签和多个算法的预测结果，编程实现MSE、MAE、RMSE三种评测指标，对模型进行对比分析。给定二分类问题真实标签和多个算法的预测结果，编程实现混淆矩阵评测，采用错误率、精度、查全率、查准率、F1指标对结
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
特征分析工程化梨V_v 文献深度学习人工智能神经网络笔记
scikit功能Python中的特征选择存储库scikit-feature。scikit-feature是一个开源的Python特征选择库，由亚利桑那州立大学数据挖掘与机器学习实验室开发。它基于一个广泛使用的机器学习包scikit-learn以及两个科学计算包Numpy和Scipy构建。scikit-feature包含大约40种流行的特征选择算法，包括传统的特征选择算法以及一些结构化和流式特征选择
用TensorBoard可视化PyTorch 109702008 #深度学习 #python 人工智能 pytorch 人工智能 python
一、TensorBoard与PyTorch配合使用的基本步骤PyTorch可以直接与TensorBoard进行集成，因为TensorBoard是一个独立于TensorFlow之外的可视化工具。TensorBoard被设计为支持机器学习实验的可视化，如训练的进度和结果等。PyTorch中的`torch.utils.tensorboard`模块允许PyTorch用户使用这个强大的可视化工具。以下是将T
从零开始玩转TensorFlow：小明的机器学习故事 3 山海青风 #机器学习机器学习 tensorflow 人工智能
下面是一篇以小明为主角，尝试用TensorFlow预测校园活动参与率的学习故事。我们会在故事情境中穿插对线性回归和逻辑回归的原理介绍，并附带必要的代码示例，帮助你从零基础理解并动手实践。文章结尾还有简要的分析总结。小明的第一次机器学习实验场景：预测校园活动的参与率小明最近加入了学生会，负责策划校园活动。每次活动都需要准备场地、宣传物料和餐饮，但经常会出现场地过小或准备物资不足等问题。为了让活动准备
云原生周刊：K8s 严重漏洞 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
云原生周刊：K8s严重漏洞开源项目推荐KitOpsKitOps是一款开源的DevOps工具，专为AI/ML项目的全生命周期管理而设计，通过将模型、数据集、代码和配置打包并版本化为符合OCI（开放容器标准）的工件，简化了AI/ML工作流的部署与管理。KitOps支持统一打包，将AI/ML模型、数据集和配置封装为便携式工件，同时提供详细的版本控制，确保机器学习实验的可追溯性和可复现性。YokaiYok
使用 Databricks+Mlflow 进行机器学习模型的训练和部署阿里云云栖号机器学习人工智能 python 大数据云计算
ML工作流的痛点机器学习工作流中存在诸多痛点：首先，很难对机器学习的实验进行追踪。机器学习算法中有大量可配置参数，在做机器学习实验时，很难追踪到哪些参数、哪个版本的代码以及哪个版本的数据会产生特定的结果。其次，机器学习实验的结果难以复现。没有标准的方式来打包环境，即使是相同的代码、相同的参数以及相同的数据，也很难复现实验结果。因为实验结果还取决于采用的代码库。最后，没有标准的方式管理模型的生命周期
【机器学习】实验记录工具 Encarta1993 机器学习人工智能
Weights&Biases（简称为WandB）是一个用于跟踪机器学习实验、可视化实验结果并进行协作的工具。它提供了一个简单易用的界面，让用户可以轻松地记录模型训练过程中的指标、超参数和输出结果，并将这些信息可视化展示。WandB还支持团队协作，可以让团队成员共享实验记录、交流想法，并进行实验结果的比较和分析。通过WandB，用户可以更好地管理和理解他们的机器学习项目，加速实验迭代过程，提高模型的
机器学习实验2——线性回归求解加州房价问题在半岛铁盒里机器学习机器学习线性回归人工智能加州房价
文章目录实验内容数据预处理代码缺失值处理特征探索相关性分析文本数据标签编码数值型数据标准化划分数据集线性回归闭合形式参数求解原理梯度下降参数求解原理代码运行结果总结实验内容基于CaliforniaHousingPrices数据集，完成关于房价预测的线性回归模型训练、测试与评估。数据预处理代码"""数据预处理"""importpandasaspdimportnumpyasnpimportmatplo
机器学习实验4——CNN卷积神经网络分类Minst数据集在半岛铁盒里机器学习机器学习 cnn 分类 MINST
文章目录实验内容原理CNN实现分类Minst代码数据预处理：设置基本参数：实验内容基于手写minst数据集，完成关于卷积网络CNN的模型训练、测试与评估。原理卷积层通过使用一组可学习的滤波器（也称为卷积核）对输入图像进行滑动窗口卷积操作，这样可以提取出不同位置的局部特征，从而捕捉到图像的空间结构信息。激活函数在卷积层之后，通常会应用一个非线性激活函数，如ReLU激活函数的作用是引入非线性，使得CN
机器学习实验3——支持向量机分类鸢尾花在半岛铁盒里机器学习机器学习支持向量机分类鸢尾花 SVM
文章目录实验内容数据预处理代码认识数据相关性分析径向可视化各个特征之间的关系图支持向量机SVM求解直觉理解：数学推导代码运行结果总结实验内容基于鸢尾花数据集，完成关于支持向量机的分类模型训练、测试与评估。数据预处理代码importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsfromsklearnimp
机器学习实验报告——隐式马尔可夫模型HMM 长安er 机器学习机器学习人工智能 HMM 隐马尔可夫模型
目录一、模型介绍1.1模型引入1.2模型背景及发展历程1.3模型基本假设1.4模型基本概念介绍1.5HMM三要素二、模型基本问题2.1评估问题2.1.1说明2.1.2解决方法2.2学习问题2.2.1说明2.2.2解决方法2.3解码问题2.3.1说明2.3.2解决方法三、模型实现3.1hmmlearn库简介3.2案例实现3.3代码实现3.4分析四、模型讨论4.1优缺点讨论4.3HMM的应用五、模型总
机器学习实验报告-集成学习长安er 机器学习机器学习集成学习人工智能 boosting bagging
目录一、集成学习介绍1.1集成学习的引入1.2集成学习发展史1.3集成学习的学习组织方式1.3.1并联组织关系1.3.2串联组织关系1.4集成学习及其实现方法概述二、集成学习实现方法2.1Boosting2.1.1基本过程2.1.2注意点2.2bagging2.2.1基本过程2.2.2注意点2.3Stacking2.3.1几种比较简单的结合策略2.3.2如何理解Stack三、集成学习代码实现3.1
机器学习实验报告——EM算法长安er 搜索引擎
目录一、算法介绍1.1算法背景1.2算法引入1.3算法假设1.4算法原理1.5算法步骤二、算法公式推导2.1数学基础2.2EM算法推导三、算法实现3.1关于EM聚类3.2EM工具包的使用3.3实例测试四、算法讨论4.1EM算法的优缺点4.2EM算法的应用4.3对于EM算法框架，如何选择具体的算法五、实验总结一、算法介绍1.1算法背景EM的英文是ExpectationMaximization，所以E
机器学习实验报告- SVM算法长安er 机器学习机器学习算法支持向量机
目录一、算法介绍1.1算法背景1.2算法引入1.3算法假设1.4算法原理1.5算法实现步骤二、算法关键点2.1核函数选择2.2支持向量的选取2.3间隔最大化三、算法公式推导3.1关键概念和方法介绍3.2支持向量机公式推导3.3基于核函数的支持向量机公式推导四、算法实现4.1数据集描述4.2代码实现五、实验讨论5.1SVM算法优缺点5.2关于模型评估的讨论5.3关于支持向量机针对线性可分与非线性可分
机器学习实验||分类机器学习建模分析小嘤嘤怪学机器学习
实验目的掌握机器学习建模分析掌握回归分析、分类分析、聚类分析、降维等了解各分类器之间的差异实验环境操作系统：作系统：Windows11应用软件：JupyterNotebook实验内容与结果（题目、源程序、运行结果）一个分类器只能使用一列lable使用scikit-learn建立决策树为葡萄酒数据集构造分类器（分类结果为’good’或‘not’）[“不可使用quantity”列]2.使用scikit
Codalab平台学习笔记 Q同学的nlp笔记笔记人工智能自然语言处理深度学习 nlp 语言模型 python
简介Codalab是一个用于复现深度学习研究的协作平台，由斯坦福大学和微软合作开发。其核心理念是在云端运行机器学习实验，像jupyternotebook一样在数字实验室中管理实验，同时可以发布实验的worksheet以便其他人可以复现实验结果。Colab官网展示的三个步骤为：上传文件：首先将代码和数据集文件上传至平台。进行实验：运行代码，进行训练或者测试。发布结果：将实验结果进行发布，以供他人复现
机器学习实验四：决策树-隐形眼镜分类（计算信息增益和信息熵以及模型准确率） Blossom i 机器学习机器学习决策树分类
决策树-隐形眼镜分类（计算信息增益和信息熵以及准确率）Title:使用决策树预测隐形眼镜类型#Description:隐形眼镜数据是非常著名的数据集，它包含很多患者眼部状况的观察条件以及医生推荐的隐形眼镜类型。#隐形眼镜类型包括硬材质、软材质以及不适合佩戴隐形眼镜。数据来源于UCI数据库#为了更容易显示数据,本书对数据做了简单的更改，数据存储在源代码下载路径的文本文件中。运行结果展现运行代码：im
厉害了！几行代码搞定ML模型，低代码机器学习Python库正式开源 DevolperFront
点击“开发者技术前线”，选择“星标????”在看|星标|留言,真爱机器之心编辑部PyCaret库支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型，提升机器学习实验的效率。想提高机器学习实验的效率，把更多精力放在解决业务问题而不是写代码上？低代码平台或许是个不错的选择。最近，机器之心发现了一个开源低代码机器学习Python库PyCaret，它支持在「低代码」环境中训练和部署有监督以及无
机器学习实验一：线性回归 Magic171 吴恩达机器学习机器学习线性回归人工智能
系列文章目录机器学习实验一：线性回归机器学习实验二：决策树模型机器学习实验三：支持向量机模型机器学习实验四：贝叶斯分类器机器学习实验五：集成学习机器学习实验六：聚类文章目录系列文章目录一、实验目的二、实验原理1.线性回归2.梯度下降法3.最小二乘法三、实验内容四、实验步骤1.随机生成数据集2.梯度下降法3.最小二乘法4.绘图总结一、实验目的（1）掌握线性回归的基本原理；（2）掌握线性回归的求解方法
机器学习实验四：贝叶斯分类器 Magic171 吴恩达机器学习机器学习人工智能
系列文章目录机器学习实验一：线性回归机器学习实验二：决策树模型机器学习实验三：支持向量机模型机器学习实验四：贝叶斯分类器机器学习实验五：集成学习机器学习实验六：聚类文章目录系列文章目录一、实验目的二、实验原理三、实验内容1.朴素贝叶斯2.半朴素贝叶斯3.高斯分布的朴素贝叶斯计算方法4.实验数据介绍5.评价指标介绍四、实验步骤1.划分数据集2.训练朴素贝叶斯分类方法3.评价分类器4.使用分类器进行预
机器学习实验二：决策树模型 Magic171 吴恩达机器学习机器学习决策树人工智能
系列文章目录机器学习实验一：线性回归机器学习实验二：决策树模型机器学习实验三：支持向量机模型机器学习实验四：贝叶斯分类器机器学习实验五：集成学习机器学习实验六：聚类文章目录系列文章目录一、实验目的二、实验原理三、实验内容四、实验步骤1.数据集引入及分割2.训练决策树3.利用CCP进行后剪枝总结一、实验目的（1）了解pandas和sklearn数据科学库功能；（2）掌握决策树原理，包括划分选择中三种
机器学习实验三：支持向量机模型 Magic171 吴恩达机器学习支持向量机机器学习算法
系列文章目录机器学习实验一：线性回归机器学习实验二：决策树模型机器学习实验三：支持向量机模型机器学习实验四：贝叶斯分类器机器学习实验五：集成学习机器学习实验六：聚类文章目录系列文章目录一、实验目的二、实验原理三、实验内容四、实验步骤1.训练集和测试数据集划分2.评价分类结果TP、FN、FP、TN以及精确率和召回率3.加入松弛因子后，与未加松弛因子之前效果做对比。五、代码参考总结一、实验目的（1）了
ml_collections库介绍 qq_27390023 python
ml_collections是由Google发布的一个用于配置管理的Python库，它主要用于机器学习实验中的超参数、配置选项和实验设置。这个库旨在提供一个清晰、灵活和易于使用的方式来组织和管理配置信息。###1.安装#激活conda环境后pip安装pipinstallml-collections###2.定义一个简单的配置对象fromml_collectionsimportConfigDictf
抢人饭碗了！推荐一款全自动的机器学习建模神器PyCaret 机器学习算法那些事
Datawhale干货编译：张峰，Datawhale成员寄语：PyCaret，是一款Python中的开源低代码（low-code）机器学习库，支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型，提升机器学习实验的效率。本文对PyCaret低代码库进行了简单介绍，并对其操作方法进行了详细的解读。现在，让我们一起来领略下：如何用仅仅几行代码搞定一个机器学习模型吧。首发PyCaret1.0.
机器学习建模神器PyCaret已开源！提升效率，几行代码轻松搞定模型 Wang_AI
编译：张峰，Datawhale成员寄语：PyCaret，是一款Python中的开源低代码（low-code）机器学习库，支持在「低代码」环境中训练和部署有监督以及无监督的机器学习模型，提升机器学习实验的效率。本文对PyCaret低代码库进行了简单介绍，并对其操作方法进行了详细的解读。现在，让我们一起来领略下：如何用仅仅几行代码搞定一个机器学习模型吧。首发PyCaret1.0.0我们很高兴能宣布Py
【机器学习实验一】k近邻算法（KNN) 疯狂的大马猴— python 机器学习 pycharm
【机器学习实验一】k近邻算法（KNN)一、配置环境看了很多教程，最终决定安装Anaconda+Pycharm的环境。因为Anaconda中包含了很多库，使用的时候就不用另外手动安装了。而Pycharm作为一款针对Python的编辑器，配置简单，功能强大，使用起来省时省心，对初学者友好，这也是编程验室推荐新手使用Pycharm的原因。基础安装教程大家可参考：Python环境的安装（Anaconda+
机器学习推导+python实现（八）：线性可分支持向量机明曦君机器学习手推 python 机器学习
写在开头：今天提前开始一下线性可分支持向量机的内容，因为最近在准备找实习，所以先来温习一下支持向量机方面的，后面再支持向量机完了后，可能会优先更新XGboost的内容，然后中间缺少的章节会在后面进行补充。本节代码的实现部分参考机器学习实验室内容安排线性回归（一）、逻辑回归（二）、K近邻（三）、决策树值ID3（四）、CART（五）、感知机（六）、神经网络（七）、线性可分支持向量机（八）、线性支持向量
干货| 机器学习模型与算法最全分类汇总！ Python数据之道神经网络算法决策树聚类机器学习
来源：机器学习实验室机器学习Author：louwillMachineLearningLab本文总共涉及了26种机器学习模型与算法，几乎涵盖了全部主流的机器学习算法。包括：线性回归、逻辑回归、Lasso回归、Ridge回归、线性判别分析K近邻、决策树、感知机、神经网络、支持向量机AdaBoost、GBDT、XGBoost、LightGBM、CatBoost、随机森林聚类算法与kmeans、主成分分
机器学习实验七：决策树-基于信贷数据集，使用sklearn中相关库实现决策树的构造 Blossom i 机器学习机器学习决策树 sklearn
决策树-基于信贷数据集，使用sklearn中相关库实现决策树的构造如下图数据集，住房(1表示拥有住房，0表示没有住房);婚姻(0表示单身1表示已婚，2表示离异);年收入一栏中单位为1000元;(拖欠贷款一栏0表示不拖欠，1表示拖欠)讨论sklearn中tree.DecisionTreeClassifier()重要的参数有哪些，怎么调整；使用tree.DecisionTreeClassifier()
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str