lijiamin-

人工智能基础 | 回归分析（四）

文章目录

前言
一、简单数学公式实现一元回归
二、公式拆解
三、线性回归API初步使用
四、线性回归的损失及优化
五、梯度下降
- 代码案例
- 公式解释
- 常见的梯度下降算法
- 波士顿回归案例
六、交叉验证/网格搜索
七、正则化线性模型
八、逻辑回归
- 损失及优化
- API介绍
- 代码案例

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RNDWUsLE-1668351864196)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/公众号横幅-1.png)]

以下内容是在学习过程中的一些笔记，难免会有错误和纰漏的地方。如果造成任何困扰，很抱歉。

前言

回归，指研究一组随机变量 (Y1 ，Y2 ，…，Yi) 和另一组 (X1，X2，…，Xk) 变量之间关系的统计分析方法，回归分析是一种数学模型，当因变量和自变量为线性关系时，它是一种特殊的线性模型。

线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，运用十分广泛。其表达形式为：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jObYK71m-1668351864196)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习入门-线性回归模型公式-3.png)]

b为误差服从均值为0的正态分布，如果只有一个自变量的情况下就叫一元回归，如果有多个自变量的情况下就叫多元回归；

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-B3zlQut0-1668351864197)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/多元线性回归的简单公式-1.png)]

回归的目的是预测数组型的目标值，其应用范围有股票预测

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c7INm1n0-1668351864197)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习-股票预测示例样图-1.png)]

天气、PM2.5、温湿度预测等

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YYJ2OuZy-1668351864197)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/机器学习-天气预测示例样图-1.png)]

一、简单数学公式实现一元回归

不引用深度学习框架，通过简单的数学公式完成一元回归案例

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

np.random.seed(0)
area = 2.5 * np.random.randn(100) + 25
price = 25 * area + 5 + np.random.randint(20, 50, size=len(area))

data = np.array([area, price])
data = pd.DataFrame(data=data.T, columns=['area', 'price'])

# 绘图
# plt.scatter(data['area'], data['price'])
# plt.show()

W = sum(price * (area - np.mean(area))) / sum((area - np.mean(area)) ** 2)
b = np.mean(price) - W * np.mean(area)
# print("计算回归系数", W, b)

y_pred = W * area + b

# 绘图
plt.plot(area, y_pred, color='red', label="forecast")
plt.scatter(data['area'], data['price'], label="train")
plt.xlabel("areaX")
plt.ylabel("priceY")
plt.legend()
plt.show()

绘图输出

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ou2wqvTL-1668351864198)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/连续值预测-一元线性简单效果图-1.png)]

二、公式拆解

对于线性模型的定义公式为：f(x) = w0 + w1·x1 + w2·x2 + … + wn·xn

当通过矩阵表示时：f(x) = XW，W是根据要求得到的非输入式参数，X是输入的数据矩阵

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zb47VWUN-1668351864198)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/线性模型-W的矩阵-1.png)]

n代表一个数据有n个数据，m代表一共是m个数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NLh4iytJ-1668351864198)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/线性模型-X的矩阵-1.png)]

那么数据集的数据矩阵为

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OfYqkfFM-1668351864199)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/线性模型-Y的矩阵-1.png)]

线性回归模型的最终目标就是找到参数 W 来使得 f(x) = XW 尽可能无限贴近 Y

三、线性回归API初步使用

本期示例将通过Sk-Learn实现线性回归的API，首先我们重新回忆机器学习的五大基本流程

获取数据集
数据预处理
特征工程
模型训练/机器学习
模型评估及优化

通过该流程阅读如下代码

"""
    机器学习流程
    1.获取数据集
    2.数据处理
    3.特征工程
    4.机器学习
    5.模型评估
"""

from sklearn.linear_model import LinearRegression

# get dataset
x = [[80, 86],
     [82, 80],
     [85, 78],
     [90, 90],
     [86, 82],
     [82, 90],
     [78, 80],
     [92, 94]
     ]

y = [84.2, 80.6, 80.1, 90, 83.2, 87.6, 79.4, 93.4]

# 实例化估计器
estimator = LinearRegression()

# 模型训练
estimator.fit(x, y)

# 系数coefficient：[0.3 0.7]
coefficient = estimator.coef_
print("coefficient：", coefficient)

# 预测
res = estimator.predict([[80, 100]])
print("预测结果：", res)

四、线性回归的损失及优化

我们在进行线性预测时，往往会出现部分预测的结果和实际结果不符，比预期有一定的偏差，对于这种存在局部预测出现损失偏差的情况，我们将这个损失偏差衡量出来，并进行定义（损失函数转换矩阵写法）。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gapASfDB-1668351864199)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/回归-损失函数的简单公式-1.png)]

简述其含义为：（预测值1 减去真实值1）的平方＋ …N

对于任何机器学习问题，都需要先明确损失函数，在遇到回归问题时，通常我们会直接想到如下的损失函数形式

均方误差（Mean Square Error，MSE）
平均绝对误差（Mean Absolute Error，MAE）
均方根误差（Root Mean Square Error，RMSE）
均方对数误差（Mean Squared Log Error）
平均相对误差（Mean Relative Error，MAE）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-m8yCU30v-1668351864199)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/乌鸦坐飞机.png)]

五、梯度下降

梯度下降法是迭代法的一种，我们将这个思想比作是一个上下山的过程，可以用于求解最小二乘问题，是一个致力于找到函数极值点的算法，简单来说是为了计算函数中的最小值，是一种以抛物线的形式呈现，迭代公式为

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lYtVBF8S-1668351864200)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/梯度下降法迭代公式-1.png)]

其中，-s(k)代表梯度负方向，pk代表梯度方向上的搜索步长，接下来我们将通过Tensorflow实现对于梯度下降的简单示例。

代码案例

此为一元回归案例，准备数据集，Income为入参，Education为结果值

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CFGTR4b7-1668351864200)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/tensorflow-梯度下降示例-数据集-1.png)]

加载库与数据

import tensorflow as tf
import pandas as pd

# 加载数据 加载列
data = pd.read_csv(
    'hello01.csv'
)
y = data.Education
x = data.Income

重点：导入Sequential模型新增层，并查看我们构建的模型详情

model = tf.keras.Sequential()
model.add(
    # 1:输出维度     1,:输入维度 是矩阵式
    tf.keras.layers.Dense(1, input_shape=(1,))
)
# 打印模型详情
print(model.summary())

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZuzrND0C-1668351864200)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/梯度下降法基础-构建模型打印详情-1.png)]

模型优化，通过选择损失函数，将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”

model.compile(
    optimizer='adam',
    loss='mse'
)

选择完损失函数后，接下来对模型进行训练，我们将训练过程打印出日志呈现，并实时查看其损失值的大小

# 记录训练过程 epochs:训练次数
# 训练过程中 loss值会不断下降直到无限逼近
history = model.fit(x, y, epochs=10000)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0SRnD9TL-1668351864201)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/梯度下降法基础-训练数据图-1.png)]

最后使用该模型实现预测

# 进行预测 连续值x 预测y
preTemp = model.predict(pd.Series([1233]))

print("结果是 = ", preTemp)

公式解释

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ukyeK7w7-1668351864201)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/梯度下降算法公式图-1.png)]

常见的梯度下降算法

全梯度下降（FG）

计算训练集所有的样本误差，对其求和再取平均值作为目标函数。
随机梯度下降（SG）

全梯度下降每迭代更新一次都需要计算所有的样本误差，样本数量大的情况下效率比较低，所以这个函数采取随机选择单个样本误差来代入某一轮的计算，每一轮都重新随机获取样本误差。

每次只使用一个样本迭代，如果遇到噪声容易陷入局部最优解，即可能拟合度过高。
小批量梯度下降（mini-bantch）

兼顾上述两种的缺点，从训练样本集中随机抽取一部分（SG）作为小样本集，对这个小样本集采用FG迭代更新权重。

被抽出的小样本集所含样本个数称之为batch_size，通常设置为2的幂次方。
随机平均梯度下降（SAG）

对SG方法的进一步优化，SG解决了运算成本大的问题，但是对于训练结果常常不尽人意，因为每一轮的误差样本梯度数据更新都跟上一轮的数据无关。

随机随机平均梯度下降克服了这个问题，通过在内存里保存上一次的梯度，最终求所有梯度的平均值，进而更新参数。

关于sk-learn中的相关API

# fit_intercept 是否计算偏置 - 小规模数据（不能解决拟合问题）优选岭回归
sklearn.linear_model.LinearRegression(fit_intercept=True)

# SGDRegressor类实现了梯度下降，支持不同的损失函数和正则化惩罚项来拟合线性回归模型 - 大规模数据
sklearn.linear_model.SGDRegressor(
    loss="squared_loss",
    fit_intercept=True,
    learning_rate="invscaling",
    eta0=0.01
)

波士顿回归案例

"""
    机器学习流程
    1.获取数据集
    2.数据处理
    3.特征工程
    4.机器学习
    5.模型聘雇
"""

# 告警抑制
import warnings
warnings.filterwarnings("ignore")

from sklearn.linear_model import LinearRegression
from sklearn.datasets import load_boston
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# get dataset
boston = load_boston()

# 数据集划分
x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, test_size=0.2)

# 特征工程
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)

# 机器学习
est = LinearRegression()
est.fit(x_train, y_train)

# 模型评估
y_res = est.predict(x_test)
print("预测值：", y_res)

score = est.score(x_test, y_test)
print("准确率：", score)

# 损失函数
ret = mean_squared_error(y_test, y_res)
print("均方误差：", ret)

六、交叉验证/网格搜索

链接
常见交叉验证方法汇总 - 知乎 (zhihu.com)
Python机器学习笔记：Grid SearchCV（网格搜索） - 战争热诚 - 博客园 (cnblogs.com)

七、正则化线性模型

降低模型的过拟合的好方法就是正则化这个模型（即限制它）：模型有越少的自由度，就越难拟合数据。例如，正则化一个多项式模型，一个简单的方法就是减少多项式的阶数。

Ridge Regression 岭回归

线性回归的正则化版本，通过在原先的线性回归的cost方法中添加正则项。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WQ4mBifU-1668351864201)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/线性回归-岭回归-公式-1.png)]

其中公式a=0则表示退化为线性回归。
Lasso 回归

线性回归的另外一个正则化版本，正则项为权值向量的ℓ1范数。

优势在于能够自动进行特征选择，并输出一个稀疏模型（只有少数特征的权重是非零的）。
Elastic Net 弹性网络

在岭回归和Lasso回归中进行了折中，通过参数变化可对公式进行控制。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZLYXlQVb-1668351864202)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/线性回归-弹性网络2-公式-1.png)]
- r=0：弹性网络变为岭回归
- r=1：弹性网络便为Lasso回归
Early Stopping

在验证错误率达到最小值的时候停止训练。

通过波士顿房价预测案例演示岭回归

"""
    机器学习流程
    1.获取数据集
    2.数据处理
    3.特征工程
    4.机器学习
    5.模型聘雇
"""

# 告警抑制
import warnings

warnings.filterwarnings("ignore")

from sklearn.linear_model import LinearRegression, Ridge
from sklearn.datasets import load_boston
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# get dataset
boston = load_boston()

# 数据集划分
x_train, x_test, y_train, y_test = train_test_split(boston.data, boston.target, test_size=0.2)

# 特征工程
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)

# 机器学习
# est = LinearRegression() # 线性回归
# est = Ridge(alpha=1)  # 岭回归
est = RidgeCV(alphas=(0.001, 0.1, 1, 10, 100)) # 自动选择
est.fit(x_train, y_train)

# 模型评估
y_res = est.predict(x_test)
print("预测值：", y_res)

score = est.score(x_test, y_test)
print("准确率：", score)

# 损失函数
ret = mean_squared_error(y_test, y_res)
print("均方误差：", ret)

八、逻辑回归

Logistic Regression - 属于机器学习中的入门的分类器，与线性回归不同，逻辑回归指的是是与否的回答，并且搭配交叉熵损失函数，刻画实际输出与期望输出的距离，来得到最终答案。

使用多元非线性回归来预测离散型因变量的模型，尤其是对于二分类变量的预测，该模型是一种分类技术。

如果在线性模型的基础上做二分类任务，实际上就是在最终的输出结果上套上一层函数，最简单的就是“单位阶跃函数”(unit-step function)，通过结果输入进行逻辑分类

逻辑回归的输入是线性回归的输出。

损失及优化

逻辑回归的损失，称之为对数似然损失，公式如下

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nkS3G2VW-1668351864202)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/逻辑回归-损失函数的公式-1.png)]

完整的公式代入

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EUeOKkK4-1668351864202)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/逻辑回归-完整的损失函数的公式-1.png)]

借助log思想，进行完成真实值等于0、等于1的两种情况的划分；优化后提升原本属于1类别的概率，降低原本是0类别的概率。

API介绍

api介绍

# solver可选参数:{liblinear,sag,saga,newton-cg,lbfgs};
# ----
# 默认是liblinear 用于优化问题的算法
# 小数据集使用liblinear 如大数据集则建议使用sag、sags
# 对于多类问题 只有newton-cg、sag、sags、lbfgs可以处理多项损失 liblinear只能处理一对多分类（one-versus-rest）
# ----
# penalty:正则化种类
# C:正则化力度
sklearn.linear_model.LogisticRegression(solver='liblinear', penalty='l2', C=1.0)
# LogisticRegression方法相当于SGDRegressor(loss='log',penalty='l2')
# SGDRegressor实现了普通的随机梯度下降 而LogisticRegression实现随机平均梯度下降

代码案例

癌症分类预测-良／恶性乳腺癌肿瘤。

下载原始数据集

99条样本，共11列数据，第一列用语检索的id，后9列分别是与肿瘤相关的医学特征，最后一列表示肿瘤类型的数值。
包含16个缺失值，用”?”标出。

import pandas as pd

data = pd.read_csv(
    "https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",
    names=names)

完整代码

"""
    机器学习流程
    1.获取数据集
    2.数据处理
    3.特征工程
    4.机器学习
    5.模型聘雇
"""

# 告警抑制
import warnings

warnings.filterwarnings("ignore")

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression

import ssl

ssl._create_default_https_context = ssl._create_unverified_context

# 数据集获取
names = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape',
         'Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin',
         'Normal Nucleoli', 'Mitoses', 'Class']

data = pd.read_csv(
    "https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",
    names=names)

print("data.head() = ", data.head())

# 数据预处理 将缺失值进行字符替换
data = data.replace(to_replace="?", value=np.NaN)
data = data.dropna()

# 特征选择
x = data.iloc[:, 1:10]
print("x.head() = ", x.head())
y = data["Class"]
print("y.head() = ", y.head())

# 划分测试集/训练集
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=22)

# 特征工程(标准化)
transfer = StandardScaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)

# 机器学习(逻辑回归)
estimator = LogisticRegression()
estimator.fit(x_train, y_train)

# 模型评估
y_predict = estimator.predict(x_test)
print("y_predict = ", y_predict)
estimator.score(x_test, y_test)

over

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PdWFDwNf-1668351864203)(https://csdn-pic-1301850093.cos.ap-guangzhou.myqcloud.com/csdn-pic/小星球-1.png)]

新手村：数据预处理-异常值检测方法嘉羽很烦机器学习机器学习
机器学习中异常值检测方法一、前置条件知识领域要求编程基础Python基础（变量、循环、函数）、JupyterNotebook或PyCharm使用。统计学基础理解均值、中位数、标准差、四分位数、正态分布、Z-score等概念。机器学习基础熟悉监督/无监督学习、分类、聚类、回归等基本概念。数据预处理数据清洗、特征缩放（标准化/归一化）、数据可视化（Matplotlib/Seaborn）。二、渐进式学习
新手村：数据预处理-特征缩放嘉羽很烦机器学习线性回归算法机器学习
新手村：数据预处理-特征缩放特征缩放（FeatureScaling）是数据预处理中的一个重要步骤，特别是在应用某些机器学习算法时。特征缩放可以使不同尺度的特征具有相同的量级，从而提高模型训练的效率和性能。常见的特征缩放方法包括标准化（Standardization）和归一化（Normalization）。常见的特征缩放方法标准化（Standardization）将特征转换为均值为0，标准差为1的标
python ==module 'datetime' has no attribute 'strptime' NO如果 python python
示例：datetime.datetime.strptime(string,"%Y-%m-%d%H:%M:%S")换成时分秒格式，数据库存储为datetime格式
在Python中如何检测和解决内存泄漏问题 python资深爱好者 python jvm
在Python中，内存泄漏通常不是像在一些低级语言（如C或C++）中那样常见，因为Python的内存管理（包括自动垃圾回收）相对高级且自动化。然而，在长时间运行的应用程序中，特别是在使用大量循环、大型数据结构或外部库时，仍然可能出现内存泄漏。以下是在Python中检测和解决内存泄漏的一些方法：1.使用内存分析工具a.objgraphobjgraph是一个用于分析Python对象图的库，可以帮助你识
Python在数据处理中的应用：从入门到精通程之编 python 信息可视化开发语言
活动发起人@小虚竹想对你说：这是一个以写作博客为目的的创作活动，旨在鼓励大学生博主们挖掘自己的创作潜能，展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴，那么，快来参加吧！我们一起发掘写作的魅力，书写出属于我们的故事。我们诚挚邀请你参加为期14天的创作挑战赛！在当今数字化时代，数据处理已成为各个领域不可或缺的一部分。无论是企业决策、科学研究还是日常的个人数据分析，掌握高效的
洛谷 P5534 【XR-3】等差数列 python 阿于阿于 xr
这题不用向下取整//就会错，不太能理解为什么...感觉对结果好像没什么影响啊a1,a2,n=map(int,input().split())d=a2-a1an=a1+d*(n-1)s=(a1+an)*n//2print(s)
python 装饰器每天减 1/5kg python
装饰器装饰器本质上是一个返回函数的高阶函数，可以接收函数作为参数，并返回一个新的函数。它允许你在不修改原函数代码的情况下，动态地给函数或方法添加额外的功能在我们的日常使用中，装饰器一般用于：日志记录、权限认证、性能分析、缓存等场景。简单示例defmy_decorator(func):defwrapper(*args,**kwargs):print("Beforecallingthefunction
支持向量机 (SVM) 算法详解 sssugarr 机器学习算法详解 python svm 支持向量机算法 sklearn
支持向量机(SVM)算法详解支持向量机（SupportVectorMachine,SVM）是一种监督学习模型，广泛应用于分类和回归分析。SVM特别适合高维数据，并且在处理复杂非线性数据时表现出色。本文将详细讲解SVM的原理、数学公式、应用场景及其在Python中的实现。什么是支持向量机？支持向量机的目标是找到一个最佳的决策边界（或称超平面）来最大限度地分隔不同类别的数据点。对于线性可分的数据，SV
python记录运行时间_计算python程序运行时间 weixin_39668408 python记录运行时间
本文介绍三种方法用来计算python程序的运行时间，考虑多现在计算机都是多进程执行环境，本文介绍的方法，前两种统计了其它进程的时间，实际上是python程序执行开始和结束的时间，只有最后一个方法，是计算的python程序的独自占用的CPU时间，但是python官方已经不再推荐。各位同学可以根据自己的应用情况选择考虑。1，用datatime模块，秒级精度>>>importdatetime>>>dat
Python 时间同步程序东亭山人 Python 时间同步
Python时间同步程序运行结果两种修改本地时间的方法(局域网内，利用网关服务器，穿越代理，与互联网时间同步的方法：前部分用于win7系统，后部分用于winserver2008。需要pip3installntplib需要启动WindowsTime服务。)importwin32apiimportdatetimeimportosimporttimeimportntplibdefSetClockL():
过拟合：机器学习中的“死记硬背”陷阱彩旗工作室人工智能机器学习人工智能
在机器学习中，过拟合（Overfitting）是一个几乎每个从业者都会遇到的经典问题。它像一把双刃剑：当模型过于“聪明”时，可能会陷入对训练数据的过度依赖，从而失去处理新问题的能力。本文将从原理到实践，深入探讨过拟合的本质及应对策略。1.什么是过拟合？过拟合是指模型在训练数据上表现极佳，但在新数据（测试数据或真实场景数据）上表现显著下降的现象。通俗来说，模型像一个“死记硬背的学生”，记住了训练集中
Python爬虫 -- re正则+csv存储小鞠.. Python爬虫 python 爬虫开发语言
爬取Boss上有关Python的工作。网址链接https://www.zhipin.com/wapi/zpgeek/search/joblist.json?scene=1&query=python&city=100010000&experience=&payType=&partTime=°ree=&industry=&scale=&stage=&position=&jobType=&sala
Python常用国内镜像源（清华、豆瓣、阿里云、中科大）老马达 #深度学习基础 python
使用Python最便捷的就是下载使用各种“包”，然而往往长时间不用就容易忘记，在这里将网上一些资源收集整理，一是方便自己日后使用，二是与诸君共享。一、代码清华大学开源软件镜像站：https://pypi.tuna.tsinghua.edu.cn/simple阿里云开源镜像站：https://mirrors.aliyun.com/pypi/simple/豆瓣：https://pypi.douban.
python实现数据库存储过程_Python通过调用mysql存储过程实现更新数据功能示例食色也 python实现数据库存储过程
本文实例讲述了Python通过调用mysql存储过程实现更新数据功能。分享给大家供大家参考，具体如下：一、需求分析由于管理费率配置错误，生成订单的还本付息表和订单表的各种金额，管理费之间的计算都有错误，需要进行数据订正。为此，为了造个轮子，以后省很多功夫，全部用程序去修正，不接入人工。二、带参数mysql存储过程创建1、更新订单付息表(t_order_rapay)dropprocedureifex
python调用数据库存储过程_python连接mysql调用存储过程示例 weixin_39806948 python调用数据库存储过程
复制代码代码如下:#!/usr/bin/envpython#-*-coding:utf8-*-importMySQLdbimporttimeimportos,sys,stringdefCallProc(id,onlinetime):'''调用存储过程，输入参数：编号，在线时间，输出：帐号，密码;使用输出参数方式'''accname=''accpwd=''conn=MySQLdb.connect(h
python调用MySql存储过程 weixin_30667649 数据库 python
环境：1.mysql5.0或者以上支持存储过程的版本2.安装MySQL-python，目前支持到2.x步骤：一.数据库准备1.建立表CREATETABLE`Account`(`id`BIGINT(20)NOTNULLAUTO_INCREMENT,`sm_accountName`VARCHAR(100)COLLATEgbk_chinese_ciNOTNULLDEFAULT'',`sm_passwor
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
Python调用mysql存储过程 Up_梅子酒 mysql python
Python调用mysql存储过程importpymysqlconn=pymysql.connect(host='127.0.0.1',port=3306,user='root',password='root',database='test',charset='utf8')cur=conn.cursor()cur.callproc('T1')#调用存储过程conn.commit()result=c
Python存储数据库教程--超详细！！小鞠.. 数据库 Python爬虫 python 数据库 mysql
目录1、首先导入需要用到的包2、连接数据库3、创建游标对象4、创建名为`dataname`的数据库，如果数据库不存在则创建，字符集设置为`utf8`。5、执行sql1语句6、创建数据表语句1.如果名为`user_id`的数据表不存在，则创建一个名为`user_tb`的数据表2.列定义7、执行sql2语句8、设置需要存入数据库的字段9、将数据插入`user_tb`数据表10、执行sql3语句11、提
anaconda运行python3_Anaconda上的python3初体验 weixin_39534208
正好最近没事，打算学习一下python3还有学学怎么看英语文献。然后接触到了Anaconda，当然之前也有用过python3的ide还有pycharm，不过实话实说Anaconda目前都非常让我满意。毕竟学计算机，人生苦短，没必要为了繁琐的软件使用来浪费时间。Anaconda就很好的解决了这个问题，他上面把许多有用的东西整合到了一起，非常方便快捷。安装Anaconda也没有太大难度，选择好对应环境
Anaconda-用conda创建python虚拟环境 g_grace1 深度学习
原文链接https://zhuanlan.zhihu.com/p/94744929conda可以理解为一个工具，也是一个可执行命令，其核心功能是包管理和环境管理。包管理与pip的使用方法类似，环境管理则是允许用户方便滴安装不同版本的python环境并在不同环境之间快速地切换。conda的设计理念conda将几乎所有的工具、第三方包都当作package进行管理，甚至包括python和conda自身。
在anaconda中创建python环境咕噜oo Python python anaconda
查看所有python虚拟环境condaenvlist星号表示默认环境。创建环境condacreate-npython37python=3.7.0其中python37是环境名称，自定义；python=3.7.0是python版本号。创建成功后可以发现在[anaconda3本地路径]\envs（D:\big_data\Anaconda3\envs）文件夹下会出现python37文件夹：也可以手动指定路
RSA加密算法详解：从基础原理到实际应用冬停算法
RSA加密算法详解：从基础原理到实际应用在现代信息安全领域，RSA加密算法因其坚实的数学基础和广泛的应用而备受关注。本文将全面介绍RSA算法的原理、密钥生成、加密解密过程以及数字签名的实现，并通过Python示例代码帮助您深入理解和掌握RSA的实际应用。目录什么是RSA？RSA的基本原理RSA密钥生成RSA加密与解密RSA签名与验证RSA的安全性Python实现RSA7.1RSA密钥生成示例7.2
Anaconda与python版本依旧天真无邪 Python Anaconda python anaconda
下面的地址可以查看anaconda对应的python版本:https://docs.anaconda.com/anaconda/packages/oldpkglists/下面的地址安装python3.7.X的最新版本：https://www.python.org/downloads/release/python-379/下面的地址安装anaconda的各版本：https://mirrors.tun
浅谈Python项目开发&管理、烟雨楼 python linux 开发语言
本文主要探讨的是个人在Python项目开发&管理这块的一些经验之谈，经过在团队实践后主要内容总结如下：基础环境管理编码标准&规范化远程开发项目脚手架环境管理使用Anaconda和Pipenv共同管理Python项目环境环境管理这块是个很普遍的问题，其面临的问题如下：如何对不同项目，任意Python版本的环境进行管控如何对不同项目，内外网Python依赖库进行管控（有些包是公司内部开发，那么对于项目
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)_anaconda配置python环境全栈工程师_oEe python 开发语言
2什么是Anaconda？Anaconda是一个开源的跨平台Python发行版本，支持WindowsmacOSLinux操作系统。Anaconda中包含了conda等180多个科学包及其依赖项。其中conda则是一个开源的软件包管理系统和环境管理系统，用于安装多个版本的软件包及其依赖关系，并在它们之间轻松切换。3Anaconda的安装进入Anaconda下载界面选择相应的操作系统，本文主要介绍在W
【Python】Python 环境搭建白冥_曜家的 Python学习路线 python python
目录安装pythonpip3与venv[^5]VSCode[^9]安装python目前，Python有两个版本，一个是2.x版，一个是3.x版，这两个版本是不兼容的。推荐安装Python3.x，建议从Python的官方网站下载安装程序1，推荐下载最新版本2的Windowsinstaller(64-bit)3。运行下载的安装包，记得勾上AddPython3.xtoPath4，然后点InstallNo
2.5 python接口编程 nervermore990 Python python
在现代软件开发的复杂生态系统中，不同系统、模块之间的交互协作至关重要。接口编程作为一种关键机制，定义了组件之间的通信规范与交互方式。Python凭借其卓越的灵活性、丰富的库资源以及简洁易读的语法，在接口编程领域占据了重要地位，广泛应用于各类项目开发中，从Web应用到数据处理，再到自动化测试等场景。一、接口编程基础概念（一）接口的定义从本质上讲，接口是一种抽象的规范，它规定了一组方法或行为的签名，但
《Python 环境配置指南：pip 安装与常用命令大全（附代码示例）》细水长流者环境 python pip chrome
《Python环境配置指南：pip安装与常用命令大全（附代码示例）》目录1.前言2.什么是pip？3.检查pip是否安装4.安装pip5.常用pip命令1)安装包2)升级包3)卸载包4)查看已安装的包5)导出与安装依赖6.配置国内镜像源7.虚拟环境管理8.总结9.参考文档1.前言在Python开发中，pip是管理第三方库的必备工具。无论是安装、升级还是卸载包，pip都能轻松搞定。本文将详细介绍pi
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

人工智能基础 | 回归分析（四）

文章目录

前言

一、简单数学公式实现一元回归

二、公式拆解

三、线性回归API初步使用

四、线性回归的损失及优化

五、梯度下降

代码案例

公式解释

常见的梯度下降算法

波士顿回归案例

六、交叉验证/网格搜索

七、正则化线性模型

八、逻辑回归

损失及优化

API介绍

代码案例

你可能感兴趣的:(机器学习,python,人工智能)