天海一直在AI

机器学习技术（七）——有监督学习之逻辑回归算法原理及实操

文章目录

机器学习技术（七）——有监督学习之逻辑回归算法原理及实操
- 一、引言
- 二、逻辑回归算法原理
- 三、实践案例介绍
- - 1、数据集及需求
  - 2、导入相关依赖库
  - 3、读取并查看数据
  - 4、数据预处理
  - 5、构建模型
  - 6、测试模型
  - 7、可视化模型
  - - 步骤1 训练集结果及可视化
    - 步骤2 测试集结果及可视化
- 四、总结

一、引言

当你想要解决一个分类问题时，逻辑回归是一种常用且强大的统计分析工具。它能够根据一系列特征值来预测一个样本属于某一类的概率。逻辑回归的灵活性、易解释性和计算效率使其成为了数据科学领域的重要技术之一。

本文内容：详细介绍逻辑回归算法原理，基于python的逻辑回归的底层代码实现及调用。基于逻辑回归的模型探索被调查人员年龄，估计工资以及是否会购买某产品的关系，并将预测结果进行可视化。

二、逻辑回归算法原理

1、我们定义逻辑回归的预测函数为
$h_\theta(x) = g(\theta^Tx)$
其中g(x)为sigmoid函数
$\frac{1}{1+e^{-x}}$
对于二分类任务有“单位阶跃函数”用来将实值z转换为0或1
$y=\begin{cases}0,&z<0\\0.5,&z=0\\1,&z>0\end{cases}$
最后我们可以得到下方函数，0.5可以作为分类的边界
$h_\theta(x) = \frac{1}{1+e^{-\theta^TX}}$

几种决策边界的例子：

关于逻辑回归的代价函数，设代价函数为：
$Cost(h_\theta(x),y)=\ \begin{cases} -log(h_\theta(x))&if \quad y=1 \\ -log(1-h(1-h_\theta(x))) &if \quad y=0 \end{cases}$
由上式可以推出：
$Cost(h_\theta(x),y)= -ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$
则在逻辑回归模型使用梯度下降算法中的代价函数可以表示为：
$J(\theta) = -\frac{1}{m}[\sum^{m}_{i=1}y^{(i)}logh_\theta(x^{(i)})+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

三、实践案例介绍

1、数据集及需求

本案例使用的数据样本为400用户的基本信息，其中包含每个样本的ID，性别，年龄，估计工资以及是否购买该产品。其中我们选择的自变量为用户的年龄，估计工资。应变量为是否购买该产品，并以0表示不否买，1表示购买该产品。

User ID	Gender	Age	EstimatedSalary	Purchased
15624510	Male	19	19000	0
15810944	Male	35	20000	0
15668575	Female	26	43000	0
15603246	Female	27	57000	0
15804002	Male	19	76000	0
15728773	Male	27	58000	0
15598044	Female	27	84000	0
15694829	Female	32	150000	1
15600575	Male	25	33000	0

数据集地址：https://download.csdn.net/download/tianhai12/88275733

采用逻辑回归模型通过对400名用户的年龄以及估计工资对是否购买该产品进行预测，并对数据样本的训练集以及测试集分别进行模型预测结果的可视化来显示模型表现。

2、导入相关依赖库

讲数据处理所需库以及可视化依赖包导入。

#导入相关依赖包
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

3、读取并查看数据

将400名用户数据导入，并将其中年龄和估计工资数据命名为x，将是否购买该产品设置为y。

输入：

#导入数据集
dataset = pd.read_csv('ml/Social_Network_Ads.csv')
#提取所有的行，索引为2,3的列
X = dataset.iloc[:, [2, 3]].values
y = dataset.iloc[:, 4].values

#查看前五行数据集
dataset.head()

结果显示如下，每位用户共有五组特征，其中我们主要关注年龄，估计工资以及是否购买该产品。

4、数据预处理

将我们所需数据按3：1的比例划分为训练集以及测试集以便后续训练模型，并对所有原始数据进行标准化为均值为0方差为1的数据以防止预测结果被一些维度较大的值影响。

#导入划分数据集的方法
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
#数据标准化
#导入标准化方法
from sklearn.preprocessing import StandardScaler
#标准化数据，保证每个维度的特征数据方差为1，均值为0。使得预测结果不会被某些维度过大的特征值而主导
sc = StandardScaler()
#将标准化的数据进行重定义
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

划分数据集为训练集和测试集，test_size参数表示测试集占总数据集的比例，这里的random_state就是为了保证程序每次运行都分割一样的训练集合测试集。否则，同样的算法模型在不同的训练集和测试集上的效果不一样。当你用sklearn分割完测试集和训练集，确定模型和促初始参数以后，你会发现程序每运行一次，都会得到不同的准确率，无法调参。这个时候就是因为没有加random_state。加上以后就可以调参了。

5、构建模型

导入逻辑回归模型，并基于上述所得训练集训练模型。

输入：

#使用训练数据集来训练模型
#导入逻辑回归模型
from sklearn.linear_model import LogisticRegression
#初始化逻辑回归分类器
classifier = LogisticRegression(solver='liblinear',random_state = 0)
#调用LogisticRegression中的fit函数/模块用来训练模型参数
classifier.fit(X_train, y_train)

solver的选项：['liblinear', 'newton-cg', 'lbfgs', 'sag', 'saga']

输出模型如下,其中各个参数所代表含义如下：

(可能根据包的版本不同,详细参数也有所不同,这里简单例举，具体可以参考自己电脑中LogisticRegression方法内的介绍)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
intercept_scaling=1, max_iter=100, multi_class=‘warn’,
n_jobs=None, penalty=‘l2’, random_state=0, solver=‘warn’,
tol=0.0001, verbose=0, warm_start=False)
以下为逻辑回归模型各个函数意义：
penalty：惩罚项，str类型，可选参数为l1和l2，默认为l2。用于指定惩罚项中使用的规范。
dual：对偶或原始方法，bool类型，默认为False。对偶方法只用在求解线性多核(liblinear)的L2惩罚项上。当样本数量>样本特征的时候，dual通常设置为False。
tol：停止求解的标准，float类型，默认为1e-4。就是求解到多少的时候，停止，认为已经求出最优解。
c：正则化系数λ的倒数，float类型，默认为1.0。必须是正浮点型数。像SVM一样，越小的数值表示越强的正则化。
fit_intercept：是否存在截距或偏差，bool类型，默认为True。
intercept_scaling：仅在正则化项为”liblinear”，且fit_intercept设置为True时有用。float类型，默认为1。
class_weight：用于标示分类模型中各种类型的权重，可以是一个字典或者’balanced’字符串，默认为不输入，也就是不考虑权重，即为None。
random_state：随机数种子，int类型，可选参数，默认为无，仅在正则化优化算法为sag,liblinear时有用。
solver：优化算法选择参数，只有五个可选参数，即’liblinear’, ‘newton-cg’, ‘lbfgs’, ‘sag’, ‘saga’。默认为liblinear。solver参数决定了我们对逻辑回归损失函数的优化方法，有四种算法可以选择，分别是：
liblinear：使用了开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数。
lbfgs：拟牛顿法的一种，利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。
newton-cg：也是牛顿法家族的一种，利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。
sag：即随机平均梯度下降，是梯度下降法的变种，和普通梯度下降法的区别是每次迭代仅仅用一部分的样本来计算梯度，适合于样本数据多的时候。
saga：线性收敛的随机优化算法的的变重。

6、测试模型

导入所需方法，并测试模型。

输入：

#使用训练好的模型对X_test进行预测，结果存储在变量y_pred中
y_pred = classifier.predict(X_test)
#构建混淆矩阵
#导入构建混淆矩阵的方法
from sklearn.metrics import confusion_matrix
#分别传入测试集的真实值和预测值来构建混淆矩阵， y_test是样本真实结果，y_pred是样本预测结果
cm = confusion_matrix(y_test, y_pred)
print(cm)
#使用逻辑回归模型自带的评分函数score获得模型在测试集上的准确性结果
print('Accuracy of LR Classifier:',classifier.score(X_test,y_test))

输出结果为混淆矩阵以及模型预测准确率。由结果可知，测试集中100样本预测对了89个，模型预测准确率为0.89.

输出：

[[65  3]
 [ 8 24]]
Accuracy of LR Classifier: 0.89

7、可视化模型

步骤1 训练集结果及可视化

导入可视化方法，首先对训练集预测数据以及模型预测结果进行可视化。

输入：

#可视化训练数据集的结果
#导入可视化的方法
from matplotlib.colors import ListedColormap
#训练集重新赋值
X_set, y_set = X_train, y_train
X1, X2 = np.meshgrid(np.arange(start = X_set[:, 0].min() - 1, stop = X_set[:, 0].max() + 1, step = 0.01),
                    np.arange(start = X_set[:, 1].min() - 1, stop = X_set[:, 1].max() + 1, step = 0.01))

#输出X1，X2结果
print(X1,X2)
#以红色表示不购买该产品，绿色代表购买该产品
plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),
            alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(), X1.max())
plt.ylim(X2.min(), X2.max())
for i, j in enumerate(np.unique(y_set)):
   plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],
               c = ListedColormap(('red', 'green'))(i), label = j)
#添加图表的描述
plt.title('Logistic Regression (Training set)')
plt.xlabel('Age')
plt.ylabel('Estimated Salary')
plt.legend()
plt.show()

输出为X1，X2结果以及模型预测与真实值比较可视化图。

[[-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]
 [-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]
 [-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]
 ...
 [-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]
 [-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]
 [-2.99318916 -2.98318916 -2.97318916 ...  3.13681084  3.14681084
   3.15681084]] [[-2.58254245 -2.58254245 -2.58254245 ... -2.58254245 -2.58254245
  -2.58254245]
 [-2.57254245 -2.57254245 -2.57254245 ... -2.57254245 -2.57254245
  -2.57254245]
 [-2.56254245 -2.56254245 -2.56254245 ... -2.56254245 -2.56254245
  -2.56254245]
 ...
 [ 3.30745755  3.30745755  3.30745755 ...  3.30745755  3.30745755
   3.30745755]
 [ 3.31745755  3.31745755  3.31745755 ...  3.31745755  3.31745755
   3.31745755]
 [ 3.32745755  3.32745755  3.32745755 ...  3.32745755  3.32745755
   3.32745755]]

该散点图中红色代表不购买该产品，绿色代表购买该产品。由图可知训练集中300个样本大部分被分对了，小部分红点在绿色部分，绿点在红色部分，为没有预测对的点，由图可知，该模型在训练集上表现连良好。

步骤2 测试集结果及可视化

对测试集数据进行相同可视化方法。

输入：

#可视化测试集结果，步骤与训练集相似。
from matplotlib.colors import ListedColormap
X_set, y_set = X_test, y_test
X1, X2 = np.meshgrid(np.arange(start = X_set[:, 0].min() - 1, stop = X_set[:, 0].max() + 1, step = 0.01),
                    np.arange(start = X_set[:, 1].min() - 1, stop = X_set[:, 1].max() + 1, step = 0.01))
plt.contourf(X1, X2, classifier.predict(np.array([X1.ravel(), X2.ravel()]).T).reshape(X1.shape),
            alpha = 0.75, cmap = ListedColormap(('red', 'green')))
plt.xlim(X1.min(), X1.max())
plt.ylim(X2.min(), X2.max())
for i, j in enumerate(np.unique(y_set)):
   plt.scatter(X_set[y_set == j, 0], X_set[y_set == j, 1],
               c = ListedColormap(('red', 'green'))(i), label = j)
plt.title('Logistic Regression (Test set)')
plt.xlabel('Age')
plt.ylabel('Estimated Salary')
plt.legend()
plt.show()

测试机输出结果如下所示，我们可以发现共有三个红点被错分在绿色区域，8个绿点被错分在红色区域，与混淆矩阵结果一致，总共11个样本预测错误，模型准确率0.89，表现良好。

四、总结

通过基于逻辑回归探索400名用户的年龄以及估计工资对是否购买该产品进行预测，并对数据样本的训练集以及测试集分别进行模型预测结果的可视化来显示模型表现。由可视化图像可得模型表现良好，后续可以通过用户年龄以及估计工资来预测他是否会购买该产品，进行一个目标客户选择。

程序员创业公司的技术栈选择与性能优化 AI天才研究院 ChatGPT AI大模型企业级应用开发实战大数据AI人工智能大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
《程序员创业公司的技术栈选择与性能优化》概述本文旨在探讨程序员创业公司在选择技术栈和进行性能优化方面的策略与实践。随着技术的不断进步和市场的快速变化，技术栈的选择和优化成为创业公司成功的关键因素。正确的技术栈选择不仅能够提升系统的性能和可扩展性，还能降低开发成本和维护难度。关键词技术栈选择性能优化创业公司云计算数据库微服务人工智能区块链边缘计算摘要本文首先分析了技术栈选择的重要性以及创业公司在技术
AI人工智能深度学习算法：高并发场景下深度学习代理的性能调优 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1深度学习代理的兴起近年来，随着人工智能技术的飞速发展，深度学习在各个领域都取得了显著的成果。特别是在自然语言处理、图像识别、语音识别等领域，深度学习模型的性能已经超越了传统方法。为了更好地将深度学习技术应用于实际场景，深度学习代理应运而生。深度学习代理是一种将深度学习模型封装起来，并提供对外接口的服务。它可以接收来自客户端的请求，将请求数据输入到深度学习模型中进行推理，并将推理结
如何学习爬虫技术：从入门到实践的全面指南 CodeJourney. 学习爬虫
一、引言在当今数字化时代，网络上的数据量呈爆炸式增长，能够高效地获取和处理这些数据变得愈发重要。爬虫技术作为一种从网页中自动提取信息的手段，在各个领域都有着广泛的应用，无论是数据分析、机器学习的数据集构建，还是市场调研、价格监测等商业场景，掌握爬虫技术都能为你打开一扇获取丰富信息资源的大门。然而，对于初学者来说，面对琳琅满目的工具和复杂的网络环境，可能会感到无从下手。本文将带你逐步深入了解爬虫技术
Mysql-生产环境实战经验总结猿与禅 MySQL底层原理及实战 mysql 数据库生产环境经验故障排查压测
文章目录真实生产环境下的Mysql数据库机器配置如何规划互联网公司的生产环境数据库是如何进行性能压测1.准备测试环境2.构建测试场景3.性能测试4.监控与分析5.资源压力测试6.故障恢复测试7.文档记录与复盘8.安全与合规注意事项如何为生产环境中的数据库部署监控系统1.选择监控工具2.安装监控组件3.配置MySQL导出器4.配置Prometheus5.配置Grafana6.设置警报规则7.监控My
AI生成PPT：智能技术重塑演示文稿创作的新篇章 mhjidfoi 人工智能
在快节奏的商业与学术环境中，演示文稿（PPT）作为信息传递与观点展示的重要工具，其质量与效率直接关系到演讲者的说服力和观众的接收度。近年来，随着人工智能（AI）技术的飞速发展，AI生成PPT的应用正逐渐从科幻概念转变为现实工具，为演示文稿的创作带来了革命性的变革。本文将深入探讨AI生成PPT的工作原理、优势、挑战以及未来展望，为您揭示这一智能技术的无限潜力。一、AI生成PPT的工作原理AI生成PP
零门槛一键生成PPT，利用人工智能快速提高办公效率（无需第三方插件） beautycountry88 powerpoint 人工智能
人工智能技术的发展正以惊人的速度改变着我们的世界，今天给大家介绍下利用ChatGPT快速生成PPT的方法，它能够帮助你一键生成PPT内容和漂亮的PPT文档，无需繁琐的设计和排版，只需要与ChatGPT交流，你就能轻松拥有一份令人赞叹的演示文稿。什么是ChatGPT？它是基于人工智能技术的语言模型，能够理解和生成自然语言。与传统的PPT制作方式不同，ChatGPT通过与你进行对话，理解你的需求和要点
探索AloT（人工智能物联网）：未来智能设备的核心驱动力为也科技人工智能物联网边缘计算目标检测 iot
探索AloT（人工智能物联网）：未来智能设备的核心驱动力随着物联网（IoT）技术的飞速发展，人工智能（AI）也在各行各业中找到了应用的空间。两者的结合，诞生了一个崭新的技术领域——AloT（ArtificialIntelligenceofThings，人工智能物联网）。AloT不仅仅是AI与物联网技术的简单融合，它更是推动智能设备进化和物联网产业向更高层次发展的关键力量。今天，我们就来深入探讨Al
将机器学习算法移植到低端MCU上的实用指南为也科技 AI边缘计算机器学习算法单片机嵌入式硬件 python c语言物联网
将机器学习算法移植到低端MCU上的实用指南在物联网（IoT）和边缘计算迅猛发展的今天，将智能功能嵌入到资源有限的低端单片机（MicrocontrollerUnit,MCU）上，已经成为许多开发者和工程师追求的目标。然而，这一过程充满挑战，但只要掌握正确的方法，也能在低端MCU上实现高效的机器学习应用。本文将以具体的案例为例，逐步讲解每个步骤的实际操作，包括所需的工具、命令和代码示例，帮助开发者成功
汽车和工业用激光雷达行业分析 LPiling 汽车自动驾驶人工智能
行业现状激光雷达（LiDAR）作为自动驾驶和智能驾驶领域的关键技术，近年来经历了显著的技术进步和成本下降。激光雷达通过脉冲激光照射目标并用传感器测量反射脉冲返回时间来测量目标距离，能够生成高分辨率的地图和三维模型。这种技术在汽车领域的应用已经从高端车型快速渗透到中低端市场，成为自动驾驶系统不可或缺的传感器之一。在工业领域，激光雷达支持机器人、工厂自动化和物流等多种应用。随着电子商务的蓬勃发展，消费
抽取网易云音乐热门评论（附代码）：html+css+python+js 音乐与灵魂的碰撞爱玩游戏的jason other html css python
抽取网易云音乐热门评论：html+css+python+js音乐与灵魂的碰撞代码链接不说废话，上代码！！！get.py#get.pyimporturllib.requestimporturllib.errorimporturllib.parseimportjson#抓取网易云音乐指定url的热评defget_hotComments(id):url='https://music.163.com/we
python常见绘图及代码 CodeJourney. 算法人工智能 python
一、引言在数据驱动的时代，将数据转化为直观的图形对于理解数据、发现模式和传达信息至关重要。Python作为一种功能强大且广受欢迎的编程语言，拥有丰富的绘图库，能满足不同场景下的数据可视化需求。本文将深入探讨Python中常见的绘图程序，包括Matplotlib、Seaborn、Plotly和Bokeh，并提供详细的代码示例。二、Matplotlib：基础绘图的基石2.1简单折线图Matplotli
智能送餐机器人底盘方案：从传感器选型到架构的全方位解析为也科技机器人机器人 python 单片机计算机视觉硬件工程 linux ubuntu
在这个快节奏的时代，外卖和快递行业的需求持续攀升，送餐机器人作为智能配送的前沿技术，正逐步走进我们的生活。而一个高效、稳定且智能的送餐机器人底盘，是确保其卓越性能的关键所在。今天，我将带大家深入了解我们团队在开发送餐机器人底盘时，从传感器选型到双主控架构（MCU与RK3588）的详细技术实现过程。让我们一起揭开智能送餐机器人的技术秘密吧！版权所有©深圳市为也科技有限公司目录项目背景与目标系统架构总
Python用 subprocess编写超时进程控制脚本 Steffen Python
一直都寻找在Python下方便控制子进程运行时间的脚本。虽然网上有很多的好方法，但是都不能满足我的需求（也是我资质太低看别人的脚本总感觉太吃力，总有些看不明白的地方）。下面这个脚本和网上一样利用了subprocess函数创建一个子进程控制脚本。（闲话少说，直接上菜！！！）#!/usr/bin/pythonimportsubprocess,timedefTest_ilo():ilo_ip='10.2
25/1/21 算法笔记＜ROS2＞编译ROS2 c++节点文档步骤青椒大仙KI11 c++开发语言
在ROS2中，创建节点是指编写一个程序（通常是C++或Python代码），这个程序能够与ROS2系统进行交互，执行特定的任务。节点是ROS2中最基本的执行单元，每个节点通常负责完成一个特定的功能，例如控制机器人、处理传感器数据或执行计算。完整步骤：编译ROS2C++节点1.准备工作有ROS2安装colcon构建工具安装turtlesim包2.创建工作空间创建工作空间：ROS2的工作空间是一个目录结
Python中实现多层感知机（MLP）的深度学习模型 Echo_Wish Python 笔记从零开始学Python人工智能 python 深度学习开发语言
深度学习已经成为机器学习领域的一个热门话题，而多层感知机（MLP）是最基础的深度学习模型之一。在这篇教程中，我将向你展示如何使用Python来实现一个简单的MLP模型。什么是多层感知机（MLP）？多层感知机（MLP）是一种前馈神经网络，它包含一个输入层、一个或多个隐藏层以及一个输出层。每个层都由一系列的神经元组成，神经元之间通过权重连接。MLP能够学习输入数据的非线性特征，因此在复杂问题的建模中非
Python异常处理：从基础到进阶傻啦嘿哟 python 开发语言
目录一、异常处理基础1.1什么是异常1.2捕获异常1.3多个异常处理1.4else和finally子句二、进阶应用2.1自定义异常2.2异常链2.3使用contextlib进行上下文管理2.4捕获所有异常（慎用）2.5异常处理与函数返回值三、实战案例3.1文件读写异常处理3.2网络请求异常处理四、总结在编程过程中，我们经常会遇到各种运行时错误，比如除零错误、文件未找到错误等。为了处理这些错误，Py
Python识别处理验证码技术详解傻啦嘿哟 python 开发语言
目录一、验证码的种类二、OCR技术简介三、使用OCR技术识别验证码1.安装所需库2.下载和处理验证码图片3.使用OCR进行识别4.完整代码示例四、处理复杂验证码五、案例：识别古诗文网验证码六、总结验证码作为一种常见的安全手段，广泛应用于各种网站和应用中，以防止自动化脚本的恶意攻击。然而，在自动化测试或数据抓取过程中，识别验证码成为了一个不得不面对的问题。本文将详细介绍如何使用Python来识别和处
python超时退出进程_长时间运行进程的超时和Windows服务（Python）拉菲雪球兔 python超时退出进程
将服务用作具有多个线程的控制器。一个线程(Main)应该同步和排队命令，并使用win32serviceframework进行通信、注册到系统等。另一个线程(Worker)应该等待来自队列的命令并执行它们。如果您将任意代码作为单独的进程执行，那么您可以从工作线程中派生这些代码，并在它们完成后简单地读回结果并进行清理。在这样，当一个stop到达时，您的主线程将把它注册到它队列中的worker，它将唤醒
A股程序化交易接口有哪些？不同接口在功能和稳定性上有何差异？财云量化 python炒股自动化量化交易程序化交易 a股程序化交易接口功能股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
实战LangChain（七）：集成CrewAI——实现多代理协作 matianlongg 深度学习 langchain
实战LangChain（七）：集成CrewAI——实现多代理协作实战LangChain（一）：构建您的第一个聊天机器人_langchai机器人实战LangChain（二）：探索RAG——为聊天机器人注入知识-CSDN博客实战LangChain（三）：深化交互——利用Neo4j提升聊天机器人的对话能力实战LangChain（四）：LangGraph入门——状态管理与基础结构实战LangChain（五
ssti注入 m0_73818134 flask python
flask有个明显的特征就是服务器模板，把用户输入的回显到web页面，一般在用户交互的地方(输入/输出),这个要用python去构造链子去执行python命令，来getshell。一般的注入是get型的如{{7*7}}，{%7*7%}，{#7*7#},还有{%print(7*7)%}.一般的链子1().__class__.__base__.__subclasses__()[140].__init_
python之.pyc文件 diantuge7474 java 运维 python
.pyc是个什么呢？计算机是不能够识别高级语言的，所以当我们运行一个高级语言程序的时候，就需要一个“翻译机”来从事把高级语言转变成计算机能读懂的机器语言的过程。这个过程分成两类，第一种是编译，第二种是解释。编译型语言在程序执行之前，先会通过编译器对程序执行一个编译的过程，把程序转变成机器语言。运行时就不需要翻译，而直接执行就可以了。最典型的例子就是C语言。解释型语言就没有这个编译的过程，而是在程序
人工智能与量子计算：未来编程的碰撞与共鸣大梦百万秋知识学爆量子计算
引言：编程的“摩尔定律”快到尽头了？曾几何时，摩尔定律曾预言着计算能力的飞速发展——每两年，晶体管的数量翻倍，处理器的速度也在跟着疯狂增长。这个定律引领了数十年的技术革命，推动了今天的智能手机、超级计算机和现代互联网的诞生。然而，摩尔定律的黄金时代正逐渐走向尾声。传统的硅基芯片工艺遇到了物理极限，无法再轻易实现持续的性能翻倍。此时，新的计算范式开始崭露头角——量子计算与人工智能（AI）的结合，正在
AI Agent：深度解析与未来展望码事漫谈 c++人工智能
一、AIAgent的前世：从概念到萌芽（一）早期探索AIAgent的概念可以追溯到20世纪50年代，早期的AI研究主要集中在简单的规则系统上，这些系统的行为是确定性的，输出由输入决定。随着时间的推移，AI逐渐能够处理不确定性，1990年代机器学习的兴起为AIAgent的发展奠定了基础，神经网络技术的突破为深度学习的发展提供了可能。（二）技术突破2017年后，大语言模型（LLM）的出现推动了AIAg
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【人工智能】Python常用库-Keras：高阶深度学习 API IT古董深度学习人工智能 Python 人工智能 python 深度学习
Keras：高阶深度学习APIKeras是一个高效、用户友好的深度学习框架，作为TensorFlow的高级API，支持快速构建和训练深度学习模型。它以模块化、简单和灵活著称，适合研究和生产环境。Keras的发音为[ˈkerəs]，类似于“凯拉斯”或“克拉斯”。这个名字来源于希腊语κέρας(kéras)，意思是“角”或“角质物”。这个词与深度学习的灵感来源——大脑的神经网络结构有一定联系。Kera
深度求索DeepSeek V2.5-1210发布：AI代码生成器迎来全新升级 2401_89759264 人工智能前端
深度学习技术日新月异，而强大的AI代码生成器也随之不断进化。今天，我们将聚焦于深度求索团队发布的DeepSeekV2.5-1210版本，这款标志着DeepSeekV2系列收官之作，为我们带来了令人惊喜的Post-Training能力提升和备受期待的联网搜索功能。这篇文章将深入探讨DeepSeekV2.5-1210的各项改进，以及其开源带来的深远影响。DeepSeekV2系列的研发历程与V2.5-1
南京大学苏州校区学生代表团到访合合信息，开启“沉浸式”人工智能企业行人工智能图像识别程序员
为进一步深化校企合作，探索产业科技拔尖创新人才培养新模式，近期，南京大学苏州校区师生代表到访上海合合信息科技股份有限公司（以下简称“合合信息”，股票代码：SH688615）。此次活动设置了展厅讲解、技术交流、模拟面试等多个体验环节，旨在增强学生对人工智能及商业大数据技术在实际应用中的理解和认识，引导学生系统性开展职业规划，提升职业胜任力。图说：南京大学苏州校区学生代表团到访合合信息合影留念合合信息
【Node.js] ADFVBM 面试学习路线阿里巴巴 node.js
一、概述Node.js是一个基于ChromeV8引擎的JavaScript运行环境，使用了一个事件驱动、非阻塞式I/O模型，让JavaScript运行在服务端的开发平台，它让JavaScript成为与PHP、Python、Perl、Ruby等服务端语言平起平坐的脚本语言。官网地址：https://nodejs.org/zh-cnNode.js学习路线：JavaScript基础语法+Node.js内
SAP UI5 初学者教程之十三 - 如何添加自定义 CSS 类试读版
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

机器学习技术（七）——有监督学习之逻辑回归算法原理及实操

机器学习技术（七）——有监督学习之逻辑回归算法原理及实操

文章目录

一、引言

二、逻辑回归算法原理

三、实践案例介绍

1、数据集及需求

2、导入相关依赖库

3、读取并查看数据

4、数据预处理

5、构建模型

6、测试模型

7、可视化模型

步骤1 训练集结果及可视化

步骤2 测试集结果及可视化

四、总结

你可能感兴趣的:(机器学习技术,机器学习,人工智能,python)