nymph.c

机器学习（基础）

小编最近在学习机器学习的基础知识，为巩固知识，整理出基本要点，更好的学习理解

1.目的

 —1.机器学习使计算机能够从研究数据和统计信息中学习
 2.机器学习是迈向人工智能方向的第一步
 3.机器学习是一种程序，可以分析数据并学习和运行结果
2.数据集：任何数据集合，可以是数组到完整数据库的任何内容
3.数据类型：1.数值：离散类型（整数），连续数据（具有无限值的数据）
2.分类：无法度量的值（颜色值或任何yes/no)
3.序数：可以相互度量

2.均值，中值，众数

1.均值–平均值（使用numpy模块）
**使用numpy.mean()
import numpy
v=[99,25,43,64]
x=numpy.mean(v)
print(x)
2.中值–（从小到大排列一列数然后寻找最中间的一个数（奇数）或者计算中间两个数的平均值（偶数））
**使用numpy.median()
import numpy
v=[99,25,43]
x=numpy.median(v)
print(x)#会自动排序并输出
3.众数–出现次数最多的数（使用SciPy模块）
**使用scipy mode（）
from scipy import stats
v=[99,25,43,99]
x=scipy.mode(v)
print(x)

3.标准差（匀方差）———描述数的离散程度

 1.低标准偏差表示大多数字接近平均值，高标准偏差表示大多数字分布在更宽的范围内
 2.Numpy std（）方法可以查找标准差
  import numpy
  v=[86,87,22,85,84]
  s=numpy.std(v)
  print(s)

4.方差————指示值的分散程度

方差的平方根，会得到标准差
1.Numpy var()方法可以确定方差
import numpy
v=[32,111,138,28,59,77,99]
x=numpy.var(v)
print(x)

5.百分位数

   统计学中使用百分位数提供一个数字，该数字描述了给定百分比值小于的值

1.Numpy percetile（object,目标数）方法查找百分位数
import numpy
v=[5,31,43,48,50,47,7,11,15,39,80,82,32,8,6,25,36,27,61,31]
x=numpy.percetle(v,75)
print（x）
75百分数：75%的x值是结果值及以下

6.数据分布

NumPy，附带了许多创建任意大小的随机数据集的方法
import numpy x=numpy.random.uniform(0.0,5.0,250) print(x)

1.直方图（为了可视化数据集）hist绘制直方图
代码：
`import numpy
 import matplotlib.pyplot as plot
 x=numpy.random.uniform(0.0,5.0,250)
 plot.hist(x,5)
 plot.show() `
 #生成250个数据，x轴代表生成的数据是0.0-5.0之间的随机数由5栏表示
  y轴表示在每个分隔段数据的个数!
 2.大数据分布：包含250个的数据集认为不够大可以创建一个随机的值，并且通过更改参数，可以创建所需大小的数据集
    eg：import numpy
        import matplotlib.pyplot as plt
        x=numpy.random.uniform(0.0,5.0,1000)
        plt.hist(x,100)
        plt.show().

7.正态数据分布

又称为高斯数据分布或钟形曲线
使用numpy.random.normal()方法创建的数组
import numpy import matplotlib.pyplot as plt x=numpy.random.normal(5.0,1.0,100000) plt.hist(x,100) plt.show()
代码解释
1.创建的数组（具有100000个值）绘制具有100栏的直方图
2.指定平均值为5.0，标准差为1.0（值集中到5.0左右，很少偏离1.0）
3.大多值在4.0到6.0之间，最高值大约是5.0

8.Matplotlib模块

1.新建画布（可以根据实际情况省略）

`matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass=<class 'matplotlib.figure.Figure'>, clear=False, **kwargs)`

num:int or str or Figure,optional 一个唯一的标识符
figsize：画布的宽度和高度，单位为英寸，默认值为（6.4，4.8）
dpi：每英寸的像素个数，默认100
facecolor:背景颜色，default：rcParams"figure.facecolor"]
edgecolor:边框颜色，default：rcParams"figure.edgecolor"]

折线图plt.plot()

matplotlib.pyplot.plot(*args,scalex=True,scaley=True,date=None,**kwargs)

x:横坐标，可选的，默认为range(len(y))
y:纵坐标，即数据项，可以是一维或多维的列表或数组
markersize：标记大小
color：线条颜色
marker：数据标记的形状，默认是没有标记
linestyle：线条样式，默认为实线
linsize:线条尺寸

x=[1,2,3] y=[1,2,3] #以下两种写法等价， plt.plot(x,y,color='green',marker='o',linestyle=;dashed',linesize=2,marksize=12 plt.plot(x,y,'go--',linesize=2,marksize=12 #可以在一张图中画好多条折线 y1=[4，5，6] plt.plot(x,y1,color='red',marker='o',linestyle=;dashed',linesize=2,marksize=12

垂直柱状图（plt.bar)

matplotlib.pyplot.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, **kwargs)

x: float or array-like柱子的横坐标
height:float or array-like柱子的高度
width：float or array-like柱子的宽度，default：0.8
bottom:falot or array-like，y轴的起始值，default：0
align：柱子与x轴坐标的对齐方式{‘center’，‘edge’}，default：‘center’
label：list[str]将相应的横坐标替换成标签

import numpy as np
import matplotlib.pyplot as plt
x=[1,2,3,4,5]
y=np.random.rand(5）#5个随机数据
plt.figure(figsize=(8,4))
plt.bar(x,y)
x_=list(ramge(len(x))
name_list=['yueyue','lmm','lym','jie','num']
plt.xticks(x,x_)#设置x轴刻度
plt,show()
#plt.ba(range(len(x)),y,tick_label=name_list,bottom)

水平柱状图（plt.barh()）

y: float or array-like柱子在y轴的坐标
width：float or array-like柱子的宽度，即水平长度
height：float or array-like,柱子的高度,与垂直柱状图的宽度相应default：0.8
left：float or array-like，每个柱子在x方向的起始坐标 default：0
align：柱子同y轴坐标的对齐方式{‘center’,‘edge’},default:‘center’
tick_label:list[str]将相应的纵坐标替换成标签

import matplotlib.pyplot as plt
import numpy as np
name_list=name_list=['yueyue','lmm','lym','jie','num']
x=[52.1,49.3,72.5,69.8,67.52]
plt.barh([1,2,3,4,5],x,left=[1,2,1,2,1],tick_label=name_list)
plt.ylabel(" ")#设置y轴坐标标签
plt.show()

饼状图（plt.pie()）

import  matplotlib.pyplot as plt
x=[15,25,35,25]
name=['A','B','C','D']
label=['15%','25%','35%','25%']#标注对应的刻度
color=['#14615E','#F46C40','#3E95C0','#A17D3B']
plt.pie(x,label=name,colors=color ,autopct='%d%%')
plt.axis('equal')#刻度等长
plt.show()

散点图（plt.scatter()）

import nump as np
import matplotlib.pyplot as plt
N=10
x=np.random.rand(N)
y=np.random.ramd(N)
x1=np.random.ramd(N)
x2=np.random.ramd(N)
plt.scatter(x,y,color='red',marker='^',label='red')
plt.legend(loc='upper left')
plt.scatter(x1,y2,color='red',marker='^',label='red')
plt.legend(loc='best')#在左上角最好的位置设置标签
plt.xlabel('x轴')#给横坐标添加标签
plt.ylabel('y轴')#给纵坐标添加标签
plt.show()

绘制四幅子图

p1=huaban.add_subplot(221)
p2=huaban.add_subplot(222)
p3=huaban.add_subplot(221)
p4=huaban.add_subplot(222)
#这些数字的意思是，把画板分成两行两列，四个位置，p1在位置1，p2在位置2.......

import numpy as np
import matplotlib.pyplot as plt
x=range(-10,10)
y=np.random.rand(20)
huaban=fi.figure(facecolor='pink',figsize=(8,8),dpi=100)

p1=huaban.add_subplot(221)
x=np.random.rand(10)
p1.plot(x,np.sin(x),label='sinx',marker='o')
plt.legend(loc='best')
plt.grid(c='r',linestyle=':')

p2=huaban.add_subplot(222)
x1=np.linespace(-np.pi*2,np.pi*2,1000)
y1=np.sin(x1)
p2.plot(x1,y1,label='sinx',color='best')
plt.legend(loc='best')
plt.grid(c='b',linestyle='--')

p3=huaban.add_subplot(223)
N=10
x=np.random.rand(N)
y=np.random.ramd(N)
x1=np.random.ramd(N)
x2=np.random.ramd(N)
plt.scatter(x,y,color='red',marker='^',label='red')
plt.scatter(x1,y2,color='red',marker='^',label='red')

p4=huaban.add_subplot(224)
x=np.random.rand(10)
p1.plot(x,np.cos(x),label='sinx',marker='o')
plt.legend(loc='best')
plt.grid(c='c',linestyle=':')
plt.show()

需要中文标注 plt.rcParams[‘font.sans-serif’] = [‘SimHei’]
显示负号 plt.rcParams[‘axes.unicode_minus’] = False

9.线性回归

线性回归是指使用数据点之间的关系在所有数据点之间画一条直线，尽可能的使预测结果更加准确
1.导入scipy并绘制线性回归线：

import matplotlib.pyplot as plt
from scipy import stats

2.创建x,y数值的数组

x=[5,7,8,7,2,17,2,9]
y=[99,86,81,88,111,86,103,87]

3.执行一个方法，返回一些重要的键值，slope是指使用斜率，intercept是指截距，r是指相关性指数

slope, intercept, r, p, std_err = stats.linregress(x, y)

4.定义一个函数计算统计slope，intercept所返回值，这个新值表示相应的x值在y轴上放置的位置，map在这里的意思是映射的意思，会根据提供的函数对指定序列做映射。
map函数会返回一个迭代器，如果要转换为列表，可以使用 list() 来转换。


def myfunc(x):
  return slope * x + intercept
y1= list(map(myfunc,x))

5.展示原始散点图和线性回归直线

plt.scatter(x,y)
plt.plot(x,y1)
plt.show()

R**2

重要的是知道x轴与y轴之间的关系，如果没有关系，线性回归不能预测任何东西
r**2的值是[0,1],0表示不相关，1表示100%相关
可以查看拟合度的代码


from scipy import stats
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
slope, intercept, r, p, std_err = stats.linregress(x, y)
def myfunc(x):
  return slope * x + intercept
speed = list(map(myfunc,x)
print(r)

10.多项式回归

多项回归使用变量x与y之间的关系绘制数据点线的最佳方法
1.导入所需模块

import numpy
import matplotlib.pylot as plt

2.创建x，y数轴的数值

x=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22]
y=[100,90,80 60,60,55,60,65,60,65,60.60,70,70,75,76,78,79,90,99,99,100]

3.Numpy中有一种方法可以建立多项式模型

d=numpy.poly1d(numpy.polyfit(x,y,3))

4.指定行的显示方式，从1-22

line=numpy.linspace(1,22,100)

5.绘制原始散点图和多项式回归线

plt.scatter(x,y)
plt.plot（line，d(line))
plt.show()

注解np.poly1d(）and poly.fit() and linsppace()

（1）.np.poly1d()此函数有两个参数：

参数1：为一个数组，若没有参数2，则生成一个多项式，例如：

p = np.poly1d([2,3,5,7])

print§==>>2x3 + 3x2 + 5x + 7 数组中的数值为coefficient（系数），从后往前 0，1，2.。。为位置书的次数

参数2：若参数2为True，则表示把数组中的值作为根，然后反推多项式，例如：
q = np.poly1d([2,3,5],True)
print(q) ===>>(x - 2)(x - 3)(x - 5) = x3 - 10x2 + 31x -30

参数3：variable=‘z’表示改变未知数的字母，例如：

q = np.poly1d([2,3,5],True,varibale = ‘z’)

print(q) ===>>(z - 2)(z - 3)(z - 5) = z3 - 10z2 + 31z -30
（2）

polyfit(x, y, deg):

x:M个采样点的横坐标数组；
y:M个采样点的纵坐标数组；y可以是一个多维数组，这样即可拟合相同横坐标的多个多项式；
deg：多项式阶数。

(3)

linspace(start,stop,num)

start
start 参数数值范围的起始点。如果设置为0，则结果的第一个数为0.该参数必须提供。

stop
stop 参数数值范围的终止点。通常其为结果的最后一个值，但如果修改endpoint = False, 则结果中不包括该值(后面示例会说明)。

num (可选)
num 参数控制结果中共有多少个元素。如果num=5，则输出数组个数为5.该参数可选，缺省为50.

R**2

同线性回归R**2相同，直接列出代码

import numpy
from sklean.meterics import r2_score#随机森林
x=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22]
y=[100,90,80,60,60,55,60,65,70,70,70,75,76,78,79,90,99,99,90,100]
my=numpy.poly1d(numpy.polyfit(x,y,3))
print(r2_score(y,my(x))

如果拟合度过低则告诉我们不适合多项式项目

预测未来值

import numpy
from sklean.meterics import r2_score#随机森林
x=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22]
y=[100,90,80,60,60,55,60,65,70,70,70,75,76,78,79,90,99,99,90,100]
my=numpy.poly1d(numpy.polyfit(x,y,3))
t=my(23)
print(t)

11.多元回归

pandas模块允许导入一个csv文件并返回一个DataFrame对象
sklearn
多元回归同线性回归1一样虽然有多个独立值，我们试图基于两个或多个变量来测量一个值
列出独立值，并将变量命名为X，并将相关列表命名为小写y
1.读取数据，导入模块

from matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression#用LinearRegression创建一个线性回归对象
from mpl_toolkits.mplot3d import Axes3D#绘制3D模型
from numpy as np
#from pandas

data=np.loadtext('data.csv',delimiter=',')#导入数据
#data=pandas.read_csv('data.csv')
x_data=data[:,0:-1]#特征：前两列
y_data=data[:,-1]#标签（所预测数据）（最后一列）

#X=['1号数据','2号数据']
#y=['预测数据']

2.训练模型
训练模型，并输出所求得的相关参数。并做预测进行测试LinearRegression有一个名为fit（）的方法，该方法将独立值和从属值作为参数，并用描述这种关系的数据填充回归对象：

model=LinearRegression()
model.fit(x_data,y_data)#训练模型
#构建测试样本
x_test=[[102,4]]
predict=model.predict(x_test)
print(predict)

3.可视化

x_1=x_data[:,0]#第一列数据
x_2=x_dat[:,1]#第二列数据
x_1,x_2=np.meshgrid(x_0,x_1)
y_hat=model.intercept+model.coef_[0]*x_[1]+model.coef_[1]*x_2

fig=plt.figure()
ax=Axes3D(fig)
ax.scatter(x_data[:,0],x_data[:1],y_data)
ax.plot_surface(x_1,x_2,y_hat)
ax.set_xlabel("x1")
ax.set_ylabel("x2")
ax.set_zlabel("y")
plt.show()

12.缩放

当数据拥有不同的值，甚至不同的度量单位时，很难比较，缩放为易于比较的值，缩放为可比较的值，可以很容易的看到一个值与另一个值相比有多少，这就是标准化的过程
z=(x-u)/s
z是新值，x是原始值，u是平均值，s是标准差
StandardScaler（）可以返回带有转换数据集方法的scaler对象

import pandas
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler
scale=StandardScaler()


data=np.loadtext('data.csv',delimiter=',')#导入数据
x_data=data[:,0:-1]#特征：前两列
#X=['1号数据','2号数据']
scaledX = scale.fit_transform(x_data)
print(scaledX)

例子

import pandas
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler()

df = pandas.read_csv("cars2.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

scaledX = scale.fit_transform(X)

regr = linear_model.LinearRegression()
regr.fit(scaledX, y)

scaled = scale.transform([[2300, 1.3]])

predictedCO2 = regr.predict([scaled[0]])
print(predictedCO2)

13.训练/测试

训练/测试是一种测量模型准确的方法
数据集：训练集（80%）和测试集(20%)

拆分训练集

训练集应该是原始数据的 80％的随机选择。

测试集应该是剩余的 20％。

train_x = x[:80] train_y = y[:80]
test_x = x[80:] test_y = y[80:]

R**2

sklearn模块有一个名为rs_score()的方法可以找到x，y的相关性
使用随机森林

from matplotlib.pyplot as plt
from sklearn.metrics import r2_score
from numpy as np
numpy.random.seed(2)#产生两个随机数
#from pandas

x=numpy.random.normal(3,1,100)#正态分布
y=numpy.random.normal(150,40,100)/X
 train_x = x[:80] 
 train_y = y[:80]
test_x = x[80:] 
test_y = y[80:]
my=numpy.poly1d(numpy.polyfit(train_x,train_y,4))
r2=r2_score(test_y,my(test_x)）
#r2=r2_score(train_y,my(train_x)）
print(r2)

14.决策树

决策树是一种流程图，可以帮助负责人根据之前的经验进行决策,数据必须都是数字
1.导入模块，读取数据集

import pandas
from sklearn import tree
import pydotplus
from sklearn.tree inport DecisionTreeClassifier#决策树
import matplotlib.pyplot as plt
import matplotlib.image as plting

df=pandas.read_csv()

特征列与目标列分开，特征列是我们尝试从中预测的列，目标列是具有尝试预测值的列

features=['Age','Experience','Rank']
X=df[features]
y=df['Go']

创建实际的决策树，然后在计算机上保存一个.png的文件

dtree=DecisionTreeClassifier()#创建一棵树
dtree=dtree.fit(X,y)  
data=tree.export_graphviz(dtree,out_file(输出)=None，feature_name(特征列的名字）=features)
graph=pydotplus.graph_from_dot_data(data)
graph.write_png()

img=plting.imread()
imgplot=plt.imshow(img)
plt.show()

预测值

print（dtrr.predict（[[10,20,1,3]]))

最后

如果你觉得这篇文章对你有用，建议点赞收藏。
欢迎各位读者指正错误，请在评论区留言。或者发表自己的看法，小编不胜感激。

Python湖南长沙二手房源爬虫数据可视化分析大屏全屏系统开题报告黄菊华老师大数据库可视化二手房源数据可视化系统
博主介绍：《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者，CSDN博客专家，在线教育专家，CSDN钻石讲师；专注大学生毕业设计教育和辅导。所有项目都配有从入门到精通的基础知识视频课程，免费项目配有对应开发文档、开题报告、任务书、PPT、论文模版等项目都录了发布和功能操作演示视频；项目的界面和功能都可以定制，包安装运行！！！在文章末尾可以获取联系方式Python湖南长沙二手房源爬虫
Java与Python详细比对 -- Java与Python优缺点知之为 python 开发语言 java
系列文章-Java与PythonPython和Java都是比较流行的编程语言，它们各自有着独特的特性和应用场景。python用途最多的是脚本，java用途最多的是web。文章目录系列文章目录-Java与Python前言一、Java与Python整体区别二、Java与Python详细区别2.1语法结构方面2.2编程特性方面2.3语言执行及内存管理方面2.4多线程及网络编程方面2.5开发工具及相关功能
Development Problems Based On PyTorch woxiwangxuehaocpp pytorch 深度学习人工智能
问题解决RuntimeError:unabletowritetofile:Nospaceleftondevice(28)问题描述：Traceback(mostrecentcalllast):File"/opt/conda/lib/python3.10/multiprocessing/queues.py",line244,in_feedobj=_ForkingPickler.dumps(obj)Fi
如何使用Flask或Django框架构建一个简单的Web应用？清水白石008 Python题库 python flask django 前端
如何使用Flask或Django框架构建一个简单的Web应用？Flask和Django是两个流行的PythonWeb框架，用于构建Web应用。Flask是一个轻量级、易于扩展的框架，而Django则是一个功能全面的框架，包含了更多开箱即用的工具和功能。下面将分别介绍如何使用Flask和Django构建一个简单的Web应用。使用Flask构建简单Web应用1.安装Flask首先，确保安装了Flask
Flask 高并发部署方案详细教程！爬遍天下无敌手
前言虽然标题写的是Flask，但是下面这个教程不仅仅只适用于Flask,还适用于其他Pythonweb框架，记得帮忙点赞！众所周知Flask是一个同步的框架，处理请求的时候是以单进程的方式，当同时访问的人数过多时，Flask服务就会出现阻塞的情况。就像我们买火车票一样，当买火车票的人多的时候，排队的人就会很多，队伍就会很长，相应的等待的时间会变得很长！因此Flask,Django，webpy等框架
flask mysql orm_Flask的ORM和查询操作碍事的尾巴 flask mysql orm
Flask的ORMSQLAlchemySQLAlchemy是Python编程语言下的一个嵌入式软件。提供了SQL工具包以及对象关系映射(ORM)工具。SQLAlchemy“采用简单的Python语言，为高效和高级的数据库访问设计，实现完整的企业级持久模型”。SQLAlchemy首次发行于2006年2月，并迅速地在Python社区中最广泛使用的ORM工具之一，不亚于Django的ORM框架。Flas
数据架构与机器学习：如何构建智能系统 AI天才研究院 AI大模型应用入门实战与进阶大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍机器学习（MachineLearning）是一种使计算机程序在未被明确编程的情况下，通过经验的学习自动改善其行为的技术。机器学习的目标是使计算机能够自主地从数据中学习，以便在未来的问题中做出更好的决策。数据架构（DataArchitecture）是一种用于有效管理、存储和处理数据的系统结构和组件。数据架构涉及到数据的收集、存储、处理和分析，以及数据的存储和传输。数据架构是构建智能系统的
解锁高性能Web应用：Gunicorn、Flask与Docker的高并发部署秘籍我是瓦力前端 gunicorn flask
引言在当今的互联网时代，高并发Web应用已成为许多企业的核心需求。无论是电商平台、社交网络还是实时数据分析系统，高并发能力直接影响到用户体验和业务成败。本文将带你深入探讨如何利用Gunicorn、Flask和Docker，实现高性能、高并发的Web应用部署。Gunicorn、Flask和Docker的基本概念Gunicorn：GreenUnicorn(简称Gunicorn)是一个PythonWSG
【python】setuptools Eternal-Student Python python 开发语言
setuptools是Python的一个核心工具包，用于构建、打包和分发Python项目。它是Python生态系统中最重要的工具之一，主要用于定义项目的元数据（如名称、版本、依赖等）以及构建和安装过程。以下是关于setuptools的详细介绍：1.setuptools的主要功能setuptools提供了以下核心功能：项目元数据管理：定义项目的名称、版本、作者、描述、依赖等信息。通过setup()函
【Visual Studio 2019 C++ 编译器的路径添加到系统 PATH 环境变量】 Eternal-Student Windows visual studio c++java
对于某些Python包，特别是那些涉及本地扩展或需要编译C/C++代码的包，需要一个支持C++开发的环境。VisualStudio是一个全面的开发环境，它提供了编译器、调试器以及其他许多工具，这些工具对于开发和编译C++代码非常有用。下载网址：ThankYouforDownloadingVisualStudioCommunityEdition(microsoft.com)以下是安装VisualSt
元组（tuple）转换为列表（list） Eternal-Student Python list windows 数据结构
在编程中，特别是在Python中，经常需要将元组（tuple）转换为列表（list）。元组通常使用圆括号()表示，如(x,y)，而列表使用方括号[]表示，如[x,y]。以下是如何将(x,y)转换为[x,y]的详细方法和示例。一、单个元组转换为列表方法1：使用list()函数Python提供了内置的list()函数，可以将元组直接转换为列表。示例代码：#定义一个元组tuple_point=(3,5)
【python】flask-Web 应用程序框架 3L_csdn #python flask python 前端 python web框架 http
目录简介一、简单示例二、Flask详细使用总结1、HTML转义2、路由2.1、使用route()装饰器将函数绑定到URL。2.2、变量规则2.3、唯一的URLs/重定向行为2.4、网址构建2.5、HTTP方法2.5、有json体返回的HTTPGET请求示例(请求中不带参数)2.6、有json体返回的HTTPGET请求示例(请求中带参数)简介Flask是一个轻量级的WSGIWeb应用程序框架。它旨在
超详细的Numpy基础教程！！！不会爬虫的闲鱼 numpy 数据分析 python
Numpy是一个开源的Python库，用于支持大型多维数组和矩阵运算，同时提供了大量的数学函数库。它是科学计算中非常重要的工具。Numpy在数据科学中非常重要，因为它提供了高效的数组处理能力和广泛的数学函数库，这对于处理大规模数据集、进行科学计算和机器学习等任务至关重要。一、安装与设置如何安装Numpypipinstallnumpy验证安装的方法importnumpyprint(numpy.__v
Pycharm中import torch报错解决方案（Python+Pycharm+Pytorch cpu版）波波仔86 人工智能 python pycharm pytorch import 解释器配置
pycharm环境搭建完毕后，编写一个py文件demo，importtorch报错，提示没有。设置python解释器：选择conda环境，使用现有环境，conda执行文件找到Anaconda安装路径下Scripts文件夹内的conda.exe，最后选择含有torch软件包的虚拟环境，题主创建名为pytorch。创建完解释器后，下方会显示出该解释器/虚拟环境下的所有软件包，看到有pytorch包即选
flask--基础知识点--6--flask高并发处理 Raging__Fire #flask python flask
Flask是一个轻量级的PythonWeb框架，适合构建中小型应用。但是，对于高并发场景，Flask本身可能需要一些辅助工具和配置来提升性能。以下是一些优化Flask应用以处理高并发的方法：1.使用WSGI服务器Flask自带的开发服务器性能和稳定性不足以应对生产环境中的高并发请求，可以考虑使用更强大的WSGI服务器，如：Gunicorn:一个基于Python的WSGIHTTP服务器。uWSGI:
【python error】cannot import name ‘TorchDispatchMode‘ from ‘torch.utils._python_dispatch‘ Eternal-Student Jetson Orin NX Python python 开发语言
报错：cannotimportname‘TorchDispatchMode’from‘torch.utils._python_dispatch’(/home/nvidia/.conda/envs/pytorch/lib/python3.8/site-packages/torch/utils/_python_dispatch.py)File“/media/nvidia/Ubuntu/xxxxx/ev
全自动量化交易软件是否真的可靠？使用过程中有哪些潜在风险需要注意财云量化 python炒股自动化量化交易程序化交易全自动量化交易软件可靠性潜在风险数据准确性股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
【测试语言篇四】Python进阶篇之json模块 m0_37135615 编程语言 python php 开发语言
一、json模块介绍JSON（JavaScript对象表示法）是一种轻量级数据格式，用于数据交换。在Python中具有用于编码和解码JSON数据的内置json模块。只需导入它，就可以使用JSON数据了：importjsonJSON的一些优点：JSON作为“字节序列”存在，在我们需要通过网络传输（流）数据的情况下非常有用。与XML相比，JSON小得多，可转化为更快的数据传输和更好的体验。JSON非常
DeepSeek API 客户端使用文档老大白菜 python 人工智能数据库
1.简介deep.py是一个用于与DeepSeekAPI交互的Python客户端封装。它提供了简单易用的接口，支持对话历史管理、日志记录等功能，使得与DeepSeekAPI的交互更加便捷和可靠。2.功能特点简单的接口设计自动管理对话历史完整的日志记录灵活的配置选项异常处理机制3.安装依赖pipinstallopenai4.配置环境在项目根目录创建.env文件：#WindowssetDEEPSEEK
信息检索系统评估指标的层级分析：从单点精确度到整体性能度量人工智能深度学习llm检索系统
在构建搜索引擎系统时，有效的评估机制是保证系统质量的关键环节。当用户输入查询词如"machinelearningtutorialspython"，系统返回结果列表后，如何客观评估这些结果的相关性和有效性？这正是信息检索评估指标的核心价值所在。分析用户与搜索引擎的交互模式，我们可以观察到以下行为特征：用户主要关注结果列表的前几项对顶部结果的关注度显著高于底部结果用户基于多次搜索体验形成对搜索系统整体
python系列【仅供参考】：python tornado 集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案坦笑&&life #python python tornado redis
pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类sys_redis_helper.pyimportredis
Python通过SSH隧道访问数据库 Java菜鸟在北京 python sshtunnel paramiko SSH隧道访问数据库
本文介绍通过sshtunnel类库建立SSH隧道，使用paramiko通过SSH来访问数据库。实现了两种建立SSH方式：公私钥验证、密码验证。公私钥可读本地，也可读取AwsS3上的私钥文件。本质上就是在本机建立SSH隧道，然后将访问DB转发到本地SSH内去访问数据库。简单易懂，上代码：fromsshtunnelimportSSHTunnelForwarderfromsqlalchemyimport
用Python写一个天气预报小程序穿梭的编织者 Python脚本 python 小程序
一、界面效果二、完整代码importtkinterastkfromtkinterimportttkimportrequestsimportjsonfromdatetimeimportdatetimefromPILimportImage,ImageTkimportiofromttkbootstrapimportStyleclassWeatherApp:def__init__(self,root):s
Python写一个脚本——30行代码——1秒实现PDF任意页码拆分穿梭的编织者 Python精选 pdf python
一、引入库importosfromPyPDF2importPdfReader,PdfWriter二、定义拆分方法defsplit_pdf(input_path,output_dir,ranges):ifnotos.path.exists(output_dir):os.makedirs(output_dir)withopen(input_path,'rb')asfile:pdf=PdfReader(
python手写kmeans算法菜鸟懿机器学习聚类算法 python
kmean聚类是最基础和常见的算法，工程上使用比较常见，spark,sklearn都有实现，本文手写实现kmeans#!/usr/bin/pythonimportsysimportrandomimportmathdefcreate_rand_points(max_x,max_y,count):"""Createcountpoints(0-x),(0-y)."""points=[]foriinran
Python 科学计算与机器学习入门：NumPy + Scikit-Learn 实战指南吴师兄大模型 python numpy scikit-learn 人工智能开发语言机器学习编程
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
吴恩达机器学习笔记复盘（二）监督学习和无监督学习 wgc2k 机器学习机器学习笔记学习
监督学习经济价值以及定义监督学习是机器学习中创造了99%经济价值的类型，它是学习输入到输出映射的算法，关键在于给学习算法提供包含正确答案（即给定输入X的正确标签Y）的学习例子。生活中的例子邮件分类，输入是电子邮件，输出是判断邮件是否为垃圾邮件。语音识别，输入音频剪辑，输出文本记录。机器翻译，输入一种语言文本，输出其他语言的相应翻译。在线广告，输入广告和用户信息，预测用户是否点击广告，为公司带来大量
python start函数_Python中10个常用的内置函数半残大叔霁天 python start函数
大家好，我是小张在3.8版本中，Python解释器有近69个内置函数可供使用，有了它们能极大地提高编码效率，数量虽然不少，但在日常搬砖中只用到其中一部分，根据使用频率和用法，这里列出来几个本人认为不错的内置函数，结合一些例子介绍给大家complex()返回一个形如a+bj的复数，传入参数分为三种情况：参数为空时，返回0j参数为字符串时，将字符串表达式解释为复数形式并返回参数为两个整数(a,b)时，
数据分析大数据面试题大杂烩01 爱学习的菜鸟罢了大数据 flink 大数据面试 hive hadoop kafka
互联网:通过埋点实时计算用户浏览频次用优惠券等措施吸引用户,通过历史信息用非智能学习的title方式构造用户画像(抖音,京东)电信,银行统计营收和针对用户的个人画像:处理大量非实时数据政府:健康码,扫码之后确诊,找出与确诊对象有关联的人订单订单表(除商品以外所有信息),商品详情表,通过搜集用户title进行定制化推荐点击流数据通过埋点进行用户点击行为分析FLINK一般用来做实时SPARK一般用来做
一个完整的python webSockets游戏服务器，每100ms接收并广播玩家位置小宝哥Code Python基础及AI开发 python 游戏服务器
PythonWebSockets游戏服务器下面是一个完整的PythonWebSockets游戏服务器实现，它每100ms接收并广播玩家位置信息。这个服务器使用websockets和asyncio库来处理WebSocket连接和异步操作。完整代码#!/usr/bin/envpython3"""实时游戏位置广播服务器每100ms接收玩家位置并广播给所有连接的客户端"""importasyncioimp
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

机器学习（基础）

1.目的

2.均值，中值，众数

3.标准差（匀方差）———描述数的离散程度

4.方差————指示值的分散程度

5.百分位数

6.数据分布

7.正态数据分布

8.Matplotlib模块

折线图plt.plot()

垂直柱状图（plt.bar)

水平柱状图（plt.barh()）

饼状图（plt.pie()）

散点图（plt.scatter()）

绘制四幅子图

9.线性回归

R**2

10.多项式回归

注解np.poly1d(）and poly.fit() and linsppace()

R**2

预测未来值

11.多元回归

12.缩放

13.训练/测试

拆分训练集

R**2

14.决策树

最后

你可能感兴趣的:(机器学习,numpy,python,数据分析)