天 _ 还没亮

Python - Pandas

。

一、1.什么是Pandas(Av67831175,P1)

二、Pandas怎样读取数据

四、pandas数据查询

六、pandas数据统计函数

9、Pandas数据进行排序

10、.Pandas字符串处理

11、.Pandas的axis参数怎么理解

13、Pandas怎样实现数据的Merge

15、Pandas批量拆分与合并Excel文件

16、Pandas怎样实现groupby分组数据统计

。

一、1.什么是Pandas(Av67831175,P1)

什么是pandas
一个开源的Python类库：用于数据分析、数据处理、数据可视化
高性能
容易使用的数据结构
容易使用的数据分析工具
很方便和其他类库一起使用：
numpy：用于数学计算
scikit-learn：用于机器学习

二、Pandas怎样读取数据

数据类型	说明	pandas读取方法
csv.tsv.txt	用逗号分隔、tab分隔的纯文本文件	pd.read_csv
excel	微软xls湖综合xlsx文件	pd.read_excel
mysql	关系型数据库表	pd.read_sql

1.pandas读取纯文本文件代码演示

读取csv文件

读取txt文件

2.pandas读取xlsx格式excel文件

3.pandas读取mysql数据表

import pandas as pd

1.读取纯文本文件

1.1读取csv，使用默认标题行、逗号分隔符

fpath = ""
rating = pd.read_csv(fpath) //使用pd.read_csv读取数据
ratings.head()     //查看前几行数据
ratings.shape      //查看数据的形状，返回（行数、列数）
ratings.columns    //查看列名列表
ratings.index     //查看索引列
ratings.dtypes    //查看每列的数据类型

1.2读取TXT文件，自己指定分隔符、列名

1.2读取TXT文件，自己指定分隔符、列名

fpath = ""

pvuv=pd.read_csv(
fpath,
sep='\t',
header=None,
names=['pdate','pv','uv']
)
pvuv

2.读取Excel文件
fpath = ""
pvuv=pd.read_csv(fpath)
pvuv

3.读取MySQL数据库
import pymysql
conn=pymysql.connect(
host='127.0.0.1',
host='root',
password='12345678',
database='test',
charst='utf8',
)
mysql_page=pd.read_sql("selcet * from crazyant_pvuv",con=conn)
mysql_page

三、pandas数据结构

dataframe：二维数据，整个表格，多行多列

series ：一维数据，一行或一列

column ：列

row ：行

index ：索引列

1.Series

2.DataFrame

3.从DataFrame中查询Series

import pandas as pd
import numpy as np

1.Series是一种类似于一维数组的对象，它由一组数据（不同数据类型）以及一组与之相关的数据标签（即索引）组成

1.1仅有数据列表即可产生最简单的series
S1 = pd.Series([1,'a',5.2,7])
s1 //左侧为索引 右侧为数据
s1.index //获取索引
s1.value //获取数据

1.2创建一个具有标签索引的series
S2 = pd.Series([1,'a',5.2,7]，index=['d','b','a','c'])
s2
s2.index

1.3使用python字典创建series
sdata={'ohio':35000,'ohio':35000,'ohio':35000,'ohio':35000}
s3.pd.series(sdata)
s3

1.4根据标签索引查询数据
类似培养和天虹的字典dict
s2
s2['a']
type(s2['a'])
s2[['b','a']]
type(s2[['b','a']])

2.DataFrame

DataFrame是一个表格型数据结构

每列可以是不同的数据类型（数值、字符串、布尔值等）
既有行索引index，也有列索引columns
可以被看做有Series组成的字典

2.1根据多个字典序列创建dataframe
data={
	
	'state':['ohio','ohio','ohio','ohio'],
	'year':[2000,2001,2002,2003],
	'pop':[1.5,2.1,3.4,1.6]
}
df=pd.dataframe(data)
df
df.dtypes
df.columns
df.index

3.从DataFrame中查询出Series

如果只查询一行、一列，返回的是pd.Series
如果查询多行、多列，返回的是pd.DataFrame

3.1查询一列，结果是一个pd.series
df['year']
type(df['year'])
3.2查询多列，结果是一个pd.dataframe
df[['year','pop']]
type(df[['year','pop']])

3.3查询一行，结果是一个pd.series
df.loc[1]
type(df.loc[1])
3.4查询多行，结果是一个pd.dataframe
df.loc[1:3]
type(df.loc[1:3])

四、pandas数据查询

pandas数据查询的几种方法

1.df.loc方法，根据行、列的标签值查询

2.df.iloc方法，根据行、列的数字位置查询

3.df.where方法

4.df.query方法

.loc既能擦汗讯，又能呢个覆盖写入，强烈推荐

pandas使用df.loc查询数据的方法

1.使用单个label值查询数据

2.使用值列表批量查询

3.使用数值区间进行范围查询

4.使用条件表达式查询

5.使用函数查询

注意：
以上查询方法，既适用于行 也适用于列
注意官产降维dataframe>series>值
import pandas as pd
0、读取数据
数据为北京2018年全年天气预报
df=pd.read_csv("")
df.head()
df.set_index('ymd',inplace=ture) #设定索引为日期 方便按日期筛选
df.index
df.head()
df.loc[:,"bWendu"]=df["bWendu"].str.replace("℃","").astype('int32')
df.loc[:,"yWendu"]=df["yWendu"].str.replace("℃","").astype('int32')
df.dtypes
df.head()


1、使用单个label值查询数据
行或者列，都可以只传入单个值，实现精确匹配
df.loc['2018-01-03','bWendu'] #得到单个值
df.loc['2018-01-03',['bWendu','yWendu']] #得到一个series
2、使用值列表批量查询
df.loc[['2018-01-03','2018-01-04','2018-01-05'],'bWendu'] #得到一个series
df.loc[['2018-01-03','2018-01-04','2018-01-05'],['bWendu','yWendu']] #得到dataframe
3、使用数值区间进行范围查询
df.loc['2018-01-03':'2018-01-04','bWendu'] #行index按区间
df.loc['2018-01-03','bWendu':'fengxiang'] #列index按区间
df.loc['2018-01-03':'2018-01-04','bWendu':'fengxiang'] #行和列都按区间查询
4、使用条件表达式
bool列表的长度 需要  等于行数或者列数

df.loc[df["yWendu"]<-10,:] #简单条件查询，最低温度低于-10度的列表
df["yWendu"]<-10 #观察一下这里的boolean条件
复杂条件查询，查一下完美天气
组合条件用&合并，每个条件判断都需要带括号
df.loc[(df["bWendu"]<=30)&(df["yWendu"]>=15)&(df["tianqi"]<='晴')&(df["aqiLevel"]==1)]
#查询最高温度小于30 并且最低温度大于15 且是晴天 并且天气为优的数据
(df["bWendu"]<=30)&(df["yWendu"]>=15)&(df["tianqi"]<='晴')&(df["aqiLevel"]==1)
#再次观察这里的booleantiaojian 
5、调用函数查询
df.loc[lambda df:(df["bWendu"]<=30)&(df["bWendu"]>=15),:]
#直接写lambda表达式
def query_my_data(df)
 return df.index.str.startswith("2018-09")&df["aqiLevel"]==1
 df.loc[query_my_data,:]

五、pandas新增数据列

在进行数据分析时，经常需要按照一定条件创建新的数据列，然后进行进一步分析

1.直接赋值

2.df.apply方法

3.df.assign方法

4.按条件选择分组分别赋值

import pandas as pd
0、读取cSV数据到dataframe
fpath = ""

df=pd.read_csv(fpath)
df.head()
1、直接赋值的方法
实例：清理温度列，变成数字类型

df.loc[:,"bWendu"]=df["bWendu"].str.replace("℃","").astype('int32')
df.loc[:,"yWendu"]=df["yWendu"].str.replace("℃","").astype('int32')
#替换温度的后缀℃
df.loc[:,"wencha"]=df["bWendu"]-df["yWendu"]
df.head()
2、df.apply方法
apply a function along an axis of the datafram
object passed to the function are series objects whose index is either 
the dataframe(axis=0)or the dataframe columns(axis=1)
实例：添加一列温度类型
1.如果最高温度大于33度就是高温
2.低于-10度就是低温
3.否则是常温
def get_wendu_type(x)
	if x["bWendu"]>33:
		return '高温'
	if x["bWendu"]<-10:
		return '低温'
df.loc[:,"wendu_type"]=df.apply(get_wendu_type,axis=1)
#设置axis==1 这是series的index是columns
df["wendu_type"].value_counts()
3、df.assign方法
assign new columns to a dataframe
returns a new object with all original columns in addition to new ones
实例：将温度从摄氏度变成华氏度
df.assign(
	yWendu_huashi = lamda x : x['yWendu']*9/5+32,
	bWendu_huashi = lamda x : x['bWendu']*9/5+32
)
#可同事添加多列

4、按条件选择分组分别赋值
按条件先选择数据，然后对这部分数据赋值新列
实例：高低温差大于10度，则认为温差大
#先创建空间 （这是第一种创建新列的方法）
df['wendu_type']=''
df.loc[df["bWendu"]-df["bWendu"]>10,"wendu_type"]="温差大"
df.loc[df["bWendu"]-df["bWendu"]<=0,"wendu_type"]="温差正常"

df["wencha_type"].value_counts()

六、pandas数据统计函数

1.汇总类统计

2.唯一去重和按值计数

3.相关系数和协方差


import pandas as pd
0、读取cSV数据
fpath = ""
 
df=pd.read_csv(fpath)
df.head(3)
1、汇总类统计
df.describe()
df["bWendu"].mean() #查看单个series的数据
df["bWendu"].max() #最高温
df["bWendu"].min() #最低温


2.唯一去重和按值计数
2.1唯一性去重
一般不用于数值列，而是每局、分类列
df.["fengxiang"].unique()
df.["tianqi"].unique()
df.["fengli"].unique()
2.2按值技术
df.["fengxiang"].value_vounts()
df.["tianqi"].value_vounts()

 
 
3.相关系数和协方差
用途：
1.两只股票，是不是同涨同跌？程度有多大？正相关还是负相关？
2.产品销量的波动，跟哪些因素正相关、复相关，程度有多大？
 
对于X、Y：
1.协方差：
衡量同向反向程度，如果协方差为正，说明同向变化，协方差越大说明同向程度越高；
如果协方差为负，说明反向运动，协方差越小反向程度越高
2.相关系数：
衡量相似度程度，当他们的相关系数为1时，说明两个变量变化时的正向相似度最大，
当相关系数为-1时，说明两个变量变化的反向相似度最大
 
df.cov()  //协方差矩阵
df.corr() //相关系数矩阵
df["aqi"].corr(df["bWendu"])//单独查看空气质量和最高温度的相关系数
df["aqi"].corr(df["yWendu"])
df["aqi"].corr(df["bWendu"]-df["yWendu"])//空气质量和温差的相关系数

7、pandas对确实数据的处理

isnull和notnull：检测是否是空值，可用于df和series
dropna：丢弃、删除缺失值
axis：删除行还是列，{0 or ‘index’ ，1 or ‘columns’ }，default 0
how：如果等于any则任何值为空都删除，如果等于all则所有值都为空才删除
inplace ：如果为true则修改当前df，否则返回新的df

fillna ：填充空值

value ：用于填充的值，可以是单个值，或者字典（key是列名，value是值）
method：等于ffill使用前一个不为空的值填充forward fill；等于ffill使用前一个不为空的值填充backward fill
axis ：按行还是列填充 {0 or ‘index’ ，1 or ‘columns’ }
inplace ：如果为true则修改当前df，否则返回新的df

import pandas as pd
实例：特殊Excel的读取、清晰、处理
步骤1：读取Excel的时候，忽略前几个空行
studf=pd.read_excel("",skiprows=2)
studf
步骤2：检测空值
studf.isnull()
studf["分数"].isnull()
studf["分数"].notnull()
studf.loc[studf["分数"].notnull(),:]
步骤3：删除全是空值的列
studf.dropna(axis="index",how='all',inplace=ture)
studf
步骤5：将分数列为空的填充为0
studf.fillna({"分数",0}) 
#等同于studf.loc[:,'分数']=studf['分数'].fillna(0)
studf
步骤6：将姓名的缺失值填充
使用前面的有效值填充，用ffill:forward fill
studf.loc[:,'姓名']=studf['姓名'].fillna (method="ffill")
studf
步骤7：将清洗好的Excel保存
studf.to_excel("./data/st_excel.xlsx",index=flase)

8、Pandas的SettingWithCopyWarning报警

9、Pandas数据进行排序

Series的排序：

Series.sort_value（ascending=true ,inplace=false）

ascending : 默认为true升序排序，为false降序排序

inplace :是否修改原始series

DataFrame的排序：

DataFrame.sort_value（by，ascending=True ,inplace=Fals）

by : 字符串或者list<字符串>，单列排序或者多列排序

ascending : bool或者list，升序还是降序，如果是list对应by的多列

inplace :是否修改原始dataframe


import pandas as pd
0、读取数据
fpath=""
df=pd.read_csv(fpath)

df.loc[:,"bWendu"]=df["bWendu"].str.replace("℃","").astype('int32') 
//替换温度的后缀℃
df.loc[:,"yWendu"]=df["yWendu"].str.replace("℃","").astype('int32') 

1、series的排序
df["aqi"].sort_values()
df["aqi"].sort_values(ascending=False)
df["tianqi"].sort_values()

2、dataframe的排序
2.1单列排序
df.sort_values(by="aqi")
df.sort_values(by="aqi",ascending=False)


2.2多列排序
df.sort_values(by=["aqiLevel","bWendu"])
//按空气质量等级、最高温度排序，默认排序
df.sort_values(by=["aqiLevel","bWendu"],ascending=False)
//两个字段都是降序
df.sort_values(by=["aqiLevel","bWendu"],ascending=[True,False])
//分别指定升序和降序

10、.Pandas字符串处理

本节演示内容：

1.获取series的str属性，然后使用各种字符串处理函数

2.使用是天然的startwith、contains等bool类series可以做条件查询

3.需要多次str处理的链式操作

4.使用正则表达式的处理

11、.Pandas的axis参数怎么理解

axis=0或者“index”

如果是单行操作，就指的是某一行
如果是聚合操作，指的是跨行cross rows

axis=1或者“columns”

如果是单列操作，就指的是某一列
如果是聚合操作，指的是跨行cross columns

import pandas as pd
import numpy as np

df=pd.dataframe(
	np.arange(12).reshape(3,4),
	columns['A','B','C','D']
)
df
1.单列drop，删除一列
df.drop（"A",axis=1）
2.单行drop，删除一行
df.drop（"A",axis=0）
3.按axis=0/index执行mean聚合操作
df.mean（axis=0）
4.按axis=1/columns执行mean聚合操作
df.mean（axis=1）
5.再次举例，加深理解
def get_sum_value(x):
return x["A"]+x["B"]+x["C"]+x["D"]
df[""]=df.apply(get_sum_value,axis=1)
df

12、Pandas的索引index有什么用途

13、Pandas怎样实现数据的Merge

pandas的merge，相当于sql的join，将不同的表按照key关联到一个表
merge的语法 ：
pd.merge(left,right,how='inner',on=none,left_on=None,right_on=None,
left_index=False,right_index=false,sort=ture,suffixes=('_x','_y'),cpoy=ture,
indicator=false,validate=None   )
left,right :要merge的dataframe或者有name的series
how :
on :
left_on,right_on :
left_index,right_index :
suffixes :两个元素的后缀，如果列有重名，自动添加后缀，默认是('_x','_y')
本次讲解提纲：
1.电影数据集的join实例
2，理解merge是一对一、一对多、多对多的数量对齐关系
3.理解left join 、right join 、inner join、outer join的区别
4.出现非key的字段重名情况的处理
 
1、电影数据集的join实例
电影评分数据集
包含文件 ：
1.用户对电影的评分数据 rating.dat
2.用户本身的信息数据users.dat
3.电影本身的数据 movies.dat
 
import pandas as pd
 
df_ratings =pd.read_csv()
df_ratings.head() 
df_users =pd.read_csv()
df_users.head() 
df_movies =pd.read_csv()
df_movies.head() 

df_ratings_users = pd.merge(
	df_ratings,df_users,left_on="UserID",right_on="UserID",how="inner"
	)

df_ratings_users.head()
df_ratings_users_movies=pd.merge(
	df_ratings_users,df_movies,left_on="moviesID",right_on="moviesID",how="inner"
)
df_ratings_users_movies.head()

2、理解merge时数量的对齐关系
one-to-one :一对一关系，关联的key都是惟一的
比如（学号，姓名）merge（学号，年龄）
结果条数为：1*1

one-to-many :一对多关系，左边唯一key，右边不唯一key
比如（学号，姓名）merge（学号，[语文成绩、数学成绩、英语成绩]）
结果条数为：1*N

many-to-many :多对多关系，左边右边都不是惟一的
比如（学号，[语文成绩、数学成绩、英语成绩]）merge（学号，[篮球、足球、乒乓球]）
结果条数为：N*N

2.1 one-to-one 一对一关系的merge
left=pd.dataframe({
	'sno':[11,12,13,14],
	'name':['name_a','name_b','name_c','name_d']
})

right=pd.dataframe({
	'sno':[11,12,13,14],
	'age':[21,22,23,24]
})
pd.merge(left,right,on='sno')

2.2 one-to-many 一对多关系（数据会被复制）
left=pd.dataframe({
	'sno':[11,12,13,14],
	'name':['name_a','name_b','name_c','name_d']
})

right=pd.dataframe({
	'sno':[11,11,11,12,12,13],
	'grade':['语文88','数学90','英语75','语文08','数学00','英语75']
})
pd.merge(left,right,on='sno')

2.3 many-to-many 多对多关系
left=pd.dataframe({
	'sno':[11,11,12,12],
	'爱好':['羽毛球','篮球','乒乓球','足球']
})

right=pd.dataframe({
	'sno':[11,11,11,12,12,12],
	'grade':['语文88','数学90','英语75','语文08','数学00','英语75']
})
pd.merge(left,right,on='sno')


3、理解left join、left join、left join、left join的区别

left = pd.dataframe({
	'key':['K0','K1','K2','K3'],
	'A':['A0','A1','A2','A3'],
	'B':['B0','B1','B2','B3']
})

right = pd.dataframe({
	'key':['K0','K1','K4','K5'],
	'C':['C0','C1','C2','C3'],
	'D':['D0','D1','D2','D3']
})
3.1 inner join,默认
左边和右边的key都有，才会出现在结果里
pd.merge(left,right,how='inner')

3.2 lef join
左边的都会出现在结果里，右边的如果无法匹配则为Null
pd.merge(left,right,how='left ')

3.3 right join
右边的都会出现在结果里，左边的如果无法匹配则为Null
pd.merge(left,right,how='right')

3.4 outer join
左边、右边的都会出现在结果里，如果无法匹配则为Null
pd.merge(left,right,how='outer')


4、如果出现非key的字段重名情况

left = pd.dataframe({
	'key':['K0','K1','K2','K3'],
	'A':['A0','A1','A2','A3'],
	'B':['B0','B1','B2','B3']
})

right = pd.dataframe({
	'key':['K0','K1','K4','K5'],
	'A':['A0','A1','A2','A3'],
	'D':['D0','D1','D2','D3']
})

pd.merge(left,right,on='key')
pd.merge(left,right,on='key',suffixes=('_left','_right'))

。。。。。。。。。。。。。。。。。

14、Pandas实现数据Concat合并

使用场景：
批量合并相同格式的Excel、给dataframe添加行、给dataframe添加列

concat语法：
使用某种合并方式（inner/outer）
沿着某个轴向（axis=0/1）
把多个pandas对象（dataframe/series）合并成一个

concat语法：pandas concat（objs,axis=0,join='outer',ignore_index=false）
objs:
axis:
join:
ignore_index:

append语法：dataframe.append(other,ignore_index=false)
append只有按行合并，
other:
ignore_index:

import pandas as pd
import warnings
warnings.filterwarnings('ignore')

一、使用pandas.concat合并数据

15、Pandas批量拆分与合并Excel文件

一、讲一个大excel等份拆分成多个excel

1.使用df.iloc方法，将一个大的dataframe，拆分成多个小dataframe

2.将使用dataframe.to_excel保存每个小excel

1.计算拆分后的每个excel的行数

user_names = ["xiao_shuai","xiao_wang","xiao_ming","xiao_lei","xiao_bo","xiao_hong"]

//大的excel 会拆分给几个人

split_size = total_row_count//len(user_names)

二、

二、合并多个小Excel到一个大Excel
1.遍历文件夹，得到要合并的Excel文件列表
2.分别读取dataframe，给每个df添加一列用于标记来源
3.使用pd.concat进行df批量合并
4.将合并后的dataframe输出到Excel

1.遍历文件夹，得到要合并的Excel文件列表
import os
excel_namaes = []
for excel_name in os.listdir(splits.dir):
	excel_names.append(excel_name)
excel_namaes
2.分别读取dataframe

df_list=[]
for excel_name in excel_names:
	excel_path = f"{}"

16、Pandas怎样实现groupby分组数据统计

类似SQL：
select city,max(temperature)from city_weather group by city;
groupby :现对数据分组，然后在每个分组上应用聚合函数、转换函数
本次演示：
一、分组使用聚合函数做函数统计
二、遍历groupby的结果理解执行流程
三、实例分组探索天气数据
import pandas as pd
import numpy as np
df = pd.dataframe({'A':['foo','bar','foo','bar','foo','bar','foo','bar'],
				'B':['one','one','two','three','two','two','two','two'],
				'C':np.random.randn(8),
				'D':np.random.randn(8)

})
一、使用聚合函数做数据统计
1.单个列groupby，查询所有数据列的统计
df.groupby('A').sum()
2.多个列groupby，查询所有数据列的统计
df.groupby(['A','B']).mean()
df.groupby(['A','B'],as_index=False).mean()
3.同事查看多种数据统计
df.groupby('A').agg([np.sum,np.mean,np.std])
4.查看单列的结果数据统计
df.groupby('A')['C'].agg([np.sum,np.mean,np.std]) //预过滤 性能更好
df.groupby('A').agg([np.sum,np.mean,np.std])['C']
5.不同列使用不同的聚合函数
df.groupby('A').agg({"C":np.sum,"D":np.mean})
二、遍历groupby的结果理解执行流程
for循环可以遍历每个group

17、怎样使用Pandas的分层索引MultiIndex

18、怎样使用Pandas的map-apply-applymap数据转换函数

19、Pandas怎样实现groupby每个分组的apply.mp4

20、Pandas使用stack和pivot实现数据透视.mp4

21、Pandas使用apply函数给表格同时添加多列.mp4

你可能感兴趣的:(Python,python,数据挖掘,机器学习)

基于flask框架高校学生宿舍管理系统 (python+mysql+论文) 真纯Django毕设程序 python flask mysql
本系统（程序+源码）带文档lw万字以上文末可获取本课题的源码和程序系统程序文件列表系统的选题背景和意义选题背景：
Python中global的用法叉选手 python python
global是python中的一个关键字，作用在变量上，该关键字通常放在函数块中，用来声明该变量为全局变量。例如下面变量a，定义在函数外面的是全局变量a，定义在fun函数里面的a是另一个a，是局部变量a，两者没有任何关系。好比这个地区有个叫张三的人，公办室里有个另一个叫张三的人。他们是两个不同的人。a=10deffun():a=2fun()print(a)#输出10如果想要函数里面的那个a就代表外
巨潮PDF年报下载01——python request库圣道寺 python学习笔记 python
目录标题背景代码块背景(70条消息)迅雷API批量下载巨潮年报_无敌的前任的博客-CSDN博客代码块fromwin32com.clientimportDispatch#pipinstallwin32compat#pipinstallpywin32importosimportreimportopenpyxlimportrequestsimporturllib.requestimporttimedef
python中global的用法 Jqlender python python
python变量的作用域：Local局部作用域Enclosing闭包函数外的函数中Global全局作用域查找规则：以Local->Enclosing->Global规则查找，即：同名变量，优先引用的是局部变量，在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找。global关键字x=5deffun_a():print(x)deffun_b():x=x+1print(x)fun_a
Python 潮流周刊#84：2024 年 Python 的最佳实践（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2200字。以下是本期摘要：文章&教程①现代Python开发的良好实践②2024年最先进的Python③回顾一年：2024年的Flask④介绍Annotate
Python基于matplotlib-scalebar库绘制比例尺懒大王爱吃狼 python python matplotlib 开发语言自动化 Python基础 opencv
在Python中，你可以使用matplotlib-scalebar库来在图表上绘制比例尺。这个库是matplotlib的一个扩展，专门用于在绘图时添加比例尺。以下是一个简单的示例，展示了如何使用matplotlib-scalebar来绘制带有比例尺的图表。首先，你需要安装matplotlib-scalebar库。如果你还没有安装它，可以使用以下命令来安装：pipinstallmatplotlib-
Python 潮流周刊#77：Python 依赖管理就像垃圾场火灾？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2200字。以下是本期摘要：文章&教程①Python依赖管理一种垃圾场火灾②Python的膨胀：精细的项目间依赖关系分析③分享我的Django项
Python 潮流周刊#74：创下吉尼斯世界记录的 Python 编程课（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。本期分享了12篇文章，12个开源项目，2则音视频，全文2300字。好消息：即日起至万圣节（12.31），周刊限时99元/年，欢迎订阅！！以下是本期摘要：文章&教程①创下吉尼斯世界记录的Python
Python 潮流周刊#71：PyPI 应该摆脱掉它的赞助依赖（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，1则音视频，全文2000字。以下是本期摘要：文章&教程①PyPI应该摆脱掉它的赞助依赖②创建不分大小写的Python字符串类③用Tree-sitter&Jedi重
Python 潮流周刊#72：Python 3.13.0 最终版已发布！（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了14篇文章，12个开源项目，4则音视频，全文2300字。以下是本期摘要：文章&教程①Python3.13.0最终版已发布！②关于Python3.13，了解这些信息就够了③Python3.13
Python 潮流周刊#67：uv 的重磅更新（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①uv：统一的Python打包工具②PyJWT和python-jose在处理JWT令牌时的差异③Kindle+Pytho
Python 潮流周刊#68：2023 年 Python 开发者调查结果（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，2则热门讨论，全文2100字。以下是本期摘要：文章&教程①2023年Python开发者调查结果②为什么在Docker中我仍然要用Python虚拟环境？③我如何用P
Python WebSocket服务器介绍一只会写程序的猫 Python python websocket 服务器
PythonWebSocket服务器介绍WebSocket是一种在Web浏览器和服务器之间实现全双工通信的协议。它允许服务器主动发送消息到浏览器，而不需要浏览器发起请求。Python提供了许多库和框架来实现WebSocket服务器，本文将介绍如何使用Python构建一个简单的WebSocket服务器。WebSocket协议和工作原理WebSocket协议是通过HTTP协议的升级实现的。在HTTP协
python如何读取csv文件？ gaogsf Python python 开发语言
CSV（CommaSeparatedValues）文件是一种常见的文件格式，它将数据以逗号分隔的形式存储，通常用于存储表格数据。在Python中，我们可以使用多种方法来读取CSV文件，本文将从多个角度分析Python如何读取CSV文件。一、Python内置的csv库Python内置了csv库，可以使用该库中的reader对象来读取CSV文件。下面是一个示例代码：importcsvwithopen(
探索装饰器的奥秘：Python里的超级英雄披风大梦百万秋知识学爆 python 开发语言
引言：每一行代码都可以是一件披风有没有想过，代码写得再帅气，读起来再优雅，它始终是千篇一律的套路？有时候，代码中的函数就像是穿着普通衣服的路人，默默地完成任务。而这时候，你可能会想：“嘿，我要给它们一点魔法，让它们更具超能力！”别担心，Python里的装饰器正是你需要的神秘工具，它能给你的函数加上一件“超级英雄披风”，让它们瞬间拥有更多的功能，且不改变它们原本的外貌。今天我们就来一起揭开装饰器的面
在 Python 中使用 PyPDF2 向 PDF 文件批量添加水印信息科技云课堂 python pdf
目录：使用PyPDF2添加水印到PDF文件批量添加水印到PDF文件所有页PDF文件广泛用于不同的设备和平台上，在某些情况下，可能需要在PDF文件中申明版权，需要将水印、条形码、二维码等添加到PDF中。PyPDF2提供了一种将另一个PDF文件作为水印，添加到PDF文件的方法。在下面的示例中，制作一个PDF水印文档，可以加入文字、二维码，通过合并的方法为PDF文件添加水印。使用PyPDF2添加水印到P
Python 潮流周刊#86：Jupyter Notebook 智能编码助手（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目，全文2000字。以下是本期摘要：文章&教程①介绍JupyterNotebook智能助手②用纯Python写一个“Redis”，速度比原生Redis还快？③30分钟
Python 中最易误解的功能前端
有些功能即使是经验丰富的开发者也会被难住。我也曾被它们绊倒，花数小时挠头苦思，最终才学会如何正确应对。所以，不浪费时间，让我们来探索Python中最易误解的功能，它们为何棘手，以及你如何能最终掌握它们。1.可变默认参数问题：如果你曾写过一个带有默认列表或字典参数的函数，你可能会注意到一些奇怪的现象。它会在函数调用之间“记住”值！defadd_item(item,items=[]):items.ap
python注册nacos服务 MTonj Python python 开发语言
根据nacosopenapiOpenAPI指南主要是实现以下接口：创建服务注册实例注销实例删除服务发送实例心跳实现demo如下：一个web服务1http_server1.py#coding:utf-8importsocketfrommultiprocessingimportProcessdefhandle_client(client_socket):"""处理客户端请求"""request_dat
用Python进行websocket接口测试代码小念软件测试自动化测试技术分享 python websocket 开发语言
这篇文章主要介绍了用Python进行websocket接口测试，帮助大家更好的理解和使用python，感兴趣的朋友可以了解下我们在做接口测试时，除了常见的http接口，还有一种比较多见，就是socket接口，今天讲解下怎么用Python进行websocket接口测试。SocketSocket又称"套接字"，应用程序通常通过"套接字"向网络发出请求或者应答网络请求，使主机间或者一台计算机上的进程间可
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
使用 Python 实现 WebSocket 服务器与客户端通信又蓝 python websocket
简介WebSocket是一种基于TCP协议的通信协议，能够在客户端与服务器之间进行全双工（双向）通信。相比传统的HTTP协议，WebSocket可以实现实时数据的传输，尤其适合需要实时交互的应用场景，如在线游戏、实时聊天、金融交易等。我通过Python实现一个简单的WebSocket服务器，并使其与客户端进行通信。我们将创建两个Python文件：websocket.py和main.py，webso
基于Python实现读取嵌套压缩包下的文件袁袁袁袁满 Python实用技巧大全 python 嵌套压缩包下文件读取 Python实现嵌套压缩包压缩包 zipfile BytesIO
文章目录前言思路完整代码代码优化前言工作中遇到的问题，需要用Python实现嵌套压缩包下文件读取，这里记录下方法，希望能帮助到更多的人。思路打开外层zip压缩包并遍历文件：使用withzipfile.ZipFile(outer_zip_path,'r')asouter_zip语句以读取模式'r'打开用户输入的外层zip压缩包对应的文件，这样在代码块结束后会自动关闭该文件，避免资源泄露。通过oute
【如何利用Python抢演唱会门票】python利用selenium实现大麦网抢票 Python小炮车 python selenium 数据库
一、selenium原理介绍Selenium是一个用于Web[应用程序](https://link.juejin.cn/?target=https%3A%2F%2Fbaike.baidu.com%2Fitem%2F%25E5%25BA%2594%25E7%2594%25A8%25E7%25A8%258B%25E5%25BA%258F%2F5985445%3FfromModule%3Dlemma_i
Python 实现七大排序算法 weixin_30527323 python shell 数据结构与算法
技术博客：github.com/yongxinz/te…本文用Python实现了插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序。先整体看一下各个算法之间的对比，然后再进行详细介绍：排序算法平均时间复杂度最好情况最坏情况空间复杂度排序方式稳定性插入排序O(n²)O(n)O(n²)O(1)In-place稳定冒泡排序O(n²)O(n)O(n²)O(1)In-place稳定选择排
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
Python数据分析常见面试题和答案01-10 飞翔还哈哈6 Python数据分析 python pandas 数据分析
以下是一些Python数据分析常见面试题和答案：1.Python中的list和tuple的区别是什么？答：List是可变的，而元组（tuple）是不可变的。因此，使用list来存储需要频繁修改的数据，而使用元组来存储不能更改的数据项。2.解释NumPy中的数组？为什么numpy在数据分析中很重要？答：NumPy是Python中提供高性能科学计算和数据分析的包。NumPy数组是一种类似于列表的数据结
【Python小技巧】使用prettytable格式化显示dataframe数据 IT里的交易员 Python经验池 python
文章目录前言一、安装prettytable二、函数打包三、应用示例总结前言经常我们使用print(df)输出dataframe数据，打印输出的数据没有格式，看起来屏幕一篇乱。有没有一种可以格式化输出的工具？还真有，那就是prettytable。一、安装prettytablePrettyTable是Python中的一个库，用于以美观的表格形式显示数据。要使用PrettyTable，首先需要安装它，可
Python中用ollama库实现连续对话 longnershot python 开发语言 AI编程
找来找去没找到一个简单示例，用4o和问心来回调整简单生成了一个，抛砖引玉了。importollamadefchat_with_ollama():#初始化一个列表来存储对话历史，每个元素是一个包含用户输入和模型回复的元组history=[]whileTrue:#获取用户输入，并转换为小写，方便后续判断退出条件user_input=input("\nUser:")#判断用户是否想要退出对话ifuser
Python电子书教程汇总 iteye_3941 python
From:http://bathome.net/thread-15554-1-1.html[转载教程]Python电子书教程汇总（2012-02-16更新）简明Python教程(AByteofPython)_1.20_中文版pdfhttp://www.rayfile.com/zh-cn/files/6cdcc561-58b2-11e1-ad5e-0015c55db73d/Python语言从入门到精
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>