~hello world~

pandas基础学习

1、pandas介绍

pandas是python中专门专门用于数据处理和数据分析的第三方库。
pandas常用的基本功能如下：

从Excel、CSV、网页、SQL、剪切板等文件或工具中读取数据
合并多个文件或电子表格中的数据，将数据拆分为独立的文件
数据清洗、如去重、处理缺失值、填充默认值、补全格式，处理极端值等
建立高效的索引、支持大体量数据、灵活方便的数据查询、筛选
按一定业务逻辑插入计算后的列、删除列
分组聚合数据，可独立指定分组后的各字段计算方式
数据的装置，如行装列，列转行变更处理
连接数据库，直接用SQL查询数据并进行处理
对时序数据进行分组采样，如按季、月、小时，也可以自定义周期，如工作日
窗口计算，移动窗口统计、日期移动等
灵活的可视化图表输出，支持所有的统计图像
为数据表格增加展示样式，提高数据识别效率

2、pandas的数据结构

pandas提供了Series和DataFrame作为数组数据的存储框架，数据进入这两种框架后，就可以用他们提供的强大的处理方法进行数据处理。

2.1 Series

Series（系列、数列、序列）是一个带有标签的一维数组，是由一组数据以及与这组数据有关的标签（索引）组成，Series对象可以存储整数、浮点数、字符串、Python对象等多种数据类型的数据，是pandas最基础的数据结构。各国的GDP就是一个典型的数据结构，如：中国 14.34 ，其中，国家是标签（也称索引），不是具体的数据，起到解释、定位数据的作用。

2.1.1 Series对象的创建

语法结构：pd.Series(data,index=index)

#series对象的创建
import pandas as pd
data=[13.14,21.34,5.08,10.18]
index=['中国','美国','意大利','俄罗斯']
s=pd.Series(data=data,index=index)
print(s)

中国 13.14
美国 21.34
意大利 5.08
俄罗斯 10.18
dtype: float64

2.1.2 Series的索引

位置索引，范围为[0,N-1]

#位置索引
data=[13.14,21.34,5.08,10.18]
s=pd.Series(data=data)
print(s)
print(s[2])#s[2]---获取位置索引为2的值

0 13.14
1 21.34
2 5.08
3 10.18
dtype: float64
5.08

标签索引
Series对象名[索引名称]
获取多个标签索引值，使用[[标签索引1，标签索引2，……]]

data=[13.14,21.34,5.08,10.18]
index=['中国','美国','意大利','俄罗斯']
s=pd.Series(data=data,index=index)
print(s)
print(s['中国'])#中国，为标签索引
print(s[['中国','俄罗斯']])#获取多个数据

中国 13.14
美国 21.34
意大利 5.08
俄罗斯 10.18
dtype: float64

13.14

中国 13.14
俄罗斯 10.18
dtype: float64

切片索引 :Series对象名[start : stop : step]

data=[13.14,21.34,5.08,10.18]
index=['中国','美国','意大利','俄罗斯']
s=pd.Series(data=data,index=index)
print(s[0:2:2])#位置索引切片，含投不含尾
print(s['中国':'意大利':2])#标签索引切片，含头含尾

中国 13.14
dtype: float64

中国 13.14
意大利 5.08
dtype: float64

获取Series的索引和值 ：获取索引s.index，获取值s.values

data=[13.14,21.34,5.08,10.18]
index=['中国','美国','意大利','俄罗斯']
s=pd.Series(data=data,index=index)
print(s.index)
print(list(s.index))#通常将索引转换成列表输出
print(s.values)

Index([‘中国’, ‘美国’, ‘意大利’, ‘俄罗斯’], dtype=‘object’)

[‘中国’, ‘美国’, ‘意大利’, ‘俄罗斯’]

[13.14 21.34 5.08 10.18]

2.2 DataFrame

DataFrame意为数据框架，是Pandas库中的一种数据结构，类似于二维表，由行和列组成，与Series一样支持多种数据类型

2.2.1 DataFrame对象的创建

语法结构：pd.DataFrame(data,index,columns,dtype)

#创建方式一：列表方式创建DataFrame对象
data=[['小太阳',320.9,100],['鼠标',150.3,50],['小刀',1.5,200]]
column=['名称','单价','数量']
df=pd.DataFrame(data=data,columns=column)
print(df)
print(type(df))

名称     单价   数量

0 小太阳 320.9 100
1 鼠标 150.3 50
2 小刀 1.5 200

#创建方式二：字典方式创建DataFrame对象
ata={'名称':['小太阳','鼠标','小刀'],
     '单价':[320.9,150.3,1.5],
     '数量':[100,50,200]}
f=pd.DataFrame(data=data)
print(df)
print(type(df))

名称单价数量
0 小太阳 320.9 100
1 鼠标 150.3 50
2 小刀 1.5 200

注意事项：使用字典创建DataFrame对象时，列表长度必须保持一致；当值为单个时，其他行自动填充

2.2.2 DataFrame的属性

属性	描述
values	查看所有元素的值
dtypes	查看所有元素的类型
index	查看所有行名、重命名行名
columns	查看所有列名、重命名列名
T	行列数据转换
head	查看前N条数据，默认5条
tail	查看后N条数据，默认5条
shape	查看行数和列数shape[0]表示行,shape[1]表示列
info	查看索引、数据类型和内存信息

#values——查看所有元素的值
data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('查看所有值\n',df.values)

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看所有元素的类型\n', df.dtypes)

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看所有行名称\n',list(df. index))
print('------------')
df.index=[1,2,3]#修改行名称
print ('修改行名称后的df\n',df)

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看列索引\n', df.columns)
print('------------')
df.columns=['国家','商品数量','GDP']
print('查看列名称该后的df\n',df)

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=df.T
print('转置后的df\n',df)

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看前2条数据\n',df.head(2))
print('------------')
print('查看后1条数据\n',df.tail(2))
print('------------')
print('查看行数和列数\n','行',df.shape[0],'  列',df.shape[1])

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看索引，数据类型，内存信息\n',df.info)

2.2.3 DataFrame的函数

属性	描述
describe()	查看每列的统计汇总信息,DataFrame类型
count()	返回每一列的非空值的个数
sum()	返回每一列的和，无法计算返回空值
max()	返回每一列的最大值
min()	返回每一列的最小值

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看每列的统计汇总信息\n', df.describe())

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('查看每列的统计汇总信息\n', df.describe())
print('------------')
print('返回每一列的非空值的个数\n',df.count())

data=[['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df=pd.DataFrame(data=data,columns=column)
print(df)
print('------------')
print('返回每一列的和，无法计算返回空值\n',df.sum())
print('------------')
print('返回每一列的最大值\n',df.max())
print('------------')
print('返回每一列的最小值\n',df.min())

3、数据基础操作

3.1 导入数据

3.1.1 导入Excel数据

Excel数据常常导入的是.xls或.xlsx文件
语法结构：pd.read_excel(io,sheet_name,header)
io：表示.xls或.xlsx文件路径或类文件对象.
sheet_name：表示工作表，取值如下表所示
header：默认值为0，取第一行的值为列名，数据为除列名以外的数据，如果数据不包含列名，则设置header=None

值	说明
sheet_name=0	第一个Sheet页中的数据作为DataFrame对象
sheet_name=1	第二个Sheet页中的数据作为DataFrame对象
sheet_name=‘Sheet1’	名称为’Sheet1’的Sheet页中的数据作为DataFrame对象
sheet_name=[0,1,‘Sheet3’]	第一个、第二个和名称为Sheet3的Sheet页中的数据作为DataFrame对象
sheet_name=None	读取所有工作表

#导入Excel数据
data=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(data)

#导入指定列的数据
import pandas as pd
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%' , usecols=['入流','出流','水位'])
print (df)

3.1.2 导入CSV文件

除了Excel文件，CSV文件是pandas另一种重要文件形式，CSV可用记事本打开
语法结构：pd.read_csv(filepath_or_buffer,sep=,header,encoding=None)
filepath_or_buffer：字符串、文件路径,也可以是URL链接
sep：每行数据内容的分割符号字符串、分隔符，CSV常用’,’
header：指定作为列名的行，默认值为0，即取第一行的值为列名。数据为除列名以外的数据，若数据不包含列表，则设置header=None
names：用来指定列的名称，类似于列表的序列，不允许有重复值
usecols：用来获取指定列名的的数据
skip_blank_lines：跳过指定行数
nrows：用于指定需要读取的行数，常用于较大的数据
encoding：字符串，默认值为None，文件的编码格式

df=pd.read_csv(r'C:\Users\Desktop\data.CSV',sep=',',encoding='gbk')#ANSI默认为gbk
pd.set_option('display.unicode.east_asian_width',True)#规则格式
print(df)

3.1.3 导入MTHL网页

语法结构：pd.read_html(io,match='.+ ',flavor,header,encoding)
io：字符串、文件路径，也可以是URL链接，网址不接受https
match：正则表达式
flavor：解释器，默认为’lxml’.
header：指定列标题所在的行
encoding：文件的编码格式
注：导入MTHL网页数据时只能导入table标签的数据

#导入HTML
url='http://www.espn.com/nba/salaries'
df=pd.DataFrame()#创建一个空的DataFrame对象

#DataFrame添加数据
df=df.append(pd.read_html(url,header=0))
print (df)

#将数据保存
df.to_csv('nba球员薪水',index=False)#index=False表示保存时不要索引,保存位置与该编码文件在同一个目录

3.2 数据提取

3.2.1 按行提取

数据提取常用到DataFrame对象的loc属性与iloc属性
loc属性，以列名(columns)和行名(index)作为参数，当只有一个参数时，默认是行名，即抽取整行数据，包括所有列。
iloc属性，以行和列位置索引(即:0,1,2…）作为参数，0表示第一行，1表示第2行，以此类推。当只有一个参数时，默认是行索引，即抽取整行数据,包括所有列。

data=[[45,65,200],[56,45,50],[67,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print (df)
print('----------')
#提取单行数据
print('loc提取行数据\n',df.loc['李四'])
print('----------')
print('loc提取行数据\n',df.iloc[1])

data=[[45,65,200],[56,45,50],[67,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)
print (df)
print('----------')

#提取多行数据
print('loc提取多行数据\n',df.loc[['张三','王五']])
print('----------')
print('loc提取多行数据\n',df.iloc[[0,2]])

data=[[45,65,200],[56,45,50],[67,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)
print (df)
print('----------')

#提取多行数据
print('loc提取连续多行数据\n',df.loc['张三':'王五'])#含头含尾
print('----------')
print('loc提取连续多行数据\n',df.iloc[0:2])#含头不含尾

3.2.2 按列提取

data=[[45,65,200],[56,45,50],[67,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print (df)
print('----------')
print('直接提取\n',df[['数学','英语']])#直接提取
print('----------')
#提取多行数据
print('loc提取列数据\n',df.loc[:,['数学','英语']])#含头含尾
print('----------')
print('iloc提取连续多列数据\n',df.iloc[:,1:])#含头不含尾

3.2.3 提取区域数据

data=[[45,65,200],[56,45,50],[67,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('----------')
print('李四的数学与英语成绩\n',df.loc['李四',['数学','英语']])
print('----------')
print('张三与王五的语文成绩\n',df.iloc[[0,2],[1]])

3.2.4 提取指定条件数据

data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('----------')
print('提取数学成绩及格的数据\n',df.loc[df['数学']>=60])
print('----------')
print('提取数学和语文成绩都及格的数据\n',df.loc[(df['数学']>=60)&(df['语文']>=60)])

3.3 数据操作

3.3.1 数据的增加

按列增加数据

data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('----------')
df['物理']=[67,89,94]
print('直接采用赋值的方式在最后增加一列\n',df)
print('----------')
df.loc[:,'化学']=[76,83,95]
print('用col属性在最后增加一列\n',df)

#在指定索引处插入列数据
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('----------')
lst=[67,89,94]
df.insert(2,'物理',lst)
print('在索引为2处增加一列\n',df)

按行增加数据

#按行增加数据
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('----------')
df.loc['陈六']=[56,64,71]
print('在最后增加一行数据\n',df)

#合并两个DataFrame对象
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张时','李阿','王明']
columns=['数学','语文','英语']
df1=pd.DataFrame(data=data,index=index,columns=columns)

df=df.append(df1)#需要赋值，赋值看不到拼接效果
print(df)

3.3.2 数据的修改

修改列标题，使用DataFrame对象的columns属性直接赋值，或者使用DataFrame对象的rename方法修改列标题

#修改行标题
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('------------')
df.columns=['数学(上)','语文(上)','英语(上)']
print('直接修改：\n',df)
print('------------')
df.rename(columns={'数学(上)':'math','语文(上)':'chinese','英语(上)':'english'},inplace=True)
print('用rename方法：\n',df)

修改行标题，使用DataFrame对象的index属性直接赋值，，或者使用DataFrame对象的rename方法修改行标题

data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('------------')
df.index=['张时','李阿','王明']
print('直接修改：\n',df)
print('------------')
df.rename({'张时':'zhangshi','李阿':'lia','王明':'wangming'},inplace=True,axis=0)
print('用rename方法：\n',df)

修改数据，使用DataFrame对象的loc属性和iloc属性

#修改数据
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('--------------')
df.loc['张三']=[100,100,90]#修改一整行
print ('修改一整行数据\n',df)
print('--------------')
df.iloc[0,:]=[90,90,90]#修改第0行的所有列
print('修改一整行数据\n',df)
print('--------------')
df.iloc[1,1]=78#修改第0行的所有列
print('修改单个数据\n',df)

3.3.3 数据的删除

使用DataFrame对象中的drop方法()
语法结构：df.drop(labels=None,axis=0,index=None,columns=None,inplace=False)
labels：表示行标签或列标签
axis：axis=0表示按行删除，axis=1表示按列删除
index :删除行，默认值为None
columns:删除列，默认值为None
inplace:对原数组作出修改并返回一个新数组。默认值为False,如果值为True,那么原数组直接就将被替换

删除列数据

#删除列数据
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('--------------')
df1=df.drop(['数学'],axis=1,inplace=False)
print(df1)
print('--------------')
df2=df.drop(columns='数学', inplace=False)
print(df2)
print('--------------')
df.drop(labels='数学', axis=1,inplace=True)
print(df)

删除行数据

#删除行数据
data=[[75,56,80],[56,45,50],[60,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('--------------')
df1=df.drop(['张三'],axis=0,inplace=False)
print(df1)
print('--------------')
df2=df.drop(index='张三', inplace=False)
print(df2)
print('--------------')
df.drop(labels='张三', axis=0,inplace=True)
print(df)

删除指定条件的数据

#删除指定条件的数据
data=[[75,56,80],[56,45,50],[50,67,67]]
index=['张三','李四','王五']
columns=['数学','语文','英语']
df=pd.DataFrame(data=data,index=index,columns=columns)

print(df)
print('--------------')
df.drop(df[df['数学']<60].index[:], inplace=True)
print('删除数学成绩小于60的数据\n',df)

3.4 数据清洗

3.4.1 查看缺失值

·使用DataFrame对象的info()方法

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
print(df.info())

3.4.2 判断数据是否存在缺失值

使用DataFrame的isnull()方法和notnull()方法

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
print(df.isnull())
print('-----------------------------------')
print(df.notnull())

3.4.3缺失值的处理

缺失值的处理方式有不处理、删除、填充或替换、插值(均值、中位数、众数等填补)

#删除缺失值
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
df=df.dropna()
print(df)

#提取指定不为null的数据
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
print('提取出流不为null的数据\n',df[df['出流'].notnull()])

#填充数据
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
df['出流']=df['出流'].fillna(0)
print('用0填充后的数据\n',df)

3.4.4 重复值处理

#删除全部重复的数据
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
print('判断是否存在重复值\n',df.duplicated())
print('-----------------------------------')
df=df.drop_duplicates()
print('删除全部重复的数据\n',df)

#删除指定列重复的数据
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%',header=0)
print(df)
print('-----------------------------------')
print('判断是否存在重复值\n',df.duplicated('水位'))
print('-----------------------------------')
df=df.drop_duplicates(['水位'],keep='last')
print('删除指定列重复的数据，保留重复行的最后一行\n',df)

3.5 异常值的检测与处理

异常值是指超出或低于正常范围的值
异常值的检测方式，根据给定的数据范围进行判断，不在范围内的数据视为异常值，常用检测方式有均方差、箱形图
异常值的处理方式有删除、当成缺失值处理、当成特殊情况进行分析

箱型图各参数数学含义（转自：箱形图（python画箱线图））

4、基于索引的相关操作

Pandas索引的作用有更方便地查询数据、提升查询性能。其中，如果索引是唯一的，Pandas会使用哈希表优化；如果索引不是唯一，但是有序，Pandas会使用二分查找算法；如果索引是完全随机的，那么每次查询都要扫描数据表。

4.1 重新设置索引

语法结构：**df.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)**

labels：新标签/索引，使“ axis”指定的轴与之一致。
index, columns：符合的新标签/索引。最好是一个Index对象，以避免重复数据
axis：轴到目标。可以是轴名称(“索引”，“列”)或数字(0、1)
method：NaN填充方法，{None，“ backfill” /“ bfill”，“ pad” /“ ffill”，“ nearest”}，pad/ffill：用前一个非缺失值去填充该缺失值，backfill/bfill：用下一个非缺失值填充该缺失值，None：指定一个值去替换缺失值（缺省默认这种方式)
copy：即使传递的索引相同，也返回一个新对象
level：在一个级别上广播，在传递的MultiIndex级别上匹配索引值
fill_value：在计算之前，使用此值填充现有的缺失(NaN)值以及成功完DataFrame对齐所需的任何新元素。如果两个对应的DataFrame位置中的数据均丢失，则结果将丢失。
limit：向前或向后填充的最大连续元素数
tolerance：不完全匹配的原始标签和新标签之间的最大距离。匹配位置处的索引值最满足方程abs(index [indexer]-target)

#重新设置索引
import pandas as pd
df=pd.Series([55,15,32],index=[1,2,3])
print(df)

#重设置设置索引
print ('重设置设置索引后的数据\n',df.reindex(range(1,6)))
print('NaN值使用33进行填充后的数据\n',df.reindex (range(1,6),fill_value=33))

4.2 设置某列为行索引

指定某列为行索引与重新设置索引区别在于，重新设置索引前提是存在一个索引，只是不满意而已，而指定某列为行索引是没有用默认的索引。
语法结构：df.set_index()

#设置指定列为行索引
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.set_index(['时间'])
print ('设置时间一列为索引\n',df)

4.3 数据清洗后重新设置连续索引

语法结构：df.reset_index()

#数据清洗后重新设置连续索引
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.dropna().reset_index()
print('数据清洗后重新设置连续索引的数据\n',df)

4.4 数据的排序

DataFrame数据排序排序时主要使用sort_values()方法
语法语法：df.sort_values(by,axis=0,ascending=True,inplace=False,kind='quicksort ,na_position='last ,ignore_index=False)
by：要排序的名称列表
axis：轴，0表示行，1表示列，默认行排序
ascending：升序或降序排序，布尔值，指定多个排序可以使用布尔值列表，降序
inplace：布尔值，默认值为False，如果值为True，则就地排序
kind：指定排序算法，值为’quicksort(快速排序)、'mergesort(混合排序)或’heapsort(堆排),默认值为quicksort
na_position：空值(NaN)的位置，值为first空值在数据开头，last空值在最后，默认值为last
ignore_index：布尔值，是否忽略索引，值为True标记索引（从0开始按顺序的整数值)，值为False则忽略索引

#排序后的数据
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.sort_values(by='出流')
print('排序后的数据\n',df)

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.sort_values(by=['入流','出流'])#靠后的优先
print('根据多列排序后的数据\n',df)

4.5 数据的排名

数据的排名是根据Series或DataFrame对象的某几列的值进行排名，主要使用rank方法
语法结构：df.rank(axis=0,method=‘average"’,ascending=True,na_option=‘keep’)
axis：轴，0表示行，1表示列，默认按行排序
method：表示在具有相同值的情况下所使用的排序方法，有average：默认值，平均排序、min：最小值排名、max：最大值排名、first：按值在原始数据中的出现的顺序分配排名、dense：密集排名，类似最小值排名，排名相同的数据只占一个名次
na_option：空值的排序方式，有keep：保留、top：如果升序,将最小排名赋给NaN、bottom：最大升序，将最大排名赋给NaN

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.sort_values(by='出流')
df['出流量排名']=df['出流'].rank(method='min',ascending=False)
print('根据出流量排名后的数据\n',df)

5、数据计算

函数	说明
求和：sum([axis,skipna])	axis=1表示按行加，axis=0表示按列加，默认列加skipna=1表示将NaN转0, skipna=0表示不转
求均值：mean([axis,skipna])
最大值：max([axis,skipna])
最小值：min([axis,skipna])
中位数：media(axis=None,skipna=None)	axis=1表示行, axis=0表示列，默认为None；skipna布尔值，表示计算结果是否排除了NaN/Null,默认为True
求众数：mode(axis=0,dropna=True)	axis=1表示行, axis=0表示列，默认值为0，dropna是否删除缺失值，布尔型，默认为True
求方差：var(axis=None,skipna=None)
标准差：std(axis=None,skipna=None)
分位数：quantile(q=0.5,axis=0, numeric_only=True)	numeric_only的值为False，将计算日期、时间和时增量数据的分位数

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df.loc['平均数']=df.loc[1:].mean()
print('平均数\n',df)

6、数据格式化

对数据进行格式化，以增加数据的可读性，常用的方式是设置小数位数用df.round(decimals=0)函数、设置百分比用apply()函数与format()函数、设置千位分隔符用apply()函数与format()函数。

6.1 小数位数设置

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
print('保留三位小数\n',df.round(3))#对所有数据都有作用

#指定列保留小数——用字典
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
print('指定列保留小数\n',df.round({'入流':0,'出流':3,'水位':3}))

#指定列保留小数——用Series
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
S=pd.Series([0,3,3],index=['入流','出流','水位'])
print('指定列保留小数\n',df.round(S))

#指定列保留小数——用自定义函数
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df=df.applymap(lambda x:'{:.3f}'.format (x))
print('指定列保留小数\n',df)

6.2 设置百分比

#设置百分比——对列起作用，apply函数
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df['百分比']=df['出流'].apply(lambda x:format(x,'.0%'))
print (df)

#设置百分比——对列起作用,map函数
df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df['百分比']=df['出流'].map(lambda x:format(x,'.0%'))
print(df)

6.3 千位分隔符

千位分隔符只是为了方面读数，不能参与运算

df=pd.read_excel(r'C:\Users\Desktop\data.xlsx',sheet_name='1%')
print(df)
print('-----------------------------------')
df['入流']=df['入流'].apply(lambda x:format(int(x),','))
print (df)

6.4 apply()、map()、applymap()的区别

apply()可以在series，对Series的每一个元素都执行一次函数，也可以在DataFrame中起作用，对DataFrame中的某一行或某一列的每个元素执行一次函数

s=pd.Series (data=[ 1,2,3,4],index=['a','b', 'c','d'])
print (s)
print (' --------------------------')
s=s.apply(lambda x:x*10)
print('apply()可以在series，对Series的每一个元素都执行一次函数\n',s)

df=pd.DataFrame(data=[[10,20,30,40],[11, 22,33,44]],index=['a','b'], columns=['A','B','C','D'])
print (' --------------------------')
print(df)
df=df.apply(lambda x:x.sum(),axis=0)
print (' --------------------------')
print('apply对DataFrame中的某一行或某一列的每个元素执行一次函数\n',df)

map只能应用在Series的每个元素上，map的参数是一个函数，还可以是字典

df=pd.DataFrame(data=[['男'],['女'],['男'],['女']], index=['张三','李姐','王五','陈妹'],columns=['性别'])
print(df)

def gender(g) :
    if g=='男':
        return 0
    else:
        return 1

df2=df['性别'].map(gender)
print('-----------------')
print('map的参数是一个函数\n',df2)
print('-----------------')
df3=df['性别'].map({'男':0,'女':1})
print('map的参数是字典\n',df3)

applymap()将函数应用到DataFrame中的每一个元素中，与apply()的区别，apply()只能应用到某列或某行

df=pd.DataFrame(data=[[10,20,30,40],[11, 22,33,44]],index=['a','b'], columns=['A','B','C','D'])
print (' --------------------------')
print(df)
df=df.applymap(lambda x:x*10)
print (' --------------------------')
print('applymap()将函数应用到DataFrame中的每一个元素中\n',df)

7、数据统计分组分析

7.1 分组统计groupby函数

分组统计函数groupby的功能是根据给定的条件将数据拆分成组，每个组可以独立应用函数(如sum())，并将结果合并到一个数据结构中。
语法结构：df.groupby(by=None,axis=0,as_index=True,sort=True)

按照单列分组计算

#按照一列分组统计
pd.set_option('display.unicode.east_asian_width',True)#规则格式

df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','数量','标准单价']]
print('对数量，标准单价都进行求和统计\n',df1.groupby('产品名称').sum())

按照多列分组计算

#按照多列分组统计
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')

print(df)
print('-------------------')
df1=df[['产品名称','销售员','数量','标准单价']]
df1=df1.groupby(['产品名称','销售员']).sum()
print('对数量，标准单价都进行求和统计\n',df1)

按照指定列分组计算

#按照指定列分组计算
pd.set_option('display.unicode.east_asian_width',True)#规则格式

df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','数量','标准单价']]
print('只对数量进行求和统计\n',df1.groupby('产品名称')['数量'].sum())

7.2 分组数据的迭代

分组数据的迭代是通过for循环对分组统计数据进行迭代(遍历分组数据)

#分组数据的迭代
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','数量','标准单价']]
print('分组之后的数据类型为DataFrameGroupBy\n',df1.groupby('产品名称'))
print('-------------------')
for name,group in df1.groupby('产品名称'):
    print(name,group)

#按照多列分组,数据迭代
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','销售员','数量']]
print('分组之后的数据类型为DataFrameGroupBy\n',df1)
print('--------------------')
for (name1,name2),group in df1.groupby(['产品名称','销售员']):
    print(name1,name2)
    print(group)
    print('-----------------------')

7.3 聚合函数的使用

通过groupby()与agg()函数联合使用，常用的函数函数, sum(),mean(),max(),min()等

#单列聚合函数
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','数量']]
print('使用聚合函数后的数据\n',df1.groupby('产品名称').agg(['sum','mean']))

不同列用不同聚合函数

#不同列使用不同聚合函数
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
df1=df[['产品名称','数量','成交金额']]
print('使用聚合函数后的数据\n',df1.groupby('产品名称').agg({'数量':['sum','mean'],'成交金额':['max','min']}))

7.4 通过自定义函数对数据进行分组统计

#通过自定义函数对数据进行分组统计
pd.set_option('display.unicode.east_asian_width',True)#规则格式
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
print('-------------------')
print (df['产品名称'].value_counts()) #df['产品名称']为Series
maxcount=lambda x:x.value_counts().index[0] #行索引为0,即为最大的数，value_counts()为降序排序
maxcount.__name__='销量最多的产品'
df1=df.agg({'产品名称':[maxcount],'数量':['max']})
print('-------------------')
print(df1)

7.5 通过字典和Series对象进行分组统计

通过字典进行分组统计

#通过字典进行分组统计
pd.set_option('display.unicode.east_asian_width',True) #规则格式
pd.set_option ('display.max_columns',500)
pd.set_option('display.width',1000)
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
df=df.set_index('产品名称')
dic={'南岸':'重庆','江津':'重庆','成都':'四川','泸州':'四川'}
df=df.groupby(dic,axis=1).sum()
print('------------------')
print(df)

通过Series进行分组统计

#通过Series进行分组统计
pd.set_option('display.unicode.east_asian_width',True) #规则格式
pd.set_option ('display.max_columns',500)
pd.set_option('display.width',1000)
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx')
print(df)
df=df.set_index('产品名称')
dic={'南岸':'重庆','江津':'重庆','成都':'四川','泸州':'四川'}
S=pd.Series(dic)
df=df.groupby(S,axis=1).sum()
print('------------------')
print(df)

7.6 数据移位

数据移位，是指数据上移或者下移
语法结构：df.shift(periods=1,freq=None,axis=0)
periods：表示移动的幅度，可以是正数，也可以是负数，默认值是1， 1表示移动一次。
freq：可选参数，默认值为None，只适用于时间序列，如果这个值存在，那么会按照参数值来移动时间索引,而数据值不会发生变化
axis：axis=1表示列,axis=0表示行，默认值为0

data=[532,937,447,765,564]
index=['一月','二月','三月','四月','五月']
df=pd.DataFrame(data=data,index=index, columns=['手机销量'])
print(df)
print('------------------')
df['销量差']=df['手机销量']-df['手机销量'].shift()
print(df)

8.数据的转换

·数据转换的分类
·—列数据转换为多列数据
行列转换

DataFrame转换为字典、列表和元组等等
语法结构：Series.str.split(pat=None,n=-1,expand=False)
pat：字符串、符号或正则表达式，表示字符串分割的数据，默认以空格分割字
n：整型、分割次数，默认值是-1。0或-1都将返回所有拆分的字符串
expand：布尔型，分割后的结果是否转换为DataFrame，默认值是False

pd.set_option('display.unicode.east_asian_width',True) #规则格式
pd.set_option ('display.max_columns',500)
pd.set_option('display.width',1000)
df=pd.read_excel(r'C:\Users\Desktop\数据统计.xlsx',usecols=['客户名','快递地址'])
print(df)
print('-------------------')
df1=df['快递地址'].str.split(' ',expand=True)
df['省']=df1[0]
df['市']=df1[1]
df['区']=df1[2]
print(df)

将元组数据进行分割

data={'a':[1,2,3,4,5],
      'b':[(1,2),(2,3),(3,4),(4,5),(5,6)]}
df=pd.DataFrame (data=data)
print(df)
print('----------------')
df[['b1','b2']]=df['b'].apply(pd.Series)
print (df)

data={'a':[1,2,3,4,5],
      'b':[(1,2),(2,3),(3,4),(4,5),(5,6)]}
df=pd.DataFrame (data=data)
print(df)
print('----------------')
#join()与apply()
df=df.join(df['b'].apply (pd.Series))
print (df)

本文仅用于学习交流

你可能感兴趣的:(学习笔记,pandas,学习,python)

课外补充InnoDB知识：InnoDB表的优势 1.01^1000 #关系型数据库 mysql
MySQL优化学习大纲1.InnoDB存储引擎在实际应用中拥有诸多优势，比如操作便利、提高了数据库的性能、维护成本低等。如果由于硬件或软件的原因导致服务器崩溃，那么在重启服务器之后不需要进行额外的操作。InnoDB崩溃恢复功能自动将之前提交的内容定型，然后撤销没有提交的进程，重启之后继续从崩溃点开始执行。2.InnoDB存储引擎在主内存中维护缓冲池，高频率使用的数据将在内存中直接被处理。这种缓存方
跨语言语义理解与生成：多语言预训练方法及一致性优化策略网罗开发 AI 大模型人工智能深度学习负载均衡
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
《Operating System Concepts》阅读笔记：p41-p49 操作系统
《OperatingSystemConcepts》学习第8天，p41-p49总结，总计9页。一、技术总结1.peer-to-peer(P2P)(1)定义P2PisAmodeofdistributedcomputinginwhichallnodesactasbothclientsofothernodesandserverstoothernodes.(2)示例Napster、Gnutella、Skyp
《Operating System Concepts》阅读笔记：p34-p40 操作系统
《OperatingSystemConcepts》学习第7天，p34-p40总结，总计7页。一、技术总结1.virtualization(虚拟化)(1)定义Atechnologyforabstractingthehardwareofasinglecomputerintoseveraldifferentexecutionenvironments,therebycreatingtheillusiont
《Operating System Concepts》阅读笔记：p26-p33 操作系统
《OperatingSystemConcepts》学习第6天，p26-p33总结，总计8页。一、技术总结timer(1)为什么设置timerWemustensurethattheoperatingsystemmaintainscontrolovertheCPU.Wecannotallowauserprogramtogetstuckinaninfinitelooportofailtocallsyst
Python 抽象基类 ABC ：从实践到优雅 python
今天我们来聊聊Python中的抽象基类（AbstractBaseClass，简称ABC）。虽然这个概念在Python中已经存在很久了，但在日常开发中，很多人可能用得并不多，或者用得不够优雅。让我们从一个实际场景开始：假设你正在开发一个文件处理系统，需要支持不同格式的文件读写，比如JSON、CSV、XML等。初始版本：简单但不够严谨我们先来看看最简单的实现方式：classFileHandler:de
Python 并发编程实战：优雅地使用 concurrent.futures python
在Python多线程编程中，concurrent.futures模块提供了一个高层的接口来异步执行可调用对象。今天，我们将通过一个循序渐进的案例，深入了解如何使用这个强大的工具。从一个模拟场景开始假设我们需要处理一批网络请求。为了模拟这个场景，我们使用sleep来代表耗时操作：importtimeimportrandomdefslow_operation(task_id):"""模拟一个耗时的网络
shutil 标准库： Python 文件操作的万用刀 python
今天来聊一个被低估的Python标准库-shutil。工作中我们用Python（尤其是写一些短小轻快的脚本）虽然经常和文件打交道，却很少用到shutil。但实际上，shutil提供了比os模块更高级的文件操作接口，能让我们写出更Pythonic的代码。从一个真实场景说起最近在整理项目代码时，需要将散落在各处的配置文件归类到统一目录。按以往的习惯，我会这样写：importos#创建目标目录ifnot
Python 自带的日期日历处理大师：calendar 库 python
在Python开发中，我们经常需要处理日期和时间。虽然datetime库是最常用的选择，但其实Python标准库中的calendar模块也是一个强大的工具，特别适合处理日历相关的计算和展示。从一个真实场景开始假设你正在开发一个会议室预订系统，需要：展示月度视图计算工作日处理节假日逻辑让我们看看如何用calendar来优雅地解决这些问题。基础用法：生成日历importcalendar#创建日历对象c
Python性能优化的幕后功臣： __pycache__与字节码缓存机制 python
在日常Python开发中，我们经常会看到项目目录下神秘的__pycache__文件夹和.pyc文件。作为经验丰富的Python开发者，今天让我们深入理解这个性能优化机制。从一个性能困扰说起最近在优化一个数据处理微服务时，发现每次启动服务都需要2-3秒的预热时间。通过profile可以发现大量时间花在了Python模块的加载上。Python的编译过程与大多数人的认知不同，Python并不是纯解释型语
Python Generator：一个被低估的性能利器 python
调用OpenAI的API时，设置stream=True，接着forchunkincompletion:我们就可以“流式”地获取响应的内容。而非等待远程的模型将所有内容生成完毕，再返回给我们（这通常要等很久）。本文讨论这背后的PythonGenerator。从一个经典问题开始假设我们要处理一个超大的日志文件，需要按行读取并分析。传统的做法是：defread_log_file(filename):re
Python `__slots__` 进阶指南：不止于节省内存，从原理到实践 python
相信不少Python开发者都听说过__slots__，知道它可以帮助节省内存。但你是否思考过它背后的原理，以及在实际开发中的其他妙用？让我们一起深入探讨。从一个性能问题说起假设你的一个系统需要处理大量的订单对象：classOrder:def__init__(self,order_id,symbol,price,quantity):self.order_id=order_idself.symbol=
Python 元类（Meta Class）：解密 Python 面向对象编程的幕后推手后端python
在Python编程中，我们每天都在和类打交道，但是你是否也和我一样想过：类本身是什么？是谁创建了类？元类（MetaClass）就是用来创建类的"类"。今天让我们一起深入理解这个强大而神秘的特性。从一个简单的类说起classPerson:def__init__(self,name):self.name=namedefgreet(self):returnf"Hello,I'm{self.name}"#
langchain系列（二）- 提示词模板以及消息码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250212说明：技术梳理提示词模板理论说明提示模板将用户输入和参数转换为语言模型的指令，以此来实现模型的响应，帮助它理解上下文并生成相关且连贯的基于语言的输出。其接受一个字典作为输入，其中每个键代表提示
langchain系列 - FewShotPromptTemplate 少量示例码--到成功大语言模型 langchain
导读环境：OpenEuler、Windows11、WSL2、Python3.12.3langchain0.3背景：前期忙碌的开发阶段结束，需要沉淀自己的应用知识，过一遍LangChain时间：20250220说明：技术梳理，针对FewShotPromptTemplate专门来写一篇博客概念说明few-shot最初来源于机器学习的概念，还有one-shot、zero-shot概念，概念如下：机器学习
nginx ngx_http_module(9) 指令详解 s_fox_ nginx nginx http 运维
nginxngx_http_module(9)指令详解nginx模块目录nginx全指令目录一、目录1.1模块简介ngx_http_uwsgi_module：uWSGI支持模块，允许Nginx与uWSGI服务器进行通信。uWSGI是一种应用服务器协议，广泛用于PythonWeb应用的部署。通过该模块，Nginx可以将动态请求转发给uWSGI服务器处理，并将响应返回给客户端。常用的指令包括uwsgi
《Operating System Concepts》阅读笔记：p50-p61 操作系统
《OperatingSystemConcepts》学习第9天，p50-p61总结，总计12页。一、技术总结1.systemcall(1)定义Theprimaryinterfacebetweenprocessesandtheoperatingsystem,providingameanstoinvokeservicesmadeavailablebytheoperatingsystem.二、英语总结(生
sql注入之python脚本进行时间盲注和布尔盲注温柔小胖 sql 数据库网络安全
一、什么是时间盲注和布尔盲注？答：时间盲注是攻击者通过构造恶意sql语句利用sleep()等延迟函数来观察数据库响应时间差异来进行推断信息和条件判断。如果条件为真，数据库会执行延时操作，如果为假则立即返回。响应时间较短。SELECTIF(1=1,SLEEP(5),0);如果条件为真、数据库会暂停5s如果条件为假、数据库会立即返回布尔盲注通过观察数据库返回的不同响应（如真或假）来推断信息。攻击者构造
Python中的生成器表达式（generator expression） Java资深爱好者 python python 开发语言
Python中的生成器表达式（generatorexpression）是一种类似于列表解析（listcomprehension）的语法结构，但它返回的是一个生成器（generator）对象，而不是一个完整的列表。生成器对象是一个迭代器，它可以逐个产生元素，而不是一次性生成所有元素，从而节省内存空间。生成器表达式在形式上与列表解析非常相似，但是它们使用圆括号()而不是方括号[]。当你迭代生成器表达式
Ollama部署大模型，本地调用居7然 android 人工智能 chatgpt 爬虫开发语言 AI编程
Ollama简单介绍Ollama是一个强大的大型语言模型平台，它允许用户轻松地下载、安装和运行各种大型语言模型。在本文中，我将指导你如何在你的本地机器上部署Ollama，并展示如何使用Python进行简单的API调用以访问这些模型最近很多人在学习大模型的时候，也遇到这个问题了，Ollama下载的模型，如果不想在命令行里面直接使用，而是想用Python去调用大模型该如何去使用？这是Ollama的官网
PyInstaller参数大揭秘：一文读懂打包神器的核心密码 Abossss Python python
一、引言在Python开发的广阔领域中，我们常常会面临这样一个问题：如何将自己精心编写的Python脚本，分享给那些没有Python环境的小伙伴，或者部署到生产环境中呢？这时候，PyInstaller库就如同一位救星，闪亮登场。PyInstaller是一个功能强大的跨平台打包工具，它可以将Python脚本及其所有依赖项，打包成一个独立的可执行文件。这意味着，无论目标系统是否安装了Python环境，
《Cell》期刊作者提交指南 TigerZ 生信宝库科研技能程序人生
❝写在前面在投稿论文前，阅读目标期刊的政策要求是非常必要的。本文为《Cell》期刊提供给作者的提交指南，包含了提交论文的相关信息和政策要求。本着自己学习、分享他人的态度，分享学习笔记，希望能对大家有所帮助。目录1期刊介绍（Aboutthejournal）2编辑评估时间表（Editorialevaluationtimeline）3CellPress期刊之间的关系（Relationshipbetwee
【SpringBoot教程】SpringBoot 统一异常处理(附核心工具类-ErrorInfoBuilder) 撸代码的羊驼 springboot springboot
作者简介：大家好，我是撸代码的羊驼，前阿里巴巴架构师，现某互联网公司CTO联系v：sulny_ann（17362204968），加我进群，大家一起学习，一起进步，一起对抗互联网寒冬#序言此前，我们主要通过在控制层（Controller）中手动捕捉异常（TryCatch）和处理错误，在SpringBoot统一异常处理的做法主要有两种：一是基于注解ExceptionHandler，二是基于接口Erro
量化交易策略都有哪些？怎么运用？股票程序化交易接口 Python股票量化交易股票API接口量化交易量化交易策略均值回归动量策略风险控制股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>均值回归策略：寻找价格的回归点均值回归的原理均值回归策略是基于一种市场现象，即价格不会永远偏离其长期的平均值。从市场的历史数据来看，无论是股票、期货还是其他金融资产，价格总是围绕着一个均值上下波动。这就像一个有弹性的绳子，当价格被拉伸
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页杰九 vue.js spring boot java
【全栈】SprintBoot+vue3迷你商城-细节解析（2）：分页往期的文章都在这里啦，大家有兴趣可以看一下后端部分：【全栈】SprintBoot+vue3迷你商城（1）【全栈】SprintBoot+vue3迷你商城（2）【全栈】SprintBoot+vue3迷你商城-扩展：利用python爬虫爬取商品数据【全栈】SprintBoot+vue3迷你商城（3）【全栈】SprintBoot+vue3
有需要2025年参加蓝桥杯比赛的同学往下看！！！岱宗夫up 教程蓝桥杯职场和发展
有需要2025年参加蓝桥杯比赛的同学往下下看！！！以下是关于近两年（2023年和2024年）蓝桥杯Python组考点的详细总结：一、2023年蓝桥杯Python考点分析在2023年的蓝桥杯Python竞赛中，考点主要集中在基础算法、数据结构、动态规划、数学、高精度计算以及二分查找等方面。（一）基础算法基础算法是竞赛的基石，包括枚举、排序（如冒泡排序、选择排序、插入排序等）、搜索（如BFS和DFS）
2024年网络安全最全【玄机】常见攻击事件分析--钓鱼邮件，网络相关+网络安全三方库的源码分析+数据结构与算法 2401_84302583 程序员网络安全学习面试
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
Ubuntu22 安装多个版本的python 莫忘初心丶 python 数据库开发语言
前言使用pyenv是一个很好的选择，尤其是在需要管理多个Python版本时。它提供了一个简单的方法来安装、切换和管理多个版本的Python，而不必依赖系统的包管理器或update-alternatives。特别是当你需要在同一系统中频繁切换Python版本时，pyenv会显得更加方便。目录前言为什么使用`pyenv`安装`pyenv`1.安装依赖2.安装`pyenv`3.配置shell环境4.安装
python的继承 zhangbeizhen18 L01-基础
记录：备忘录。1.继承classPerson(object):def__init__(self,p_name,p_addr,p_age):self.name=p_nameself.addr=p_addrself.age=p_ageclassGirl(Person):def__init__(self,g_name,g_addr,g_age,g_bra_cup):Person.__init__(sel
咱们一起学C++ 第二百四十八篇之C++中的向上类型转换与拷贝构造函数一杯年华@编程空间咱们一起学习C++c++java 开发语言
咱们一起学C++第二百四十八篇之C++中的向上类型转换与拷贝构造函数大家好呀！我一直觉得学习是一件很有趣的事，尤其是像C++这种功能强大又有点复杂的编程语言。在学习C++的过程中，我发现很多知识点都特别有意思，今天就想和大家一起分享一下C++中的向上类型转换与拷贝构造函数，咱们一起学习进步！一、C++中的向上类型转换（一）什么是向上类型转换在C++里，向上类型转换是个很重要的概念。简单来说，就是把
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方