hiddenSharp429

【Python】数据分析+数据挖掘——变量列的相关操作

前言

在Python和Pandas中，变量列操作指的是对DataFrame中的列进行操作，包括但不限于选择列、重命名列、添加新列、删除列、修改列数据等操作。这些操作可以帮助我们处理数据、分析数据和进行特征工程等。

变量列的相关操作

概述

下面将会列出一些基本的操作指令

# 查看df的前number条数据，不填数字默认为5
df.head(number)
# 查看df的后number条数据，不填数字默认为5
df.tail(number)
# 数据框的基本信息
df.info()
# 列出所有的变量名
df.columns
# 修改变量列名
df.rename()
# 筛选单个相关的变量名
df.column_name # 还有一个表达 df['column_name']
# 筛选多个相关的变量名
df[['column_name1','column_name2'...]]
# 删除变量列
df.drop()

案例数据表university_rank.csv

In[0]:

import pandas as pd # 引入pandas库
df = pd.read_csv("university_rank.csv") # 读取文件
df.head() # 显示文件头的记录（默认前五条）

out[0]:

	大学名称	地区	学科领域	排名依据
排名
1	哈佛大学	北美	工程	学术声誉
2	牛津大学	欧洲	医学	科研产出
3	北京大学	亚洲	商学	国际影响力
4	悉尼大学	大洋洲	计算机科学	教学质量
5	圣保罗大学	南美	艺术	学生满意度

In[1]:

df.tail() # 查看文件末的记录（默认后五条）

out[1]:

	大学名称	地区	学科领域	排名依据
排名
96	圣保罗国立大学	南美	计算机科学	研究生录取率
97	约翰内斯堡大学	非洲	环境科学	学术声誉
98	麦吉尔大学	北美	艺术	学生满意度
99	伦敦政治经济学院	欧洲	法律	国际影响力
100	东京大学	亚洲	教育	毕业生就业率

可以看的出来无论是df.head()还是df.tail()，如果里面不填写相关的参数，那么默认只查询5条记录。

那么接下来我们尝试一下给它们传入一些参数

In[2]:

number = 10 # 设置一个参数
df.head(number) # 传入参数

out[2]:

	大学名称	地区	学科领域	排名依据
排名
1	哈佛大学	北美	工程	学术声誉
2	牛津大学	欧洲	医学	科研产出
3	北京大学	亚洲	商学	国际影响力
4	悉尼大学	大洋洲	计算机科学	教学质量
5	圣保罗大学	南美	艺术	学生满意度
6	约翰内斯堡大学	非洲	法律	毕业生就业率
7	麦吉尔大学	北美	教育	校友网络
8	伦敦政治经济学院	欧洲	经济学	国际化程度
9	东京大学	亚洲	社会科学	研究生录取率
10	澳大利亚国立大学	大洋洲	环境科学	科研经费

注意：在jupyter notebook中默认情况下，如果DataFrame的行数超过一定阈值，默认情况下，Jupyter Notebook 会自动省略 DataFrame 中的行，显示前面几行和最后几行，并用省略号 ... 表示省略的行。这个阈值默认是 60 行，也就是说，当 DataFrame 的行数超过 60 行时，Jupyter Notebook 会自动省略中间的部分，只显示前几行和最后几行数据，您可以使用pd.set_option来调整Jupyter Notebook中DataFrame的显示行数和列数的限制。

# 设置显示的最大行数和列数为None，表示不限制
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)

In[3]:

df.info() # 快速了解 DataFrame数据是否有缺失值、了解数据类型是否正确，以及预估内存占用情况。

out[3]:


Int64Index: 100 entries, 1 to 100
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   大学名称    100 non-null    object
 1   地区      100 non-null    object
 2   学科领域    100 non-null    object
 3   排名依据    100 non-null    object
dtypes: object(4)
memory usage: 3.9+ KB

变量列的重命名

案例数据表university_rank.csv

我们先看一下DataFrame的列分别有什么，使用df.columns函数来查看

In[4]:

df = pd.read_csv("university.csv") # 读取文件
df.columns # 展示该DataFrame的列名

out[4]:

Index(['大学名称', '地区', '学科领域', '排名依据'], dtype='object')

在Pandas中有很多函数的作用都是重复的，故不需要掌握全部有关变量列重命名的函数，在这个案例中可以使用df.columns来修改列的名称，只需要给其赋值一个（列表）list就行

In[5]:

df.columns = ['university_name', 'site', 'area', 'rank_info'] # 更改列名
df # 展示新DataFrame

out[5]:

	university_name	site	area	rank_info
排名
1	哈佛大学	北美	工程	学术声誉
2	牛津大学	欧洲	医学	科研产出
3	北京大学	亚洲	商学	国际影响力
4	悉尼大学	大洋洲	计算机科学	教学质量
5	圣保罗大学	南美	艺术	学生满意度
...	...	...	...	...
96	圣保罗国立大学	南美	计算机科学	研究生录取率
97	约翰内斯堡大学	非洲	环境科学	学术声誉
98	麦吉尔大学	北美	艺术	学生满意度
99	伦敦政治经济学院	欧洲	法律	国际影响力
100	东京大学	亚洲	教育	毕业生就业率

100 rows × 4 columns

这里如果要使用df.columns = []来修改列名，则必须的要给出的list的大小与原DataFrame的变量列的数量一致，所以这里如果变量列很多，但是需要修改的列名却只有若干个的话，建议使用df.rename()来操作

df.rename(
        # 修改列标签的字典
        columns = {
        'old_attribute1':'new_attribute1',
        'old_attribute2':'new_attribute2',
        ...
        },
        # 修改行标签的字典
        index
        # 是否在原DataFrame上修改
        inplace = False
)

In[6]:

new_df = df.rename(
    columns={
        'university_name': '学校名称',
        'site': '地点'
    }
) # 不在原df进行列的重命名
print(new_df) # 打印新的df
print(df) # 打印旧的df

out[6]:

         学校名称   地点   area rank_info
排名                                 
1        哈佛大学   北美     工程      学术声誉
2        牛津大学   欧洲     医学      科研产出
3        北京大学   亚洲     商学     国际影响力
4        悉尼大学  大洋洲  计算机科学      教学质量
5       圣保罗大学   南美     艺术     学生满意度
..        ...  ...    ...       ...
96    圣保罗国立大学   南美  计算机科学    研究生录取率
97    约翰内斯堡大学   非洲   环境科学      学术声誉
98      麦吉尔大学   北美     艺术     学生满意度
99   伦敦政治经济学院   欧洲     法律     国际影响力
100      东京大学   亚洲     教育    毕业生就业率

[100 rows x 4 columns]
    university_name site   area rank_info
排名                                       
1              哈佛大学   北美     工程      学术声誉
2              牛津大学   欧洲     医学      科研产出
3              北京大学   亚洲     商学     国际影响力
4              悉尼大学  大洋洲  计算机科学      教学质量
5             圣保罗大学   南美     艺术     学生满意度
..              ...  ...    ...       ...
96          圣保罗国立大学   南美  计算机科学    研究生录取率
97          约翰内斯堡大学   非洲   环境科学      学术声誉
98            麦吉尔大学   北美     艺术     学生满意度
99         伦敦政治经济学院   欧洲     法律     国际影响力
100            东京大学   亚洲     教育    毕业生就业率

[100 rows x 4 columns]

若设置inplace = True则在原df上进行修改，因此就不需要进行赋值操作了。

In[7]:

df.rename(
    columns={
        'university_name': '学校名称',
        'site': '地点',
        'area': '学科领域',
        'rank_info': '排名依据'
    },
    inplace=True
) # 在原df进行修改
print(df) # 打印新df

out[7]:

         大学名称   地区   学科领域    排名依据
排名                               
1        哈佛大学   北美     工程    学术声誉
2        牛津大学   欧洲     医学    科研产出
3        北京大学   亚洲     商学   国际影响力
4        悉尼大学  大洋洲  计算机科学    教学质量
5       圣保罗大学   南美     艺术   学生满意度
..        ...  ...    ...     ...
96    圣保罗国立大学   南美  计算机科学  研究生录取率
97    约翰内斯堡大学   非洲   环境科学    学术声誉
98      麦吉尔大学   北美     艺术   学生满意度
99   伦敦政治经济学院   欧洲     法律   国际影响力
100      东京大学   亚洲     教育  毕业生就业率

[100 rows x 4 columns]

补充：

有时候df.columns函数会搭配tolist函数

column_list = df.columns.tolist() 
print(column_list)

变量列的筛选

在Pandas中对变量列筛选的函数冗余度很高，在这里只详细介绍一下最简单的方法

# 筛选单个列
df.column_name # column_name是您想要筛选的列标签
# 筛选多个列
df[['column_name1','columns_name2']]

案例数据表university_rank.csv

In[8]:

df = pd.read_csv("university_csv") # 读取案例文件
df.学校名称 # 使用df.column_name来筛选单列

out[7]:

排名
1          哈佛大学
2          牛津大学
3          北京大学
4          悉尼大学
5         圣保罗大学
         ...   
96      圣保罗国立大学
97      约翰内斯堡大学
98        麦吉尔大学
99     伦敦政治经济学院
100        东京大学
Name: 学校名称, Length: 100, dtype: object

注意这里的df.column_name返回的数据类型结果是numpy中的Series

In[9]:

type(df.学校名称)

out[9]:

pandas.core.series.Series

其实不用 . 运算符也可以进行单列的筛选，使用df['column_name']拥有一样的效果，不过一般在对新增变量列的时候才会使用，也就是说当使用.来进行单列筛选的时候必须保证该DataFrame有该列，而使用df.["column_name"]则不需要。

In[10]:

df['学校名称']

out[10]:

排名
1          哈佛大学
2          牛津大学
3          北京大学
4          悉尼大学
5         圣保罗大学
         ...   
96      圣保罗国立大学
97      约翰内斯堡大学
98        麦吉尔大学
99     伦敦政治经济学院
100        东京大学
Name: 学校名称, Length: 100, dtype: object

进行多列的筛选的时候需要使用列表嵌套

In[11]:

df[['学校名称', '排名依据']]

out[11]:

	学校名称	排名依据
排名
1	哈佛大学	学术声誉
2	牛津大学	科研产出
3	北京大学	国际影响力
4	悉尼大学	教学质量
5	圣保罗大学	学生满意度
...	...	...
96	圣保罗国立大学	研究生录取率
97	约翰内斯堡大学	学术声誉
98	麦吉尔大学	学生满意度
99	伦敦政治经济学院	国际影响力
100	东京大学	毕业生就业率

100 rows × 2 columns

补充：

除了使用方括号 [] 运算符来筛选列，还可以使用 loc 属性、使用 iloc 属性

# loc:
# 假设 df 是一个 DataFrame，'column_name' 是您想要筛选的列标签
selected_column = df.loc[:, 'column_name'] # 筛选column_name列以及其前面的所有列

# iloc
# 假设 df 是一个 DataFrame，column_index 是您想要筛选的列的索引（从 0 开始）
selected_column = df.iloc[:, column_index]

删除变量列

要删除 DataFrame 中的变量列，可以使用 drop() 方法或 del 关键字。下面主要介绍这两种方法~

df.drop(
	# 要删除的行索引或列标签。可以是单个值或一个包含多个值的列表
	labels = [],
    # 需要删除的列名的列表
    columns = [],
    # 用于指定要删除的行索引。可以是单个值或一个包含多个值的列表。与 axis=0 一起使用
    index = [],
    # 指定要删除的是行还是列。默认为 0，即删除行。如果要删除列，则应设置为 1
    axis = 0
    # 是否在在df上进行修改
    inplace = False
)

案例数据表university_rank.csv

In[12]:

df = db
df.drop(
    columns=['地区', '学科领域']
)

out[12]:

	大学名称	排名依据
排名
1	哈佛大学	学术声誉
2	牛津大学	科研产出
3	北京大学	国际影响力
4	悉尼大学	教学质量
5	圣保罗大学	学生满意度
...	...	...
96	圣保罗国立大学	研究生录取率
97	约翰内斯堡大学	学术声誉
98	麦吉尔大学	学生满意度
99	伦敦政治经济学院	国际影响力
100	东京大学	毕业生就业率

100 rows × 2 columns

使用 del 关键字则是直接在原始 DataFrame 上进行删除，也就是在df.drop()中inplace参数默认为True

添加变量列

如果是对已有的变量列进行赋值则可以直接使用df.column_name = ?来对已有的column_name进行赋值

如果是想创建一个变量类则需要使用df[new_column_name] = '?' 来创建’new_column_name’，并且全部赋值成'?'

案例数据表university_rank.csv

In[13]:

df = pd.read_csv("university_rank.csv") # 读取案例数据
df # 展示案例数据

out[13]:

	大学名称	排名	地区	学科领域	排名依据
0	哈佛大学	1	北美	工程	学术声誉
1	牛津大学	2	欧洲	医学	科研产出
2	北京大学	3	亚洲	商学	国际影响力
3	悉尼大学	4	大洋洲	计算机科学	教学质量
4	圣保罗大学	5	南美	艺术	学生满意度
...	...	...	...	...	...
95	圣保罗国立大学	96	南美	计算机科学	研究生录取率
96	约翰内斯堡大学	97	非洲	环境科学	学术声誉
97	麦吉尔大学	98	北美	艺术	学生满意度
98	伦敦政治经济学院	99	欧洲	法律	国际影响力
99	东京大学	100	亚洲	教育	毕业生就业率

100 rows × 5 columns

In[14]:

df.地区 = "未知" # 使用`.`运算符进行对已有的变量列进行赋值
df # 展示修改后的表

out[14]:

	大学名称	排名	地区	学科领域	排名依据
0	哈佛大学	1	未知	工程	学术声誉
1	牛津大学	2	未知	医学	科研产出
2	北京大学	3	未知	商学	国际影响力
3	悉尼大学	4	未知	计算机科学	教学质量
4	圣保罗大学	5	未知	艺术	学生满意度
...	...	...	...	...	...
95	圣保罗国立大学	96	未知	计算机科学	研究生录取率
96	约翰内斯堡大学	97	未知	环境科学	学术声誉
97	麦吉尔大学	98	未知	艺术	学生满意度
98	伦敦政治经济学院	99	未知	法律	国际影响力
99	东京大学	100	未知	教育	毕业生就业率

100 rows × 5 columns

使用df['column_name']来对原有的列进行赋值或者创建一个新的列

In[15]:

df = pd.read_csv("university_rank.csv") # 重新读一下数据表
df["入学人数"] = "未知" # 创建一个新的列，并且赋值为"未知"
df # 展示一下新的df

out[15]:

	大学名称	排名	地区	学科领域	排名依据	入学人数
0	哈佛大学	1	北美	工程	学术声誉	未知
1	牛津大学	2	欧洲	医学	科研产出	未知
2	北京大学	3	亚洲	商学	国际影响力	未知
3	悉尼大学	4	大洋洲	计算机科学	教学质量	未知
4	圣保罗大学	5	南美	艺术	学生满意度	未知
...	...	...	...	...	...	...
95	圣保罗国立大学	96	南美	计算机科学	研究生录取率	未知
96	约翰内斯堡大学	97	非洲	环境科学	学术声誉	未知
97	麦吉尔大学	98	北美	艺术	学生满意度	未知
98	伦敦政治经济学院	99	欧洲	法律	国际影响力	未知
99	东京大学	100	亚洲	教育	毕业生就业率	未知

100 rows × 6 columns

使用df['column_name']的方法虽然简单，但是只能在列的末尾添加新的列，下面将介绍一个新的添加变量列的方法。

DataFrame支持插入的变量列自定义位置、列名、值、是否重名等，具体使用方法为df.insert

df.insert(
        # 插入变量列的索引，第一个变量列为0，依次类推
        loc
        # 插入变量列的名称，是一个字符串
        column
        # 变量值，可以是单个标量值（如整数、浮点数、字符串等），也可以是一个与 DataFrame 行数相同长度的列表或 Series
        value
        # 是否允许重名
        allow_duplicate = False
)

In[16]:

df = pd.read_csv("university_rank.csv") # 重新读入一下案例数据表
df.insert(loc=2, column="创办时间", value="未知") # 使用df.insert来插入新列表
df

out[16]:

	大学名称	排名	创办时间	地区	学科领域	排名依据
0	哈佛大学	1	未知	北美	工程	学术声誉
1	牛津大学	2	未知	欧洲	医学	科研产出
2	北京大学	3	未知	亚洲	商学	国际影响力
3	悉尼大学	4	未知	大洋洲	计算机科学	教学质量
4	圣保罗大学	5	未知	南美	艺术	学生满意度
...	...	...	...	...	...	...
95	圣保罗国立大学	96	未知	南美	计算机科学	研究生录取率
96	约翰内斯堡大学	97	未知	非洲	环境科学	学术声誉
97	麦吉尔大学	98	未知	北美	艺术	学生满意度
98	伦敦政治经济学院	99	未知	欧洲	法律	国际影响力
99	东京大学	100	未知	亚洲	教育	毕业生就业率

100 rows × 6 columns

变量列的四则运算

对DataFrame类型数据进行运算时需要考虑到库支持类型是否满足运行需求，常用的库有math\numpy

numpy库中的运算可以支持Series类型数据而math库中并不支持，需要使用别的函数来进行类型转换

注：在添加变量列的时候也可以进行四则运算

案例数据表university_rank.csv

In[17]:

import numpy as np # 为了进行运算，先导入numpy库
df = pd.read_csv("university_rank.csv") # 读取案例数据表
df["入学人数"] = 1000 # 在列末尾新增一个变量列并赋值1000
df.入学人数 = np.sqrt(df.入学人数) # 对新增的变量列进行运算
df # 展示运算后的数据表

out[17]:

	大学名称	排名	地区	学科领域	排名依据	入学人数
0	哈佛大学	1	北美	工程	学术声誉	31.622777
1	牛津大学	2	欧洲	医学	科研产出	31.622777
2	北京大学	3	亚洲	商学	国际影响力	31.622777
3	悉尼大学	4	大洋洲	计算机科学	教学质量	31.622777
4	圣保罗大学	5	南美	艺术	学生满意度	31.622777
...	...	...	...	...	...	...
95	圣保罗国立大学	96	南美	计算机科学	研究生录取率	31.622777
96	约翰内斯堡大学	97	非洲	环境科学	学术声誉	31.622777
97	麦吉尔大学	98	北美	艺术	学生满意度	31.622777
98	伦敦政治经济学院	99	欧洲	法律	国际影响力	31.622777
99	东京大学	100	亚洲	教育	毕业生就业率	31.622777

100 rows × 6 columns

如果不想在原来的DataFrame上进行修改，则可以使用df.assign

In[18]:

df = pd.read_csv("university_rank.csv")
df["入学人数"] = 10000
df1 = df.assign(入学人数=np.sqrt(df.入学人数))
print(df)
print(df1)

out[18]:

        大学名称   排名   地区   学科领域    排名依据   入学人数
0       哈佛大学    1   北美     工程    学术声誉  10000
1       牛津大学    2   欧洲     医学    科研产出  10000
2       北京大学    3   亚洲     商学   国际影响力  10000
3       悉尼大学    4  大洋洲  计算机科学    教学质量  10000
4      圣保罗大学    5   南美     艺术   学生满意度  10000
..       ...  ...  ...    ...     ...    ...
95   圣保罗国立大学   96   南美  计算机科学  研究生录取率  10000
96   约翰内斯堡大学   97   非洲   环境科学    学术声誉  10000
97     麦吉尔大学   98   北美     艺术   学生满意度  10000
98  伦敦政治经济学院   99   欧洲     法律   国际影响力  10000
99      东京大学  100   亚洲     教育  毕业生就业率  10000

[100 rows x 6 columns]
        大学名称   排名   地区   学科领域    排名依据   入学人数
0       哈佛大学    1   北美     工程    学术声誉  100.0
1       牛津大学    2   欧洲     医学    科研产出  100.0
2       北京大学    3   亚洲     商学   国际影响力  100.0
3       悉尼大学    4  大洋洲  计算机科学    教学质量  100.0
4      圣保罗大学    5   南美     艺术   学生满意度  100.0
..       ...  ...  ...    ...     ...    ...
95   圣保罗国立大学   96   南美  计算机科学  研究生录取率  100.0
96   约翰内斯堡大学   97   非洲   环境科学    学术声誉  100.0
97     麦吉尔大学   98   北美     艺术   学生满意度  100.0
98  伦敦政治经济学院   99   欧洲     法律   国际影响力  100.0
99      东京大学  100   亚洲     教育  毕业生就业率  100.0

[100 rows x 6 columns]

如果是用math库，那么就需要使用apply进行中间转化，将Series转换成math库支持的类型进行运算

In[19]:

import math # 使用math库中的运算函数
df = pd.read_csv("university_rank.csv")
df["入学人数"] = 10000
df.入学人数 = df.入学人数.apply(math.sqrt) # 需要使用apply函数进行类型转换
df # 展示新数据表

out[19]:

	大学名称	排名	地区	学科领域	排名依据	入学人数
0	哈佛大学	1	北美	工程	学术声誉	100.0
1	牛津大学	2	欧洲	医学	科研产出	100.0
2	北京大学	3	亚洲	商学	国际影响力	100.0
3	悉尼大学	4	大洋洲	计算机科学	教学质量	100.0
4	圣保罗大学	5	南美	艺术	学生满意度	100.0
...	...	...	...	...	...	...
95	圣保罗国立大学	96	南美	计算机科学	研究生录取率	100.0
96	约翰内斯堡大学	97	非洲	环境科学	学术声誉	100.0
97	麦吉尔大学	98	北美	艺术	学生满意度	100.0
98	伦敦政治经济学院	99	欧洲	法律	国际影响力	100.0
99	东京大学	100	亚洲	教育	毕业生就业率	100.0

100 rows × 6 columns

假如是对所有的cell进行运算而不是单独的几列进行运算，那么就可以使用df.applymap方法

In[20]:

df[["排名", "入学人数"]].applymap(math.sqrt)

out[20]:

	排名	入学人数
0	1.000000	10.0
1	1.414214	10.0
2	1.732051	10.0
3	2.000000	10.0
4	2.236068	10.0
...	...	...
95	9.797959	10.0
96	9.848858	10.0
97	9.899495	10.0
98	9.949874	10.0
99	10.000000	10.0

100 rows × 2 columns

结束语

如果有疑问欢迎大家留言讨论，你如果觉得这篇文章对你有帮助可以给我一个免费的赞吗？我们之间的交流是我最大的动力！

你可能感兴趣的:(Python,python,numpy,pandas,数据分析,数据挖掘)

应急救援路径规划中的蚁群算法与路径评价研究【附代码】拉勾科研工作室算法
数据科学与大数据专业|数据分析与模型构建|数据驱动决策✨专业领域：数据挖掘与清洗大数据处理与存储技术机器学习与深度学习模型数据可视化与报告生成分布式计算与云计算数据安全与隐私保护擅长工具：Python/R/Matlab数据分析与建模Hadoop/Spark大数据处理平台SQL数据库管理与优化Tableau/PowerBI数据可视化工具TensorFlow/PyTorch深度学习框架✅具体问题可以私
【列表复制】详解python中list列表复制的几种方法（赋值、切片、copy()，deepcopy()）有梦想的程序星空 Python开发教程 python 开发语言
在Python编程领域，列表是一种极为常用的数据结构，用于存储多个元素的有序集合。当涉及到对列表进行复制操作时，浅拷贝和深拷贝是两种重要的概念与技术手段，它们在处理列表数据的过程中有着截然不同的行为和影响，深刻理解二者的差异与应用场景对于编写高效、准确且健壮的Python代码至关重要。1、浅拷贝和深拷贝浅拷贝复制指向某个对象的地址（指针），而不复制对象本身，新对象和原对象共享同一内存。深拷贝会额外
python3安装clickhouse_sqlalchemy(greenlet) 失败
安装clickhouse_sqlalchemy时，可能会遇到依赖问题，特别是greenlet模块的安装问题。以下是详细的解决方案，帮助您顺利完成安装过程。常见问题与解决方案1.升级pip确保您的pip版本是最新的，这有助于避免由于旧版本导致的兼容性问题。pipinstall--upgradepip解释：使用pipinstall--upgradepip命令将pip升级到最新版本，以确保能够安装最新的
pandas判断某列是否已按从小到大排序
在使用Pandas进行数据分析时，判断某一列是否已按从小到大排序是一个常见的操作。本文将详细介绍如何使用Pandas判断某列是否按升序排列，并提供多种解决方案和详细解释，确保您能够在实际应用中轻松实现这一功能。判断列是否按升序排序的方法使用is_monotonic_increasing方法Pandas提供了一个便捷的方法is_monotonic_increasing，用于判断某一列是否按从小到大排
python（类和对象之类函数和静态函数） huo_1214
类函数和静态函数#-*-coding:utf-8-*-#类函数和静态函数classPeople(object):#类变量total=0def__init__(self,name,age):#调用父类的初始化函数super(People,self).__init__()#初始化当前类对象的一些属性self.name=nameself.age=age#对象函数，只能由对象调用defeat(self):
python程序设计期末大作业,python大作业代码100行 chatgpt001 人工智能
大家好，小编来为大家解答以下问题，python期末大作业代码200行带批注，python程序设计期末大作业，今天让我们一起来看看吧！#题目：利用Python实现一个计算器，可以计算小数复数等importredefcalculator(string):#去除括号函数defget_grouping(string):flag=Falseret=re.findall('$([^()]+)$',stri
华为OD机试E卷 - 单词接龙（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od java python javascript c++C
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述单词接龙的规则是：可用于接龙的单词首字母必须要前一个单词的尾字母相同；当存在多个首字母相同的单词时，取长度最长的单词，如果长度也相等，则取字典序最小的单词；已经参与接龙的单词不能重复使用。现给定一组全部由小写字母组成单词数组，并指定其中的一个单词作为起始单词，进行单词接龙，请输出最长的单词串，单词串是单词拼接而成，中间
Linux 下 kill 孙子进程（qbit）
qbit在使用Python的FastAPI框架，在Python脚本中用os.system调用了uvicorn启动程序，调用链条大致如下python3main.py#进程1--shpython3uvicorn#进程2--python3uvicorn#进程3qbit发现直接kill进程1或进程2，并不能终止进程3。即kill某个进程，并不一定能终止该进程的子进程和孙子进程。于是通过找到孙子进程的方式来
WSL ubuntu 20.04安装python3
在WSLUbuntu20.04上安装Python3的详细步骤✨在WSL（WindowsSubsystemforLinux）的Ubuntu20.04环境中安装Python3，可以按照以下步骤进行。每一步都提供了详细的解释，确保您能够顺利完成安装过程。1.打开WSL终端️首先，启动您的WSLUbuntu20.04终端。这可以通过在Windows搜索栏中输入“WSL”或“Ubuntu”来找到并打开。2.
大数据新视界 --大数据大厂之 ClickHouse：大数据分析领域的璀璨明星青云交大数据新视界 #ClickHouse 之道 ClickHouse 大数据分析性能优势应用场景技术实现竞品对比前沿技术融合数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
SSL context 中设置TLS版本无效的原因和有效解决办法 ecmascript-6
如果在设置SSL/TLS上下文时，指定的TLS版本无效，可能有多种原因。这里列出了一些常见的问题及其解决方法：1.TLS版本设置方法不正确在很多编程语言和框架中，设置TLS版本的方法各不相同。如果你没有正确配置或选择正确的API，TLS版本的设置可能不会生效。确保你按照相应的文档或官方指导进行配置。例如，在Python中，使用ssl.create_default_context()设置TLS版本：
[Python基础](5) Python列表( list )详细解读 apk___ Python python 开发语言 list
作者制作不易，关注、点赞、收藏一下吧!目录1.列表的基本概念2.一维列表2.1.创建一维列表与访问元素2.2.在一维列表中修改元素、添加元素、删除元素2.3.列表排序2.4.一维列表遍历重点！2.5.列表切片3.二维列表3.1.创建二维列表和访问元素3.2.在二维数组中修改元素、添加元素、删除元素3.3.二维列表遍历3.4.二维列表切片4.拓展NumPy数组1.列表的基本概念在Python中，列表
Python | 经典类与新式类，静态方法、类方法与实例方法详解！ chaochao️ Python python 面向对象编程新式类经典类
创作不易，来了的客官点点关注，收藏，订阅一键三连❤前言“人生苦短，我用python”，我是一个即将毕业的大学生，超超。如果你也爱python，不妨跟着萌新超超一起学习python，拿下python，一起加油，共同努力，拿到理想offer！系列文章目录Python——什么是面向对象？类的定义、self和继承详解Python——函数大全及使用方法！lambda？global?Python——流程控制，
【1】Elasticsearch 30分钟快速入门不知名美食探索家 ES快速学习 es elasticsearch
文章目录一、Elasticsearch基本概念及工作原理（一）基本概念（二）工作原理二、Elasticsearch原生RESTful方式的增删改查（一）创建索引（二）插入文档（三）查询文档（四）更新文档（五）删除文档（六）删除索引三、PythonSDK实现增删改查（一）安装ElasticsearchPythonSDK（二）连接到Elasticsearch（三）插入文档（四）查询文档（五）更新文档（
【华为OD-E卷 - 求字符串中所有整数的最小和 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 python 华为od java c++javascript
【华为OD-E卷-求字符串中所有整数的最小和100分（python、java、c++、js、c）】题目输入字符串s，输出s中包含所有整数的最小和。说明：字符串s，只包含a-zA-Z±合法的整数包括1）正整数：一个或者多个0-9组成，如0230021022）负整数：负号–开头，数字部分由一个或者多个0-9组成，如-0-012-23-00023输入描述包含数字的字符串输出描述所有整数的最小和用例用例一
【华为OD-E卷 - 通过软盘拷贝文件 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 java 华为od python javascript c++
【华为OD-E卷-通过软盘拷贝文件100分（python、java、c++、js、c）】题目有一名科学家想要从一台古董电脑中拷贝文件到自己的电脑中加以研究。但此电脑除了有一个3.5寸软盘驱动器以外，没有任何手段可以将文件持贝出来，而且只有一张软盘可以使用。因此这一张软盘是唯一可以用来拷贝文件的载体。科学家想要尽可能多地将计算机中的信息拷贝到软盘中，做到软盘中文件内容总大小最大。已知该软盘容量为14
Python 装饰器暮色尽染 Python python 开发语言
Python装饰器是一种强大且优雅的工具，它允许我们在不修改原始函数代码的情况下，增加或改变函数的功能。装饰器的使用可以显著提高代码的复用性和可读性，是Python编程中不可或缺的一部分。装饰器的基本概念装饰器本质上是一个函数，它接受一个函数作为参数并返回一个新的函数。通过装饰器，我们可以在函数执行前后添加额外的逻辑，而不需要修改函数本身的代码。这种特性使得装饰器非常适合用于日志记录、性能测试、事
【华为OD-E卷 - 服务失效判断 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-服务失效判断100分（python、java、c++、js、c）】题目某系统中有众多服务，每个服务用字符串（只包含字母和数字，长度relPairs=split(relInput,',');//将依赖关系解析为Pair对象的列表List>rels=newArrayListp=split(pStr,'-');rels.add(newPairfails=split(failInput,
搭建个人AI知识库：RAG与本地模型实践指南 ai开发知识库
引言你是否想过拥有一个私人订制的AI助手，能够随时为你提供最个性化的信息？本文将带你一步步搭建一个基于本地模型和RAG技术的个人知识库。搭建本地模型环境os:archlinux内存:32gcpu:6核12线程python:3.12.7docker27.3.1+docker-compose向量库:milvus2.4.13+attu2.4(客户端)ollamapacman-Sollamasystemc
在Python中，文本查找和替换的常用操作 python正则表达式
1.使用字符串方法进行查找和替换Python的字符串类(str)提供了简单的查找和替换方法，如find()、replace()等。示例：text="Hello,world!"#查找子字符串的位置position=text.find("world")print(position)#输出:7#替换子字符串new_text=text.replace("world","Python")print(new_
jupyter notebook练手项目：线性回归——学习时间与成绩的关系橙意满满的西瓜大侠机器学习 jupyter 线性回归机器学习
线性回归——学习时间与学习成绩的关系第1步：导入工具库pandas——数据分析库，提供了数据结构（如DataFrame和Series）和数据操作方法，方便对数据集进行读取、清洗、转换等操作。matplotlib——绘图库，pyplot提供了一系列简单易用的绘图函数，用于创建各种类型的图表，如折线图、散点图、柱状图等。%matplotlibinline——使matplotlib绘制的图像嵌入在Jup
21章5节：如何绘制三维曲面图、三维球面图和三维曲面地形图 DAT｜R科学用R探索医药数据科学信息可视化三维曲面图三维球面图三维曲面地形图
三维可视化图形在数据分析和科学研究中具有重要意义，尤其是用于展示复杂的三维数据结构。三维曲面图、三维球面图和三维曲面地形图是常见的可视化方式，它们帮助用户更直观地理解数据的分布和关系。在R语言中，plot3D包提供了多个强大的函数，如surf3D和spheresurf3D，用于绘制这些三维图形。通过这些函数，用户可以展示带有颜色编码、光照效果和不同视角的三维表面或球面，广泛应用于地形建模、数据可视
Python3 利用正则转化参数化表达式（qbit）正则表达式
前言技术栈Python3.11regex2023.5.5案例测试代码#encoding:utf-8#author:qbit#date:2024-04-24#summary:利用正则转换参数化表达式importregexline1='owner=x_111ANDdoc_type=%x%_222ORauthor=x_333ORorgan=x_444AND(NOTpub_year=x_555)'dic=
基于SpringBoot的物业管理系统计算机学姐 Java精选实战项目源码 SpringBoot源码 Vue源码 spring boot 后端 java mysql vue.js spring intellij-idea
作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：Java精选实战项目源码、Python精选实战项目源码、大数据精选实战项目源码系统展示【2025最新】基于Java+SpringBoot+Vu
Javascript(turfjs)等值线图绘制前端空间计算mapbox
使用气象、环境类空间数据绘制等值线通常是由NCL、Python来做，在一些场景中：你只是想在WEB端做一些简单的绘制你的后端只有Node.js环境你纯粹是个前端工程师你也许需要使用纯Javascript来做这件事。本文尝试根据空间中的一组散点来绘制等值线图（或色斑图）。1.准备工作turfjs，空间分析（geospatialanalysis）工具包，支持在浏览器和Node.js环境中运行，空间数据
ECharts实战：在UniApp中实现动态数据可视化 Front_Yue echarts uni-app 信息可视化
前言当今，数据可视化已经成当今，随着数据的日益增长，数据可视化变得越来越重要。ECharts是一个强大的数据可视化工具，它提供了丰富的图表类型和交互方式，可以帮助我们更好地理解和分析数据。当今的数据可视化已成为数据分析和决策制定的重要工当今时代，数据分析和可视化已经成为了各行各业中不可或缺的一部分。而ECharts作为一款强大的数据可视化库，已经成为了众多开发者的首选。在本文中，我们将会介当今，数
【原创】大数据治理入门（2）《提升数据质量：质量评估与改进策略》入门必看高赞实用精通代码大仙数据库 hadoop python 大数据信息可视化 python 数据库 sql
提升数据质量：质量评估与改进策略引言：数据质量的概念在大数据时代，数据的质量直接影响到数据分析的准确性和可靠性。数据质量是指数据在多大程度上能够满足其预定用途，确保数据的准确性、完整性、一致性和及时性是数据质量的关键要素。高质量的数据能够帮助企业更好地理解市场趋势、优化运营流程、支持业务决策，从而提升企业的竞争力。质量评估指标：准确性、完整性、一致性、及时性准确性（Accuracy）定义：数据的准
销售易、用友、销帮帮CRM：优势特色与适用企业深度总结程序员编辑器运维
一、销售易CRM优势特色全渠道客户互动：整合线上线下多个渠道，实现客户信息的统一管理。销售自动化：自动化销售流程，提高销售效率，减少人为错误。智能分析与报告：提供深入的数据分析和定制化报告，帮助企业做出数据驱动的决策。高度定制化：根据企业需求定制CRM功能，满足不同业务场景的需求。移动办公支持：移动应用支持销售人员随时随地访问CRM系统，提高工作效率。集成能力：能够与ERP、OA等企业管理系统集成
Python入门：3.Python的输入和输出格式化平凡程序猿~ Python python 开发语言
引言在Python编程中，输入与输出是程序与用户交互的核心部分。而输出格式化更是对程序表达能力的极大增强，可以让结果以清晰、美观且易读的方式呈现给用户。本文将深入探讨Python的输入与输出操作，特别是如何使用格式化方法来提升代码质量和可读性。一、输入操作Python提供了简单而强大的输入功能，通过内置函数input()可以从用户那里获取字符串形式的输入。以下是一些基本用法和注意事项：1.基本用法
后端开发技术后端
在当今数字化和互联网化的时代背景下，后端开发技术作为连接前端和用户的重要桥梁，正以前所未有的速度发展和演进。后端开发的核心技术通常包括主流服务器端语言如Java、Python、Node.js等；关系型或非关系型数据库如MySQL、MongoDB等；容器编排工具如Docker、Kubernetes等。以Python为例，其简洁明了的语法受众多开发者青睐，适合快速原型开发和敏捷项目交付。随着云计算的普
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置