MarvinMao

Pandas 学习笔记基础知识汇总

一、pandas读取和存储excel、csv文件

1、df1 = pd.read_excel( file_path ,index_col = ‘col2’ ) 设置索引列为col2，读取出来的数据是dataframe格式

2、df2 = pd.read_csv( serprator =’::’,engine = python) 设置分隔符和读取引擎

3、dataframe.to_excel( file_path ) dataframe.to_csv( )

4、pd.read_excel(filepath,skiprows=2) 跳过前2行

二、pandas loc定位的使用

1、df.loc[] 可以查询，可以赋值，按单个label查询，使用条件查询，切片区间查询（行列可以同时设定区间），可以跟函数

2、df.loc[].str.replace() 可以跟str相关函数str.startwith , str.endwith

3、df.loc[lambda df: (df[‘age’] > 18) & (df[‘age’] < 35) , : ] 筛选年龄介于18到35的行，列不筛选所以冒号梁板没有内容

df.loc[df[‘age’] < 18 , ‘type’] = ‘少年’ 新增一个列，对小于18岁的，类型是少年

4、一维的数据是series，二维是数据是dataframe

5、pandas的与是& python的与是and

6、df.iloc[] df.where() df.query()

三、pandas新增或修改数据列

1、直接赋值

2、df.apply()方法，沿着series的某个轴逐个数据应用函数。

3、df.assign()可以同时添加多个列

四、pandas的统计函数

1、通过df.describe() 可以发现，有mean min max std quantile等

2、df.[‘name’].unique() 去重后返回一个数组

3、df.[‘class’].value_counts() 统计不同值出现过几次

4、df.cov() 协方差矩阵，为正是通向变化

5、df.corr() 相关系数矩阵，-1~1 相关性大小和方向

6、使用方法df[‘age’].cov(df[‘class’]) ，也可以查看整改表的相关系数 df.corr()

五、pandas对缺失值的处理（数据清洗）

1、isnull和notnull，判断是否空值，可以用于dataframe和series，可以判断某一列，或者某个范围

2、df.dropna() 删除空行参数可以指定行数和列，axis=columns(index) , how=any(all) ，inplace=True(False)

3、df.fillna(‘分数’,0) 填充空值 , df.fillna(‘姓名’,method=“ffill”) 使用前面的姓名填充缺失的姓名（适用于excel中姓名列相同姓名被合并了单元格的情况）

4、df.to_excel(new_filepath,index=False) 把df存到新的excel文件中

5、pd.read_csv() 参数engine=python的意义

六、pandas处理copy报警

1、settingwithcopywarning，视图view的修改会影响原df，copy是一个副本不会影响原df

2、df.loc[condition,‘总分’] =df[’'数学] + df[‘语文’] 通过直接赋值的方式避开警告

3、也可以先创建一个copy，对copy进行整理后再赋值给原df

七、pandas数据排序

1、series.sort_values(acending=False,inplace=True) 对series进行降序排序，替换原数据

2、dataframe.sort_values(by[‘col1’,‘col2’], ascending=[False , True], inplace = True) 对dataframe的col1和col2列进行降序排序，替换原数据，可以单独设置每个列的升降序

八、pandas对字符串的处理

1、只能对series操作，并且只能对string类型操作

2、df[‘name’].str.strip() 删除name中的空格

3、其他函数：df.loc[].str.replace() 可以跟str相关函数str.startwith() , str.endwith()，str.contains()，str.isnumeric() , str.len() , str.split() , str.slice() 切片 , 多个函数可以连续操作str.func1().str.func2() ， str都要写

4、正则表达式的语法方式：str.loc[‘日期’].str.replace([‘年月日’],’’) 把日期中的年月日都替换成空

九、pandas的axis参数

1、axis=0或者index是对行操作，axis=1或者columns是对列操作

2、df.drop(‘A’,axis=1) 删除列名为A的这一列， df.drop(‘A’,axis=0) 删除行名为A的这一行

3、df.mean(axis=0) 对每一列的数据相加并求平均数，因为axis=0那么每一行 的数据都要动起来，参与求和和求平均的操作

4、df.mean(axis=1) 对每一行的数据求和再求平均，因为axis=1 那么 每一列 的数据要横向动起来，参与求和求平均操作

十、pandas的索引 index的用处

1、df.set_index(‘name’,inplace=True,drop=False) 把name设置成df的index,保留原来的name列

2、查询name=‘张三’ 的所有行就可以简化成： df[‘张三’] 原来查询需要：df.loc[df['name']=='张三'] 或者 df[df['name']=='张三']

3、合理设置index提高查询效率。如果index是唯一的，pandas用哈希表优化查找

4、合理设置index提高查询效率。如果index是有序的，pandas采用二分查找

5、 % timeit 返回程序运行时间

6、df_shuffle.loc[‘name’] 打乱姓名排序

7、index有自动对齐功能，两个series相加，如果index相同，该行直接相加，如果不同则无法相加

8、使用index更多更强大的数据结构支持，如groupby , datetimeindex

十一、pandas的merge语法

1、相当于sql的join，将不同的表按key关联到一个表

2、pd.merge(left_df,right_df,how,on,sort,suffixes)

on：列名，join用来对齐的那一列的名字，用到这个参数的时候一定要保证左表和右表用来对齐的那一列都有相同的列名

how：数据融合的方法, inner交集 outer并集 left完全保留左边 right完全保留右边

sort：根据dataframe合并的keys按字典顺序排序，默认是，如果置false可以提高表现。

suffixes：如果非key列名重复，通过这个参数加后缀

十二、pandas的数据合并concat 、 append 、join语法

1、concat可以给df添加行或列

2、pd.concat([df1,series1…] , axis=0 , join = ‘outer’ , ignore_index = False)

合并方式：inner 或 outer

合并方向：axis =1 或 0

ignore_index :是否忽略掉原来的索引，重新从0开始添加索引

4、df1.append(df2 , ignore_index = False) 只能按行合并，可以是series 可以是list

5、通过类似列表推导式给空series添加元素：

pd.concat(

	[pd.dataframe( [i]) , columns=['A'] ) for  i  in  range (5) ] ,

	ignore_index = True

)

6、df1.join(df2) 可用于df间列方向的拼接操作,默认左列拼接,how=’left’

十三、merge、concat合并方法的区别

1、merge没有join、axis、ignore_index 参数， concat没有on 、how 、suffixes 、sort参数

2、merge只能有左右两个df或series，concat可以有多个df或series放在列表中

3、merge的参数how可以是[ right \ left \ outer \ inner]

4、concat通过join和axis来控制合并方式和方向：join可以是 [outer 或 inner] axis可以是 [ 0 或 1]（index 或 columns）

十四、pandas 拆分、合并excel

1、os.mkdir() 新建文件夹

2、split_dir = f"{ work_dir}/splits" 这里的f是什么意思，还有一种u r ？

3、拆分步骤：通过iloc获取部分数据形成新的小dataframe - 通过to_excel写入新的excel表

4、for index , name in enumerate(user_name ) enumerate枚举的用法？

5、os.listdir(dir) 遍历文件夹下面的子文件夹或文件名？

十五、pandas分组统计groupby

1、df1.groupby([col1,col2] ，as_index = False ).mean() 对df1按col1 col2两列进行两个维度分组，对每个分组求平均值，如果某列不是数字类型，则不会参与求均值

2、as_index:表示是否合并col1

3、df1.groupby([col1,col2] ，as_index = False ).agg( np.sum , np.std , np.mean) 同时进行多个指标计算，类似的还有apply()

4、df1.groupby(‘col1’ ).agg({ ‘C’ : np.sum , ‘B’ : np.std }) 对分组后的C列求和，B列求标准差

5、可以通过for遍历分组后的结果 A 是列名

g = df1.groupby('A')

for  name , group  in g:

	print(name)

	print(group)

g.get_group('name1')  # 获取某个分组，name1是列数据

6、pandas自带plot画图工具，默认是折线图，用法df.plot()

十六、pandas的分层索引multiindex

1、df.groupby([‘col1’,'col2]) 按多个列分组，获得的结果的索引就是多层索引

2、ser.unstack() 把第二层索引编程columns

3、df.set_index([‘col1’,'col2]) 设置分层索引，为col1 col2 两列

4、df.sort_index() 按索引排序，默认升序

5、设置索引后查询效率提高

6、同时查询多层索引： df.loc[ (‘col1’, ‘col2’) ] col1和col2在这里合并在一起作为一个复合索引，col1和col2不是一个列，比如一个是姓名张三，另一个是性别男。元组内的每个值都可以是列表或者单个值

7、同时查询同级索引的多个值： df.loc[ [‘index1’,‘index2’ ] ] 这里的index1和index2是并列的一级索引，比如都是name列的值，张三和李四。这是一个并列筛选

8、slice(none) 表示筛选全部值

十七、pandas的数据转换函数map、apply 、applymap

1、map : 只用于series，实现每个 值 —> 值 的映射

2、apply：用于series时实现每个 值 —> 值 的映射，用于dataframe时实现某个轴（列向或行向）的series的处理

3、applymap：只用于dataframe，用于处理df的每个元素

4、map 可以series.map(dict ) 也可以 series.map(function)

5、apply(function) 用于series时，function接受的参数是series的每个值，

6、df.applymap(lambda x : int(x) ) 把df里面的值都转换成整数

7、函数可以其他参数

十八、pandas怎样对每个分组应用apply函数

1、数据归一化概念，提高机器学习效率

2、df.head(5) df的前5行， df.tail(5) df的后5行

3、遵从split 、 apply 、combain

十九、pandas的stack和pivot实现数据透视

1、注意与crosstab交叉表的区别

2、df[‘datetime’] = pd.to_datetime(df[‘time’] , unit=‘s’) unit时间单位，将time时间戳列格式化成时间格式

3、df[‘datetime’].dt.year 获取事件的年份，month月份,days 日期

4、df_group.unstack() 把分组数据转换成二维透视，便于用来画图，把指定的columns变成索引

5、unstack的逆操作是stack，把最内侧的index变成columns

6、df.pivot( ‘col1’ ,‘col2’, ‘col3’) 对三列建立透视表

7、crosstab交叉表pd.croosstab(data.col1,data.col2).plot.bar() 通过col1,col2两列两个维度进行分别统计，并绘制柱状图

8、交叉表是用于统计分组频率的特殊透视表

二十、pandas对日期进行快速处理

1、将各种日期格式，统一映射成pandas的统一日期格式对象

2、核心方法：pd.to_datetime() 转换后的格式是pandas.timestamp对象

3、df[‘col2’].astype(‘int’) 把col2列的数据转换成 int64 格式

4、df.set_index(pd.to_datetime(df[‘日期’])) 把日期列转换成pandas日期对象，并设置成index索引datetimeindex

5、转换成日期对象的好处：通过loc[ ]索引快速查找，dt.month()等方法快速获取月份、年份、天数

6、通过loc[ ]切片查询时，传入的切片可以是一个时间区间，可以是年份或者月份

7、如果设置成了索引，可以通过 df.index.month 获取索引的月份

8、日期对象的相关属性：

time = pd.Timestamp('now')
# Timestamp('2020-06-09 16:30:54.813664')

time.asm8 # 返回 numpy datetime64格式（以纳秒为单位）。
# numpy.datetime64('2020-06-09T16:30:54.813664000')
time.year # 2020
time.month # 6
time.week # 24 当年第几周
time.day # 9 日
time.hour # 16
time.minute # 46
time.second # 59
time.dayofweek # 1 周几，周一为0
time.dayofyear # 161, 一年的第几天
time.weekofyear # 24 同上
time.quarter # 2 当前季度数
time.days_in_month # 30 当月有多少天
time.daysinmonth # 30 同上
time.is_leap_year # True 是否闰年，公历的
time.is_month_end # False 是否当月最后一天
time.is_month_start # False 是否当月第一天
time.is_quarter_end # False 是否当季最后一天
time.is_quarter_start # False 是否当季第一天
time.is_year_end # 是否当年最后一天
time.is_year_start # 是否当年第一天
# 如指定会返回类似 
time.tz # None 当前时区别名
time.tzinfo # 时区信息
time.value # 1591721219890462000   时间戳纳秒

9、对于时间序列数据，可以使用 s.dt.xxx 的形式来访问它们的属性和调用它们的方法，例如：time.dt.date = time.day

10、日期对象常用的函数：

# 转换为指定时区
time.astimezone('UTC')
# Timestamp('2020-06-09 08:55:58.027896+0000', tz='UTC')

# 转换单位，向上舍入
time.ceil('s') # 转为以秒为单位
# Timestamp('2020-06-09 16:55:59+0800', tz='Asia/Shanghai')
time.ceil('ns') # 转为以纳秒为单位
time.ceil('d') # 保留日
time.ceil('h') # 保留时

# 转换单位, 为向下舍入
time.floor('h') # 保留时
# Timestamp('2020-06-09 17:00:00+0800', tz='Asia/Shanghai')

# 类似四舍五入
time.round('h') # 保留时

# 返回星期名
time.day_name() # 'Tuesday'
# 月份名称
time.month_name() # 'June'

# 将时间戳规范化为午夜，保留时区信息。
time.normalize()
# Timestamp('2020-06-09 00:00:00+0800', tz='Asia/Shanghai')

# 时间元素替换 datetime.replace，可处理纳秒。
time.replace(year=2019) # 年份换为2019年
# Timestamp('2019-06-09 17:14:44.126817+0800', tz='Asia/Shanghai')
time.replace(month=8) # 月份换为8月
# Timestamp('2020-08-09 17:14:44.126817+0800', tz='Asia/Shanghai')

# 转为周期类型，将丢失时区
time.to_period(freq='h') # 周期为小时
# Period('2020-06-09 17:00', 'H')

# 转为指定时区
time.tz_convert('UTC') # 转为 utc 时间
# Timestamp('2020-06-09 09:14:44.126817+0000', tz='UTC')

# 本地化时区转换
time = pd.Timestamp('now')
time.tz_localize('Asia/Shanghai')
# Timestamp('2020-06-09 17:32:47.388726+0800', tz='Asia/Shanghai')
time.tz_localize(None) # 删除时区

二十一、pandas处理日期索引的缺失

方法一

1、df_date = df.set_index( df[‘日期’] ) 把日期列设置成索引，把新的dataframe赋值给df_date

2、把日期转换成日期对象：df_date = df_date.set_index( pd.to_datetime( df_date.index ))

3、创建连续的日期序列：pdates = pd.date_range( start = ‘2020-1-1’ , end = ‘2020-12-31’ ) 创建2020年一整年的日期序列

4、df_date_new = df_date.reindex( pdates , fill_value =0 ) # 设置新的日期索引为pdates序列
方法二

1、df_new= df.set_index( pd.to_datetime( df[‘日期’] )).drop(“日期” , axis = 1) 把dataframe的索引变成日期对象的索引

2、df_new = df_new.resample(‘D’).mean().fillna(0) 按天采样参数可以是Y M D H，按每天的平均值采样，填充空值为0

3、如果是2D，表示两天采样一次

二十二、pandas实现excel的vlookup

1、表1有学号、语文成绩、数学成绩3列，表2有学号、姓名、性别3列。合并到表3有学号、姓名、性别、语文成绩、数学成绩5列。
表1：

表2：

表3：

2、pd.read_excel() 读取成绩信息score_df，学生信息stu_df

3、df_merge = pd.merge(left = score_df , right = stu_df , left_on = ‘学号’, right = ‘学号’)

4、df_merge.columns.to_list() 把合并的df 列名转成list

5、修改df的列顺序？

6、df_merge.to_excel(file_path , index = False) 重新存到excel表

二十三、python读取excel绘制折线图

1、使用pyecharts，安装和引入pyecharts

2、实例化折线图对象：line = Line()

3、添加X轴：line.add_xaxis( df.index.to_list() )

4、添加Y轴：

	line.add_yaxis("开盘价" , df['open'] .round(2).to_list() )   # 第一个折线名称是 开盘价 ，引用的数据是df['open'] 保留两位小数

	line.add_yaxis("收盘价" , df['close'] .round(2).to_list() )   # 第一个折线名称是 收盘价 ，引用的数据是df['close'] 保留两位小数

5、配置图标：

line.set_global_opts(

	title_opts = opts.TitleOpts( title = '百度股票2019年' )，

	tooltip_opts = opts.TooltipOpts(trigger = "axis" , axis_pointer_type = "cross" )

)

6、绘制图像：

line.render_notebook( )

二十四、Pandas结合Sklearn机器学习

案例：泰坦尼生存预测
历史训练数据：

1、输入乘客信息：性别、年龄、是否有父母兄弟、仓位情况、票务信息

2、输出信息：是否存活

3、数据样式：
机器学习模型：

1、输入不知道是否存活的乘客信息

2、输出这个人存活的概率

代码如下：

#!/usr/bin/env python
# coding: utf-8

# ## 步骤1：获取数据

import pandas as pd

df_train = pd.read_csv( "titanic_train.csv" )
df_train

# 挑两列作为是否存活的特征
feature_cols = ['Pclass','Parch']
X = df_train.loc[:,feature_cols]  # 选取特征列的数据
X.head()

# 提取是否存活的列，作为预测的目标
y = df_train.Survived
y.head()

# ## 步骤2：训练模型

from sklearn.linear_model import LogisticRegression
# 创建模型对象
logreg = LogisticRegression()
# 实现模型训练
logreg.fit(X , y)

# ## 步骤3：对于未知数据使用模型

# 找一个历史数据中心不存在的数据
X.drop_duplicates().sort_values(by=['Pclass','Parch'])

# 预测这个数据存活的概率,结果为1表示存活
logreg.predict([[2,4]])
# 存活的概率为0.65021763
logreg.predict_proba([[2,4]])

数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
OpenCV稠密光流法可直接运行的例程（python） indrrra opencv python 人工智能
#dense_optical_flow.pyimportcv2importnumpyasnpimportargparsedefdense_optical_flow(method,video_path,params=[],to_gray=False):#读取视频cap=cv2.VideoCapture(video_path)#读取第一帧ret,old_frame=cap.read()#创建HSV并使
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
php、go、python后端接口签名实现奇华智能后台开发 linux 签名接口安全
1.php实现/**生成签名，$args为请求参数，$key为私钥*/functionmakeSignature($args,$key){if(isset($args['sign'])){$oldSign=$args['sign'];unset($args['sign']);}else{$oldSign='';}ksort($args);$requestString='';foreach($arg
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
python第一次作业
1.技术面试题（1）TCP与UDP的区别是什么？**答：1.TCP是面向连接的协议，而UDP是元连接的协议2.TCP协议传输是可靠的，而UDP协议的传输是“尽力而为3.TCP是可以实现流控，而UDP不行4.TCP可以实现分段，而UDP不行5.TCP的传输速率较慢，占用资源较大，UDP传输速率快，占用资源小。TCP/UDP的应用场景不同TCP适合可靠性高的效率要求低的，UDP可靠性低，效率高。（2）
python www_hhhhhhh python java 面试
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程：是操作系统进行资源分配的基本单位，拥有独立的地址空间、进程控制块，每个进程之间相互隔离。例如，打开一个终端窗口会启动一个bash进程。线程：是操作系统调度的基本单位，隶属于进程，共享进程的资源，但有独立的线程控制块和栈。线程切换开销远小于进程。例如，一个Web服务器的单个进程中，多个线程可同时处理不同客户
Python lambda表达式：匿名函数的适用场景与限制梦幻南瓜 python python 服务器 linux
目录1.Lambda表达式概述1.1Lambda表达式的基本语法1.2简单示例2.Lambda表达式的核心特点2.1匿名性2.2简洁性2.3即时性2.4函数式编程特性3.Lambda表达式的适用场景3.1作为高阶函数的参数3.2简单的数据转换3.3条件筛选3.4GUI编程中的回调函数3.5Pandas数据处理4.Lambda表达式的限制4.1只能包含单个表达式4.2没有语句4.3缺乏文档字符串4.
【python】 www_hhhhhhh python 面试职场和发展
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（传输控制协议）和UDP（用户数据报协议）是两种常见的传输层协议，主要区别在于连接方式和可靠性。TCP是面向连接的协议，传输数据前需建立连接，通过三次握手确保连接可靠，传输过程中有确认、重传和顺序控制机制，保证数据完整、按序到达，适用于网页浏览、文件传输等对可靠性要求高的场景。UDP是无连接的协议，无需建立连接即可发送数据，不保证数据可靠传
Python函数的返回值
1.返回值定义及案例：2.返回值与print的区别：print仅仅是打印在控制台，而return则是将return后面的部分作为返回值作为函数的输出，可以用变量接走，继续使用该返回值做其它事。3.保存函数的返回值如果一个函数return返回了一个数据，那么想要用这个数据，那么就需要保存.#定义函数defadd2num(a,b): returna+b#调用函数，顺便保存函数的返回值result=
python怎么把函数返回值_python函数怎么返回值
python函数使用return语句返回“返回值”，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。python函数使用return语句返回"返回值"，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。一个函数可以存在多条return语句，但只有一条
Python星球日记 - 第8天：函数基础 Code_流苏 Python星球日记 python 函数 def关键字函数参数返回值
引言：上一篇：Python星球日记-第7天：字典与集合名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录一、函数的定义与调用1.什么是函数？2.如何定义函数-`def`关键字3.函数调用方式二、参数与返回值1.函数参数类型2.如何传递参数3.返回值和`return`语句三、局部变量与全局变量1.变量作用域概念2.局部变
华为OD机试2025C卷 - 小明的幸运数 (C++ & Python & JAVA & JS & GO) 无限码力华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
小明的幸运数华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述小明在玩一个游戏，游戏规则如下：在游戏开始前，小明站在坐标轴原点处（坐标值为0）.给定一组指令和一个幸运数，每个指令都是一个整数，小明按照指令前进指定步数或者后退指定步数。前进代表朝坐标轴的正方向走，后退代表朝坐标轴的负方向走。幸运数为一个整数，如果某个
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul