E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pd.DataFrame
机器学习特征工程:处理缺失值填充的5大技巧
填充具体数值,通常是0填充某个统计值,比如均值、中位数、众数等填充前后项的值基于SimpleImputer类的填充基于KNN算法的填充数据importpandasaspdimportnumpyasnpdf=
pd.DataFrame
Python数据挖掘
·
2023-10-28 17:23
机器学习
机器学习
python
pandas
Pandas 7.合并 merge
合并merge%concatenating比merge简单的dataframe合并%merge可以实现索引以及key的对照的合并importpandasaspdimportnumpyasnpleft=
pd.DataFrame
bokli_dw
·
2023-10-28 10:55
Pandas - DataFrame 基本操作
的增删改查将变得非常轻松~首先,我们来构造一个DataFrame:data=[[1,2,3],[4,5,6],[7,8,9]]index=['a','b','c']columns=['A','B','C']df=
pd.DataFrame
山药鱼儿
·
2023-10-27 22:24
python 使用pandas读取arff
fromscipy.ioimportarffimportpandasaspddata=arff.loadarff('yeast-train.arff')df=
pd.DataFrame
(data[0])
lessjianshu
·
2023-10-26 06:52
机器学习类比赛中经常用到的一些函数和知识点
控制台打印结果省略的问题enumerate()pandas描述数据基本分布情况isin():判断值是否存在某两个特征之间的关联性:np.corrcoeffor循环缩写计算每一个特征和标签之间的相关程度
pd.DataFrame
安替-AnTi
·
2023-10-24 15:07
机器学习
数据挖掘
python
机器学习
python中axis=0和axis=1的理解
importpandasaspddf_1=
pd.DataFrame
([[1,1,
徕胖
·
2023-10-23 02:25
python
python中关于axis=0和axis=1应该如何理解?
importpandasaspddata=
pd.DataFrame
(data=[['吴文化','男',100,98,85],['史珍香','女',66,75,72],['范建','男',77,88,100
永不落后于人
·
2023-10-23 02:54
python
python
Python中axis=0与axis=1,指的方向有什么不同?
以下面的数据框为例:importpandasaspddf=
pd.DataFrame
({'A':[1,2,3],'B':[4,5,6],'C'
火柴先生
·
2023-10-23 02:52
Python学习之路
python
pandas
Python数据分析实战-使用replace方法模糊匹配替换某列的值(附源码和实现效果)
importpandasaspdimportre#创建一个示例DataFramedata={'A':['apple','banana','pineapple','orange','grape']}df=
pd.DataFrame
数据杂坛
·
2023-10-21 18:13
数据分析
python
数据分析
Python数据分析实战-使用map方法根据字典中的映射关系替换某列的值(附源码和实现效果)
方法根据字典中的映射关系替换某列的值实现代码importpandasaspd#创建一个示例DataFramedata={'A':[1,2,3,4,5],'B':['a','b','c','d','e']}df=
pd.DataFrame
数据杂坛
·
2023-10-21 18:43
数据分析
python
数据分析
开发语言
Python数据分析实战-使用replace方法精确匹配替换某列的值(附源码和实现效果)
0和1,而将其他值替换为2实现代码importpandasaspd#创建一个示例DataFramedata={'A':[1,2,3,4,5],'B':['a','b','c','d','e']}df=
pd.DataFrame
数据杂坛
·
2023-10-21 18:43
数据分析
数据分析
python
pandas
sklearn文本特征预处理2:Similarity, 聚类, LDA, word2vec
fromsklearn.metrics.pairwiseimportcosine_similaritysimilarity_matrix=cosine_similarity(tv_matrix)similarity_df=
pd.DataFrame
弎见
·
2023-10-21 11:44
#
sklearn数据预处理
sklearn
Similarity
聚类
LDA
word2vec
6.pandas排序
#--引入数据importpandasaspdimportnumpyasnpdf=
pd.DataFrame
(data=np.random.rand(30).reshape((6,5)),columns=
B0ZZ
·
2023-10-20 07:47
Pandas常用操作方法
本文总结自己经常使用的pandas操作方法:importpandasaspdimportnumpyasnp1、创建DataFrame数据方式1:通过字典直接创建df1=
pd.DataFrame
({"name
飞向天空的鹰
·
2023-10-20 05:59
python学习
数据分析
2023年第二届全国大学生数据统计与分析竞赛——电影评分的大数据分析
出现次数最多的国家前5名是哪些国家最受欢迎的电影类型lst=[]foriindf1['电影类型'].apply(lambdax:x.split('/')):forjini:lst.append(j)
pd.DataFrame
菜鸡小都林
·
2023-10-20 01:10
数据分析
matplotlib
pandas追加写入数据
coding:utf-8-*-#@Author:markadcimportpandasaspditems=[{'uid':i,'name':'a_{}'.format(i)}foriinrange(3)]df=
pd.DataFrame
是大嘟嘟呀
·
2023-10-20 00:36
pandas
pandas
python
开发语言
python tqdm记录dataframe使用iterrows或iteritems循环行或循环列时的进度
dataframe.shape[0])即可示例代码importpandasaspdimportnumpyasnpfromtqdmimporttqdmimporttimeif__name__=='__main__':df=
pd.DataFrame
呆萌的代Ma
·
2023-10-19 10:28
python
python
还原填充错误的缺失数据
还原填充错误的缺失数据手动方法map()函数映射自动方法for循环+replace()替换说明手动方法map()函数映射map(func)importpandasaspdimportnumpyasnp##-------df=
pd.DataFrame
小王做笔记
·
2023-10-18 04:42
数据科学项目实战学习
数据分析
python
机器学习
插值法补齐缺失数据_数据处理——缺失值处理
importpandasaspddf=
pd.DataFrame
({'一班':[90,80,66,75,99,55,76,78,98,None,90],'二班':[75,98,100,None,77,45
weixin_39782752
·
2023-10-18 04:42
插值法补齐缺失数据
python数据读写 panda(to_csv和read_csv)【读取dat文件】【写入dat文件】【非csv文件并且有多列数据时】【np多维数据的快速保存】
panda(to_csv和read_csv)importnumpyasnpimportpandasaspda=np.array([1,2,3,4])b=np.array([3,4,5,6])df=
pd.DataFrame
king没有人
·
2023-10-17 21:44
笔记
python
23/8/27刷题记录
1.pandas数据分组1741.查找每个员工花费的总时间【简单】在这段代码中,注意分组函数groupby的运用deftotal_time(employees:
pd.DataFrame
)->
pd.DataFrame
花花橙子
·
2023-10-17 16:27
算法刷题记录
python
力扣
004 Pandas 的DataFrame操作技巧
1基于行索引,删除特定行a=
pd.DataFrame
({1:[1,2,3],2:[4,5,6]})print(a)>>>12>>>014>>>125&
Jame_Y
·
2023-10-16 18:33
python:pandas之DataFrame创建
1、方案一:importpandasaspdimportnumpyasnpt=
pd.DataFrame
(np.arange(12).reshape((3,4)))#不指定列索引和行索引#t为一个二维数组
书生_Scholar
·
2023-10-15 23:19
python3 value counts函数_pandas计数 value_counts()的使用
importpandasaspddf=
pd.DataFrame
({'区域':['西安','太原','西安','太原','郑州','太原'],'10月份销售':['0.477468','0.195046'
头像收藏家
·
2023-10-15 16:17
python3
value
counts函数
python数据分析-对数据进行计数value_counts()
importpandasaspddata=
pd.DataFrame
(columns=['id','sex'],data=[[1,'男'],[2,'女'],[3,'男'],[4,'男']])data['
刘经纬老师
·
2023-10-15 16:14
数据分析
数据挖掘
python
按DataFrame中的一列分组后进行统计df.groupby()
importpandasaspddf=
pd.DataFrame
({'A':['a','a','b'],'B':[1,2,2]})print(df)print("==========="
刘经纬老师
·
2023-10-13 16:14
数据分析
pandas
数据挖掘
pandas对每个分组分别统计百分比
pandas对每个分组分别统计百分比数据如下:importnumpyasnpimportpandasaspdnp.random.seed(0)df=
pd.DataFrame
({'state':['CA'
景韦
·
2023-10-13 16:42
python
技巧
数据分析
numpy基本操作(持续更新)
In[1]:importnumpyasnpIn[2]:importpandasaspdIn[3]:df=
pd.DataFrame
({'a':[1,2,3],'b':[3,6,8]})In[4]:array
Hooddi
·
2023-10-13 00:07
学习Python处理Excel 难度0级别 多表合并、多条件筛选、找出重复项、去重
假设会员姓名不存在重名;否则找重复项的时候,要增加查找的列名importosimportpandasaspd#多表合并inputdir=r’C:\Users\HW\Desktop\新建文件夹’df_empty=
pd.DataFrame
萌侠侠
·
2023-10-12 11:22
pandas
python
[PDPTW]解读Python调用Gurobi求解PDPTW问题(Li & Lim‘s benchmark)之一
Gurobi求解PDPTW问题(Li&Lim’sbenchmark》下一篇:《【PDPTW】python调用guribo求解PDPTW问题(Li&Lim‘sbenchmark)之二》1.构造图片中的数据t2=
pd.DataFrame
panbaoran913
·
2023-10-11 19:39
车辆路径规划问题
python
人工智能
guribi
VRPTW
【Python基础-Pandas】解决Pandas会自动把None转成NaN的问题
power020.01Nonedf=
pd.DataFrame
(data={'power':[20,None]})df['energy']=df.apply(lambdacol:De
天`南
·
2023-10-11 12:31
Python
#Pandas
python
pandas
开发语言
数据可视化
pipinstallmatplotlib一、各种图#线形图importnumpyasnpimportpandasaspddf1=
pd.DataFrame
(data=np.random.randn(1000,4
凹凸曼说我是怪兽y
·
2023-10-10 21:19
Python
信息可视化
pandas库之汇总和计算描述统计
看一个简单的DataFrame:In[230]:df=
pd.DataFrame
([[1.4,np.nan],[7.1,-4.5],.....:[
samoyer
·
2023-10-10 17:12
30 天 Pandas 挑战
Day01:大的国家->df[condition]importpandasaspddefbig_countries(world:
pd.DataFrame
)->
pd.DataFrame
:condition
ciky2011
·
2023-10-10 00:46
Python
#
Pandas
python
pandas
dataframe,根据多列信息生成新列
={'year':['2018','2018','2018','2019','2019'],'math':[23,99,90,30,10],'compute':[78,62,90,66,88]}df=
pd.DataFrame
网球小伙子
·
2023-10-09 18:01
pandas
pandas
python
机器学习
python 实现excel功能_用Python实现Excel中常用的 20个操作方法总结分享
函数生成随机数,并手动拉取指定范围Pandas在Pandas中可以结合NumPy生成由指定随机数(均匀分布、正态分布等)生成的矩阵,例如同样生成10*2的0—1均匀分布随机数矩阵为,使用一行代码即可:
pd.DataFrame
weixin_39849070
·
2023-10-08 02:47
python
实现excel功能
【pandas笔记】删除DataFrame中特定所在的行或列
1.删除空行>>>data=
pd.DataFrame
([[1.0,2.2,-999.0],[1.2,2.1,3.4],[1.2,2.1,4.4],[1.2,-999.0,3.4],[1.2,np.NaN
tianyunzqs
·
2023-10-07 14:46
2021-12-20Pandas:Datafram
方法1:直接生成Dataframdf=
pd.DataFrame
(
hydro
·
2023-10-07 09:53
Python Pandas数据处理作图——霍尔效应
19.92,39.73,59.63,79.64,99.01,118.43,138.10,157.91,177.61],'Is':[0.50,1.00,1.50,2.00,2.50,3.00,3.50,4.00,4.50]}df=
pd.DataFrame
timberman666
·
2023-10-06 19:50
python
pandas
数据分析
学习
娱乐
16.Pandas实现groupBy分组统计
先对数据分组,然后在每个分组上应用聚合函数,转换函数本次演示分组使用聚合函数做数据统计遍历groupby的结果理解执行流程实例分组探索天气数据importpandasaspdimportnumpyasnpdf=
pd.DataFrame
CSDN专家-微编程
·
2023-10-06 11:58
Pandas专栏
pandas
python
数据分析
python笔记:pandas/geopandas DataFrame逐行遍历
可以使用几种不同的方法来遍历DataFrame的每一行0数据importpandasaspddata={'column1':range(1,1001),'column2':range(1001,2001)}df=
pd.DataFrame
UQI-LIUWJ
·
2023-10-06 01:48
python库整理
python
笔记
pandas
pandas计算含缺失值中列平均值_详解Python数据分析--Pandas知识点
pandas过程中用到的函数和方法,在此记录,防止遗忘1.重复值的处理利用drop_duplicates()函数删除数据表中重复多余的记录,比如删除重复多余的ID.importpandasaspddf=
pd.DataFrame
weixin_39537680
·
2023-10-05 15:17
机器学习第二课_数据预处理
数值型特征分箱(数据离散化)2.1无监督分箱法等距分箱importpandasaspddf=
pd.DataFrame
([[22,1],[13,1],[33,1],[52,0],[16,0],[42,1]
素心似锦
·
2023-10-05 15:38
【项目开发日志记录】-J项目-V2-已完成
写入顺序即为自身设置的顺序form_header=['职位名称','职级','职位族']数据=
pd.DataFrame
({'职位名称':job_name_list,'职级':job_level_list
布衣夜行人
·
2023-10-05 08:17
数据科学和人工智能技术笔记 六、日期时间预处理
六、日期时间预处理作者:ChrisAlbon译者:飞龙协议:CCBY-NC-SA4.0把日期和时间拆成多个特征#加载库importpandasaspd#创建数据帧df=
pd.DataFrame
()#创建五个日期
布客飞龙
·
2023-10-05 08:56
pandas apply 总结(待续)
在说明之前非常有必要要说明axis的定义问题df=
pd.DataFrame
({'a':[1,4],'b':[2,5],'c':[3,6]})indexabc11232456再提前要说明下apply的运行机制
xiao_dong_zi
·
2023-10-04 00:03
pandas简单的使用
对于要指定索引和属性的数据,需要传入对应参数:df=
pd.DataFrame
(data,index=indexs,columns=list("ABCD"))当简单做测试的时候,可以用字典进行生成对象:data
A黄橙橙
·
2023-10-03 18:47
12.数据透视
index,重塑的索引;columns,重塑的列名;values,生成新列的值;1.stack&unstackimportnumpyasnpimportpandasaspddata=
pd.DataFrame
B0ZZ
·
2023-10-03 03:15
Pandas小白入门散记(3)---Series.str--源代码定位问题
如下代码:importpandasaspddf=
pd.DataFrame
([1,2,
mantoureganmian
·
2023-10-02 05:23
pandas
DataFrame插入多列PerformanceWarning: DataFrame is highly fragmented.
DataFrame插入多列PerformanceWarning:DataFrameishighlyfragmented.dataframe列比较多,增加列的代码如下:df=
pd.DataFrame
()foriinrange
六月闻君
·
2023-10-01 08:30
pandas
Python
python
pandas
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他