Pandas

九、


八、统计某一属性相同值出现次数

比如要统计’label’这一列各个值出现的次数, 使用df_train.loc[:,'label'].value_counts()即可

df["author"].value_counts()

七、遍历

1.value_count

for i,v in voiceUuid_value_count.items():

2.



六、筛选、删除特定行、列

https://www.cnblogs.com/cocowool/p/8421997.html

删除具体列 df.drop('成交数量',axis=1)

删除具体行 df.drop('2018-2-3')

删除特定数值的行(删除成交金额小于10000) df[ df['成交金额'] > 10000]

删除某列包含特殊字符的行  df[ ~ df['证券名称'].str.contains('联通') ]

如果想取包含某些字符的记录,可以去掉~ df[ df['证券名称'].str.contains('联通') ]

https://blog.csdn.net/songyunli1111/article/details/79306639

按标签来删除列 df.drop(['B','C'],axis=1,inplace=True)

按序号来删除列 x = [1,2]  df.drop(df.columns[x],axis=1,inplace=True)

按序号来删除行 df.drop([0,1],inplace=True)        #默认axis=0


五、Pandas合并 去重

hotelDataDf = pandas.concat([hotelDataDf08,hotelDataDf09,hotelDataDf10])

cHotelDataDf = hotelDataDf.drop_duplicates()


四、Pandas查询最大值

行最大值

https://codeday.me/bug/20171209/105857.html


列最大值

https://blog.csdn.net/ssswill/article/details/85260320


三、DataFrame 保存为文件


https://blog.csdn.net/tz_zs/article/details/81137998

read_csv = pd.read_csv("read_data.csv")


二、创建Pandas


二、行数

获得Pandas数据的行数

dataFrame -> len(data.index)

series_movie_akDf = cMovieDataDf['ak'].value_counts()




一、行、列

1.pandas取dataframe特定行/列

https://www.cnblogs.com/nxf-rabbit75/p/10105271.html

按条件取行

选取等于某些值的行记录 用 ==

df.loc[df[‘column_name’] == some_value]

条件选取1

fData31700056 = cMapDataDf[cMapDataDf.event_id.str.contains('31700056',na=False)]

条件选取2

time_df_100 = time_df[time_df.minute<100]

2.行、列互换

你可能感兴趣的:(Pandas)