Python中和Pandas中数据类型对应关系如下:
- 果数据是纯净的数据,可以转化为数字
- astype基本也就是两种用作,数字转化为单纯字符串,单纯数字的字符串转化为数字,含有其他的非数字的字符串是不能通过astype进行转化的。
- 需要引入其他的方法进行转化,也就有了下面的自定义函数方法
astype()是最常见也是最通用的数据类型转换方法
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) res = df.dtypes df.Q1.astype('int32').dtypes # dtype('int32') df.astype({'Q1':'int32','Q2':'int32'}).dtypes
结果展示
df
res
扩展
# 以下是一些使用示例: df.index.astype('int64') # 索引类型转换 df.astype('int32') # 所有数据转换为int32 df.astype({'col1':'int32'}) # 指定字段转指定类型 s.astype('int64') s.astype('int64',copy = False) # 不与原数据关联 df['name'].astype('object') data['Q4'].astype('float') s.astype('datatime64[ns]') # 转为时间类型 data['状态'].astype('bool')
数据类型
df.dtypes会返回每个字段的数据类型及DataFrame整体的类型
如果是Series,需要用s.dtype
import pandas as pd df = pd.DataFrame([['liver','E',89,21,24,64], ['Arry','C',36,37,37,57], ['Ack','A',57,60,18,84], ['Eorge','C',93,96,71,78], ['Oah','D',65,49,61,86] ], columns = ['name','team','Q1','Q2','Q3','Q4']) df.dtypes s = pd.Series(['One','Two','Three']) s.dtype
结果展示
df
s
当数据的格式不具备转换为目标类型的条件时,需要先对数据进行处理
例如“89.3%”是一个字符串,要转换为数字,要先去掉百分号:
# 将"89.3%"这样的文本转为浮点数 data.rate.apply(lambda x:x.replace('%','')).astype('float')/100
加载数据时可以指定数据各列的类型:
import pandas as pd # 对所有字段指定统一类型 df = pd.DataFrame(data, dtype = 'float32') # 对每个字段分别指定 df = pd.read_excel(data, dtype = {'team':'string','Q1':'int32'})
到此这篇关于Pandas 类型转换astype()的实现的文章就介绍到这了,更多相关Pandas 类型转换astype()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!