pandas中的.astype()使用规范问题——以.astype(int)的一种str类型数据转int类型数据报错为例

# 导入pandas,并使用"pd"作为该模块的简写
import pandas as pd

# 使用read_csv()函数,获取文件"/Users/count/住户信息.csv",并赋值给data
data = pd.read_csv("/Users/count/住户信息.csv")

# TODO 使用astype()函数,将data["身份证号"]转换为str类型
data["身份证号"] = data["身份证号"].astype(str)

# 创建储存性别的空列表gender
gender = []

# TODO 使用for循环遍历data["身份证号"]
for ID in data["身份证号"]:
    
    # TODO 将身份证号的第13位([12])转换为int,并赋值给num
        num = ID[12].astype(int)

    # TODO 如果num是奇数
        if num%2 == 1:

        # TODO 在gender列表中添加"男"
            gender.append("男")

    # TODO 如果num是偶数
        else:
           
    

        # TODO 在gender数组中添加"女"
             gender.append("女")

# TODO 将gender赋值给data["性别"]
data["性别"] = gender

# TODO 使用print()输出data
print(data)

报错信息:

File "/code/code.py", line 18
    num = ID[12].astype(int)
      ^
SyntaxError: invalid syntax

 我们追溯到报错所在的代码:

num = ID[12].astype(int)

 这句代码之所以出错,是因为ID[12]是单独的一个str对象,而不是SeriesDataFrame对象,因此出现报错。正确的代码应为:

num = int(ID[12])
总结:`.astype()`只能作用于`Series`或`DataFrame`对象,而对于单独的一个数据所构成的对象使用会报错!

你可能感兴趣的:(pandas,Python代码bug分析,pandas,python)