valueError: Length mismatch: Expected axis has 40 elements, new values have 38 elements

背景

我拿原来的模型准备跑一个新数据集,当然列就会不同
新数据集没有head,我就自己傻乎乎一个一个数的列数(应该是数错了 我原来数的38其实是40)
就报了valueError: Length mismatch: Expected axis has 40 elements, new values have 38 elements错误

解决思路

本人英语差所以谷歌翻译了一下这句话啥意思
valueError:长度不匹配:预期轴有 40 个元素,新值有 38 个元素

也就是说我数错了
为了证实那肯定要输出.shape结果是(100000,40)行吧那我就认了 改吧就

数据处理解析

在拿到数据集最好先shape一下,看看到底多少行多少列

train_df=pd.read_csv('data/train_small.txt',header=None,sep='\t')
print(train_df.shape)

得出(10000,40)

对于没有head的数据集,需要给他定义一个头名

train_df.columns=['click']+['f'+str(i) for i in range(39)]
features=['f'+str(i) for i in range(39)]

就是这么简单

我哦这个写39是因为我前面那个是目标靶值 有个这个

错误原因

主要怪自己数数不会数
人家明确说了有40列 那你就别犟只有38列了 改就完事了 小错误 很简单 get

你可能感兴趣的:(错题集,python)