pandas:ValueError: arrays must all be same length

在将dict转化为dataframe的过程中出现ValueError: arrays must all be same length

错误示例:

d={ 'NUM' : range(3),
    'C' : ['c1','c2','c3'],
    'D' : ['d1','d2','d3','d4'],
    'E' : ['e1','e2','e3'],
    'B' : ['b1','b2','b3']}

def newdf():
    global d
    df = pd.DataFrame(d)
    return df

df=newdf()
df

这是因为使用dataframe(dict) 构建dataframe时,每个key会变成一个column,list-like values会变为行,每个values中的list长度不一致就会出现这个错误。
但,如果,我想换一种方式构建呢,例如所有key作为一个column,所有values作为另一个column,这样list的长度就没必要保持一致了。在构建dataframe时,没有axis参数来指定方向,所以我用了以下方法:

k=list(d.keys())
v=list(d.values())
df=pd.DataFrame(list(zip(k,v)),columns=['k','v'])
df

output:

k   v
0   NUM (0, 1, 2)
1   C   [c1, c2, c3]
2   D   [d1, d2, d3]
3   E   [e1, e2, e3]
4   B   [b1, b2, b3]

你可能感兴趣的:(坑)