0、引言
dataframe是pandas的数据类型;
ndarray是numpy的数据类型;
list和dict是python的数据类型;
series是pandas的一种数据类型,Series是一个定长的,有序的字典,因为它把索引和值映射起来了。
通过以下例子,可以更加清楚它们的数据表示。
1、list to others
# list
data = [[2000, 'Ohino', 1.5],
[2001, 'Ohino', 1.7],
[2002, 'Ohino', 3.6],
[2001, 'Nevada', 2.4],
[2002, 'Nevada', 2.9]] # type(data) 为 list
# list to series
ser = Series(data, index = ['one', 'two', 'three', 'four', 'five'])
# list to dataframe
df = DataFrame(data, index = ['one', 'two', 'three', 'four', 'five'], columns = ['year', 'state', 'pop'])
# list to array
ndarray = np.array(data)
2、ndarray to other
# array to dataframe
pd = DataFrame(ndarray, index = ['one', 'two', 'three', 'four', 'five'], columns = ['year', 'state', 'pop'])
或者,如果需要ndarray to list ,可以
dataArr=np.array([])
list1=[]
indexList=range(len(dataArr))
random.shuffle(indexList)#random_data
for i in range(dataArr):
list1.append(dataArr[indexList[j]])
通过索引和扩展来实现把ndarray 转换成 list 。
参考:
Yam_ List, Dict, Array, Series, DataFrame 相互转换