1.创建50×7的DataFrame对象,数据为 [10,99]之间的随机整数;columns为字符a-g;将DataFrame对象保存到csv文件中。
【提示】使用NumPy的随机生成函数randint()生成数据。
#第1题
import numpy as np
from pandas import DataFrame
df = DataFrame(np.random.randint(10,100,size = (50,7)),columns = ['a','b','c','d','e','f','g'])
df.to_csv('1.csv',mode = 'w',header = True,index = False)
2. 海伦一直使用在线交友网站寻找适合的约会对象, 她将交友数据存放在datingTestSet.xls文件中。
1)从文件中读取有效数据保存到Dataframe对象中,跳过所有文字解释行;
2)列索引名设为 ['flymiles','videogame','icecream','type’];
3)显示读取到的前面5条数据;
4)显示所有'type'为'largeDoses‘的数据;
本书中所有的数据文件保存在data文件夹中,链接如下:
https://pan.baidu.com/s/1Tu__B-YfXDz_yXzbzNKB4A?pwd=sfw2
提取码:sfw2
#第二题
import pandas as pd
#1,2)
frienddata = pd.read_csv('data\datingTestSet.csv',header = None,names = ['flymiles','videogame','icecream','type'],
skiprows = 2) #此处为names定义列索引
#3)
print(frienddata[:5])
#4)
print(frienddata[frienddata['type'] =='largeDoses']) #或者frienddata.loc[frienddata['type'] =='largeDoses',: ]