Pandas sample()用于从DataFrame中随机选择行和列。
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
参数
它返回与调用者相同类型的新对象, 其中包含从调用者对象中随机采样的n个项目。
例子1:
import pandas as pd
info = pd.DataFrame({'data1': [2, 4, 8, 0], 'data2': [2, 0, 0, 0], 'data3': [10, 2, 1, 8]}, index=['John', 'Parker', 'Smith', 'William'])
info
info['data1'].sample(n=3, random_state=1)
info.sample(frac=0.5, replace=True, random_state=1)
info.sample(n=2, weights='data3', random_state=1)
在此示例中, 我们获取一个csv文件, 并使用示例从DataFrame中提取随机行。
名为aa的csv文件, 其中包含以下数据集:
让我们编写一个代码, 从上述数据集中提取随机行:
# importing pandas package
import pandas as pd
# define data frame from csv file
data = pd.read_csv("aa.csv")
# randomly select one row
row1 = data.sample(n = 1)
# display row
row1
# randomly select another row
row2 = data.sample(n = 2)
# display row
row2
输出
Name Hire Date Salary Leaves Remaining
2 Parker Chapman 02/21/14 45000.0 10
5 Michael Palin 06/28/13 66000.0 8