直接举个栗子:
np.random.randint(low=10, high=900, size=200)
生成一组介于 [10,900) 之间的200个随机数字
应用:
ratings = all_ratings[all_ratings['UserID'].
isin(np.random.randint(low=10, high=900, size=200))]
先用np.random下的randint函数生成一组随机数列表,然后作为索引参数传给isin() 进行切片(得到bool类型列表) 再让dataframe类型的变量all_ratings通过bool类型列表,筛选出对应的随机数据行
目的是缩小样本空间,随机测试
这里使用的前提是 UserID列是integer整型,如果是其它类型,得用其它随机函数(可参考链接)
可参考: 大佬写的比较完整
但要注意参数格式部分有误,例如np.random.randint(low[, high, size])
眼熟不?嘿嘿,自己调试一下就能用啦