python 实现训练集和测试集的随机划分,划分比例8:2,代码如下所示

import os
import random
import shutil

def getData(dirPath):
    subDirs=os.listdir(dirPath)
    destdir='D:\\20180904test'  #这个文件夹需要提前建好
    for dir in subDirs:
        tempDir=dirpath+'\\'+dir+'\\'
        if not os.path.exists(destdir+'\\'+dir+'\\'):
            os.mkdir(destdir+'\\'+dir+'\\')
        fs=os.listdir(tempDir)
        random.shuffle(fs)
        le=int(len(fs)*0.8)  #这个可以修改划分比例
        for f in fs[le:]:
            shutil.move(tempDir+f,destdir+'\\'+dir+'\\')

getData('D:\\20180904')

上述代码就是训练集和测试集的划分,按照8:2的比例,自己也可以按自己要求修改比例。

你可能感兴趣的:(python数据分析)