代码拉取完成,页面将自动刷新
# -*- coding: UTF-8 -*-
"""
用来进行数据集分割,我一开始把数据集都放到了chicken/train目录下,
然后分成了两个部分,一个是训练集,一个是测试集,将训练集放到了chicken/test目录下,
训练集大小为0.7,测试集大小为0.3
@Author: mpj
@Date : 2022/2/16 15:11
@version V1.0
"""
import os
import shutil
import random
trainPath = './caltech_101_images/train'
testPath = './caltech_101_images/test'
testRage = 0.3
dirList = os.listdir(trainPath)
for dirName in dirList:
if os.path.isdir(trainPath + "/" + dirName):
os.mkdir(testPath + "/" + dirName)
fileList = os.listdir(trainPath + '/' + dirName)
fileNum = len(fileList)
testNum = int(fileNum * testRage)
for i in range(testNum):
randomIndex = random.randint(0, fileNum - 1)
fileName = fileList[randomIndex]
# 已经准备移动这个文件,就从fileList中删除这个文件,文件数量减一,防止重复移动
del fileList[randomIndex]
fileNum -= 1
shutil.move(trainPath + '/' + dirName + '/' + fileName, testPath + '/' + dirName + '/' + fileName)
print(dirName + ": " + str(fileNum) + " -> " + str(testNum))
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。