代码拉取完成,页面将自动刷新
import os
import shutil
import random
import time
import sys
import tensorflow.gfile as gfile
from captcha.image import ImageCaptcha
# 用于生成验证码的字符集
CHAR_SET = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
# 字符集的长度
CHAR_SET_LEN = 10
# 验证码的长度,每个验证码由4个数字组成
CAPTCHA_LEN = 4
# 验证码图片的存放路径
CAPTCHA_IMAGE_PATH = './images/'
# 用于模型测试的验证码图片的存放路径,它里面的验证码图片作为测试集
TEST_IMAGE_PATH = './test/'
# 用于模型测试的验证码图片的存放路径,它里面的验证码图片作为测试集
VALIDATION_IMAGE_PATH = './validation/'
# 用于模型测试的验证码图片的个数,从生成的验证码图片中取出来放入测试集中
TEST_IMAGE_NUMBER = 2000
# 用于模型测试的验证码图片的个数,从生成的验证码图片中取出来放入验证集中
VALIDATION_IMAGE_NUMBER = 2000
# 生成验证码图片,4位的十进制数字可以有10000种验证码
def generate_captcha_image(charSet=CHAR_SET, charSetLen=CHAR_SET_LEN, captchaImgPath=CAPTCHA_IMAGE_PATH):
k = 0
total = 1
for i in range(CAPTCHA_LEN):
total *= charSetLen
for i in range(charSetLen):
for j in range(charSetLen):
for m in range(charSetLen):
for n in range(charSetLen):
captcha_text = charSet[i] + charSet[j] + charSet[m] + charSet[n]
image = ImageCaptcha()
image.write(captcha_text, captchaImgPath + captcha_text + '.jpg')
k += 1
sys.stdout.write("\rCreating %d/%d" % (k, total))
sys.stdout.flush()
#从验证码的图片集中取出一部分作为测试集,这些图片不参加训练,只用于模型的测试
def prepare_test_set():
fileNameList = []
for filePath in os.listdir(CAPTCHA_IMAGE_PATH):
captcha_name = filePath.split('/')[-1]
fileNameList.append(captcha_name)
random.seed(time.time())
random.shuffle(fileNameList)
for i in range(TEST_IMAGE_NUMBER):
name = fileNameList[i]
shutil.move(CAPTCHA_IMAGE_PATH + name, TEST_IMAGE_PATH + name)
def prepare_validation_set():
fileNameList = []
for filePath in os.listdir(CAPTCHA_IMAGE_PATH):
captcha_name = filePath.split('/')[-1]
fileNameList.append(captcha_name)
random.seed(time.time())
random.shuffle(fileNameList)
for i in range(VALIDATION_IMAGE_NUMBER):
name = fileNameList[i]
shutil.move(CAPTCHA_IMAGE_PATH + name, VALIDATION_IMAGE_PATH + name)
if __name__ == '__main__':
# 生成训练集目录
if not gfile.Exists(CAPTCHA_IMAGE_PATH):
gfile.MakeDirs(CAPTCHA_IMAGE_PATH)
# 生成测试集目录
if not gfile.Exists(TEST_IMAGE_PATH):
gfile.MakeDirs(TEST_IMAGE_PATH)
# 生成验证集目录
if not gfile.Exists(VALIDATION_IMAGE_PATH):
gfile.MakeDirs(VALIDATION_IMAGE_PATH)
# 生成数据集
generate_captcha_image(CHAR_SET, CHAR_SET_LEN, CAPTCHA_IMAGE_PATH)
# 将数据集分为测试集
prepare_test_set()
# 将数据集分为验证集,执行完上方方法后,再独立执行此方法
# prepare_validation_set()
sys.stdout.write("\nFinished")
sys.stdout.flush()
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。