代码拉取完成,页面将自动刷新
import os,shutil
from PIL import Image
import pytesseract.pytesseract as pytesseract
def traverse(path):
# 一个生成器, 列出path下的所有png文件的文件名。(备用)
for root,_dirs,_files in os.walk(os.path.realpath(path)):
for name in _files:
if not name.lower().endswith(".png"):continue
yield os.path.join(root, name)
# 指定 Tesseract 可执行文件的路径(如果不是在 PATH 中)
home=os.path.split(__file__)[0]
pytesseract.tesseract_cmd = os.path.join(home,"tesseract","tesseract.exe")
i=0
while True:
file="%d.png"%i
if not os.path.isfile(file):
print("%s 不存在,已终止处理"%file)
break
print("处理:",file)
# 打开图像文件
image = Image.open(file).convert("1")
# 进行文字识别
custom_config = r'--oem 3 -l chi_tra'
text = pytesseract.image_to_string(image,
config=custom_config)
with open("%d.txt"%i,"w",encoding="utf-8") as f:
f.write(text)
i+=1
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。