加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
pdfminertest.py 623 Bytes
一键复制 编辑 原始数据 按行查看 历史
又系新一天 提交于 2016-12-14 23:14 . pdf doc文件操作
from cStringIO import StringIO
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from pdfminer.pdfpage import PDFPage
rsrcmgr = PDFResourceManager()
retstr = StringIO()
device = TextConverter(rsrcmgr, retstr, codec='utf-8', laparams=LAParams())
interpreter = PDFPageInterpreter(rsrcmgr, device)
with open("21.pdf", 'rb') as fp:
for page in PDFPage.get_pages(fp, set()):
interpreter.process_page(page)
line_list=retstr.getvalue().splitlines()
device.close()
retstr.close()
print line_list[2]
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化