代码拉取完成,页面将自动刷新
中国知网的某些文献(多为学位论文)仅提供其专有的 CAJ 格式下载,仅能使用知网提供的软件(如 CAJViewer 等)打开,给文献的阅读和管理带来了不便(尤其是在非 Windows 系统上)。
若要将 CAJ 文件转换为 PDF 文件,可以使用 CAJViewer 的打印功能。但这样得到的 PDF 文件的内容为图片,无法进行文字的选择,且原文献的大纲列表也会丢失。本项目希望可以解决上述两问题。
知网下载到的后缀为 caj
的文件内部结构其实分为两类:CAJ 格式和 HN 格式(受考察样本所限可能还有更多)。目前本项目支持 CAJ 格式文件的转换,HN 格式的转换未完善
Python 3.7.9
WxPython 4.1.0
PyPDF2 3.0.1
mupdf 1.21.1.20230112.1504
核心功能引用caj2pdf,并在其基础上将mutool命令行模式改为直接引入mupdf python库
$ pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
$ python run.py
运行程序$ python setup.py py2app
本项目基于 GLWTPL (Good Luck With That Public License) 许可证开源。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。