Python实现一键翻译英文论文 实现了pdf文档英译汉 pdf格式不变
支持谷歌、必应、有道的免费翻译接口,基于Django、PyMuPDF实现了pdf文档英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档,基本解决复制caj中文论文时的格式问题,简单的满足看论文以及写总结的需求。
目的
省去看英文论文去各个翻译网站对比翻译结果的时间消耗。解决复制中文的caj或者pdf中的文字段落时会出现格式的问题。下载翻译后的pdf以及word不用花钱,收费如翻译狗,有道等。使用必应的英译汉翻译文档。实现
基于django、PyMuPdf、谷歌、有道翻译实现了pdf英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译文档。格式矫正方面基本解决了复制caj或者pdf中文论文时出现的格式问题。问题
word不能实现pdf一样的排版,翻译后的pdf还是存在样式问题(需要考虑的很多,慢慢做优化)。表格无法写入,公示混乱。搜狗,百度翻译接口未实现。有道翻译长句子有问题,建议使用谷歌、必应。环境
开发环境的系统平台为 Windows 10 (64 位),Python 版本为 3.6 (64 位),Django版本为 2.2
atomicwrites==1.3.0attrs==19.1.0certifi==2019.3.9chardet==3.0.4colorama==0.4.1Django==2.2.1docx==0.2.4idna==2.8Js2Py==0.63lxml==4.3.3more-itertools==7.0.0pdfminer3k==1.3.1Pillow==6.0.0pluggy==0.11.0ply==3.11py==1.8.0PyExecJS==1.5.1pyjsparser==2.7.1PyMuPDF==1.14.13PyPDF2==1.26.0pytest==4.5.0python-docx==0.8.10pytz==2019.1requests==2.21.0six==1.12.0sqlparse==0.3.0tzlocal==1.5.1urllib3==1.24.3wcwidth==0.1.7展示
参考文档
PyMuPDF参考文档
只使用pdf翻译
如果只是想要拿来翻译论文的同学看这里
下载该项目后记得将文件夹名由Easy-Trans-master改为EasyTrans。将要翻译的文件放到input_file这个目录中,将56行的代码最后的pdf名字修改为要翻译的pdf名字。运行trans_file.py等代码执行结束,翻译后的文档就在output_file这个目录下面。这里采用的是必应翻译,也可以自己修改为其它自己想用的翻译方式,也可以修改目录,方便自己运行翻译就可以了。如果有好的改进pdf翻译效果的建议或者问题联系qcs@stu.ouc.edu.cn。在本地运行项目
1.克隆项目到本地(不使用git工具的话,直接下载就ok)
打开命令行,进入到保存项目的文件夹,输入如下命令:
https://github.com/QPromise/Easy-Trans.git
2.创建并激活虚拟环境(不使用可以跳过这里)
强烈推荐在 Virtualenv 下进行 Django 的开发。Virtualenv 是一个 Python 工具,使用它可以创建一个独立的 Python 环境。
在命令行进入到保存虚拟环境的文件夹,输入如下命令创建并激活虚拟环境:
C:WINDOWSsystem32>pip install virtualenv
C:WINDOWSsystem32>virtualenv C:UsersEnvsEasyTrans_env
C:WINDOWSsystem32>C:UsersEnvsEasyTrans_envScriptsactivate
(EasyTrans_env) C:WINDOWSsystem32>
3.安装项目依赖
如果使用了虚拟环境,确保激活并进入了虚拟环境,在命令行进入项目所在的 Easy-Trans 文件夹,运行如下命令:
pip install -r requirements.txt
4.数据库迁移
命令行输入
python manage.py makemigrations
python manage.py migrate
5.创建后台管理员用户
命令行输入
python manage.py createsuperuser
6.运行开发服务器
命令行输入
python manage.py runserver
在浏览器输入:127.0.0.100 就可以看到主页了。
注意
fitz这个包是PyMuPDF的,只要安装PyMuPDF就可以正常导入了。