Python实现⼀键翻译英⽂论⽂,实现了pdf⽂档英译汉,pdf格式不变
⽀持⾕歌、必应、有道的免费翻译接⼝,基于Django、PyMuPDF实现了pdf⽂档英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译⽂档,基本解决复制caj中⽂论⽂时的格式问题,简单的满⾜看论⽂以及写总结的需求。
⽬的
省去看英⽂论⽂去各个翻译⽹站对⽐翻译结果的时间消耗。
解决复制中⽂的caj或者pdf中的⽂字段落时会出现格式的问题。
下载翻译后的pdf以及word不⽤花钱,收费如翻译狗,有道等。
使⽤必应的英译汉翻译⽂档。
实现
基于django、PyMuPdf、⾕歌、有道翻译实现了pdf英译汉的功能,翻译后的pdf格式基本保持不变,可以下载docx和pdf格式的翻译⽂档。
格式矫正⽅⾯基本解决了复制caj或者pdf中⽂论⽂时出现的格式问题。最后,如果你的时间不是很紧张,并且⼜想快速的提⾼,最重要的是不怕吃苦,建议你可以扩我伪xin mengy7762,那个真的很不错,很多⼈进步都很快,需要你不怕吃苦哦!⼤家可以去添加上看⼀下~
问题
word不能实现pdf⼀样的排版,翻译后的pdf还是存在样式问题(需要考虑的很多,慢慢做优化)。
表格⽆法写⼊,公⽰混乱。
搜狗,百度翻译接⼝未实现。
有道翻译长句⼦有问题,建议使⽤⾕歌、必应。
环境
开发环境的系统平台为 Windows 10 (64 位),Python 版本为 3.6 (64 位),Django版本为 2.2
atomicwrites==1.3.0attrs==19.1.0certifi==2019.3.9chardet==3.0.4colorama==0.4.1Django==2.2.1docx==0.2.4idna==2.8Js2Py==0.63lxml==4.3.3more-iterto ols==7.0.0pdfminer3k==1.3.1Pillow==6.0.0pluggy==0.11.0ply==3.11py==1.8.0PyExecJS==1.5.
1pyjsparser==2.7.1PyMuPDF==1.14.13PyPDF2==1.26.0pyte st==4.5.0python-docx==0.8.10pytz==2019.1requests==2.21.0six==1.12.0sqlparse==0.3.0tzlocal==1.5.1urllib3==1.24.3wcwidth==0.1.7
展⽰
参考⽂档
PyMuPDF参考⽂档
只使⽤pdf翻译
如果只是想要拿来翻译论⽂的同学看这⾥
下载该项⽬后记得将⽂件夹名由Easy-Trans-master改为EasyTrans。
将要翻译的⽂件放到input_file这个⽬录中,将56⾏的代码最后的pdf名字修改为要翻译的pdf名字。
运⾏trans_file.py等代码执⾏结束,翻译后的⽂档就在output_file这个⽬录下⾯。
这⾥采⽤的是必应翻译,也可以⾃⼰修改为其它⾃⼰想⽤的翻译⽅式,也可以修改⽬录,⽅便⾃⼰运⾏翻译就可以了。如果有好的改进pdf翻译效果的建议或者问题联系qcs@stu.ouc.edu。
在本地运⾏项⽬
1.克隆项⽬到本地(不使⽤git⼯具的话,直接下载就ok)
打开命令⾏,进⼊到保存项⽬的⽂件夹,输⼊如下命令:
2.创建并激活虚拟环境(不使⽤可以跳过这⾥)
强烈推荐在 Virtualenv 下进⾏ Django 的开发。Virtualenv 是⼀个 Python ⼯具,使⽤它可以创建⼀个独⽴的 Python 环境。最后,如果你的时间不是很紧张,并且⼜想快速的提⾼,最重要的是不怕吃苦,建议你可以扩我伪xin mengy7762,那个真的很不错,很多⼈进步都很快,需要你不怕吃苦哦!⼤家可以去添加上看⼀下~下载翻译器英文翻中文
在命令⾏进⼊到保存虚拟环境的⽂件夹,输⼊如下命令创建并激活虚拟环境:
C:\WINDOWS\system32>pip install virtualenv
C:\WINDOWS\system32>virtualenv C:\Users\Envs\EasyTrans_env
C:\WINDOWS\system32>C:\Users\Envs\EasyTrans_env\Scripts\activate
(EasyTrans_env) C:\WINDOWS\system32>
3.安装项⽬依赖
如果使⽤了虚拟环境,确保激活并进⼊了虚拟环境,在命令⾏进⼊项⽬所在的 Easy-Trans ⽂件夹,运⾏如下命令:
pip install -
4.数据库迁移
命令⾏输⼊
python manage.py makemigrations
python manage.py migrate
5.创建后台管理员⽤户
命令⾏输⼊
python manage.py createsuperuser
6.运⾏开发服务器
命令⾏输⼊
python manage.py runserver
在浏览器输⼊:127.0.0.1:8000 就可以看到主页了。最后,如果你的时间不是很紧张,并且⼜想快速的提⾼,最重要的是不怕吃苦,建议你可以扩我伪xin mengy7762,那个真的很不错,很多⼈进步都很快,需要你不怕吃苦哦!⼤家可以去添加上看⼀下~
注意
fitz这个包是PyMuPDF的,只要安装PyMuPDF就可以正常导⼊了。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论