python在线预览⽂件_OFFICE⽂档转换为html在线预览OFFICE ⽂档转换为html在线预览
OFFICE ⽂档在线预览⽅案很多:
服务器先转换为PDF,再转换为SWF,最后通过⽹页加载Flash预览,⽐如flexpaper
Office⽂档直接转换为SWF,通过⽹页加载Flash预览
微软的Office365
在浏览器中直接打开
转换为html
今天,我们要⽤的⽅案是转换为html来预览。
技术⽅案:
office⽂档转换为pdf:使⽤libreoffice
pdf转html,使⽤pdf2htmlex
测试环境:
操作系统:ubuntu 12.04
office⽂档转pdf
1.1 安装libreoffice
apt-get install libreoffice-common
1.2 启动转换服务
soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard
1.3 ⽂档转换
下载后,进⾏测试:
python DocumentConverter.py Website_Information_Form.doc new.pdf
可以正常转换,但是中⽂显⽰有问题
1.4 中⽂显⽰问题修复
python中文文档google⼀下,⼤概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存
sudo fc-cache -fv 2>&1 | grep failed | cut -f1 -d":" | xargs -i sudo touch {} && sudo fc-cache -fv
再重启转换服务,再次测试,已经OK了!
2.pdf转html
下⾯介绍简单安装⽅式:
2.1 通过apt安装
sudo add-apt-repository ppa:coolwanglu/pdf2htmlex
sudo apt-get update
sudo apt-get install pdf2htmlex
2.2 测试pdf2htmlex
pdf2htmlEX --zoom 1.3 xiaoshujiang.pdf
可以看到,当前⽬录⽣成了xiaoshujiang.html
2.3 转换脚本
写⼀个脚本,将两次转换放到⼀起,⽅便调⽤:
#convert2html.sh
temp=$(date +%Y%m%d%H%m%s)
python DocumentConverter.py $1 ${temp}.pdf
pdf2htmlEX --zoom 1.3 $temp.pdf
mv $temp.html $2
rm $temp.pdf
测试
3.1 word (doc.docx)测试
convert2html.sh imo云办公室-私有云⽤户使⽤⼿册V2.0.doc imo-doc.html
效果:
3.2 表格 (xls)测试
convert2html.sh xxx.doc imo-doc.html
3.3 PPT (pptx)测试
./convert.sh xxx.pptx music-plan.html
总结
本⽂介绍了⼀种在服务端将office⽂档转换为html以⽅便预览的⽅法。
实际使⽤时,可以将⽣成好的html放到⽹站路径下,通过,设置访问权限。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。