百闻不如⼀试——公式图⽚转Latex代码
写博客时,数学公式的编辑⽐较占⽤时间,在上⼀篇中详细介绍了如何在Markdown中编辑数学符号与公式。
当然,有时候我们仅仅是想把现成的公式搬到markdown中来编辑,此时如果有⼯具能把公式截图直接解析成Latex代码就⽅便了。
刚好这⼏天看到好⼏个都在推送image-to-latex这个开源项⽬:
Convert images of LaTex math equations into LaTex code.
该项⽬当前(2021年09⽉02⽇)star⼈数为631,Fork为81:
最近正好也是在了解机器学习、深度学习相关的东西,于是打算上⼿感受⼀下转换效果。
百闻不如⼀试
其实image-to-latex这个项⽬的README写得算是⽐较清楚了,介绍了项⽬的来龙去脉、可以改进的地⽅、如何使⽤等等。
快速开始
下⾯我把⾃⼰第⼀次尝试的过程简单记录如下:
克隆项⽬
git clone --depth=1 github/kingyiusuen/image-to-latex.git
cd image-to-latex
多啰嗦⼀句:
--depth: ⽤来指定克隆的深度,1表⽰克隆最近的⼀次commit。这种⽅法克隆是为了减⼩项⽬体积的,加快克隆速度,对于那种庞⼤且活跃的开源项⽬⾮常有效。
准备Python环境
该项⽬依赖Python环境,由于我⽤的是conda来管理虚拟环境的,不是⽤venv,所以这⾥的步骤可能与README上的有⼀点点差异。
此时应该是在项⽬⽬录下,即image-to-latex⽬录,该⽬录下有⽂件。
# 创建新的python3.6环境
conda create --name latex python=3.6
# 激活环境
conda activate latex
# 安装依赖
pip install -
关于Python环境的搭建,可以参考我之前的博客:
下载模型
For example, you can use the following command to download my best run.
到了这步本该是模型训练(Model Training),我这⾥仅想体验⼀下,可以直接下载别⼈已经训练好的模型。
python scripts/download_checkpoint.py kingyiusuen/image-to-latex/1w1abmg1
此时shell显⽰如下:
(latex) ➜ python scripts/download_checkpoint.py kingyiusuen/image-to-latex/1w1abmg1
wandb: (1) Create a W&B account
wandb: (2) Use an existing W&B account
wandb: (3) Don't visualize my results
wandb: Enter your choice: 3
wandb: You chose 'Don't visualize my results'
Downloading
Model checkpoint downloaded to image-to-latex/artifacts/model.pt.
下载需要稍微等等,模型有将近2个G的⼤⼩。
启动服务
(1) 启动后端服务,执⾏命令make api
An API is created to make predictions using the trained model.
看下项⽬的Makefile⽂件,其实make api就是调⽤了下⾯的启动命令:
uvicorn api.app:app --host 0.0.0.0 --port 8000 --reload --reload-dir image-to-latex --reload-dir api
(2) 启动前端界⾯,执⾏命令make streamlit
代码转换同样,看下项⽬的Makefile⽂件,其实make streamlit调⽤了下⾯的启动命令:
streamlit run streamlit/app.py
⾄此,image-to-latex就成功启动了,下⾯就期待转换公式的效果了!
上⼿体验
下⾯我作为⼀个⼩⽩⽤户,体验⼀下image-to-latex的转换效果。
我从之前的博客中截图了10个公式,使⽤下来,感觉当前的效果并⾮太理想。注意,个别解析出来仅是缺少了右},这种也可以算解析出来了。如下:
测试来看,貌似对多⾏公式的解析不太好。当然了,有这样的免费⼯具来辅助我们把公式图⽚转成Latex代码已经让⼈挺惊喜了。相信以后随着更多的⼈参与算法的优化、模型的改善,解析的效果会更好。
写在后⾯
I found a pretty established tool called Mathpix Snip that converts handwritten formulas into LaTex code.
image-to-latex这个项⽬的README⾥也提到了mathpix这个更加成熟的⼯具。免费版每⽉能识别50次公式图⽚。详情见:
下载试了下,识别的效果确实不错。(注意:⾮⼴告,本⼈与mathpix⽆任何关系,仅仅试了下⽽已)
百闻不如⼀试,动⼿尝试之后才有发⾔权。后⾯有时间会看看image-to-latex的代码实现,学习学习。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论