python3的验证码识别算法_Python3实现简单的验证码识别环 境:
js json解析
Python3 + Selenium + OCR软件 + pytesseract/PIL(第三⽅图像识别库)
Python3安装两个第三⽅图像识别库,直接命令⾏输⼊:pip install pytesseract,同时也会附带安装PIL库
配置环境变量:
PATH→ C:\Program Files\Tesseract-OCR
TESSDATA_PREFIX→ C:\Program Files\Tesseract-OCR\tessdata
注 意:OCR软件需要配置两个环境变量,⼀个是其安装路径,另⼀个是安装路径下的tessdata,变量名为:TESSDATA_PREFIX,这个点很重要!
注意添加path,添加时候开头⽤“;”跟之前的变量隔开,结尾以“;”结尾。
打开命令终端,输⼊:tesseract -v,可以看到版本信息
windows环境下使⽤pytesseract识别验证码中⽂字时报错:
consecutive number
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your path
解决⽅案:
1.到python的安装路径下的pytesseract: 例如我的是 C:\softwares\python3.6.5\Lib\site-packages\pytesseract
2.⽤⽂本编辑器打开,查tesseract_cmd
将原来的 tesseract_cmd = 'tesseract' 改为: tesseract_cmd = 'OCR的安装路径下的'
例如我的是 tesseract_cmd = 'C:\Program Files\'
ideal什么意思注意有的地⽅需要转义 例如 \,或者也可直接加r转义
tesseract_cmd = r'C:\Program Files\'
图⽚.png
python在线编辑器python3图⽚.png
特效素材网安装opencv
signalling
由于验证码需要做⼀些优化处理,⽅便更加容易被tesserocr识别,所以需要使⽤opencv来做⼀些特殊的处理,安装opencv⽐较简单,直接pip install opencv-python即可。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。