python图像⽂字识别的环境搭建
最近⼀直在忙图像⽂字识别的编码⼯作,但是发现python的环境搭建⾮常难,python这个语⾔很有趣很有⽤,但是使⽤的环境很难搭建好。下⾯把python的环境搭建说⼀下,也仅是就我所遇到的问题说⼀下,并不适⽤所有⼈,可以参考,只能说是初步成功了。
先附上代码:(这是⼀种识别代码)
import cv2 as cv
import numpy as np
from PIL import Image #模块变text功能
import pytesseract as tess #模块识别⽂字功能
def recognize_text():
gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)
ret, open_out = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU) #构造成⼆
值图像 # kernel = cv.getStructuringElement(cv.MORPH_RECT, (1, 2)) # 尝试使⽤不同的结构元素,垂直的去掉了,⽔平的保留了
# bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel) #
# kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 1)) # 尝试使⽤不同的结构元素,进⼀步的,⽔平的去掉了了
# open_out = cv.morphologyEx(bin1, cv.MORPH_OPEN, kernel)
cv.imshow("binary-image", open_out)
cv.bitwise_not(open_out, open_out) #⿊⾊背景变成⽩⾊背景
textImage = Image.fromarray(open_out) #变成⼀张text图像了
text = tess.image_to_string(textImage)
print("shibiejieguo: %s"%text)
print("--------- Python OpenCV Tutorial ---------")
src = cv.imread("H:/yuandaimayouyong/opencv-python/9.jpg")
#H:/yuandaimayouyong/opencv-python图像/morph02.png
cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)
cv.imshow("input image", src)
recognize_text()
cv.waitKey(0)
#cv.destroyAllWindows()
这是另外⼀种识别代码:
#作者:2501902696
# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
#上⾯都是导包,只需要下⾯这⼀⾏就能实现图⽚⽂字识别
text=pytesseract.image_to_string(Image.open('H:/yuandaimayouyong/opencv-python/x.jpg'),lang='chi_sim') print(text)
这两种识别代码都需要类似的⼯作环境,下⾯说说
第⼀步是cv2的识别和导⼊,⼀般python3是识别不了CV2包的,⽹上说到了3就不⽀持了,所以很多时候会报错,
我⾃⼰的解决⽅式应该是在安装opevncv时会出现 ImportError: No module named cv2 的错误,不到cv2的包。python解释器下载
这时候安装扩展包即可:
pip install opencv-python
第⼆步,是安装
⼀、需要的软件 1、pytesseract 2、PIL或者是pillow都可以 3、tesseract-ocr 第⼀、⼆两个都可以通过pip安装,第三个百度就可以到。⼆、使⽤⽅法 1.先⽤PIL打开图⽚ 2.调⽤pytesseract的image_to_string()⽅法即可,简单吧!
这⾥前两个⽐较好装,只需要pip install xxx 就好了,但是,第三个很难装,我到现在还是没有完全装好,但是很神奇,居然可以⽤了,第三个通过pip install 安装不成功,需要⾃⼰下载软件安装,其中⾃⼰选择需要的安装语⾔,就可以了我装的是4.0版,python⽤的是3.6.3版本
第三步,就是python的解释器了,pycharm虽然⼀开始并不知道怎么使⽤,但是看⼀下⽹络上的授课视频,看到⼈家怎么使⽤,⾃⼰也就知道怎么使⽤了,这⾥主要强调⼀点,就是解释器是需要设置好的,不然没有办法使⽤,即使安装包都装上了,下⾯是我的解释器设置:files-settings-project interpreter-3.6.3 (C:\Users\lee\AppData\Local\Programs\Python\) 就是这样了,
还有要注意的地⽅,就是图⽚位置也是要注意的,⽐如我们win系统默认⽂件位置格式是:H:\yuandaimayouyong\opencv-python\6.jpg 但是在python中,需要把斜杠倒过来才能识别:H:/yuandaimayouyong/opencv-python/6.jpg 这也将困扰⼤多数⼈,不然准要失败。其中,图⽚放在C盘,容易出错,因为C:/是转义字符的意思
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论