python图像文字识别的环境搭建--688IT编程网

python图像⽂字识别的环境搭建

最近⼀直在忙图像⽂字识别的编码⼯作，但是发现python的环境搭建⾮常难，python这个语⾔很有趣很有⽤，但是使⽤的环境很难搭建好。下⾯把python的环境搭建说⼀下，也仅是就我所遇到的问题说⼀下，并不适⽤所有⼈，可以参考，只能说是初步成功了。

先附上代码：（这是⼀种识别代码）

import cv2 as cv

import numpy as np

from PIL import Image #模块变text功能

import pytesseract as tess #模块识别⽂字功能

def recognize_text():

gray = cv.cvtColor(src, cv.COLOR_BGR2GRAY)

ret, open_out = cv.threshold(gray, 0, 255, cv.THRESH_BINARY_INV | cv.THRESH_OTSU) #构造成⼆

值图像 # kernel = cv.getStructuringElement(cv.MORPH_RECT, (1, 2)) # 尝试使⽤不同的结构元素，垂直的去掉了，⽔平的保留了

# bin1 = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel) #

# kernel = cv.getStructuringElement(cv.MORPH_RECT, (2, 1)) # 尝试使⽤不同的结构元素，进⼀步的，⽔平的去掉了了

# open_out = cv.morphologyEx(bin1, cv.MORPH_OPEN, kernel)

cv.imshow("binary-image", open_out)

cv.bitwise_not(open_out, open_out) #⿊⾊背景变成⽩⾊背景

textImage = Image.fromarray(open_out) #变成⼀张text图像了

text = tess.image_to_string(textImage)

print("shibiejieguo: %s"%text)

print("--------- Python OpenCV Tutorial ---------")

src = cv.imread("H:/yuandaimayouyong/opencv-python/9.jpg")

#H:/yuandaimayouyong/opencv-python图像/morph02.png

cv.namedWindow("input image", cv.WINDOW_AUTOSIZE)

cv.imshow("input image", src)

recognize_text()

cv.waitKey(0)

#cv.destroyAllWindows()

这是另外⼀种识别代码：

#作者：2501902696

# -*- coding: UTF-8 -*-

from PIL import Image

import pytesseract

#上⾯都是导包，只需要下⾯这⼀⾏就能实现图⽚⽂字识别

text=pytesseract.image_to_string(Image.open('H:/yuandaimayouyong/opencv-python/x.jpg'),lang='chi_sim') print(text)

这两种识别代码都需要类似的⼯作环境，下⾯说说

第⼀步是cv2的识别和导⼊，⼀般python3是识别不了CV2包的，⽹上说到了3就不⽀持了，所以很多时候会报错，

我⾃⼰的解决⽅式应该是在安装opevncv时会出现 ImportError: No module named cv2 的错误，不到cv2的包。python解释器下载

这时候安装扩展包即可：

pip install opencv-python

第⼆步，是安装

⼀、需要的软件 1、pytesseract 2、PIL或者是pillow都可以 3、tesseract-ocr 第⼀、⼆两个都可以通过pip安装，第三个百度就可以到。⼆、使⽤⽅法 1.先⽤PIL打开图⽚ 2.调⽤pytesseract的image_to_string()⽅法即可，简单吧!

这⾥前两个⽐较好装，只需要pip install xxx 就好了，但是，第三个很难装，我到现在还是没有完全装好，但是很神奇，居然可以⽤了，第三个通过pip install 安装不成功，需要⾃⼰下载软件安装，其中⾃⼰选择需要的安装语⾔，就可以了我装的是4.0版，python⽤的是3.6.3版本

第三步，就是python的解释器了，pycharm虽然⼀开始并不知道怎么使⽤，但是看⼀下⽹络上的授课视频，看到⼈家怎么使⽤，⾃⼰也就知道怎么使⽤了，这⾥主要强调⼀点，就是解释器是需要设置好的，不然没有办法使⽤，即使安装包都装上了，下⾯是我的解释器设置：files-settings-project interpreter-3.6.3 (C:\Users\lee\AppData\Local\Programs\Python\) 就是这样了，

还有要注意的地⽅，就是图⽚位置也是要注意的，⽐如我们win系统默认⽂件位置格式是：H:\yuandaimayouyong\opencv-python\6.jpg 但是在python中，需要把斜杠倒过来才能识别：H:/yuandaimayouyong/opencv-python/6.jpg 这也将困扰⼤多数⼈，不然准要失败。其中，图⽚放在C盘，容易出错，因为C：/是转义字符的意思

688IT编程网

python图像文字识别的环境搭建

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表