利用百度OCR的接口实现文字识别的功能--688IT编程网

利⽤百度OCR的接⼝实现⽂字识别的功能

安装⽂字识别 C# SDK

** ⽀持平台：.Net Framework 3.5 4.0 4.5， .Net Core 2.0 **

⽅法⼀：使⽤Nuget管理依赖（推荐）

在NuGet中搜索 Baidu.AI，安装最新版即可。

⽅法⼆：下载安装

⽂字识别 C# SDK⽬录结构

Baidu.Aip

├── net35

│├── AipSdk.dll // 百度AI服务 windows 动态库

│├── l // 注释⽂件

│└── Newtonsoft.Json.dll // 第三⽅依赖

├── net40

├── net45

└── netstandard2.0

├── AipSdk.deps.json

└── AipSdk.dll

如果需要在 Unity 平台使⽤，可引⽤⼯程源码⾃⾏编译。

安装

1.在下载C# SDK压缩⼯具包。

2.解压后，将 AipSdk.dll 和 Newtonsoft.Json.dll 中添加为引⽤。

下载完成后解压，选择相应的版本引⽤dll⽂件：

新建交互类

Baidu.Aip.Ocr.Ocr是⽂字识别的交互类，为使⽤⽂字识别的开发⼈员提供了⼀系列的交互⽅法。

⽤户可以参考如下代码新建⼀个交互类：

// 设置APPID/AK/SK

var APP_ID = "你的 App ID";

var API_KEY = "你的 Api Key";

var SECRET_KEY = "你的 Secret Key";

var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);

client.Timeout = 60000; // 修改超时时间

在上⾯代码中，常量APP_ID在百度云控制台中创建，常量API_KEY与SECRET_KEY是在创建完毕应⽤后，系统分配给⽤户的，均为字符串，⽤于标识⽤户，为访问做签名验证，可在AI服务控制台中的应⽤列表中查看。

注意：如您以前是百度云的⽼⽤户，其中API_KEY对应百度云的“Access Key ID”，SECRET_KEY对应百度云的“Access Key Secret”。

接⼝说明

通⽤⽂字识别

⽤户向服务请求识别某张图中的所有⽂字

// 设置APPID/AK/SK

public static string APP_ID = "你的APP_ID";

public static string API_KEY = "你的API_KEY";

public static string SECRET_KEY = "你的SECRET_KEY";

public Baidu.Aip.Ocr.Ocr client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);

//通过图⽚提取⽂字

public JsonResult GetImgText(string UserName)

{

if (Request.Files.Count > 0)

{

Request.Files[0].SaveAs(Server.MapPath("~/Img/") + UserName + "_" + Path.GetFileName(Request.Files[0].FileName));

var image = System.IO.File.ReadAllBytes(Server.MapPath("~/Img/") + UserName + "_" + Path.GetFileName(Request.Files[0].FileName));

// 调⽤通⽤⽂字识别, 图⽚参数为本地图⽚，可能会抛出⽹络等异常，请使⽤try/catch捕获

var result = client.GeneralBasic(image);

// 如果有可选参数

var options = new Dictionary<string, object>{

{"language_type", "CHN_ENG"},

{"detect_direction", "true"},

{"detect_language", "true"},

{"probability", "true"}

};

// 带参数调⽤通⽤⽂字识别, 图⽚参数为本地图⽚

result = client.GeneralBasic(image, options);

System.Diagnostics.Debug.WriteLine(result);

System.IO.File.Delete(Server.MapPath("~/Img/") + UserName + "_" + Path.GetFileName(Request.Files[0].FileName));

return Json(result.ToString());

}

else {

return Json(null);

}

public JsonResult GeneralBasicDemo()

{

var filePath = Server.MapPath(string.Format("~/Img", "File"));//项⽬下的⽬录

var image = System.IO.File.ReadAllBytes(Path.Combine(filePath, "sfzb.jpg"));//注意File有可能⽆法识别，所以需要完整的引⽤-System.IO.File // 调⽤通⽤⽂字识别, 图⽚参数为本地图⽚，可能会抛出⽹络等异常，请使⽤try/catch捕获

var result = client.GeneralBasic(image);

Console.WriteLine(result);

return Json(result);

// 如果有可选参数

//var options = new Dictionary<string, object>{

// {"language_type", "CHN_ENG"},

// {"detect_direction", "true"},

// {"detect_language", "true"},

// {"probability", "true"}

//};

带参数调⽤通⽤⽂字识别, 图⽚参数为本地图⽚

//result = client.GeneralBasic(image, options);

//Console.WriteLine(result);

}

public void GeneralBasicUrlDemo()

{

var url = "http//www.x/sample.jpg";

// 调⽤通⽤⽂字识别, 图⽚参数为远程url图⽚，可能会抛出⽹络等异常，请使⽤try/catch捕获

var result = client.GeneralBasicUrl(url);

Console.WriteLine(result);

// 如果有可选参数

//var options = new Dictionary<string, object>{

// {"language_type", "CHN_ENG"},

// {"detect_direction", "true"},

/ {"detect_language", "true"},

// {"probability", "true"}

//};

带参数调⽤通⽤⽂字识别, 图⽚参数为远程url图⽚

//result = client.GeneralBasicUrl(url, options);

//Console.WriteLine(result);

}

前台代码(⽤到了layui前台框架):

Layout = null;

}

<html>

<head>

<title>百度云OCR技术</title>

</head>

<body>

<h1>百度云OCR技术</h1>

</form>

</div>

</body>

</html>

$(function () {

layui.use('upload', function () {

var $ = layui.jquery

, upload = layui.upload;

var ocr = der({

elem: '#ocr_form_imgSelBtn'

, url: "/Home/GetImgText"

, method: 'post'

, accept: "images"

, before: function (obj) {

this.data = { "UserName": "test"};//额外参数关键代码

}

, done: function (data) {

var regx = /^[\u4e00-\u9fa5 -.a-zA-Z0-9]+$/

var jsons = "";

for (var i = 0; i < data.words_result_num; i++) {

if (st(data.words_result[i].words)) {

jsons += data.words_result[i].words + "<br\>";

}

layer.alert(jsons);

}

, error: function () {

//失败状态，并实现重传

var demoText = $('#demoText');

demoText.html('<span >上传失败</span> <br/><a class="layui-btn layui-btn-

mini demo-reload layui-btn-normal">重试</a>'); demoText.find('.demo-reload').on('click', function () {

uploadInst.upload();

});

}

});

</script>

通⽤⽂字识别请求参数详情

参数名称是

否

必

选

类型

可选值范

围

默认值说明

image是byte[]⼆进制图像数据

url是string 图⽚完整URL，URL长度不超过1024字节，URL对应的图⽚base64编码后⼤⼩不超过4M，最短边⾄少15px，最长边最⼤4096px,⽀持jpg/png/bmp格式，当image字段存在时url字段失效

language_type否string CHN_ENG

ENG

POR

FRE

GER

ITA

SPA

RUS

JAP

KOR

CHN_ENG

识别语⾔类型，默认为CHN_ENG。可选值包括：

- CHN_ENG：中英⽂混合；

- ENG：英⽂；

POR：葡萄⽛语；

- FRE：法语；

- GER：德语；

- ITA：意⼤利语；

- SPA：西班⽛语；

- RUS：俄语；

- JAP：⽇语；

- KOR：韩语；

detect_direction否string true

false

是否检测图像朝向，默认不检测，即：false。朝向是指输⼊图像是正常⽅向、逆时针旋转

90/180/270度。可选值包括:

- true：检测朝向；

- false：不检测朝向。

detect_language否string true

writeline方法的作用

false

false是否检测语⾔，默认不检测。当前⽀持（中⽂、英语、⽇语、韩语）

probability否string true

false

是否返回识别结果中每⼀⾏的置信度

通⽤⽂字识别返回数据参数详情

字段必选类型说明

direction否number 图像⽅向，当detect_direction=true时存在。- -1：未定义，

- 0：正向，

- 1: 逆时针90度，

- 2：逆时针180度，

- 3：逆时针270度

log_id是number唯⼀的log id，⽤于问题定位

words_result_num是number识别结果数，表⽰words_result的元素个数

words_result是array定位和识别结果数组

+words否string识别结果字符串

probability否object⾏置信度信息；如果输⼊参数 probability = true 则输出+average否number⾏置信度平均值

+variance否number⾏置信度⽅差

+min否number⾏置信度最⼩值

调⽤⽅法的ajax：

688IT编程网

利用百度OCR的接口实现文字识别的功能

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

利用百度OCR的接口实现文字识别的功能

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

非零金额正则表达式

半小时正则表达式