小程序语音同步智能识别的实现案例代码解析--688IT编程网

⼩程序语⾳同步智能识别的实现案例代码解析

⽬录

⼀、背景

⼆、同声传译插件介绍

四、后端SpringBoot实现语⾳⽂件上传webApi

五、实际测试

⼀、背景

在⼩程序的⼀些应⽤场景中，会有语⾳转⽂字的需求。原有的做法⼀般是先通过⼩程序的录⾳功能录下语⾳⽂件，然后再通过调⽤语⾳智能识别WebApi（⽐如百度云AI平台，科⼤讯飞平台）将语⾳⽂件转成⽂字信息，以上的做法⽐较繁琐且⽤户的体验性较差。

为解决此问题，直接开放了同声传译的插件，⼩程序作者可以直接使⽤该插件进⾏语⾳同声传译的开发。此⽂章将通过前后端整合应⽤的完整案例完成语⾳的实时转换，并将语⾳上传到服务端后台备份。

⼆、同声传译插件介绍

同声传译由智聆语⾳团队、翻译团队与公众平台联合推出的同传开放接⼝，⾸期开放语⾳转⽂字、⽂本翻译、语⾳合成接⼝，为开发者赋能。

1、⼩程序后台添加插件

进⼊⼩程序后台-->进⼊设置-->第三⽅设置-->添加插件->搜索同声传译-->完成添加。

2、⼩程序启⽤插件

在⼩程序app.json⽂件中增加插件版本等信息：

"plugins": {

"WechatSI": {

"version": "0.3.3",

"provider": "wx069ba97219f66d99"

}

在页⾯程序⽂件中引⼊插件：

/* index.js */

const plugin = requirePlugin("WechatSI")

// 获取**全局唯⼀**的语⾳识别管理器**recordRecoManager**

const manager = RecordRecognitionManager()

recordRecoManager 对象的⽅法列表：

⽅法参数说明

start options开始识别

stop结束识别

onStart callback正常开始录⾳识别时会调⽤此事件

onRecognize callback有新的识别内容返回，则会调⽤此事件

onStop callback识别结束事件

onError callback识别错误事件

官⽅开发⽂档：插件的语⾳识别管理器

三、语⾳同步转换的前端实现

1、界⾯UI与操作

UI参考官⽅的DEMO：长按按钮进⾏录⾳，松开按钮实时将录⾳转换为⽂字。

⽤户可对同步转换的⽂字进⾏编辑，同时可将原始语⾳⽂件与⽂字上传后台服务端。

2、代码实现

语⾳同步转换的主要代码：

//导⼊插件

const plugin = requirePlugin("WechatSI");

// 获取**全局唯⼀**的语⾳识别管理器**recordRecoManager**

const manager = RecordRecognitionManager();

/**

* 加载进⾏初始化

onLoad: function () {

//获取录⾳权限

//初始化语⾳识别回调

this.initRecord();

...

/**

* 初始化语⾳识别回调

* 绑定语⾳播放开始事件

initRecord: function () {

//有新的识别内容返回，则会调⽤此事件

let currentData = Object.assign({}, this.data.currentTranslate, {

text: sult,

});

this.setData({

currentTranslate: currentData,

});

this.scrollToNew();

};

// 识别结束事件

let text = sult;

console.pFilePath);

if (text == "") {

this.showRecordEmptyTip();

return;

}

let lastId = this.data.lastId + 1;

let currentData = Object.assign({}, this.data.currentTranslate, { text: sult,

translateText: "正在识别中",

id: lastId,

voicePath: pFilePath,

duration: res.duration

});

this.setData({

currentTranslate: currentData,

recordStatus: 1,

lastId: lastId,

});

//将当前识别内容与语⾳⽂件加⼊列表

this.addRecordFile(currentData, this.data.dialogList.length);

//刷新列表

this.scrollToNew();

};

// 识别错误事件

this.setData({

recording: false,

bottomButtonDisabled: false,

});

};

/**

* 按住按钮开始语⾳识别

streamRecord: function (e) {

let detail = e.detail || {};

let buttonItem = detail.buttonItem || {};

//开始中⽂录⾳

manager.start({

lang: buttonItem.lang,

});

this.setData({

recordStatus: 0,

recording: true,

currentTranslate: {

// 当前语⾳输⼊内容

create: dTime(new Date()),

text: "正在聆听中",

lfrom: buttonItem.lang,

lto: buttonItem.lto,

});

//刷新列表

this.scrollToNew();

* 松开按钮结束语⾳识别

streamRecordEnd: function (e) {

let detail = e.detail || {}; // ⾃定义组件触发事件时提供的detail对象 let buttonItem = detail.buttonItem || {};

// 防⽌重复触发stop函数

if (!ding || dStatus != 0) {

console.warn("has finished!");

return;

}

manager.stop();

this.setData({

bottomButtonDisabled: true,

});

编辑识别⽂字并完上传的主要代码：

/**

* 页⾯的初始数据

data: {

edit_text_max: 200,

remain_length: 200,

edit_text: "",

is_focus: false,

tips: "",

index: -1,

voicePath: "",

/**

* 加载初始化

onLoad: function (options) {

//根据传⼊的⽂字内容填充编辑框

this.t)

this.setData({

index: index,

voicePath: options.voicePath

})

/**

* 编辑⽂字

editInput: function (event) {

console.log(event)

if (event.detail.value.length > EditTextMax()) {

} else {

this.data.edit_text = event.detail.value

this.updateRemainLength(this.data.edit_text)

}

/**

* 上传⽂字与语⾳⽂件

editConfirm: function (event) {

let json=this.data.edit_text

//调⽤上传⽂件api将信息上传⾄服务端webApi

wx.uploadFile({

url: api.wxFileUploadUrl,

filePath: this.data.voicePath,

name: "file",

header: {

Authorization: wx.getStorageSync("loginFlag"),

"Content-Type": "multipart/form-data",

formData: {

openId: app.globalData.userInfo.openId,

realName: "语⾳⽂件",

json: JSON.stringify(json),

success: (result) => {

console.log("success:", result);

if (result.statusCode == "200") {

let data = JSON.parse(result.data);

console.log("data", data);

if (data.success == true) {

let module = dule;

console.log("module", module);

app.showInfo("上传成功");

setTimeout( ()=>{

wx.navigateBack();

}, 2000)

} else {

app.showInfo("异常错误" + Msg + "，请重新进⼊");

wx.navigateTo({

url: "/pages/index/index",

});

}

} else {

app.showInfo("访问后台异常，重新进⼊系统");

wx.navigateTo({

url: "/pages/index/index",

});

}

fail: (result) => {

console.log("fail", result);

wx.navigateTo({

url: "/pages/index/index",

});

complete: () => {},

});

四、后端SpringBoot实现语⾳⽂件上传webApi

1、SpringBoot项⽬API相关结构树

2、⽂件上传⼯具类的实现

tools⼯具类包中主要存⽂件通⽤的⽂件上传⼯具类，该⼯具类会将⽂件上传⾄配置指定的⽂件夹下，并将⽂件信息写⼊upload_file表中。

⽂件信息实体类：与数据库中表upload_file对应；

⽂件存储仓库类：通过Spring Data JPA接⼝实现数据的CRUD；

⽂件上传⼯具接⼝：对外统⼀封装⽂件上传⽅法；

⽂件上传⼯具实现类：实现⽂件上传⽅法接⼝。

⽂件信息实体类：UploadFile.java

/**

* ⽂件信息表

* @author zhuhuix

* @date 2020-04-20

@Entity

@Getter

@Setter

@Table(name = "upload_file")

public class UploadFile {

@Id

@GeneratedValue(strategy = GenerationType.IDENTITY)

@NotNull(groups = Update.class)

private Long id;

/**

* ⽂件实际名称

@Column(name = "real_name")

private String realName;

/**

* ⽂件名

@NotNull

@Column(name = "file_name")

代码转换

private String fileName;

/**

* ⽂件主名称

@NotNull

@Column(name = "primary_name")

private String primaryName;

/**

* ⽂件扩展名

@NotNull

private String extension;

/**

* 存放路径

@NotNull

private String path;

/**

* ⽂件类型

private String type;

/**

* ⽂件⼤⼩

private Long size;

* 上传⼈

private String uploader;

@JsonIgnore

@Column(name = "create_time")

@CreationTimestamp

private Timestamp createTime;

public UploadFile(String realName, @NotNull String fileName, @NotNull String primaryName, @NotNull String extension, @NotNull String path, String type, Long size, String uploader) { alName = realName;

this.fileName = fileName;

this.primaryName = primaryName;

this.path = path;

this.size = size;

this.uploader = uploader;

}

@Override

public String toString() {

return "UploadFile{" +

"fileName='" + fileName + '\'' +

", uploader='" + uploader + '\'' +

", createTime=" + createTime +

'}';

}

⽂件存储仓库类:UploadFileRepository.java

/**

* 上传⽂件DAO接⼝层

* @author zhuhuix

* @date 2020-04-03

public interface UploadFileRepository extends JpaRepository<UploadFile, Long>, JpaSpecificationExecutor<UploadFile> {

//该接⼝继承JpaRepository及CrudRepository接⼝，已实现了如findById,save,delete等CRUD⽅法

}

UploadFileRepository 接⼝继承JpaRepository及CrudRepository接⼝，已实现了如findById,save,delete等CRUD⽅法

688IT编程网

小程序语音同步智能识别的实现案例代码解析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

小程序语音同步智能识别的实现案例代码解析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式