Python随机生成中文字符的方法--688IT编程网

Python随机⽣成中⽂字符的⽅法

第⼀种⽅法:Unicode码

在unicode码中，汉字的范围是(0x4E00, 9FBF)

import random

def Unicode():

val = random.randint(0x4e00, 0x9fbf)

return chr(val)

这个⽅法⽐较简单，但是有个⼩问题,unicode码中收录了2万多个汉字，包含很多⽣僻的繁体字。

第⼆种⽅法:GBK2312

gbk2312对字符的编码采⽤两个字节相组合，第⼀个字节的范围是0xB0-0xF7, 第⼆个字节的范围是0xA1-0xFE.

更新：

值得注意的是，对于第55区，D7FA-D7FE的5个是没有编码的，需要在两个字节组合的范围中特意剔除⼀下。

对GBK2312编码⽅式详细的解释请参看（参考⽂献3）（）。

import random

def GBK2312():

head = random.randint(0xb0, 0xf7)

body = random.randint(0xa1, 0xfe)

val = f'{head:x}{body:x}'

str = bytes.fromhex(val).decode('gb2312')

return str

GBK2312收录了6千多常⽤汉字.两种⽅法的取舍就看需求了。

pyhon encode和decode函数

Python2.x中默认的编码的基础类型是unicode编码的类型，在Python3.x才转化为基于unicode的字符串。

那么我们在Python2.x的学习中就会遇到各种各样的编码问题，encode和decode函数就是很好的帮我们解决这样问题的⼯具。下⾯的程序中有详细的介绍和例⼦！

在Python2.x中：

u = u'中⽂' #显⽰指定unicode类型对象u

str = u.encode('gb2312') #以gb2312编码对unicode对像进⾏编码

str1 = u.encode('gbk') #以gbk编码对unicode对像进⾏编码

str2 = u.encode('utf-8') #以utf-8编码对unicode对像进⾏编码

u1 = str.decode('gb2312')#以gb2312编码对字符串str进⾏解码，以获取unicode

u2 = str.decode('utf-8')#如果以utf-8的编码对str进⾏解码得到的结果，将⽆法还原原来的unicode类型

在Python3.x中：

u = '中⽂' #指定字符串类型对象u

str = u.encode('gb2312') #以gb2312编码对u进⾏编码，获得bytes类型对象str

u1 = str.decode('gb2312')#以gb2312编码对字符串str进⾏解码，获得字符串类型对象u1

u2 = str.decode('utf-8')#如果以utf-8的编码对str进⾏解码得到的结果，将⽆法还原原来的字符串内容

中文字符unicode查询

但是我们在读取、写⼊⽂件的时候就要注意以⽂件的格式来判断⽤什么⽅式来操作了，txt⽂件默认都是utf-8当然你也可以⾃⼰设定编码格式。

我们在对txt⽂件进⾏操作时，最好都将编码格式转化为utf-8来⽅便操作吧！

688IT编程网

Python随机生成中文字符的方法

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

Python随机生成中文字符的方法

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行