⽤java语⾔实现随机⽣成中⽂姓名
中⽂字符⼀般使⽤的编码格式为“GB2312”,那么gb2312到底是什么,简单介绍⼀下(参考百度百科)
GB2312
⼀般指信息交换⽤汉字编码字符集。
《信息交换⽤汉字编码字符集》是由中国国家标准总局1980年发布,1981年5⽉1⽇开始实施的⼀套国家标准,标准号是—1980。
GB2312编码适⽤于汉字处理、汉字通信等系统之间的信息交换,通⾏于中国⼤陆;新加坡等地也采⽤此编码。中国⼤陆⼏乎所有的中⽂系统和国际化的软件都⽀持GB 2312。基本集共收⼊汉字6763个和⾮汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有⼀个字符,因此可⽤所在的区和位来对汉字进⾏编码,称为。
分区表⽰
GB 2312中对所收汉字进⾏了“分区”处理,每区含有94个汉字/符号。这种表⽰⽅式也称为。
01-09区为特殊符号。
16-55区为⼀级汉字,按拼⾳排序。
56-87区为⼆级汉字,按部⾸/笔画排序。
10-15区及88-94区则未有编码。
字节结构
每个汉字及符号以两个字节来表⽰。第⼀个称为“⾼位字节”(也称“区字节)”,第⼆个字节称为“低位字节”(也称“位字节”)。
“⾼位字节”使⽤了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使⽤了0xA1-0xFE(把01-94加上 0xA0)。 由于⼀级汉字从16区起始,汉字区的“⾼位字节”的范围是0xB0-0xF7,“低位字节”的范围是0xA1-0xFE,占⽤的码位是 72*94=6768。其中有5个空位是D7FA-D7FE。
例如“啊”字在⼤多数程序中,会以两个,0xB0(第⼀个字节) 0xA1(第⼆个字节)储存。=区字节+位字节(与区位码对⽐:
0xB0=0xA0+16,0xA1=0xA0+1)。
java实现(借鉴)
public static String getChineseName() {
String str = null;
String name = null;
int highPos, lowPos;
Random random = new Random();
//区码,0xA0打头,从第16区开始,即0xB0=11*16=176,16~55⼀级汉字,56~87⼆级汉字
highPos = (176 + Math.Int(72)));
random=new Random();
//位码,0xA0打头,范围第1~94列
lowPos = 161 + Math.Int(94));
byte[] bArr = new byte[2];
bArr[0] = (new Integer(highPos)).byteValue();
bArr[1] = (new Integer(lowPos)).byteValue();
try {
//区位码组合成汉字
str = new String(bArr, "GB2312");
int Int(Surname.length-1);
//获得⼀个随机的姓⽒
name = Surname[index] +str;
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
return name;
}
//百家姓
private static final String[] Surname= {"赵","钱","孙","李","周","吴","郑","王","冯","陈","褚","卫","蒋","沈","韩","杨","朱","秦","尤","许",
"何","吕","施","张","孔","曹","严","华","⾦","魏","陶","姜","戚","谢","邹","喻","柏","⽔","窦","章","云","苏","潘","葛","奚","范","彭","郎", "鲁","韦","昌","马","苗","凤","花","⽅","俞","任","袁","柳","酆","鲍","史","唐","费","廉","岑","薛","雷","贺","倪","汤","滕","殷",
"罗","毕","郝","邬","安","常","乐","于","时","傅","⽪","卞","齐","康","伍","余","元","⼘","顾","孟","平","黄","和",
"穆","萧","尹","姚","邵","湛","汪","祁","⽑","禹","狄","⽶","贝","明","臧","计","伏","成","戴","谈","宋","茅","庞","熊","纪","舒",
"屈","项","祝","董","梁","杜","阮","蓝","闵","席","季","⿇","强","贾","路","娄","危","江","童","颜","郭","梅","盛","林","刁","钟",
"徐","邱","骆","⾼","夏","蔡","⽥","樊","胡","凌","霍","虞","万","⽀","柯","昝","管","卢","莫","经","房","裘","缪","⼲","解","应",
"宗","丁","宣","贲","邓","郁","单","杭","洪","包","诸","左","⽯","崔","吉","钮","龚","程","嵇","邢","滑","裴","陆","荣","翁","荀",
"⽺","于","惠","甄","曲","家","封","芮","羿","储","靳","汲","邴","糜","松","井","段","富","巫","乌","焦","巴","⼸","牧","隗","⼭",java技术介绍百度百科
"⾕","车","侯","宓","蓬","全","郗","班","仰","秋","仲","伊","宫","宁","仇","栾","暴","⽢","钭","厉","戎","祖","武","符","刘","景",
"詹","束","龙","叶","幸","司","韶","郜","黎","蓟","溥","印","宿","⽩","怀","蒲","邰","从","鄂","索","咸","籍","赖","卓","蔺","屠",
"蒙","池","乔","阴","郁","胥","能","苍","双","闻","莘","党","翟","谭","贡","劳","逄","姬","申","扶","堵","冉","宰","郦","雍","却",
"璩","桑","桂","濮","⽜","寿","通","边","扈","燕","冀","浦","尚","农","温","别","庄","晏","柴","瞿","阎","充","慕","连","茹","习",
"宦","艾","鱼","容","向","古","易","慎","⼽","廖","庾","终","暨","居","衡","步","都","耿","满","弘","匡","国","⽂","寇","⼴","禄",
"阙","东","欧","⽎","沃","利","蔚","越","夔","隆","师","巩","厍","聂","晁","勾","敖","融","冷","訾","⾟","阚","那","简","饶","空",
"曾","⽏","沙","乜","养","鞠","须","丰","巢","关","蒯","相","查","后","荆","红","游","郏","竺","权","逯","盖","益","桓","公","仉",
"督","岳","帅","缑","亢","况","郈","有","琴","归","海","晋","楚","闫","法","汝","鄢","涂","钦","商","牟","佘","佴","伯","赏","墨",
"哈","谯","篁","年","爱","阳","佟","⾔","福","南","⽕","铁","迟","漆","官","冼","真","展","繁","檀","祭","密","敬","揭","舜","楼",
"疏","冒","浑","挚","胶","随","⾼","皋","原","种","练","弥","仓","眭","蹇","覃","阿","门","恽","来","綦","召","仪","风","介","巨",
"⽊","京","狐","郇","虎","枚","抗","达","杞","苌","折","麦","庆","过","⽵","端","鲜","皇","亓","⽼","是","秘","畅","邝","还","宾",
"闾","辜","纵","侴","万俟","司马","上官","欧阳","夏侯","诸葛","闻⼈","东⽅","赫连","皇甫","⽺⾆","尉迟","公⽺","澹台","公冶","宗正", "濮阳","淳于","单于","太叔","申屠","公孙","仲孙","轩辕","令狐","钟离","宇⽂","长孙","慕容","鲜于","闾丘","司徒","司空","兀官","司寇", "南门","呼延","⼦车","颛孙","端⽊","巫马","公西","漆雕","车正","壤驷","公良","拓跋","夹⾕","宰⽗","⾕梁","段⼲","百⾥","东郭","微⽣", "梁丘","左丘","东门","西门","南宫","第五","公仪","公乘","太史","仲长","叔孙","屈突","尔朱","东乡","相⾥","胡母","司城","张廖","雍门", "⽏丘","贺兰","綦⽏","屋庐","独孤","南郭","北宫","王孙"};
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论