cjson源代码解读(三)解析字符串、数字、数组、对象--688IT编程网

cjson源代码解读（三）解析字符串、数字、数组、对象

1. 解析数字

static const char *parse_number(cJSON *item,const char *num)

{

double n=0,sign=1,scale=0;int subscale=0,signsubscale=1;

if (*num=='-') sign=-1,num++; /* Has sign? */

if (*num=='0') num++; /* is zero */

if (*num>='1' && *num<='9') do n=(n*10.0)+(*num++ -'0'); while (*num>='0' && *num<='9'); /* Number? */

if (*num=='.' && num[1]>='0' && num[1]<='9') {num++; do n=(n*10.0)+(*num++ -'0'),scale--; while (*num>='0' && *num<='9');} /* Fractional part? */

if (*num=='e' || *num=='E') /* Exponent? */

{ num++;if (*num=='+') num++; else if (*num=='-') signsubscale=-1,num++; /* With sign? */

while (*num>='0' && *num<='9') subscale=(subscale*10)+(*num++ - '0'); /* Number? */

}

n=sign*n*pow(10.0,(scale+subscale*signsubscale)); /* number = +/- number.fraction * 10^+/- exponent */

item->valuedouble=n;

item->valueint=(int)n;

item->type=cJSON_Number;

return num;

}

item是传进来的cjson object， num是起始数字。

1. 解析正负，⽤sign 标记， -1 是负

2. 判断是不是0

3. 判断⼩数点前⾯的数字，也就是 - 3.2 e 5 ，前⾯的3.2，这个分为两部分，⼩数点前和后

4. e或者E，即科学计数的后半部分，这个时候需要处理⼀下科学计数的部分是不是正或者负的问题，⽤signsubscale 记录。

5. 然后直接解析，这⾥作者⽤了个⼩技巧，作者直接在解析前⾯基数的部分，解析出的是整数，⽤scale记录，最后⽤科学技术弄回来就OK了，很巧妙。

6. 然后返回数字，解析出来⼀个Object。

2. 解析字符串

static const char *parse_string(cJSON *item,const char *str)

{

const char *ptr=str+1;char *ptr2;char *out;int len=0;unsigned uc,uc2;

if (*str!='\"') {ep=str;return 0;} /* not a string! */

while (*ptr!='\"' && *ptr && ++len) if (*ptr++ == '\\') ptr++; /* Skip escaped quotes. */ //跳到字符串最后⼀

个去

out=(char*)cJSON_malloc(len+1); /* This is how long we need for the string, roughly. */ //预申请⼀个字符串空间⼤⼩的空间

if (!out) return 0; //申请不成功则退出

ptr=str+1;ptr2=out; //重新开始， ptr2设置成out开始的部位

while (*ptr!='\"' && *ptr)

{

if (*ptr!='\\') *ptr2++=*ptr++; //正常情况下，直接跑下去就⾏

else

{

ptr++;

switch (*ptr)

{

case 'b': *ptr2++='\b'; break; //特殊情况，则断掉就⾏

case 'f': *ptr2++='\f'; break;

case 'n': *ptr2++='\n'; break;

case 'r': *ptr2++='\r'; break;

case 't': *ptr2++='\t'; break;

case 'u': /* transcode utf16 to utf8. */ //unicode 则要单独处理

uc=parse_hex4(ptr+1);ptr+=4; /* get the unicode char. */ //parse hex 在后⾯，就是把后四位都弄出来，

if ((uc>=0xDC00 && uc<=0xDFFF) || uc==0) break; /* check for invalid. */

if (uc>=0xD800 && uc<=0xDBFF) /* UTF16 surrogate pairs. */

{

if (ptr[1]!='\\' || ptr[2]!='u') break; /* missing second-half of surrogate. */

uc2=parse_hex4(ptr+3);ptr+=6;

if (uc2<0xDC00 || uc2>0xDFFF) break; /* invalid second-half of surrogate. */

uc=0x10000 + (((uc&0x3FF)<<10) | (uc2&0x3FF));

}

len=4;if (uc<0x80) len=1;else if (uc<0x800) len=2;else if (uc<0x10000) len=3; ptr2+=len;

switch (len) {

case 4: *--ptr2 =((uc | 0x80) & 0xBF); uc >>= 6;

case 3: *--ptr2 =((uc | 0x80) & 0xBF); uc >>= 6;

case 2: *--ptr2 =((uc | 0x80) & 0xBF); uc >>= 6;

case 1: *--ptr2 =(uc | firstByteMark[len]);

}

ptr2+=len;

break;

default: *ptr2++=*ptr; break;

}

ptr++;

}

*ptr2=0;

if (*ptr=='\"') ptr++;

item->valuestring=out;

item->type=cJSON_String;

return ptr;

}

static unsigned parse_hex4(const char *str)

{

unsigned h=0;

if (*str>='0' && *str<='9') h+=(*str)-'0'; else if (*str>='A' && *str<='F') h+=10+(*str)-'A'; else if (*str>='a' && *str<='f') h+=10+(*str)-'a'; else return 0; h=h<<4;str++;

if (*str>='0' && *str<='9') h+=(*str)-'0'; else if (*str>='A' && *str<='F') h+=10+(*str)-'A'; else if (*str>='a' && *str<='f') h+=10+(*str)-'a'; else return 0; return h;

}

除了转码，剩下的都⽐较简单，就是申⼀个字符串，然后拷过去。

3. 解析数组

static const char *parse_array(cJSON *item,const char *value)

{

cJSON *child;

if (*value!='[') {ep=value;return 0;} /* not an array! */

item->type=cJSON_Array;

value=skip(value+1);

if (*value==']') return value+1; /* empty array. */

item->child=child=cJSON_New_Item();

if (!item->child) return 0; /* memory fail */

value=skip(parse_value(child,skip(value))); /* skip any spacing, get the value. */

if (!value) return 0;

while (*value==',')

{

cJSON *new_item;

if (!(new_item=cJSON_New_Item())) return 0; /* memory fail */

child->next=new_item;new_item->prev=child;child=new_item;

value=skip(parse_value(child,skip(value+1)));

if (!value) return 0; /* memory fail */

}

if (*value==']') return value+1; /* end of array */

ep=value;return 0; /* malformed. */

}

如果内容不是空，然后⼀直往下解析。就OK了。

4. 解析对象，对象以{}表明

static const char *parse_object(cJSON *item,const char *value)

{

cJSON *child;

if (*value!='{') {ep=value;return 0;} /* not an object! */

item->type=cJSON_Object;

value=skip(value+1);

if (*value=='}') return value+1; /* empty array. */

item->child=child=cJSON_New_Item();

if (!item->child) return 0;

value=skip(parse_string(child,skip(value)));

if (!value) return 0;

child->string=child->valuestring;child->valuestring=0;

if (*value!=':') {ep=value;return 0;} /* fail! */

value=skip(parse_value(child,skip(value+1))); /* skip any spacing, get the value. */

if (!value) return 0;

while (*value==',')

{

cJSON *new_item;

if (!(new_item=cJSON_New_Item())) return 0; /* memory fail */

child->next=new_item;new_item->prev=child;child=new_item;

value=skip(parse_string(child,skip(value+1)));

if (!value) return 0;

child->string=child->valuestring;child->valuestring=0;

if (*value!=':') {ep=value;return 0;} /* fail! */

value=skip(parse_value(child,skip(value+1))); /* skip any spacing, get the value. */

if (!value) return 0;

}

字符串转数组char

if (*value=='}') return value+1; /* end of array */

ep=value;return 0; /* malformed. */

}

就是⼀个value，⼀个value往下滚，然后⾃⼰的值⽤child记录，前⼀个的位置也记录下来。跟array没有什么⼤的区别。主要就是这四个。

688IT编程网

cjson源代码解读(三)解析字符串、数字、数组、对象

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

cjson源代码解读(三)解析字符串、数字、数组、对象

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式