C语⾔字符数组与字符串的使⽤及加结束符0的问题
1、字符数组的定义与初始化
字符数组的初始化,最容易理解的⽅式就是逐个字符赋给数组中各元素。
char str[10]={ ‘I’,’ ‘,’a’,’m’,’ ‘,‘h’,’a’,’p’,’p’,’y’};
即把10个字符分别赋给str[0]到str[9]10个元素
如果花括号中提供的字符个数⼤于数组长度,则按语法错误处理;若⼩于数组长度,则只将这些字符数组中前⾯那些元素,其余的元素⾃动定为空字符(即 ‘\0’ )。
2、字符数组与字符串
在C语⾔中,将字符串作为字符数组来处理。(c++中不是)
在实际应⽤中⼈们关⼼的是有效字符串的长度⽽不是字符数组的长度,例如,定义⼀个字符数组长度为100,⽽实际有效字符只有40个,为了测定字符串的实际长度,C语⾔规定了⼀个“字符串结束标志”,以字符’\0’代表。如果有⼀个字符串,其中第10个字符
为’\0’,则此字符串的有效字符为9个。也就是说,在遇到第⼀个字符’\0’时,表⽰字符串结束,由它前⾯的字符组成字符串。
系统对字符串常量也⾃动加⼀个’\0’作为结束符。例如”C Program”共有9个字符,但在内存中占10个字节,最后⼀个字节’\0’是系统⾃动加上的。(通过sizeof()函数可验证)
有了结束标志’\0’后,字符数组的长度就显得不那么重要了,在程序中往往依靠检测’\0’的位置来判定字符串是否结束,⽽不是根据数组的长度来决定字符串长度。当然,在定义字符数组时应估计实际字符串长度,保证数组长度始终⼤于字符串实际长度。(在实际字符串定义中,常常并不指定数组长度,如char str[ ])
说明:’\n’代表ASCII码为0的字符,从ASCII码表中可以查到ASCII码为0的字符不是⼀个可以显⽰的字符,⽽是⼀个“空操作符”,即它什么也不⼲。⽤它来作为字符串结束标志不会产⽣附加的操作或增加有效字符,只起⼀个供辨别的标志。
对C语⾔处理字符串的⽅法由以上的了解后,再对字符数组初始化的⽅法补充⼀种⽅法——即可以⽤字符串常量来初始化字符数组:
char str[ ]={“I am happy”}; 可以省略花括号,如下所⽰
char str[ ]=”I am happy”;
注意:上述这种字符数组的整体赋值只能在字符数组初始化时使⽤,不能⽤于字符数组的赋值,字符数组的赋值只能对其元素⼀⼀赋值,下⾯的赋值⽅法是错误的
char str[ ];
str=”I am happy”;
不是⽤单个字符作为初值,⽽是⽤⼀个字符串(注意:字符串的两端是⽤双引号“”⽽不是单引号‘’括起来的)作为初值。显然,这种⽅法更直观⽅便。(注意:数组str的长度不是10,⽽是11,这点请务必记住,因为字符串常量”I am happy”的最后由系统⾃动加上⼀个’\0’)
因此,上⾯的初始化与下⾯的初始化等价
char str[ ]={‘I’,’ ‘,’a’,’m’,’ ‘,’h’,’a’,’p’,’p’,’y’,’\0’};
⽽不与下⾯的等价
char str[ ]={‘I’,’ ‘,’a’,’m’,’ ‘,’h’,’a’,’p’,’p’,’y’};
前者的长度是11,后者的长度是10.
说明:字符数组并不要求它的最后⼀个字符为’\0’,甚⾄可以不包含’\0’,向下⾯这样写是完全合法的。
char str[5]={‘C’,’h’,’i’,’n’,’a’};
可见,⽤两种不同⽅法初始化字符数组后得到的数组长度是不同的。
#include<stdio.h>
void main(void)
{
char c1[]={'I',' ','a','m',' ','h','a','p','p','y'};
char c2[]="I am happy";
int i1=sizeof(c1);
int i2=sizeof(c2);
printf("%d\n",i1);
printf("%d\n",i2);
}
结果:10 11
3、字符串的表⽰形式
在C语⾔中,可以⽤两种⽅法表⽰和存放字符串:
(1)⽤字符数组存放⼀个字符串
char str[ ]=”I love China”;
(2)⽤字符指针指向⼀个字符串
char* str=”I love China”;
对于第⼆种表⽰⽅法,有⼈认为str是⼀个字符串变量,以为定义时把字符串常量”I love China”直接赋给该字符串变量,这是不对的。
C语⾔对字符串常量是按字符数组处理的,在内存中开辟了⼀个字符数组⽤来存放字符串常量,程序在定义字符串指针变量str时只是把字符串⾸地址(即存放字符串的字符数组的⾸地址)赋给str。
两种表⽰⽅式的字符串输出都⽤
printf(“%s\n”,str);
%s表⽰输出⼀个字符串,给出字符指针变量名str(对于第⼀种表⽰⽅法,字符数组名即是字符数组的⾸地址,与第⼆种中的指针意义是⼀致的),则系统先输出它所指向的⼀个字符数据,然后⾃动使str⾃动加1,使之指向下⼀个字符…,如此,直到遇到字符串结束标识符 ”\0 “。
4、对使⽤字符指针变量和字符数组两种⽅法表⽰字符串的讨论
虽然⽤字符数组和字符指针变量都能实现字符串的存储和运算,但它们⼆者之间是有区别的,不应混为⼀谈。
4.1、字符数组由若⼲个元素组成,每个元素放⼀个字符;⽽字符指针变量中存放的是地址(字符串/字符数组的⾸地址),绝不是将字符串放到字符指针变量中(是字符串⾸地址)
4.2、赋值⽅式:
对字符数组只能对各个元素赋值,不能⽤以下⽅法对字符数组赋值
char str[14];
str=”I love China”; (但在字符数组初始化时可以,即char str[14]=”I love China”;)
⽽对字符指针变量,采⽤下⾯⽅法赋值:
char* a;怎么给数组赋值
a=”I love China”;
或者是 char* a=”I love China”; 都可以
4.3、对字符指针变量赋初值(初始化):
char* a=”I love China”;
等价于:
char* a;
a=”I love China”;
⽽对于字符数组的初始化
char str[14]=”I love China”;
不能等价于:
char str[14];
str=”I love China”; (这种不是初始化,⽽是赋值,⽽对数组这样赋值是不对的)
4.4、如果定义了⼀个字符数组,那么它有确定的内存地址;⽽定义⼀个字符指针变量时,它并未指向某个确定的字符数据,并且可以多次赋值。
‘\0’的问题
对字符数组,有以下⼏种定义⽅法:
1. char str[]=”12345”;
或给字符串加上⼤括号:char str[]={“12345”};
这种⽅法定义时,系统会⾃动在字符串的末尾加上字符串结束符,即 ‘\0’,
2. char str[10]={‘1’,’2’,’3’,’4’,’5’};
这种⽅法定义时,系统会⾃动从未初始化的元素开始,将之后的元素赋为\0,如上⾯的数组str中的元素实际上
是:’1’,’2’,’3’,’4’,’5’,’\0’,’\0’,’\0’,’\0’,’\0’
3. char str[]={‘1’,’2’,’3’,’4’,’5’};
这种⽅法定义时,系统不会⾃动在字符串的末尾加上字符串结束符;
此时⽤sizeof()函数可以正确求出其所占的内存⼤⼩;但⽤strlen()函数不能正确求出其长度,因为strlen是通过\0判断字符串结束的。
所以,采⽤该⽅法定义时,⼀般⼈为地加上\0,即char str[]={‘1’,’2’,’3’,’4’,’5’, ‘\0’};
易错情况:
1、char a[10]; a[10]=”hello”;//⼀个字符怎么能容纳⼀个字符串?况且a[10]也是不存在的!
2、char a[10]; a=”hello”;//这种情况容易出现,a虽然是指针,但是它已经指向在堆栈中分配的10个字符空间,现在这个情况a⼜指向数据区中的hello常量,这⾥的指针a出现混乱,不允许!
还有:不能使⽤关系运算符“==”来⽐较两个字符串,只能⽤strcmp() 函数来处理。
补充:
⽆论是静态,局部还是全局数组只有在定义时才能初始话,否则必须通过其它⽅法,⽐如循环操作实现。
任何
int a[3];
static int b[3];
a[3] = {1, 2, 3};
b[3] = {1, 2, 3};
没有在定义时初始化都是错误的!
⽤字符指针定义时:
1. 只能采⽤字符串的⽅式初始化:char *str3=”12345”;
注意:字符指针可以⽤字符串常量初始化和赋值;
即:char *str3;str3=”12345”;也是可以的
此时也可以⽤str3[4]的形式访问其中的元素,如cout<< str3[4];就会输出str指向的字符串的第四个元素。
该⽅法也是⾃动加上了字符串结束符的。
重要补充(原创)
在对字符数组进⾏赋值时,如果是这种赋值⽅式:
那么编译器是会⾃动补充’\0’的。
但是如果是这种:
可以看到,编译器输出了⼀⼤堆乱码,这是因为这种赋值⽅式编译器是不会⾃动加上’\0’的,所以编译器检测不到’\0’,导致输出了⼀堆乱码…
⼆维字符数组也是同理:
所以别忘了⼿动补充’\0’啊。。。。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论