C语言中字符串的处理方式
“很难从字符串中到感觉,但它们却是我们能指望的唯一交流纽带”
--《C语言程序设计 现代方法》
写多了 Java 代码,对 String 类 很是喜爱,可惜经典的 C 语言没有。。。最近在做程序过程中,发现对C语言字符串的处理很模糊,一会儿用数组,一会儿用指针,一会儿又引入 string.h。。。于是决定总结一下C语言中字符串的处理,一则作为笔记,二则作为技术交流和大家分享。
字符串字面量(字符串常量,在C标准中称为,字符串字面量)
如何存储字符串字面量 从本质上而言,C语言把字符串字面量作为字符数组来处理。当C语言编译器在程序中遇到长度为n的字符串字面量时,它会为字符串字面量分配长度为n+1的内存空间,在末尾增加一个额外的字符——空字符(\0)。
如何存储字符串字面量 从本质上而言,C语言把字符串字面量作为字符数组来处理。当C语言编译器在程序中遇到长度为n的字符串字面量时,它会为字符串字面量分配长度为n+1的内存空间,在末尾增加一个额外的字符——空字符(\0)。
字符串字面量的操作
通常情况下可以在任何C语言允许使用 char * 指针的地方使用字符串字面量。如:
char *p;
p= "abc";
1 这个赋值操作不是复制 "abc" 中的字符,而仅仅是使 p 指向字符串的第一个字符。
字符串变量
一些编程语言为声明字符串提供了特殊的 string 类型。C语言采取了不同的方式:只要保证字符串是以空字符串结尾的,任何一维的字符数组都可以用来存储字符串。如果编写自己的字符串处理函数,请千万注意要正确地处理空字符。
假设需要变量用来存储最多80个字符的字符串。既然字符串会在末尾处需要空字符,那么要声明的变量是含有81个字符的数组。
一些编程语言为声明字符串提供了特殊的 string 类型。C语言采取了不同的方式:只要保证字符串是以空字符串结尾的,任何一维的字符数组都可以用来存储字符串。如果编写自己的字符串处理函数,请千万注意要正确地处理空字符。
假设需要变量用来存储最多80个字符的字符串。既然字符串会在末尾处需要空字符,那么要声明的变量是含有81个字符的数组。
#define STR_LEN 80
/* 惯用法*/char str[STR_LEN+ 1];
/* 惯用法*/char str[STR_LEN+ 1];
2 对宏加一的这种方法是C程序员常用的方式。
初始化字符串变量
初始化字符串变量
char date1[8]= "June 14";
date1: | J | u | n | e | | 1 | 4 | \0 |
char date2[9]= "June 14";
date2: | J | u | n | e | | 1 | 4 | \0 | \0 |
大体上来说,这种行为与C语言处理数组初始化的方法一致。
字符串变量的声明可以忽略它的长度。这种情况下,编译器会自动计算长度:
char date3[]= "June 14";
大体上来说,这种行为与C语言处理数组初始化的方法一致。
字符串变量的声明可以忽略它的长度。这种情况下,编译器会自动计算长度:
char date3[]= "June 14";
编译器为date3分配8个字符的空间。
字符数组与字符指针一起来比较一下下面两个声明:
char date[]= "June 14";
字符数组与字符指针一起来比较一下下面两个声明:
char date[]= "June 14";
它声明date是个字符数组。和这个声明相似的是下面这个声明:
char *date= "June 14";
char *date= "June 14";
它声明date是个指向字符串字面量的指针。
[注意],不能错误地认为上面两种date可以互换。两者之间有着显著的差异:
(1) 在声明为数组时,就像任意数组元素一样,可以修改存储在date中的字符。在声明为指针时,date指向字符串字面量。(2) 在声明为数组时,date是数组名。在声明为指针时,date是变量,这个变量可以在程序执行期间指向其他字符串。
如果需要可以修改的字符串,那么就要建立字符数组来存储字符串。这时声明指针变量是不够的。下面的声明使编译器为指针变量分配了足够的内存空间:
[注意],不能错误地认为上面两种date可以互换。两者之间有着显著的差异:
(1) 在声明为数组时,就像任意数组元素一样,可以修改存储在date中的字符。在声明为指针时,date指向字符串字面量。(2) 在声明为数组时,date是数组名。在声明为指针时,date是变量,这个变量可以在程序执行期间指向其他字符串。
如果需要可以修改的字符串,那么就要建立字符数组来存储字符串。这时声明指针变量是不够的。下面的声明使编译器为指针变量分配了足够的内存空间:
char*p;
可惜的是,它不为字符串分配空间。在使用p作为字符串之前,必须把p指向字符串数组。一种可能是把p指向已经存在的字符串变量:
charstr[STR_LEN+1],*p;
p=str;
p=str;
现在p指向了str的第一个字符,所以可以把p作为字符串使用了。
3. 字符串的读写
3.1 用 printf 函数和 puts 函数写字符串
%s 允许 printf 函数写字符串。如:
char str[]= "Are we having fun yet?";
printf("Value of str: %s\n", str);
printf("Value of str: %s\n", str);
如果只显示字符串的一部分,可以用 %.ps。这里的 p 是要显示的字符数量。语句
printf("%.6s\n", str);
会显示出
Are we
C函数库还提供puts函数。
puts(str);
3.2 用 scanf 函数和 gets 函数读字符串
在 scanf 函数调用中,不需要在 str 前添加运算符 &。因为 str 是数组名,编译器会自动把它当作指针来处理。调用时,scanf 函数会跳过空白字符,然后读入字符,并且把读入的字符存储到 str 中,知道遇到空白字符为止。scanf 函数始终会在字符串末尾存储一个空字符。用 scanf 函数读入字符串永远不会包含空白字符。因此,scanf 函数通常不会读入一整行输入。换行符会使 scanf 函数停止读入,空格符或制表符也会产生同样的效果。可以参考下面的例子:
#include<stdio.h>
#define STR_LEN 80
int main()
{
char str[STR_LEN+ 1];
printf("input a string:");
scanf("%s", str);
printf("String inputed is:%s\n", str);
return 0;
}
运行结果如下:
Input a string:this is a string
String is:this
String is:this
为了每次读入一整行输入,可以使用 gets 函数。类似于 scanf 函数,gets 函数把读入的字符放到数组中,然后存储一个空字符。然而,在其他方面 gets 函数有些不同于 scanf 函数:
(1) gets 函数不会在开始读字符串之前跳过空白字符( scanf 函数会跳过)。
scanf用法c++ (2) gets 函数会持续读入直到到换行符才停止(scanf 函数会在任意空白字符处停止)。
此外,gets 函数会忽略掉换行符,而不会把它存储到数组中,用空字符代替换行符。
3.3 逐个字符读字符串
因为 scanf 函数和 gets 函数都有风险且不够灵活,C 程序员经常会编写自己的输入函数。通过每次一个字符的方式来读入字符串。下面是自己编写的读取字符串的函数 read_line():
int read_line(char strp[],int n)
{
char ch;
int i= 0;
while((ch= getchar())!= '\n')
if(i< n)
str[i++]= ch;
str[i]= '\0';/* terminates string*/
return i;/* number of characters stored*/
}
{
char ch;
int i= 0;
while((ch= getchar())!= '\n')
if(i< n)
str[i++]= ch;
str[i]= '\0';/* terminates string*/
return i;/* number of characters stored*/
}
返回之前,read_line 函数在字符串的末尾放置了一个空字符。就像 scanf 函数和 gets 函数一样,标准函数会自动在输入字符串的末尾放置一个空字符串。然而,如果自己写输入函数,必须要考虑到这一点。
3
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论