printf打印函数的原理浅析--688IT编程网

printf打印函数的原理浅析

printf的底层原理浅析

⽬录

前⾔

最近在学习linux内核的时候⽤到了⾃定义实现的printf，学习了⼀下，在此记录，希望有助于⼤家。

在C语⾔中，我们⽤到的最多的输出功能函数⼤概就是printf了。但以前只是调⽤C语⾔的库函数，具体printf是如何实现的呢？

说到底两件事：

（1）、函数变参

（2）、格式解析

下⾯将简要介绍以上两点内容，最后附⼀个简单的printf例⼦。

函数变参

何为函数变参？简要来说就是参数个数不固定的函数。⼤部分时间，我们⽤的、写的都是参数固定的函数。但是为了应对想printf这种参数不固定的函数（），C语⾔提供了⼀种变参函数的机制。printf怎么输出字符

int printf (const char*__format,...);

如上所⽰为pritnf的声明。其中format就是我们以前写的格式化字符串，其中包括我们想输出的内容和参数占位符（⽤%+格式化字符来占位）。后⾯的 ‘…’，就是代表不固定的参数。

我们调⽤的使⽤像下⾯这样进⾏调⽤：

printf（“This is a test:%d,%c,%s”,a,b,c）;

这⾥的…，就代表了a,b,c三个参数。

说完了变参函数的概念，下⾯说说变参函数的实现原理。

我们知道，在调⽤函数的时候，函数的参数是在栈中分配的。⽐如说调⽤下⾯这个普通函数。

//函数声明

int Add(int a,int b);

//函数调⽤

Add(3,5);

其栈⼤概是向下⾯这样分配的。

即，⼀般来说，栈空间是从搞地址向低地址分配，函数参数从右依次向左分配。分配完成之后，在函数内部的操作就是对这栈空间的变量进⾏的操作，这也是为什么我们在函数内部改变传⼊参数的值，却不能够传到函数外部的原因（如果不使⽤指针或者地址的话）。

⽽对于变参函数来说，其基本的传参原则是和上⾯说的⼀致。但是由于其函数声明参数并不固定，所以有些栈中的变量是没有名字的，我们如果想使⽤这段空间，必须由我们⾃⼰通过指针来实现。

是不是有点蒙圈，有点绕？

⼩⼆，来点栗⼦。

如果我这样调⽤printf函数

printf（“This is a test:%d,%c,%s”,10,'A',"helloworld"）;

看下⾯栈的内存分配图。

如上图所⽰，在栈中只有format变量（字符指针类型，在printf的声明函数中定义了此参数），是有名字的，其他的三个内存空间⾥⾯只有值，但是没有名字来指明它们。所以，我们只能通过地址变量来到（访问）它们。

这⾥要稍微补充⼀点，⼀般来说，对于变参函数来说，虽然其参数的个数是不固定的，但是其最少要有⼀个参数，就像printf函数中⾄少要有⼀个format参数⼀样（好像在宏定义变参函数中，可以由0个参数，这⾥不讨论）。

答：这个最少要有的⼀个参数⼀般就是⽤来定位栈顶空间的。就像我们在上⾯描述的那样，栈内存的分配是从右向左的，最左边的参数就是栈顶元素。相当于，我们知道了栈顶的地址，只要再根据变参中每个参数的类型（int、char型等），相应的进⾏地址偏移，就可以访问变参的内容。

哎呀，⼜有⼀个问题了，在被调⽤的函数内部我怎么知道变参的类型是什么呢？

嘿嘿，还真是，⼀般你还真是不知道。这种情况下就需要调⽤者和被调⽤者商量好了。对于printf函数来说，调⽤者通过%+格式字符的⽅式通知了被调⽤者（printf的实现者）。

怎么通知的呢？

答：就是通过第⼀个format参数了。因为%+格式字符都是在format参数⾥的啊。

格式解析

弄懂了上⾯所说的，剩下的就没什么好说的了。简单提⼀下。

简单来说就是扫描format参数⾥的字符，如果是普通字符就打印输出，如果是%，就说明后⾯有可能是格式字符，需要进⾏检测，然后从栈顶（其实是第⼀个参数的位置）弹出指定类型的数据，按照指定格式（⼗进制、⼗六进制、指定宽度、指定精度等等）进⾏输出。

基本上是⼀个字符串解析的过程。后⾯代码有解析，在此就不详述了。

⼀个简单的printf⽰例

//从传递的栈中获取参数的⼀些设置

typedef char* va_list;

#define _INTSIZEOF(n) ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )

#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )

#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

#define va_end(ap) ( ap = (va_list)0 )

#define BUFFER_SIZE 4096

static char print_buf[BUFFER_SIZE];

static char num_to_char[]="0123456789ABCDEF";

//将⼗进制数据转化为字符型数据

int fillD(char print_buf[],int k,int num,int base)

{

int i;

int tmp;

char tmp_str[BUFFER_SIZE]={0};

int tmp_index =0;

if(num ==0)

tmp_str[tmp_index++]='0';

else if(num <0)//如果是负数的话，记录下符号后转为相反的数

{

print_buf[k++]='-';

num =-num;

}

//将num转化为base进制的数据

while(num >0)

{

tmp = num % base;//取最低位元素

tmp_str[tmp_index++]= num_to_char[tmp];//⼊栈，填⼊字符型数字

num = num/ base;

}

//将字符型数字出栈倒⼊buf中

for(i = tmp_index-1;i>=0;--i)

{

print_buf[k++]= tmp_str[i];

}

return k;

}

//填充字符串

int fillStr(char print_buf[],int k,char* src)

{

int i =0;

for(;src[i]!='\0';++i)

{

print_buf[k++]= src[i];

}

return k;

}

//处理具体的解析，并输出到printf_buf中 //I , %c take %d years to %x fin %s ished it\n ; int my_vsnprintf(char print_buf[],int size,const char*fmt,va_list arg_list)

{

int i =0,k =0;

char tmp_c =0;

int tmp_int =0;

char*tmp_cp =NULL;

for(i =0;i<size && fmt[i]!='\0';++i)

{

if('%'!= fmt[i])//直接输出的普通格式字符

{

print_buf[k++]= fmt[i];

}

else//需要特殊处理的字符

{

if(i+1< size)

{

switch(fmt[i+1])

{

case'c'://处理字符型数据

tmp_c =va_arg(arg_list,char);//获得字符型参数

print_buf[k++]= tmp_c;

break;

case'd'://处理⼗进制数据

tmp_int =va_arg(arg_list,int);

k =fillD(print_buf,k,tmp_int,10);//填充⼗进制数据

break;

case'x'://处理⼗六进制数据

//填充16进制标志符号

print_buf[k++]='0';

print_buf[k++]='x';

tmp_int=va_arg(arg_list,int);//获取int型数据

k =fillD(print_buf,k,tmp_int,16);//填充⼗六进制数据

break;

case's'://处理字符串

tmp_cp =va_arg(arg_list,char*);//获得字符串型数据

k =fillStr(print_buf,k,tmp_cp);//填充字符串

break;

}

else

print_buf[k++]= fmt[i];//最后⼀个字符是%，直接读取即可

}

return k;//返回当前位置

}

//输出缓冲区⾥的字符

void__put_str(char print_buf[],int len)

{

int i =0;

for(;i<len;++i)

putchar(print_buf[i]);

}

void printk(char const*fmt,...)

{

int len =0;

va_list arg_list;

va_start(arg_list,fmt);//arg_list指向第⼀个参数的位置(不是fmt)

len =my_vsnprintf(print_buf,sizeof(print_buf),fmt,arg_list);//解析参数，并打印到输出中

va_end(arg_list);//变参结束

__put_str(print_buf,len);//转换成字符输出

}

结语

是不是懂了？做个作业呗。

1、以下代码段是C语⾔提供的变参函数的主要代码部分，你看看，能看的懂吗？

typedef char* va_list;

#define _INTSIZEOF(n) ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) )

#define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) )

#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )

#define va_end(ap) ( ap = (va_list)0 )

2、⼀般情况下，在传递字符串参数的时候，为何在栈中保存的都是字符串的⾸地址，⽽不是整个字符串内容呢？

这么简单的问题，⼀定难不倒你了。

补充

按理说，函数形参的传递在栈内存中的分布应该是和我上⾯说的差不多，但是最近在做实验的时候，发现了不⼀样的结果。形式上是函数调⽤栈空间是从下往上的。具体原因，也不是很了解，如果有懂的⼤佬，希望帮我指点下迷津。

以下是我的测试代码：

688IT编程网

printf打印函数的原理浅析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

printf打印函数的原理浅析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式