FFMpeg SDK 开发手册FFMpeg 中比较重要的函数以及数据结构如下:
1.数据结构:
(1)A VFormatContext
(2)A VOutputFormat
(3)A VInputFormat
(4)A VCodecContext
(5)A VCodec
(6)A VFrame
(7)A VPacket
(8)A VPicture
(9)A VStream
2.初始化函数:
(1)av_register_all()
(2)avcodec_open()
(3)avcodec_close()
(4)av_open_input_file()
(5)av_find_input_format()
(6)av_find_stream_info()
(7)av_close_input_file()
3.音视频编解码函数:
(1)avcodec_find_decoder()
(2)avcodec_alloc_frame()
(3)avpicture_get_size()
(4)avpicture_fill()
(5)img_convert()
(6)avcodec_alloc_context()
(7)avcodec_decode_video()
(8)av_free_packet()
(9)av_free()
4.文件操作:
(1)avnew_steam()
(2)av_read_frame()
(3)av_write_frame()
(4)dump_format()
5.其他函数:
(1)avpicture_deinterlace()
(2)ImgReSampleContext()
以下就根据,以上数据结构及函数在ffmpeg测试代码output_example.c中出现的前后顺进行分析。在此之前还是先谈一下ffmpeg的编译问题。在linux下的编译比较简单,这里不多说了。在windows下的编译可以参考以下网页:
/viewthread.php?tid=1897&extra=page%3D1
值得一提的是,在使用编译后的sdk进行测试时(用到ffmpeg目录下的output_example.c)编译过程中可能会有以下两个问题:
1.Output_example.c用到了snprintf.h这个头文件。然而这个头文件在win下和linux下有所不同。
具体在win下可以用以下方法解决:
www.ijs.si/software/snprintf/
2.如果使用vc6,或是vc6的命令行进行编译,inline可能不认。错误会出现在common.件中,可以在common.h中加入
#ifdef _MSC_V AR
#define inline __inline
#endif
交待完毕进入正题。
一.FFMpeg 中的数据结构:
I. AVFormatContext
一般在使用ffmpeg sdk的代码中A VFormatContext是一个贯穿始终的数据结构,很多函数都要用到它作为参数。FFmpeg代码中对这个数据结构的注释是:format I/O context
此结构包含了一个视频流的格式内容。其中存有了A VInputFormat(or A VOutputFormat同一时间A V
FormatContext内只能存在其中一个),和A VStream、A VPacket这几个重要的数据结构以及一些其他的相关信息,比如title,author,copyright等。还有一些可能在编解码中会用到的信息,诸如:duration, file_size, bit_rate等。参考avformat.h头文件。
Useage:
声明:
A VFormatContext *oc; (1)
初始化:由于A VFormatConext结构包含许多信息因此初始化过程是分步完成,而且有些变量如果没有值可用,也可不初始化。但是由于一般声明都是用指针因此一个分配内存过程不可少:
oc =av_alloc_format_context(); (2)
结构中的A VInputFormat*(或A VOutputFormat*)是一定要初始化的,基本上这是编译码要使用什么codec的依据所在:
oc->oformat
fmt;      (3)
or oc->iformat
=
=
fmt;
其中A VOutputFormat* fmt或A VInputFormat* fmt。(A VInputFormat and A VOutputFormat的初始化在后面介绍。随后在参考代码output_example.c中有一行:
snprintf(oc-filename, sizeof(oc->filename), “%s”, filename);  (4)
还不是十分清楚有什么作用,估计是先要在输出文件中写一些头信息。
在完成以上步骤後,(初始化完毕A VInputFormat*(或A VOutputFormat*)以及A VFormatContext)接下来就是要利用oc初始化本节开始讲到的A VFormatContext中的第二个重要结构。A VStream(假设已经有了声明A VStream *video_st。参考代码中用了一个函数来完成初始化,当然也可以在主函数中做,传递进函数的参数是oc 和fmt->video_codec(这个在下一节介绍(29)):
fmt->video_codec); (5)
vdeo_st = add_video_stream(oc,
此函数会在后面讲到A VStream结构时分析。
A VFormatContext最后的一个设置工作是:
if( av_set_paramters(oc,NULL) < 0){ (6)
//handle error;
}
1);        (7)
filename,
0,
dump_format(oc,
作用就是看看先前的初始化过程中设置的参数是否符合规范,否则将报错。
上面讲的都是初始化的过程,包括A VFormatContext本身的和利用A VFormatContext初始化其他数据结构的。接下来要讲讲整个的编解码过程。我想先将ouput_example.c中main函数内的编解码函数框架描述一下。这样比较清晰,而且编码者为了结构清晰,在写ouput_example.c的过程中也基本上在main函数中只保持A VFormatContext和A VStream两个数据结构(A VOutputFormat其实也在但是包含在A VFormatContext中了)。
// open video codec and allocate the necessary encode buffers
if(video_st)
video_st); (8)
open_video(oc,
// write the stream header, if any
av_write_header(oc);  (9)
// encode and decode process
;){
for(;
video_st); (10)
write_video_frame(oc,
condition…here
//
break
}
//close codec
if(video_st)
video_st); (11)
close_video(oc,
/
/write the trailer , if any
av_write_trailer(oc); (12)
// free the streams
for(i=0; i<oc->b_streams; i++){
av_freep(&oc->streams[i]->codec); (13)
av_freep(&oc->streams[i]); (14)
}
//close the ouput file
if(!(fmt->flags & A VFMT_NOFILE)){
url_fclose(&oc->pb); (15)
}
av_free(oc); (16)通过以上的一串代码,就可以清晰地看出A VFormatContex* oc和A VStream* video_st是在使用ffmpeg SDK开发时贯穿始终的两个数据结构。以下,简要介绍一下三个标为红的函数,他们是参考代码output_example.c开发者自行定义的函数。这样可以使整个代码结构清晰,当然你在使用ffmpeg SDK时也可以在主函数中完成对应的功能。在后面我们会专门针对这三个函数做分析。
1.open_video(oc, video_st);
此函数主要是对视频编码器(或解码器)的初始化过程。初始化的数据结构为A VCodec* codec 和A VCodecContext* c包括用到了的SDK函数有:
c = st->codec;
codec = avcodec_find_encoder(c->codec_id); //编码时,编码器(17)
codec = avcodec_find_decoder(c->codec_id); //解码时,解码器(18)
A VCodecContex是结构A VStream中的一个数据结构,因此在A VStream初始化後(5)直接复值给c。
// internal open video codec
avcodec_open(c,codec); (19)
// allocate video stream buffer
// A VFrame *picture
// uint8_t *video_outbuf
video_outbuf_size=200000;
video_outbuf = av_maloc(video_outbuf_size); (20)
// allocate video frame buffer
c->height); (21) picture = alloc_picture(c->pix_fmt, c->width,
上述三步比较容易理解,打开视频编解码codec、分配输出流缓存大小、分配每一帧图像缓存大小。其中A VFrame也是ffmpeg中主要数据结构之一。这一步(8)是对编解码器的初始化过程。
2.write_video_frame(A VFormatContext *oc, A VStream *st)
这个函数中做了真正的编解码工作,其中的函数比较复杂先列出来慢慢分析。
用到的数据结构有A VCodecContext *c, SwsContext *img_convert_ctx。其中SwsContext是用来变
换图像格式的。比如yuv422变到yuv420等,当然也用到函数,见下面列表。
(22)
fill_yuv_image(tmp_picture, frame_count, c->width, c->height);
sws_scale(img_convert_ctx, tmp_picture->, tmp_picture->linesize,
0, c->height, picture->data, picture->linesize); (23) img_convert_ctx = sws_getContxt(c->width, c->height, PIX_FMT_YUV420P, (24)
c->width, c->heigth, c->pix_fmt, sws_flags, NULL, NULL, NULL);
由于参考代码中做的是一个编码。因此,它总是要求编码器输入的是yuv文件,而且是yuv420格式的。就会有了以上一些处理过程。接下来调用编码器编码,数据规则化(打包)用到A VPacket,这也是ffmpeg 中一个比较不好理解的地方。
out_size = avcodec_encode_video(c, video_outbuf, video_outbuf_size, picture); (25)
A VPacket pkt;
av_init_packet(&pkt); (26)
//……handle pkt process, we will analyze later
&pkt);  (27) ret = av_write_frame(oc,sdk
有encode就一定会有decode。而且ffmpeg专为解码而生,但是为什么在参考代码中只用了encoder 呢?个人猜想是因为encode只是用yuv420来编码,这样的yuv420生成比较容易,要是用到解码的化,还要在代码中附带一个其他格式的音视频文件。在源代码libavcodec文件夹中有一个apiexample.c的参考代码,其中就做了编解码。有空的化我会分析一下。
3.close_video(A VFormatContext *oc, A VStream *st)
avcodec_close(st->codec);
av_free(picture->data[0]);
av_free(picture);
av_free(video_outbuf);
比较容易理解,不多说了。
以上一大段虽然名为介绍A VFormatContext。但基本上把ouput_example.c的视频编码部分的框架走了一遍,其一是想说明结构A VFormatContext的重要性,另一方面也是希望对使用FFMpeg SDK开发者有一个大致的框架。
其实,真正的一些编码函数,内存分配函数在SDK中都已经封装好了,只要搞清楚结构就能用了。而开发者要做的就是一些初始化的过程,基本上就是针对数据结构1的初始化。
II. AVOutputFormat
虽然简单(初始化)但是十分重要,他是编解码器将要使用哪个codec的“指示”。在其成员数据中
最重要的就是关于视频codec的了:enum CodecID video_codec;
A VOutputFormat *fmt;
guess_format(NULL,
NULL);  (28)
filename,
=
fmt
根据filename来判断文件格式,同时也初始化了用什么编码器。当然,如果是用A VInputFormat *fmt
的化,就是fix用什么解码器。(指定输出序列->fix编码器,指定输入序列->fix解码器?)
III. AVStream
A VStream作为继A VFormatContext後第二个贯穿始终的结构是有其理由的。他的成员数据中有
A VCodecContext这基本的上是对所使用的Video Codec的参数进行设定的(包括bit rate、分辨率等重要信息)。
同时作为“Stream”,它包含了“流”这个概念中的一些数据,比如:帧率(r_frame_rate)、基本时间计量
单位(time_base)、(需要编解码的)首帧位置(start_time)、持续时间(duration)、帧数(nb_frames)以及
一些ip信息。当然后面的这些信息中有些不是必须要初始化的,但是A VCodecContex是一定要初始化的,而
且就是作为初始化A VStream最重要的一个部分。我们在前面就谈到了A VStream的初始化函数(5),现在来看
看他是怎么做的:
// declaration
*video_st;
A VStream
video_st
= add_video_stream(oc, fmt->video_codec);
*add_video_stream(A VFormatContex *oc, int codec_id){ (29)
A VStream
static
*c; // member of A VStream, which will be initialized here
A VCodecContext
*st; // temporary data, will be returned
A VStream
st = av_new_stream(oc,
0); (30)
st->codec;
=
c
// 以下基本是针对c的初始化过程。包括比特率、分辨率、GOP大小等。
……
// 以下的两行需要注意一下,特别是使用MP4的
if(!strcmp(oc->oformat->name, “mp4”) || !strcmp(oc->oformat->name, “mov”) || !strcmp(oc->oformat->name, “3gp”))
CODEC_FLAG_GLOBAL_HEADER;
|=
c->flags
// 将st传给video_st;
st;
return
}
以上代码中,有几点需要注意的。一个是(30)和c = st->codec是一定要做的,当然这是编程中最基本的
问题,(30)是将st这个A VSteam绑定到A VFormatContext* oc上。后面的c = st->codec是将c绑定到st的
A VCodecContext上。其二是对c的初始化过程中,ouput_example.c里做的是一些基本的配置,当然作为使用
者的你还希望对codec加入其他的一些编解码的条件。可以参考avcodec.h里关于A VCodecContext结构的介
绍,注释比较详细的。
关于A VStream的使用在前面介绍A VFormatContext时已有所涉及,在主函数中三个编解码函数中(8)、(10)和(11)中。观察相关的代码,可以发现主要还是将A VStream中的A VCodecContext提取出来,再从中提取
出A VCodec结构如在(8)中:
// open_video(oc, video_st);
// A VFormatContext *oc, A VStream *st
A VCodec *codec;
*c;
A VCodecContext
st->codec;
=
c
avcodec_find_encoder(c->codec_id); (31)
codec
=
/
/ open the codec
avcodec_open(c, codec); (32)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。