curl应用总结(一)
    最近开发中用到curl库,虽然都是很简单的应用,但对这个库还是产生了兴趣,想学习总结一下。curl库功能非常强大,这里主要针对http应用,尤其是http文件下载做一个总结。当然了,还是主要针对Windows系统来讲。
    本文是第一篇,当然要简单介绍一下curl,然后说一下Windows系统下的编译安装,以及对curl工具的简单应用。
 
    curl是一个基于命令行的应用工具,提供利用URL标准进行文件传输的功能。目前已经支持非常多的流行的互联网协议,如:FTP, FTPS, HTTP, HTTPS, SCP, SFTP, TFTP, TELNET, DICT, LDAP, LDAPS and FILE等。curl支持SSL认证,HTTP POST/PUTFTP上传,HTTP上传、代理、cookies、用户+密码认证、文件续传、代理管道等一系列强大功能。curl是用C语言写的,但是绑定了很多开发语言。大体上可以把curl分成命令行工具和libcurl库两个部分,命令行工具可以直接输入指令完成相应功能,libcurl则是一个客户端URL传输库,是线程安全且兼容IPv6,可以非常方便地用来做相关开发。
    更多关于curl的信息可以参考curl.haxx.se/curl的相关文档非常全,不得不赞一下。其实查阅原文文档是一个很好的习惯,而且还是一件很惬意的事情,对提高英文阅读能力帮助也很大。
    curl上可以直接下载到编译好的libdllexe文件,但是自己由源码编译安装curl,也是一件有意思的事情。从网站上下载源码包,解压缩后会看到根文件目录下面有很多文件及文件夹。其中的文件是有关curl项目的介绍、版本变更情况、以及一些有关配置和编译的文件;文件夹中比较重要的有3个:docslibsrcdocs中包括项目的所有相关文档,lib中为libcurl库的源码,srccurl命令行工具的源码。curl命令发送post请求带参数
    如果你熟悉MSVS开发环境的话,那么编译过程再简单不过了,因为最新的curl源码包中已经自带了vc6的工程文件,只要高于6.0版本的环境都可以直接打开工程进行编译链接,生成二进制文件。整个solution中包含两个project,一个是libcurl库,一个是curl的命令行工具。其中,运行是要加载libcurl.dll动态库的。另外,自带的工程设置中没有用到OpenSSLZlib这些第三方库,如果需要用到相关扩展功能的话,需要配置引用这些库文件进行编译。
    还有一种方式是通过MSVS命令行的方式进行编译。步骤如下:
    1、首先要清楚自己安装的是msvc哪个版本,目前常见的vc6vc2003vc7),vc2005vc8)和vc2008vc9),curl源码包中都已经写好了相应的makefile文件,我机器上装的是vc2005
    2、将vc的安装目录的bin文件目录加到PATH环境变量中,我机器上bin的路径为C:\Program Files\Microsoft Visual Studio 8\VC\bin,这一步主要是为了使我们能够在任何路径下运行bin路径下的工具,如后面要用到的编译工具cl.exemake工具
    3、在运行中启动,在其中运行bin目录下的vcvars32.bat这个批处理文件,这个文件中定义了很多vc库文件及相关资源工具的访问变量,指明了响应资源的访问路径,跟环境变量的作用相似,但是只作用于当前命令行窗口;
    4、在cmd中进入到你要编译的curl源码的根文件目录下,输入命令“nmake vc”回车,应该就会看到一长串的编译信息输出。结束后,在lib子目录下会生成release文件夹,里面即为编译后生成的目标文件以及静态链接库文件libcurl.lib,在src子目录下生成可执行文件。这一步中需要注意的是根文件目录下的makefile文件中将vc编译工具定义为了vc6,我们应该把其中的“VC=vc6”这句改为自己机器上对应的vc版本。
    另外,“nmake vc”命令也是没有引用任何第三方库来进行编译的,默认编译静态链接的r
elease版本文件。如果要编译其他版本或者引用第三方库来进行编译,则要添加make参数,具体可以参考makefile文件中的配置。
    以上主要介绍的是在Windows平台下用msvc工具编译curl代码,其实curl库几乎可以支持所有常见的操作系统,而且支持的编译工具也很多,如MingW32CygwinBorland C++等。curl的文档中写得都非常清楚,这里就不详细说了。
   
    以上简单介绍了curl库和在Windows平台下用msvc环境编译curl执行文件的步骤,下一篇中将总结一些应用curl库的知识。

curl应用总结(二)
(2009-07-06 19:40:01)
    curl的应用方式,一是可以直接通过命令行工具,另一种是利用libcurl库做上层的开发。本篇主要总结一下命令行工具的http相关的应用,尤其是http下载方面的;下一篇再讲基于libcurl库的开发。
   
   
    curl的命令行工具功能非常强大,这些数据交互的功能基本上都是通过URL方式进行的,我们先来看看curl对多个URL的灵活操作,这些规则使我们的批处理需求应用起来非常方便。
   
    1、用{}表示多个URL
    site.{one,two,three},只要在{}中写上不同的部分,就可以表示3URL了。
   
    2、用[]表示多个URL
    ftp://ftp.numericals/file[1-100].txtftp://ftp.numericals/file[001-100].txtftp://ftp.letters/file[a-z].txt[]中表示按数字或字母的顺序排列。
    还能表示不连续的排列,如 www.numericals/file[1-100:10].txtwww.letters/file[a-z:2].txt":"后面的数字表示等差排列的阶跃数。
   
    3、结合起来使用
    /archive[1996-1999]/vol[1-4]/part{a,b,c}.html
   
   
    curl命令行工具的基本语句为:curl [options] [],即 curl [选项] [下载地址]。因此,如果你想下载百度的首页,最简单的方法启动cmd,进入curl安装目录,输入命令:curl www.baidu,回车,你的输出窗口将立即出现百度首页的html数据。
    对于所有的布尔型option,基本上--option表示支持这个选项,--no-option表示禁用这个选项。下面总结几个比较有用的options
   
    1-o/--output <file>
    这个基本上要算最常用的选项了,用于将下载的数据保存到某个文件中。如 curl -o baidu.html www.baidu则将百度首页保存到baidu.html文件中了。下载过程中标准输出还会显示下载的统计信息,比如进度、下载字节数、下载速度等。如果指定输出为"-
",则下载数据会输出到标准输出。
    如果输出的文件是一个多级目录的话,则要配合--create-dirs选项,--create-dirs将自动创建设置的输出目录。
    如果希望保存到本地的文件名和服务器上的相同,就可以直接用-O选项(大写O),而省去指定本地文件名。
    如果下载多个数据文件,可以使用上面提到的多URL规则。下载文件名也可以批量自定义,就是使用"#"。可以将"#"加到文件名当中,这样实际文件名中的#将被多个URL中的当前字符串代替,如 curl {site,host}.host[1-5] -o "#1_#2"#1将被"site""host"代替,#2将被1-5之间的数字代替,也就是被当前被处理的URL中的字符串代替。
    另外下载数据的时候,可以加个"-#"选项,用一个进度条来代替文本表示进度。
   
    2-c/--cookie-jar <file name> -b/--cookie <name=data>
    这是两个操作cookie的选项,很多服务器是需要cookie信息的。用前一个选项可以指定一个文件,将其他文件中的cookie或者从服务器得到的cookie写到文件中;后一个选项则用来向服务器发送cookie信息,可以用"name=data"的形式,也可以直接跟一个保存cookie
的文件名。
   
    3-x/--proxy <proxyhost[:port]>
    该选项为http指定代理及端口,如果不指定端口,默认为1080。如 curl -x 201.36.208.19:3128 curl.haxx.se/
   
    4-u/--user <user:password> -U/--proxy-user <user:password>
    登录某些页面或ftp需要先进行认证,输入用户名和密码。curl的这个选项可以直接处理这类操作,用指定的账号和密码进行登录认证。
    后面的选项指定代理的用户名和密码,这样便可以直接用这个代理访问网页了,如  curl -U user:password -x 201.36.208.19:3128 curl.haxx.se/
   
    5-A/--user-agent <agent string>
    该选项可以指定客户端类型,服务器通过该选项判断用户应用的平台及浏览器信息。如 curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" www.clientinfo
表示告诉服务器,客户端是运行在Windows 2000系统上的IE6.0

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。