【php中的curl】php中curl的详细解说
什么是cURL:
cURL可以使⽤URL的语法模拟浏览器来传输数据,
因为它是模拟浏览器,因此它同样⽀持多种协议,
FTP, FTPS, HTTP, HTTPS, GOPHER, TELNET, DICT, FILE 以及 LDAP等协议都可以很好的⽀持,包括⼀些:
HTTPS认证,HTTP POST⽅法,HTTP PUT⽅法,FTP上传,keyberos认证,HTTP上传,代理服务器,cookies,⽤户名/密码认证,下载⽂件断点续传,上传⽂件断点续传,http代理服务器管道,甚⾄它还⽀持IPv6,scoket5代理服务器,通过http代理服务器上传⽂件到FTP服务器等等。
这就是我们为什么要使⽤cURL的原因!
使⽤cURL完成简单的请求主要分为以下四步:
1.初始化,创建⼀个新cURL资源
2.设置URL和相应的选项
3.抓取URL并把它传递给浏览器
4.关闭cURL资源,并且释放系统资源
我们来采集⼀个页⾯,通常情况下,我们会使⽤file_get_contents()函数来获取:
像这样:
$str = file_get_contents('url');
//或者是:
$str = file("url");
//或者是:
readfile("url");
>
这样我们会发现,我们没有办法有效地进⾏错误处理,更重要的是我们没有办法完成⼀些⾼难度的任务:
如:处理cookies,验证,表单提交,⽂件上传等等。
好,现在我们来⽤代码完成上述cURL的四步:
//1.初始化,创建⼀个新cURL资源
$ch = curl_init();
//2.设置URL和相应的选项
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 0);
//3.抓取URL并把它传递给浏览器
curl_exec($ch);
//4.关闭cURL资源,并且释放系统资源
curl_close($ch);
>
上述四步中,其中第⼆步最为关键,可以设置⼀些⾼级选项:
例如上例中的CURLOPT_URL和CURLOPT_HEADER,分别代表“需要获取的URL地址”和“启⽤时会将头⽂件的信息作为数据流输出”,这些只是冰⼭⼀⾓,我们还可以设置很多选项:
选项可选value值
CURLOPT_AUTOREFERER当根据Location:重定向时,⾃动设置header中的Referer:信息。
CURLOPT_BINARYTRANSFER在启⽤CURLOPT_RETURNTRANSFER的时候,返回原⽣的(Raw)输出。
CURLOPT_COOKIESESSION启⽤时curl会仅仅传递⼀个session cookie,忽略其他的cookie,默认状况下cURL会将所有的cookie返回给服务端。session cookie是指那些⽤来判断服务器端的session是否有效⽽存在的cookie。
CURLOPT_CRLF启⽤时将Unix的换⾏符转换成回车换⾏符。
CURLOPT_DNS_USE_GLOBAL_CACHE启⽤时会启⽤⼀个全局的DNS缓存,此项为线程安全的,并且默认启⽤。
php支持多线程吗CURLOPT_FAILONERROR显⽰HTTP状态码,默认⾏为是忽略编号⼩于等于400的HTTP信息。
CURLOPT_FILETIME启⽤时会尝试修改远程⽂档中的信息。结果信息会通过curl_getinfo()函数的CURLINFO_FILETIME选项返回。
curl_getinfo().
CURLOPT_FOLLOWLOCATION启⽤时会将服务器服务器返回的"Location: "放在header中递归的返回给服务器,使⽤
CURLOPT_MAXREDIRS可以限定递归返回的数量。
CURLOPT_FORBID_REUSE在完成交互以后强迫断开连接,不能重⽤。
CURLOPT_FRESH_CONNECT强制获取⼀个新的连接,替代缓存中的连接。
CURLOPT_FTP_USE_EPRT启⽤时当FTP下载时,使⽤EPRT (或 LPRT)命令。设置为FALSE时禁⽤EPRT和LPRT,使⽤PORT命令 only.
CURLOPT_FTP_USE_EPSV启⽤时,在FTP传输过程中回复到PASV模式前⾸先尝试EPSV命令。设置为FALSE时禁⽤EPSV命令。
CURLOPT_FTPAPPEND启⽤时追加写⼊⽂件⽽不是覆盖它。
CURLOPT_FTPASCIICURLOPT_TRANSFERTEXT的别名。
CURLOPT_FTPLISTONLY启⽤时只列出FTP⽬录的名字。
CURLOPT_HEADER启⽤时会将头⽂件的信息作为数据流输出。
CURLINFO_HEADER_OUT启⽤时追踪句柄的请求字符串。
CURLOPT_HTTPGET启⽤时会设置HTTP的method为GET,因为GET是默认是,所以只在被修改的情况下使⽤。
CURLOPT_HTTPPROXYTUNNEL启⽤时会通过HTTP代理来传输。
CURLOPT_MUTE启⽤时将cURL函数中所有修改过的参数恢复默认值。
CURLOPT_NETRC在连接建⽴以后,访问~/rc⽂件获取⽤户名和密码信息连接远程站点。
CURLOPT_NOBODY启⽤时将不对HTML中的BODY部分进⾏输出。
CURLOPT_NOPROGRESS
启⽤时关闭curl传输的进度条,此项的默认设置为启⽤。
Note:
PHP⾃动地设置这个选项为TRUE,这个选项仅仅应当在以调试为⽬的时被改变。
CURLOPT_NOSIGNAL启⽤时忽略所有的curl传递给php进⾏的信号。在SAPI多线程传输时此项被默认启⽤。
CURLOPT_POST启⽤时会发送⼀个常规的POST请求,类型为:application/x-www-form-urlencoded,就像表单提交的⼀样。
CURLOPT_PUT启⽤时允许HTTP发送⽂件,必须同时设置CURLOPT_INFILE和CURLOPT_INFILESIZE。
CURLOPT_RETURNTRANSFER将curl_exec()获取的信息以⽂件流的形式返回,⽽不是直接输出。
CURLOPT_SSL_VERIFYPEER禁⽤后cURL将终⽌从服务端进⾏验证。使⽤CURLOPT_CAINFO选项设置证书使⽤CURLOPT_CAPATH选项设置证书⽬录 如果CURLOPT_SSL_VERIFYPEER(默认值为2)被启⽤,CURLOPT_SSL_VERIFYHOST需要被设置成TRUE否则设置为FALSE。
CURLOPT_TRANSFERTEXT启⽤后对FTP传输使⽤ASCII模式。对于LDAP,它检索纯⽂本信息⽽⾮HTML。在Windows系统上,系统不会
把STDOUT设置成binary模式。
CURLOPT_UNRESTRICTED_AUTH在使⽤CURLOPT_FOLLOWLOCATION产⽣的header中的多个locations中持续追加⽤户名和密码信息,即使域名已发⽣改变。
CURLOPT_UPLOAD启⽤后允许⽂件上传。
CURLOPT_VERBOSE启⽤时会汇报所有的信息,存放在STDERR或指定的CURLOPT_STDERR中。
对于下⾯的这些option的可选参数,value应该被设置⼀个integer类型的值:
选项可选value值
CURLOPT_BUFFERSIZE每次获取的数据中读⼊缓存的⼤⼩,但是不保证这个值每次都会被填满。
CURLOPT_CLOSEPOLICY不是CURLCLOSEPOLICY_LEAST_RECENTLY_USED就是CURLCLOSEPOLICY_OLDEST,还存在另外三
个CURLCLOSEPOLICY_,但是cURL暂时还不⽀持。
CURLOPT_CONNECTTIMEOUT在发起连接前等待的时间,如果设置为0,则⽆限等待。
CURLOPT_CONNECTTIMEOUT_MS尝试连接等待的时间,以毫秒为单位。如果设置为0,则⽆限等待。
CURLOPT_DNS_CACHE_TIMEOUT设置在内存中保存DNS信息的时间,默认为120秒。
CURLOPT_FTPSSLAUTHFTP验证⽅式:CURLFTPAUTH_SSL(⾸先尝试SSL),CURLFTPAUTH_TLS(⾸先尝试TLS)
或CURLFTPAUTH_DEFAULT(让cURL⾃动决定)。
CURLOPT_HTTP_VERSION CURL_HTTP_VERSION_NONE(默认值,让cURL⾃⼰判断使⽤哪个版
本),CURL_HTTP_VERSION_1_0(强制使⽤ HTTP/1.0)或CURL_HTTP_VERSION_1_1(强制使⽤ HTTP/1.1)。
CURLOPT_HTTPAUTH
使⽤的HTTP验证⽅法,可选的值
有:CURLAUTH_BASIC、CURLAUTH_DIGEST、CURLAUTH_GSSNEGOTIATE、CURLAUTH_NTLM、CURLAUTH_ANY和CURLAU TH_ANYSAFE。 可以使⽤|位域(或)操作符分隔多个值,cURL让服务器选择⼀个⽀持最好的值。
CURLAUTH_ANY等价于CURLAUTH_BASIC | CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE |
CURLAUTH_NTLM.CURLAUTH_ANYSAFE等价于CURLAUTH_DIGEST | CURLAUTH_GSSNEGOTIATE | CURLAUTH_NTLM.
CURLOPT_INFILESIZE设定上传⽂件的⼤⼩限制,字节(byte)为单位。
CURLOPT_LOW_SPEED_LIMIT当传输速度⼩于CURLOPT_LOW_SPEED_LIMIT时(bytes/sec),PHP会根据
CURLOPT_LOW_SPEED_TIME来判断是否因太慢⽽取消传输。
CURLOPT_LOW_SPEED_TIME当传输速度⼩于CURLOPT_LOW_SPEED_LIMIT时(bytes/sec),PHP会根据CURLOPT_LOW_SPEED_TIME 来判断是否因太慢⽽取消传输。
CURLOPT_MAXCONNECTS允许的最⼤连接数量,超过是会通过CURLOPT_CLOSEPOLICY决定应该停⽌哪些连接。
CURLOPT_MAXREDIRS指定最多的HTTP重定向的数量,这个选项是和CURLOPT_FOLLOWLOCATION⼀起使⽤的。
CURLOPT_PORT⽤来指定连接端⼝。(可选项)
CURLOPT_PROTOCOLS
CURLPROTO_*的位域指。如果被启⽤,位域值会限定libcurl在传输过程中有哪些可使⽤的协议。这将允许你在编译libcurl时⽀持众多协议,但是限制只是⽤它们中被允许使⽤的⼀个⼦集。默认libcurl将会使⽤全部它⽀持的协议。参见CURLOPT_REDIR_PROTOCOLS. 可⽤的协议选项为:CURLPROTO_HTTP、CURLPROTO_HTTPS、CURLPROTO_FTP、CURLPROTO_FTPS、CURLPROTO_SCP、CURLPROTO_SFTP 、CURLPROTO_TELNET、CURLPROTO_LDAP、CU
RLPROTO_LDAPS、CURLPROTO_DICT、CURLPROTO_FILE、CURLPROTO_TF TP、CURLPROTO_ALL
CURLOPT_PROXYAUTHHTTP代理连接的验证⽅式。使⽤在CURLOPT_HTTPAUTH中的位域标志来设置相应选项。对于代理验证只
有CURLAUTH_BASIC和CURLAUTH_NTLM当前被⽀持。
CURLOPT_PROXYPORT代理服务器的端⼝。端⼝也可以在CURLOPT_PROXY中进⾏设置。
CURLOPT_PROXYTYPE不是CURLPROXY_HTTP(默认值) 就是CURLPROXY_SOCKS5。
CURLOPT_REDIR_PROTOCOLSCURLPROTO_*中的位域值。如果被启⽤,位域值将会限制传输线程在CURLOPT_FOLLOWLOCATION开启时跟随某个重定向时可使⽤的协议。这将使你对重定向时限制传输线程使⽤被允许的协议⼦集默认libcurl将会允许除FILE和SCP之外的全部协议。这个和7.19.4预发布版本种⽆条件地跟随所有⽀持的协议有⼀些不同。关于协议常量,请参照CURLOPT_PROTOCOLS。
CURLOPT_RESUME_FROM在恢复传输时传递⼀个字节偏移量(⽤来断点续传)。
CURLOPT_SSL_VERIFYHOST1 检查服务器SSL证书中是否存在⼀个公⽤名(common name)。译者注:公⽤名(Common Name)⼀般来讲就是填写你将要申请SSL证书的域名 (domain)或⼦域名(sub domain)。2 检查公⽤名是否存在,并且是否与提供的主机名匹配。
CURLOPT_SSLVERSION使⽤的SSL版本(2 或 3)。默认情况下PHP会⾃⼰检测这个值,尽管有些情况下需要⼿动地进⾏设置。
CURLOPT_TIMECONDITION如果在CURLOPT_TIMEVALUE指定的某个时间以后被编辑过,则使⽤CURL_TIMECOND_IFMODSINCE返回页⾯,如果没有被修改过,并且CURLOPT_HEADER为true,则返回⼀个"304 Not Modified"的header,CURLOPT_HEADER为false,则使
⽤CURL_TIMECOND_IFUNMODSINCE,默认值为CURL_TIMECOND_IFUNMODSINCE。
CURLOPT_TIMEOUT设置cURL允许执⾏的最长秒数。
CURLOPT_TIMEOUT_MS设置cURL允许执⾏的最长毫秒数。
CURLOPT_TIMEVALUE设置⼀个CURLOPT_TIMECONDITION使⽤的时间戳,在默认状态下使⽤的是CURL_TIMECOND_IFMODSINCE。
对于下⾯的这些option的可选参数,value应该被设置⼀个string类型的值:
选项可选value值
CURLOPT_CAINFO⼀个保存着1个或多个⽤来让服务端验证的证书的⽂件名。这个参数仅仅在和CURLOPT_SSL_VERIFYPEER⼀起使⽤时才有意义。 .
CURLOPT_CAPATH⼀个保存着多个CA证书的⽬录。这个选项是和CURLOPT_SSL_VERIFYPEER⼀起使⽤的。
CURLOPT_COOKIE设定HTTP请求中"Cookie: "部分的内容。多个cookie⽤分号分隔,分号后带⼀个空格(例如, "fruit=apple;
colour=red")。
CURLOPT_COOKIEFILE包含cookie数据的⽂件名,cookie⽂件的格式可以是Netscape格式,或者只是纯HTTP头部信息存⼊⽂件。
CURLOPT_COOKIEJAR连接结束后保存cookie信息的⽂件。
CURLOPT_CUSTOMREQUEST
使⽤⼀个⾃定义的请求信息来代替"GET"或"HEAD"作为HTTP请求。这对于执⾏"DELETE"或者其他更隐蔽的HTTP请求。有效值如"GET","POST","CONNECT"等等。也就是说,不要在这⾥输⼊整个HTTP请求。例如输⼊"GET /index.html HTTP/1.0 "是不正确的。
Note: 在确定服务器⽀持这个⾃定义请求的⽅法前不要使⽤。
CURLOPT_EGDSOCKET类似CURLOPT_RANDOM_FILE,除了⼀个Entropy Gathering Daemon套接字。
CURLOPT_ENCODINGHTTP请求头中"Accept-Encoding: "的值。⽀持的编码有"identity","deflate"和"gzip"。如果为空字符串"",请求头会发送所有⽀持的编码类型。
CURLOPT_FTPPORT这个值将被⽤来获取供FTP"POST"指令所需要的IP地址。"POST"指令告诉远程服务器连接到我们指定的IP地址。这个字符串可以是纯⽂本的IP地址、主机名、⼀个⽹络接⼝名(UNIX下)或者只是⼀个'-'来使⽤默认的IP地址。
CURLOPT_INTERFACE⽹络发送接⼝名,可以是⼀个接⼝名、IP地址或者是⼀个主机名。
CURLOPT_KRB4LEVELKRB4 (Kerberos 4) 安全级别。下⾯的任何值都是有效的(从低到⾼的顺序):"clear"、"safe"、"confidential"、"private".。如果字符串和这些都不匹配,将使⽤"private"。这个
选项设置为NULL时将禁⽤KRB4 安全认证。⽬前KRB4 安全认证只能⽤于FTP传输。
CURLOPT_POSTFIELDS全部数据使⽤HTTP协议中的"POST"操作来发送。要发送⽂件,在⽂件名前⾯加上@前缀并使⽤完整路径。这个参数可以通过urlencoded后的字符串类似'para1=val1¶2=val2&...'或使⽤⼀个以字段名为键值,字段数据为值的数组。如果value是⼀个数
组,Content-Type头将会被设置成multipart/form-data。
CURLOPT_PROXYHTTP代理通道。
CURLOPT_PROXYUSERPWD⼀个⽤来连接到代理的"[username]:[password]"格式的字符串。
CURLOPT_RANDOM_FILE⼀个被⽤来⽣成SSL随机数种⼦的⽂件名。
CURLOPT_RANGE以"X-Y"的形式,其中X和Y都是可选项获取数据的范围,以字节计。HTTP传输线程也⽀持⼏个这样的重复项中间⽤逗号分隔如"X-Y,N-M"。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论