phpapache⽇志,Apache⽇志详解
1、Apache⽇志⽂件名称及路径介绍
当我们安装并启动Apache后,Apache会⾃动⽣成两个⽇志⽂件,这两个⽇志⽂件分别是访问⽇志access_log(在Windows上是
access.log)和错误⽇志error_log(在Windows上是error.log)。如果使⽤SSL服务的话,还可能存在ssl_access_log和ssl_error_log和ssl_request_log三种⽇志⽂件。
⽇志⽂件的路径根据安装⽅式不同位置也是不⼀样的,⼀般都是在Apache安装⽬录的logs⼦⽬录中,⽇志⽂件路径可根据实际安装情况在Apache的配置⽂件中进⾏查。
2、Apache访问⽇志格式详解
访问⽇志access_log记录了所有对Web服务器的访问活动,下⾯是访问⽇志access_log中的⼀个标准记录
192.168.115.5- - [01/Apr/2018:10:37:19 +0800] "GET / HTTP/1.1" 200 45
⽇志字段所代表的内容如下:
1.远程主机IP:表明访问⽹站的是谁
2.空⽩(E-mail):为了避免⽤户的邮箱被垃圾邮件骚扰,第⼆项就⽤“-”取代了
3.空⽩(登录名):⽤于记录浏览者进⾏⾝份验证时提供的名字。
4.请求时间:⽤⽅括号包围,⽽且采⽤“公⽤⽇志格式”或者“标准英⽂格式”。 时间信息最后的“+0800”表⽰服务器所处时区位于UTC之后的8⼩时。
5.⽅法+资源+协议:服务器收到的是⼀个什么样的请求。该项信息的典型格式是“METHOD RESOURCE PROTOCOL”,即“⽅法 资源 协议”。
METHOD: GET、POST、HEAD、……
RESOURCE: /、index.html、/default/index.php、……(请求的⽂件)
PROTOCOL: HTTP+版本号
6.状态代码:请求是否成功,或者遇到了什么样的错误。⼤多数时候,这项值是200,它表⽰服务器已经成功地响应浏览器的请求,⼀切正常。
7.发送字节数:表⽰发送给客户端的总字节数。它告诉我们传输是否被打断(该数值是否和⽂件的⼤⼩相同)。把⽇志记录中的这些值加起来就可以得知服务器在⼀天、⼀周或者⼀⽉内发送了多少数据。
3、Apache访问⽇志配置
(1)访问⽇志格式分类
apache中⽇志记录格式主要有两种,普通型(common)和复合型(combined),安装时默认使⽤普通型(common)类型⽇志记录访问信息,
(2)配置Apache访问⽇志格式命令及参数
配置Apache访问⽇志格式主要有两个参数,即LogFormat指令和CustomLog指令
php的工作流程LogFormat指令:定义格式并为格式指定⼀个名字,以后我们就可以直接引⽤这个名字。
CustomLog指令:设置⽇志⽂件,并指明⽇志⽂件所⽤的格式(通常通过格式的名字)。
在apache的配置⽂件f中,有⼏⾏是这么配置的:
LogFormat "%h %l %u %t "%r" %>s %b" common定义格式和名字
CustomLog "logs/access.log" common普通⽂件记录
%h%I%u%t%r%>s%b
远端主机远端登录名远程⽤户名时间请求第⼀⾏状态传送字节
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\"\"%{User-Agent}i\"" combined
CustomLog logs/access_log combined复合⽇志记录
%{Referer}i\\"%{User-Agent}i\
请求来源客户端浏览器提供的浏览器识别信息
访问⽇志⽂件的位置实际上是⼀个配置选项。如果我们检查f配置⽂件,可以看到该⽂件中有如下这⾏内容:
CustomLog /usr/local/apache/logs/access_log common
CustomLog指令指定了保存⽇志⽂件的具体位置以及⽇志的格式。上⾯这⾏指令指定的是common⽇志格式,⾃从有了Web服务器开始,common格式就是它的标准格式。
4、Apache错误⽇志格式详解
错误⽇志的⽂件名字是error_log(Windows平台是error.log)。错误⽇志的位置可以通过ErrorLog指令设置:
ErrorLog logs/error.log , 除⾮⽂件位置⽤根“/”开头,否则这个⽂件位置是相对于ServerRoot⽬录的相对路径。
错误⽇志⽆论在格式上还是在内容上都和访问⽇志不同。然⽽,错误⽇志和访问⽇志⼀样也提供丰富的信息,我们可以利⽤这些信息分析服务器的运⾏情况、哪⾥出现了问题。
错误⽇志记录了服务器运⾏期间遇到的各种错误,以及⼀些普通的诊断信息,⽐如服务器何时启动、何时关闭等。我们可以设置⽇志⽂件记录信息级别的⾼低,控制⽇志⽂件记录信息的数量和类型。这是通过LogLevel指令设置的,该指令默认设置的级别是error,即记录称得上错误的事件。有关该指令中允许设置的各种选项的完整清单,请参见/docs/mod/core.html#loglevel的Apache ⽂档。
我们在⽇志⽂件中见到的内容分属两类:⽂档错误和CGI错误。但是,错误⽇志中偶尔也会出现配置错误,另外还有前⾯提到的服务器启动和关闭信息。
(1)⽂档错误
⽂档错误和服务器应答中的400系列代码相对应,最常见的就是404错误——Document Not Found(⽂档没有到)。除了404错误以外,⽤户⾝份验证错误也是⼀种常见的错误。
404错误在⽤户请求的资源(即URL)不存在时出现,它可能是由于⽤户输⼊的URL错误,或者由于服务器上原来存在的⽂档因故被删除或移动。 因此建议在不提供重定向或者其他补救措施的情况下,我们永远不应该移动或者删除Web⽹站的任何资源。 当⽤户不能打开服务器上的⽂档时,错误⽇志中出现的记录如下所⽰:
[Fri Mar 30 14:45:09 2018][error] [client 192.168.115.120]
File does not exist: /usr/local/apache/bugletdocs/Img/south-korea.gif
错误⽇志格式说明:
1.错误发⽣的⽇期和时间
2.错误的级别或严重性
3.导致错误的IP地址
4.错误信息本⾝。
可以看到,正如访问⽇志access_log⽂件⼀样,错误⽇志记录也分成多个项。错误记录的开头是⽇期/时间标记,注意它们的格式和access_log中⽇期/时间的格式不同。access_log中的格式被称为“标准英⽂格式”。 错误记录的第⼆项是当前记录的级别,它表明了问题的严重程度。这个级别信息可能是LogLevel指令的⽂档中所列出的任⼀级别(参见前⾯LogLevel的链接),error级别处于warn级别和crit级别之间。404属于error错误级别,这个级别表⽰确实遇到了问题,但服务器还可以运⾏。 错误记录的第三项表⽰⽤户发出请求时所⽤的IP地址。
记录的最后⼀项才是真正的错误信息。对于404错误,它还给出了完整路径指⽰服务器试图访问的⽂件。当我们料想某个⽂件应该在⽬标位置却出现了404错误时,这个信息是⾮常有⽤的。此时产⽣这种错误的原因往往是由于服务器配置错误、⽂件实际所处的虚拟主机和我们料想的不同,或者其他⼀些意料不到的情况。
由于⽤户⾝份验证问题⽽出现的错误记录如下所⽰:
user rbowen@rcbowen : authentication failure for "/cgi-bin/i" : password mismatch
注意:由于⽂档错误是⽤户请求的直接结果,因此它们在访问⽇志中也会有相应的记录。
(2)CGI错误
错误⽇志最主要的⽤途或许是诊断⾏为异常的CGI程序。为了进⼀步分析和处理⽅便,CGI程序输出到STDERR(Standard Error,标准错误设备)的所有内容都将直接进⼊错误⽇志。这意味着,任何编写良好的CGI程序,如果出现了问题,错误⽇志就会告诉我们有关问题的详细信息。
然⽽,把CGI程序错误输出到错误⽇志也有它的缺点,错误⽇志中将出现许多没有标准格式的内容,这使得⽤错误⽇志⾃动分析程序从中分析出有⽤的信息变得相当困难。
下⾯是⼀个例⼦,它是调试Perl CGI代码时,错误⽇志中出现的⼀个错误记录:
[Web Mar 30 15:32:10 2018] [error] [client 192.168.115.120] Premature
end of script headers: /usr/local/apache/cgi-bin/i
Global symbol "$rv" requires explicit package name at
/usr/local/apache/cgi-bin/i line 81.
Global symbol "�tails" requires explicit package name at
/
usr/local/apache/cgi-bin/i line 84.
Global symbol "$Config" requires explicit package name at
/usr/local/apache/cgi-bin/i line 133.
Execution of /usr/local/apache/cgi-bin/i
aborted due to compilation errors.
可以看到,CGI错误和前⾯的404错误格式相同,包含⽇期/时间、错误级别以及客户地址、错误信息。但这个CGI错误的错误信息有好⼏⾏,这往往会⼲扰⼀些错误⽇志分析软件的⼯作。
有了这个错误信息,即使是对Perl不太熟悉的⼈也能够出许多有关错误的信息,例如⾄少可以⽅便地得知是哪⼏⾏代码出现了问题。Perl 在报告程序错误⽅⾯的机制是相当完善的。当然,不同的编程语⾔输出到错误⽇志的信息会有所不同。
由于CGI程序运⾏环境的特殊性,如果没有错误⽇志的帮助,⼤多数CGI程序的错误都将很难解决。
有不少⼈在邮件列表或者新闻组中抱怨说⾃⼰有⼀个CGI程序,当打开⽹页时服务器却返回错误,⽐
如“Internal Server Error”。我们可以肯定,这些⼈还没有看过服务器的错误⽇志,或者根本不知道错误⽇志的存在。决多⼤多数情况下,错误⽇志能够精确地指出CGI错误的所在以及如何修正这个错误。
5、查看服务器⽇志⽅法
在服务器维护时,经常会遇到各种错误,不断地检查服务器的⽇志,可以⽅便知道哪⼉出了问题。⽤ssh远程连接到服务器,然后输⼊下⾯的命令,可以动态显⽰错误⽇志后⼏⾏内容,⽅便进⾏排错。
tail -f /usr/local/apache/logs/error_log
⽆论具体采⽤的是哪⼀种⽅法,同时打开多个终端窗⼝都是⼀种好习惯:⽐如在⼀个窗⼝中显⽰错误⽇志,在另⼀个窗⼝中显⽰访问⽇志。这样,我们就能够随时获知⽹站上发⽣的事情并⽴即予以解决。
6、Apache⽇志的定制
有时候我们需要定制Apache默认⽇志的格式和内容,⽐如增加或减少⽇志所记录的信息、改变默认⽇志⽂件的格式等。
(1)定义⽇志格式及格式串变量含义详解
定制⽇志⽂件的格式涉及到两个指令,即LogFormat指令和CustomLog指令。默认f⽂件提供了关于这两个指令的⼏个⽰例。
LogFormat指令:定义⽇志格式并为它指定⼀个名字,以后就可以直接引⽤这个名字。
CustomLog指令:设置⽇志⽂件,并指明⽇志⽂件所⽤的格式(通常通过格式的名字)。
LogFormat指令在默认的f⽂件中,我们可以到下⾯这⾏代码:
LogFormat "%h %l %u %t \"%r\" %>s %b" common
该指令创建了⼀种名为“common”的⽇志格式,⽇志的格式在双引号包围的内容中指定。格式字符串中的每⼀个变量代表着⼀项特定的信息,这些信息按照格式串规定的次序写⼊到⽇志⽂件。 Apache⽂档已经给出了所有可⽤于格式串的变量及其含义,下⾯是其译⽂:
%a: 远程IP地址
%A: 本地IP地址
%B: 已发送的字节数,不包含HTTP头
%b: CLF格式的已发送字节数量,不包含HTTP头。例如当没有发送数据时,写⼊‘-’⽽不是0。
%{FOOBAR}e: 环境变量FOOBAR的内容
%f: ⽂件名字
%h: 远程主机
%H 请求的协议
%Foobar}i: Foobar的内容,发送给服务器的请求的标头⾏。
%l: 远程登录名字(来⾃identd,如提供的话)
%m: 请求的⽅法
%{Foobar}n: 来⾃另外⼀个模块的注解“Foobar”的内容
%{Foobar}o: Foobar的内容,应答的标头⾏
%p: 服务器响应请求时使⽤的端⼝
%P: 响应请求的⼦进程ID。
%q: 查询字符串(如果存在查询字符串,则包含“?”后⾯的部分;否则,它是⼀个空字符串。)
%r: 请求的第⼀⾏
%s: 状态。对于进⾏内部重定向的请求,这是指*原来*请求的状态。如果⽤%...>s,则是指后来的请求。
%t: 以公共⽇志时间格式表⽰的时间(或称为标准英⽂格式)
%{format}t: 以指定格式format表⽰的时间
%T: 为响应请求⽽耗费的时间,以秒计
%u: 远程⽤户(来⾃auth;如果返回状态(%s)是401则可能是伪造的)
%U: ⽤户所请求的URL路径
%v: 响应请求的服务器的ServerName
%V: 依照UseCanonicalName设置得到的服务器名字
分析前⾯来⾃默认f⽂件的LogFormat指令⽰例,可以看出它创建了⼀种名为“common”的⽇志格式,其中包括:远程主机,远程登录名字,远程⽤户,请求时间,请求的第⼀⾏代码,请求状态,以及发送的字节数。
LogFormat "%V %h %l %u %t \"%r\" %>s %b" common
【补充】""修饰符可以⽤来指定对于已被内部重定向的请求是选择原始的请求还是选择最终的请求。默认情况下,%s, %U, %T, %D, %r 使⽤原始请求,⽽所有其他格式串则选择最终请求。例如,%>s 可以⽤于记录请求的最终状态,⽽ %
如果在“%”和变量之间放⼊了⼀个或者多个HTTP状态代码,则只有当请求返回的状态代码属于指定的状态代码之⼀时,变量所代表的内容才会被记录。例如,如果我们想要记录的是⽹站的所有⽆效链接,那么可以使⽤:
LogFormat @4{Referer}i BrokenLinks
反之,如果我们想要记录那些状态代码不等于指定值的请求,只需加⼊⼀个“!”符号即可:
LogFormat %!200U SomethingWrong
7、⽇志中记录的相关信息说明
有许多信息可以⽤⽇志⽂件来记录,其中包括:
(1)远程机器的地址:“远程机器的地址”和“谁在浏览⽹站”差不多,但并不等同。
(2)浏览时间:浏览者何时开始访问⽹站?从这个问题的答案中我们能够了解不少情况。从单个访问记录能够得到的信息⾮常有限,但如果从数千个访问记录出发,我们就可以得到⾮常有⽤和重要的统计信息。
(3)⽤户所访问的资源:⽹站的哪些部分最受⽤户欢迎?这些最受欢迎的部分就是我们应该继续加以发展的部分。⽹站的哪些部分总是受到冷落?⽹站中这些受到冷落的部分或许隐藏得太深,或许它们确实没有什么意思,此时我们就得想办法加以改进。当然,⽹站还有的内容,⽐如法律上的声明,虽然很少有⼈访问,但却不应该随便地改动它们。
(4)⽆效链接:当然,⽇志⽂件还能够告诉我们哪些东西不能按照我们所想象地运⾏。⽹站中是否存在错误的链接?其他⽹站链接过来时有没有搞错URL?是否存在不能正常运⾏的CGI程序?是否有搜索引擎检索程序每秒发出数千个请求,从⽽影响了本⽹站的正常服务?这些问题的答案都可以从⽇志⽂件到线索。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论