(转)常见Nginx服务器故障处理。
⽬的:
在Nginx服务器出现故障时,能快速定位并解决相关错误。
概述:
Nginx常见错误与问题之解决⽅法技术指南。
安装环境:
系统环境:redhat enterprise 6.5 64bit
1、Nginx 常见启动错误
有的时候初次安装nginx的时候会报这样的错误
sbin/nginx -c f
报错内容:sbin/nginx: error while loading shared libraries: libpcre.so.1:
cannot open shared object file: No such file or directory
启动时如果报异常error while loading shared libraries: libpcre.so.1: cannot open
shared object file: No such file or directory 这说明我们的环境还不是和启动需要
⼩⼩的配置⼀下
解决⽅法(直接运⾏):
32位系统 [root@sever lib]# ln -s /usr/local/lib/libpcre.so.1 /lib
64位系统 [root@sever lib]# ln -s /usr/local/lib/libpcre.so.1 /lib64
然后执⾏ps -ef | grep nginx 查看nginx进程确认是否真的已经启动了,在进程列表⾥会
有最起码两个, worker(nginx⼯作进程)和master(nginx主进程)
root 4349 1 0 02:24 ? 00:00:00 nginx: master process sbin/nginx -c
f
nginx 4350 4349 0 02:24 ? 00:00:00 nginx: worker process
root 4356 28335 0 02:30 pts/1 00:00:00 grep nginx
NGINX 就 OK了
2、400 bad request错误的原因和解决办法
配置f相关设置如下.
client_header_buffer_size 16k;
large_client_header_buffers 4 64k;
根据具体情况调整,⼀般适当调整值就可以。
3、Nginx 502 Bad Gateway错误
在php.ini和f中分别有这样两个配置项:max_execution_time和request_terminate_timeout。
这两项都是⽤来配置⼀个PHP脚本的最⼤执⾏时间的。当超过这个时间时,PHP-FPM不只会终⽌脚本的执⾏,
还会终⽌执⾏脚本的Worker进程。所以Nginx会发现与⾃⼰通信的连接断掉了,就会返回给客户端502错误。
以PHP-FPM的request_terminate_timeout=30秒时为例,报502 Bad Gateway错误的具体信息如下:
1)Nginx错误访问⽇志:
2013/09/19 01:09:00 [error] 27600#0: *78887 recv() failed (104: Connection reset by peer) while reading response header from upstream,
client: 192.168.1.101, server: test, request: "POST /index.php HTTP/1.1", upstream: "fastcgi://unix:/dev/shm/php-fcgi.sock:",
host: "test", referrer: ""
2)PHP-FPM报错⽇志:
WARNING:  child 25708 exited on signal 15 (SIGTERM) after 21008.883410 seconds from start
所以只需将这两项的值调⼤⼀些就可以让PHP脚本不会因为执⾏时间长⽽被终⽌了。request_terminate_timeout可以覆盖max_execution_time,
所以如果不想改全局的php.ini,那只改PHP-FPM的配置就可以了。
此外要注意的是Nginx的upstream模块中的max_fail和fail_timeout两项。有时Nginx与上游服务器(如Tomcat、FastCGI)的通信只是偶然断掉了,但max_fail如果设置的⽐较⼩的话,那么在接下来的fail_timeout时间内,Nginx都会认为上游服务器挂掉了,都会返回502错误。
所以可以将max_fail调⼤⼀些,将fail_timeout调⼩⼀些。
4、Nginx出现的413 Request Entity Too Large错误
这个错误⼀般在上传⽂件的时候会出现,
编辑Nginx主配置⽂件f,到http{}段,添加
client_max_body_size 10m; //设置多⼤根据⾃⼰的需求作调整.
如果运⾏php的话这个⼤⼩client_max_body_size要和php.ini中的如下值的最⼤值⼀致或
者稍⼤,这样就不会因为提交数据⼤⼩不⼀致出现的错误。
post_max_size = 10M
upload_max_filesize = 2M
5、解决504 Gateway Time-out(nginx)
遇到这个问题是在升级discuz论坛的时候遇到的⼀般看来, 这种情况可能是由于nginx默认的
fastcgi进程响应的缓冲区太⼩造成的, 这将导致fastcgi进程被挂起, 如果你的fastcgi服务
对这个挂起处理的不好, 那么最后就极有可能导致504 Gateway Time-out,现在的⽹站, 尤其某
些论坛有⼤量的回复和很多内容的, ⼀个页⾯甚⾄有⼏百K。默认的fastcgi进程响应的缓冲区
是8K, 我们可以设置⼤点在f⾥, 加⼊: fastcgi_buffers 8 128k这表⽰设置
fastcgi缓冲区为8×128
当然如果您在进⾏某⼀项即时的操作, 可能需要nginx的超时参数调⼤点,例如设置成90秒:
send_timeout 90;只是调整了这两个参数, 结果就是没有再显⽰那个超时, 效果不错
Nginx中关于与上游服务器通信超时时间的配置factcgi_connect/read/send_timeout。
以Nginx超时时间为90秒,PHP-FPM超时时间为300秒为例,报504 Gateway Timeout错误时的Nginx错误访问⽇志如下:
2013/09/19 00:55:51 [error] 27600#0: *78877 upstream timed out (110: Connection timed out) while reading response header from upstream,
client: 192.168.1.101, server: test, request: "POST /index.php HTTP/1.1", upstream: "fastcgi://unix:/dev/shm/php-fcgi.sock:",
host: "test", referrer: ""
调⾼这三项的值(主要是read和send两项,默认不配置的话Nginx会将超时时间设为60秒)之后,504错误也解决了。
⽽且这三项配置可以配置在http、server级别,也可以配置在location级别。担⼼影响其他应⽤的话,就配置在⾃⼰应⽤的location中吧。
要注意的是factcgi_connect/read/send_timeout是对FastCGI⽣效的,⽽proxy_connect/read/send_timeout是对proxy_pass⽣效的。
配置举例:
location ~ \.php$ {
root                    /home/cdai/test;
include                fastcgi_params;
fastcgi_connect_timeout      180;
fastcgi_read_timeout            600;
fastcgi_send_timeout            600;
fastcgi_pass            unix:/dev/shm/php-fcgi.sock;
fastcgi_index          index.php;
fastcgi_param          SCRIPT_FILENAME /home/cdai/test$fastcgi_script_name;
}
6、如何使⽤Nginx Proxy
朋友⼀台服务器运⾏tomcat 为8080端⼝,IP:192.168.1.2:8080,另⼀台机器
IP:192.168.1.8. 朋友想通过访问即可访问tomcat服务.配置如下:
在192.168.1.8的f上配置如下:
server {
listen 80;
server_name
location / {
proxy_pass
include /usr/local/nginx/f;
}
}
7. 安装完成Nginx后⽆法站外访问?
刚安装好nginx⼀个常见的问题是⽆法站外访问,本机wget、telnet都正常。⽽服务器之外,不管是局域⽹的其它主机还是互联⽹的主机都⽆法访问站点。如果⽤telnet的话,提⽰:正在连接到192.不能打开到主机的连接,在端⼝ 80: 连接失败
如果⽤wget命令的话,提⽰:
Connecting to 192.168.0. failed: No route to host.
如果是以上的故障现象,很可能是被CentOS的防⽕墙把80端⼝拦住了,尝试执⾏以下命令,打开80端⼝:
iptables -I INPUT -p tcp --dport 80 -j ACCEPT
然后⽤:
/
etc/init.d/iptables status
查看当前的防⽕墙规则,如果发现有这样⼀条:
ACCEPT    tcp  --  0.0.0.0/0            0.0.0.0/0          tcp dpt:80
就说明防⽕墙规则已经添加成功了,再在站外访问就正常了。
8、如何关闭Nginx的LOG
access_log /dev/null
error_log /dev/null
此外,错误⽇志主要记录客户端访问nginx出错时的⽇志,通过错误⽇志,能快速定位客户端访问异常!
错误信息
错误说明
"upstream prematurely(过早的) closed connection"
请求uri的时候出现的异常,是由于upstream还未返回应答给⽤户时⽤户断掉连接造成的,对系统没有影响,可以忽略"recv() failed (104: Connection reset by peer)"
(1)服务器的并发连接数超过了其承载量,服务器会将其中⼀些连接Down掉;
(2)客户关掉了浏览器,⽽服务器还在给客户端发送数据;
(3)浏览器端按了Stop
"(111: Connection refused) while connecting to upstream"
⽤户在连接时,若遇到后端upstream挂掉或者不通,会收到该错误
"(111: Connection refused) while reading response header from upstream"
⽤户在连接成功后读取数据时,若遇到后端upstream挂掉或者不通,会收到该错误
"(111: Connection refused) while sending request to upstream"
Nginx和upstream连接成功后发送数据时,若遇到后端upstream挂掉或者不通,会收到该错误
"(110: Connection timed out) while connecting to upstream"
nginx连接后⾯的upstream时超时
"(110: Connection timed out) while reading upstream"
nginx读取来⾃upstream的响应时超时
"(110: Connection timed out) while reading response header from upstream"
nginx读取来⾃upstream的响应头时超时
"(110: Connection timed out) while reading upstream"
nginx读取来⾃upstream的响应时超时
"(104: Connection reset by peer) while connecting to upstream"
upstream发送了RST,将连接重置
"upstream sent invalid header while reading response header from upstream"
upstream发送的响应头⽆效
"upstream sent no valid HTTP/1.0 header while reading response header from upstream"
upstream发送的响应头⽆效
"client intended to send too large body"
⽤于设置允许接受的客户端请求内容的最⼤值,默认值是1M,client发送的body超过了设置值exited
"reopening logs"
⽤户发送kill  -USR1命令
"gracefully shutting down",
⽤户发送kill  -WINCH命令
"no servers are inside upstream"
upstream下未配置server
"no live upstreams while connecting to upstream"
upstream下的server全都挂了
"SSL_do_handshake() failed"
SSL握⼿失败
"ngx_slab_alloc() failed: no memory in SSL session shared cache"
ssl_session_cache⼤⼩不够等原因造成
"could not add new SSL session to the session cache while SSL handshaking"
ssl_session_cache⼤⼩不够等原因造成

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。