web⽹站——理论01
LAMP的架构以及通信过程
LAMP的架构:
LAMP是⼀个多C/S架构的平台,最初级为web客户端基于TCP/IP通过http协议发起传送,这个请求可能是动态的,也可能是静态的。
所以web服务器通过发起请求的后缀来判断,如果是静态的资源就由web服务器⾃⾏处理,然后将资源发给客户端。如果是动态这时web服务器会通过CGI(Common Gateway interface)协议发起给php。
这⾥但是如果php是以模块形式与Web服务器联系。那么他们是通过内部共享内存的⽅式。如果是php单独的放置与⼀台服务器,那么他们是通过sockets套接字监听的⽅式通信(这⼜是⼀个C/S架构)。
这时php会相应的执⾏⼀段程序,如果在执⾏程序时,需要⽤到数据。那么php就会通过mysql协议发送给mysql服务器(也可以看作是⼀个C/S架构)。由mysql服务器处理,将数据供给php程序。
LAMP流程
1. ⽤户发送http请求到达httpd服务器
2. httpd解析url获取需要的资源的路径,通过内核空间读取硬盘资源,如是静态资源,则构建响应报⽂,发回给⽤户
3. 如果是动态资源,将资源地址发给php解析器,解析php程序⽂件,解析完毕将内容发回给httpd,httpd构建响应报⽂,发回给⽤户
4. 如果涉及到数据库操作,则利⽤php-mysql驱动,获取数据库数据,返回给PHP解析器。
A,M,P是怎么联动起来⼯作的呢?
apache + php结合的⽅式⼤概⼏种
第⼀种:把php编译时直接编译成apache的模块、module模块化的⽅式进⾏⼯作(apahce默认的这种⽅式)。
第⼆种:CGI、通⽤⽹关接⼝、apache基于CGI跟hph通信
第三种:fastcgi、他也是⼀种协议、在这种模块下他们两个是这样结合的:
本来php是做为⼀个模块或都是php解析器运⾏的,不是监听在某个套接字上接收别⼈的请求的,⽽是让
别⼈调⽤为⼀个进程使⽤的,可能是做为别⼈的⼦进程在运⾏,但是⼯作在fastcgi这种模块下的hph⾃⾏启⽤为⼀个服务进程,
他监听在某个套接字上,随时可以接受来⾃客户端的请求的,他也是有⼀个主进程的,为了可以响应多个⽤户的请求,他会启⽤多个⼦进程,这些⼦进程我们也可以称为⼯作进程,
他也是有空闲进程的,⼀但有客户请求他马上使⽤空闲的进程响应客户端的请求,将结果返回给前端的调⽤者,在php5.3.3版本之前他是没有这个能⼒了,只能⼯作在模块和CGI的⽅式下,⽽在5.3.3之后这个模块直接被收进php模块中,这种模块就叫php-fpm。
所以在以后编译php时,要想跟apache结合,就要编译成php-fpm,这是基于fastcgi⼯作的模式,并启动这服务进程,也就意味着他是通过套接字跟前端的调⽤者通信,既然基于套按字通信了,那么前端的web服务器和后⾯的php服务器完全可以⼯作在不同的主机上,实现了所谓的分层机制。
apache不会跟数据库打交道,他是个静态web服务器,跟数据库打交道的是应⽤程序,作为应⽤程序的源驱动能够基于某个API跟服务器之间建⽴会话,⽽后他会通过我们的mysql语句发送给数据库,数据库再将结果返回给应⽤程序,不是php进程,⽽是php进程中所执⾏的代码。
php + mysql的通信
PHP跟mysql怎么整合起来呢,php⼜怎么被httpd所调⽤呢
⾸先httpd并不具备解析代码的能⼒,他要依赖于php的解析器,接着php本⾝不依赖于mysql,他只是⼀个解析器,能执⾏代码就OK 了,那他什么时候⽤到mysql呢,如果要在mysql中存数据时才⽤到mysql,只是当php中有运⾏mysql语句时才⽤到mysql。
php语⾔要想联系mysql,通常⽤到php的驱动,rpm包的叫php_mysql,php跟mysql没有⼀点关系,只有程序员在php中编写mysql语句时才连接mysql来执⾏sql语句的。
基于php-mysql去连接mysql只使⽤⼀个函数mysql_connect();⽽mysql_connect()正是php-mysql提供的⼀个API,只要指明要连接的服务器即可。
Apache的三种⼯作模式
Apache ⼀共有3种稳定的 MPM 模式(多进程处理模块),它们分别是 prefork、worker、event。http-2.2版本的httpd默认的mpm⼯作模式为prefork,2.4版本的httpd默认是event⼯作模式。可以通过 httpd -V 来查看。
[root@ken ~]# httpd -V | grep -i "server mpm"
Server MPM: Prefork
编译的时候,可以通过 configure 的参数来指定:
--with-mpm=prefork|worker|event
1、prefork ⼯作模式
(作⽤:⽤⼀个进程处理⼀个⽤户请求)
Apache在启动之初,就预先fork⼀些⼦进程,然后等待请求进来。之所以这样做,是为了减少频繁创建和销毁进程的开销。每个⼦进程只有⼀个线程,在⼀个时间点内,只能处理⼀个请求。
优点:成熟稳定,兼容所有新⽼模块。同时,不需要担⼼线程安全的问题。
缺点:⼀个进程相对占⽤更多的系统资源,消耗更多的内存。⽽且,它并不擅长处理⾼并发请求。
2、worker ⼯作模式
(作⽤:⼀个进程⽣成多个线程,⼀个线程处理⼀个⽤户请求)
使⽤了多进程和多线程的混合模式。它也预先fork了⼏个⼦进程(数量⽐较少),然后每个⼦进程创建⼀些线程,同时包括⼀个监听线程。每个请求过来,会被分配到1个线程来服务。线程⽐起进程会更轻量,
因为线程通常会共享⽗进程的内存空间,因此,内存的占⽤会减少⼀些。在⾼并发的场景下,因为⽐起prefork有更多的可⽤线程,表现会更优秀⼀些。
优点:占据更少的内存,⾼并发下表现更优秀。
缺点:必须考虑线程安全的问题。
3、event ⼯作模式
(⽤⼀个线程处理⼀个⽤户请求)
它和worker模式很像,最⼤的区别在于,它解决了keep-alive场景下,长期被占⽤的线程的资源浪费问题。event MPM中,会有⼀个专门的线程来管理这些keep-alive类型的线程,当有真实请求过来的时候,
将请求传递给服务线程,执⾏完毕后,⼜允许它释放。这样增强了⾼并发场景下的请求处理能⼒。
HTTP采⽤keepalive⽅式减少TCP连接数量,但是由于需要与服务器线程或进程进⾏绑定,导致⼀个繁忙的服务器会消耗完所有的线程。Event MPM是解决这个问题的⼀种新模型,它把服务进程从连接中分
离出来。在服务器处理速度很快,同时具有⾮常⾼的点击率时,可⽤的线程数量就是关键的资源限制,此时Event MPM⽅式是最有效的,但不能在HTTPS访问下⼯作。
服务器的返回状态值
(表⽰请求的是否成功等信息)
1xx:⼀般不⽤,就是⼀些描述信息
2xx:表⽰请求成功
200:ok,请求下载成功
201:create ok,上传成功
3xx:表⽰请求的资源被重定向
301:moved permanently,永久重定向
302:Found,临时重定向
304:not modified,标识⼀个缓存的资源是否发⽣过更改
4xx:请求失败,因为客户端原因导致失败
403:forbidden,表⽰客户端没有权限访问所请求的资源
404:Not Found,表⽰客户端所请求的资源不存在
405:Method Not Allowd:表⽰客户端所⽤的⽅法不被允许
5xx:请求失败,因为服务器端原因导致失败
500:Internal Server Error,服务器内部错误
502:Bad Gateway,代理服务器从上游服务器获取到的是伪响应
503:service unavailable,服务器暂时不可⽤
IP/PV/UV:⽤来对⽹站的访问情况进⾏统计
(1)ip:internet protocol,独⽴IP数
表⽰我们的⽹站在⼀天之内被多少IP访问过(00-24),相同IP⼀天只能计为⼀次。这种统计⽅式是不准确的,实际的访问⼈数的多于IP数的
(2)pv:Page View
表⽰是的在⼀天之内某个页⾯被访问过多少次(每刷新⼀次,算⼀次访问)
(3)uv:uniq vistor,独⽴访客
表⽰⼀个⽤户就是⼀个uv
计算ip pv⽅式
1. 在页⾯中插⼊⼀段js代码,实现统计
2. 分析⽇志
3. 使⽤第三⽅平台做统计
计算uv⽅式
1. 给每个客户端分配cookie,对cookie处理来实现统计
2. 根据客户端的特征信息(ip+浏览器类型+机器其他信息)
⽹站 IP(万) PV(万)服务器数量(台)
58 250 3000 500
51cto 40 80-100 30
chinaunix 28 50-80 15
taobao 7-8000 5000-10000 10000
虚拟主机
利⽤虚拟主机功能,可以把⼀台处于运⾏状态的物理服务器分割成多个“虚拟的服务器”。
web服务器又被称为Apache的虚拟主机功能是服务器基于⽤户请求的不同主机域名或端⼝号还ip,实现提供多个⽹站同时为外部提供访问服务的技术,⽤户请求的资源不同,最终获取到的⽹页内容也各不相同。
该⽅案适合访问量少的公司实施。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论