http与www服务概念详解
http 协议简介 :
HTTP 协议,全称 HyperTest Transfer Protocol, 中⽂名称超⽂本传输协议,是互联⽹上应⽤最为⼴泛的⼀种⽹络协议。所有的 www 都必须遵守这个标准,设计 HTTP 最初的⽬的是为了提供⼀种发布和接收 HTML 页⾯的⽅法。
(HTTP (HyperTest Transfer Protocol ,超⽂本传输协议)是在万维⽹上进⾏通信时所⽤的协议⽅案, HTTP 有很多应⽤,但是最著名的是应⽤于 W eb 游览器和 Web 服务器之间
的双⼯通信)。
WWW(World Wide Web) ,简称 web ,中⽂常译为 ”万维⽹ ”或 ”环球⽹ ”。它是⽬前 Internet 上最⽅便,最受⽤户欢迎的信息服务类型。
http 协议 www 服务默认端⼝是 80 。加密的 www 服务 https 默认端⼝ 443。
⽤户访问⽹站基本流程
2)域名解析过程流
程图
http 协议请求流程与请求头消息
游览⼀个页⾯时(⽐如www.doczj/doc/3a9c4587e718964bcf84b9d528ea81c759f52e19.html /
index.html ) ,游览器会向服务器
www.doczj/doc/3a9c4587e718964bcf84b9d528ea81c759f52e19.html 发送⼀条HTTP 请求,服务器会去寻所期望的对象(在这个例⼦中就是
/index.html) ,如果成功,就将对象,对象类型、对象长度以及其他⼀些信息放在HTTP响应中发送给客户端。
[root@jianghao01 jianghao]# curl -I www.doczj/doc/3a9c4587e718964bcf84b9d528ea81c759f52e19.html 仅仅显⽰⽂档的头⽂件信息HTTP/1.1 200 OK
Server: bfe/1.0.8.18
Date: Sat, 15 Jul 2017 14:54:25 GMT
Content-Type: text/html
web服务器主要提供什么服务Content-Length: 277
Last-Modified: Mon, 13 Jun 2016 02:50:08 GMT
Connection: Keep-Alive
ETag: "575e1f60-115"
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Pragma: no-cache
Accept-Ranges: bytes
动态web 服务请求流程:
客户端发送请求httpd 得到请求httpd 解析请求的格式(html,css) 请求相应的php 解析php 解析程序执⾏完毕,返回结果(html) 给httpd httpd 把数据返回给客户端( 可能是压缩过的) 游览器接到返回结果,根据HTML 绘出界⾯展⽰出来。
⼩结:http 协议通信原理
1、http 是osi 模型中应⽤层协议。http 协议的重要应⽤是www 服务。
2、DNS 解析原理
3、http 请求信息包含的内容。
4、http 服务返回的内容,消息主体也消息头。
5、⽤户通过浏览器访问站服务器的请求到返回数据流程
静态⽹页:
概念:
在⽹站设计中,存粹HTML 格式的⽹页(可以包含图⽚,JS(前端功能实现),CSS (样式)等)通常被称为”静态⽹页”。
特点:所有程序在客户端解析,客户端如:IE游览器,你编的是什么,它显⽰的就是什么,⼀旦编写完成,就不会有任何改变。维护和更新⽐较⿇烦。
扩展名:对应程序⽂件的常见扩展名为:htm,html,xml,shtml,jpg(gif,png,bmp 等所有图⽚),js,css(样式),swf,avi,flv 视频格式。
(1)静态⽹页每个⽹页都有⼀个固定的URL,且⽹页⼀般以.htm 、html 、.shtml 等常见
形式为后缀,⽽且地址中不含问号“?”或“&”
(2)⽹页内容⼀经发布到⽹站服务器上,⽆论是否有⽤户访问,每个静态⽹页的内容都是保存在⽹页服务器上的,也就是说,静态⽹页是实实在在保存在服务器上的⽂件,每个⽹页都是⼀个独⽴的⽂件。
(3)静态⽹页的内容相对稳定,因此,容易被搜索引擎收录(优点,seo)
(4)静态⽹页没有数据库的⽀持,在⽹站制作和维护⽅⾯⼯作量较⼤,因此当⽹站信息量很⼤时完全依靠静态⽹页制作的⽅式⽐较困难(缺点)。
(5)静态⽹页的交互性较差,在功能⽅⾯有较⼤的限制(缺点)。
(6)⽹页程序在⽤户浏览器端解析,如IE浏览器,这样程序解析效率更⾼,由于服务
端不进⾏解析,因此可以接受更多的并发访问,当客户端向服务器请求数据时,服务器直接把数据返回(不做任何解析),当客户端拿到数据后,在浏览器端解析展现出来。
静态⽹页⼩结:
1、客户浏览器端解析程序,效率很⾼。
特点
(1)动态⽹页⼀般以数据库技术为基础,可以⼤⼤降低⽹站的维护⼯作量。
(2)采⽤动态⽹页技术的⽹站可以实现更多的功能,如⽤户注册,⽤户登录,在线调查,投票,⽤户管理,订单管理,发博⽂等等。
(3)动态⽹页⼤多并不是独⽴存在于服务器上的⽹页⽂件,只有当⽤户请求时服务器才返回⼀个完整的⽹页。
(4)动态⽹页中的“?对”搜索的收录存在⼀定的问题,搜索引擎⼀般不可能从⼀个⽹站的数据库中访问全部⽹页,或者出于技术⽅⾯的考虑,搜索蜘蛛⼀般不会区抓取⽹址中的“?后⾯的内容,因此采⽤动态⽹页的⽹站在进⾏搜索引擎推⼴时需要做⼀定的技术处理(伪静态)才能适应搜索引擎的抓取的要求。
(5)程序在服务端解析,服务端:php 引擎,java 容器
(tomcat,resin,jboss)。
(6)由于程序在服务端解析,因此,会消耗⼤量的CPU和内存等资源,因此,效率远不
如静态⽹页。
动态⽹页⼩结:
1、程序在服务端解析,⼀般以数据库为基础,可以⼤量的和⽤户交互
2、url 地址后缀⼀般为asp,aspx,php,jsp,do,cgi,perl ,并且常伴随?,&
3、架构优化:效率很差,并发也很低,尽可能转换成静态⽹页提供服务。
伪静态⽹页:
缺点:性能没有提升。反⽽降低了⽹站的性能。
伪静态特点:从URL地址⾥看,给⼈感觉是静态内容(如地址结尾带html ), 通过rewrite 规则实现URL 重写。地址规范、美观、有利于搜索引擎抓取。
伪静态⼩结:
1、动态⽹页伪装成静态。
2、⽬的:便于搜索引擎收录,提升⽤户访问量和提升⽤户体验。
3、由于仅仅是伪装,实际上还是动态,性能没有提升,转换消耗资源因此性能反⽽下降。
4、尽可能转换成真正的静态页⾯,除⾮并发量不是很⼤,⽤rewrite 实现伪静态。
⾼并发⽹站架构从动态转静态不同业务产品实现的例⼦:
1、门户新闻业务(⼀旦发布完成,⼏乎不会改动)对于新闻的业务静态化相对简单,有编辑⼈发布新闻,就可以⽣成静态⽂件,然后把静态内容同步到全国所有CDN 服务器节点上,再对⽤户提供访问。
2、视频⽹站业务(⼀旦发布完成,⼏乎不会改动)。优酷视频⽹,⽤户上传视频,需要
经历审核-转码的过程,⼤概1-2 个⼩时,审核-转码-
推送。
3、blog/bbs/sns/ 微博社区业务、电商(淘宝,京东)(⽤户发布完成,可能会随时
更新)异步,消息中间件、消息队列。
1Web 概念
1.1W eb1.0
以静态、单向阅读为主,⽹站内信息可以直接和其他⽹站信息进⾏交互,能通过第三⽅信息平台同时对多家⽹站信息进⾏整合使⽤。早期门户新闻类页⾯,或者传统的企业宣传的静态页⾯
特点:由⽹站提供⽅来更新和维护内容。
1.2W eb
2.0
以动态页⾯为主,以⽤户为中⼼,⽹站由⽤户参与或编辑的。产品如:bbs,blog,sns,微
博。以分享为特征的实时⽹络,⽤户在互联⽹上拥有⾃⼰的数据,并能在不同的⽹站上使⽤。
特点:以⽤户为中⼼,由⽤户上传或参与编辑维护内容。
1.3W eb3.0
将以⽹络化和个性化为特征,提供更多⼈⼯智能服务,完全基于Web ,⽤浏览器即可实现复杂的系统程序才具有的功能。
Web3.0 的特征分析:
1、微内容(Widget)的⾃由整合与有效聚合
2、适合多种终端平台,实现信息服务的普适性
3、良好的⼈性化⽤户体验,以及基础性的个性化配置
4、有效和有序的数字新技术
2访问模式
2.1b/s 模式
b/s 模式—browser/server 游览器/ 服务器结构,常见协议如http 如:apache 服务。
b/s 架构的全称为browser/server ,即游览器/ 服务器结构。Browser 指的是web 游览器,极少数事务逻辑在前端实现,但主要事务逻辑在服务器端实现,browser 客户端,webapp 服务器端和DB 端够成
所谓的三层架构。B/S架构的系统⽆需特别安装,客户端只需web 游览器即可。
B/S架构中,显⽰逻辑交给了web 游览器,事务处理逻辑在放在webapp上,这样就避免了庞⼤的胖客户端,减少了客户端的压⼒。因为客户端包含的逻辑很少,因此也被称为瘦客户端。
优点:
(1)⽆需安装客户端,有web 游览器即可。
(2)BS架构可以直接放在⼴域⽹上,通过⼀定的权限控制实现多客户访问的⽬的,交互性较强。
(3)BS架构⽆需升级多个客户端,升级服务器即可。
缺点:
(1)在跨游览器上(要兼容各种游览器),BS架构不尽⼈意。
(2)BS 架构的表现要达到CS程序的程度需要花费不少精⼒(需要测试⼈员做各种测试)。
(3)在速度和安全性上需要花费巨⼤的设计成本,这是BS架构的最⼤问题。
(4)客户端服务器端的交互是请求-响应模式,通常需要刷新页⾯,这并不是客户端乐意去做的。
2.2C/S 模式
C/S 模式-client/server ,酒店管理系统。考勤系统,会计⽤友软件,收银系统。
C/S架构是⼀种典型的两层架构,客户端服务器端架构,其客户端包含⼀个或多个在⽤户的电脑上运⾏的程序,⽽服务器端有两种,⼀种是数据库服务器端,客户端通过数据库连接访问服务器端的数据;另⼀种是socket 服务器端,服务器端的程序通过socket 与客户端的程序通信。
C/S架构也可以看做是胖客户端架构。因为客户端需要实现绝⼤多数的业务逻辑和界⾯展⽰。这种架构中,作为客户端的部分需要承受很⼤的压⼒,因为显⽰逻辑和事务处理都包含在
其中,通过与数据库的交互(通常是SQL 或存储过程的实现)来达到持久化数据,依次来满⾜实际项⽬的需要。
优点:
1、C/S 架构的界⾯和操作可以很丰富。
2、安全性能可以很容易保证,实现多层认证也不难。
3、由于只有⼀层交互,因此相应速度较快。
4、服务器端和客户端可以更好的兼容。
缺点:
1、适⽤⾯窄,通常⽤于局域⽹中。
2、⽤户固定。由于程序需要安装才可以使⽤,因此不适合⾯向⼀些不可知的⽤户。
3、维护成本⾼,发⽣⼀次升级,则所有客户端的程序都需要改变。
3PV IP UV
3.1 IP
IP 即Internet Protocol, 这⾥指独⽴IP 数,独⽴IP 数是指不同IP 地址的计算机访问⽹站时被计的总次数。独⽴IP 数是衡量⽹站流量的⼀个重要指标。⼀般⼀天内相同IP 地址的客户端访问⽹站页⾯只会被记为⼀次。
3.2P V
PV(访问量):即Page View,中⽂翻译为页⾯游览,即页⾯游览量或单击量,不管客户端是不是相
同,也不管IP是不是相同,⽤户只要访问⽹站页⾯就会被计算PV,⼀次计⼀个PV。
⼀个来访者访问⽹站,可能产⽣若⼲PV数,但是独⽴IP数就只有1 个,因此,如果对⽐⼀个⽹站的独⽴IP数和PV数,不难看出,PV ⼀定会⼤于等于IP数,其⽐例视⽹站的业务⽽定,对于分类门户,可能会达到10:1 甚⾄更多。
3.3U V
UV(独⽴访客)即Unique Visitor ,同⼀个客户端(PC 或移动端)访问⽹站被记为⼀个访客。⼀天内相同的客户端访问同⼀个⽹站只记⼀次UV。UV ⼀般是以客户端Cookie 等技术作为统计依据的,实际统计会有误差。
3.4企业⽹站对IP、PV、UV 的度量
3.4.1 对IP 的度量
(1)分析所有Web 服务器的访问⽇志信息,对IP 地址段去重后计数,这是IT⼈员的
基本计算⼿段。
(2)在⽹站的每个(所有)页⾯结尾,嵌⼊JS 等统计程序代码,待⽤户加载⽹页后,IP 即传给统计IP 的服务器,这种⽅法⼀般被第三⽅统计公司或在企业内部开发⽇志分析程序时使⽤。
(3)⽤第三⽅⼤家⽐较信任的统计⼯具,例如:⾕歌的统计(GA)。
3.4.2对PV 的度量
(1)分析web 服务的访问⽇志(需要排除JS、CSS及各种图⽚的⽇志信息),只计算HTML、PHP等页⾯数量。
(2)在⽹站的每个页⾯结尾,嵌⼊JS等统计程序代码,带⽤户加载⽹页后,访问数量即传给统计PV 的服务器,这种⽅法⼀般被第三⽅统计公司或在企业内部开发⽇志分析程序时使⽤。
(3)⽤第三⽅⼤家⽐较信任的统计⼯具,例如:⾕歌的统计(GA)。
3.4.3对UV 的度量
(1)通过客户端HTTP请求报⽂分析
(2)通过cookie 鉴别。
3.4.4对并发的理解
单位时间内,服务器能够同时处理的最⼤连接数(有的请求1秒才结束,有的请求可能10 秒才结束)。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论