Web基础与HTTP协议
⽬录
DNS与域名
域名
⽹页
Web
HTTP协议概述
⼀、DNS与域名
1、⽹络是基于 TCP/IP 协议进⾏通信和连接的,每⼀台主机都有⼀个唯⼀的标识(固定的 IP 地址),⽤以区别在⽹络上成千上万个⽤户和计算机。⽹络在区分所有与之相连的⽹络和主机时,均采⽤⼀种唯⼀、通⽤的地址格式,即每⼀个与⽹络相连接的计算机和服务器都被指派⼀个独⼀⽆⼆的地址
七层参考模型和五层,逻辑⽹卡(IP地址)和物理⽹卡(MAC地址) bond
2、为了保证⽹络上每台计算机的 IP 地址的唯⼀性,⽤户必须向特定机构申请注册,分配 IP 地址
⽹络中的地址⽅案分为两套:IP 地址系统和域名地址系统。这两套地址系统其实是⼀⼀对应的关系
由于 IP 地址是数字标识,使⽤时难以记忆和书写,因此在IP 地址的基础上⼜发展出⼀种符号化的地址⽅案,来代替数字型的 IP 地址
⼩结:
1、⽹络上交互是基于TCP/IP协议的,每个主机在逻辑上有⼀个唯⼀位置标识(IP地址),物理地址为MAC地址
2、为了保证地址唯⼀性,⽤户协议向特地给机构申请注册,分配IP地址⽹络中的地址有两套⽅案:
① IP地址系统
②域名地址系统
⽽由于IP是由32位⼆进制数字标识,不⽅便记忆,所以以IP地址为基础发展出了符号化地址来代替解决⽅案,也是是域名
3、DNS 解析
DNS解析⽅式,三种:
① /etc/hosts
linux系统中负责快速解析的⽂件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使⽤本地/etc/hosts完成解析/映射,实现快速访问
PS: 主要⽤于主机之间(IP和主机名)的映射/解析关系,⽰例:
静态网页和动态网页的概念和区别192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2
② /f
DNS客户端配置⽂件,主要⽤于设置DNS服务器的IP和域名,还包含了主机域名的搜索顺序等等,这个⽂件是由域名解析器(resolver,⼀个根据主机名解析IP地址的库)使⽤的配置⽂件。
PS:主要⽤与匹配DNS服务器,⽰例:
nameserver 114.114.114.114
nameserver 8.8.8.8
nameserver 218.2.135.1
③ /etc/sysconfig/network-scripts/ifcfg-ens33
我们也可以在⽹卡配置⽂件中定义DNS1= DNS2=
⽣效顺序 1 hosts⽂件 2 ⽹卡配置⽂件 3 /f
⼆、域名
1、定义:标识⼀组主机并提供它们的有关信息的树形结构(主要确定了根在哪,就可以确定每个分⽀)
www.baidu
域名服务器(分布式,每台主机维护⼀个部分):
①保持和维护域名空间的程序
②响应解析器的请求
解析端(客户端)
向DNS服务器发出请求的设备
2、域名空间结构(从右往左看)
①根域位于域名空间最顶层,⼀般⽤⼀个 “.” 表⽰
基础单位,除了根域其他都只有⼀个上级域,有0或多个⼦域,同层域不可重复的⼦域或域名
②顶级域
⼀般代表⼀种类型的组织机构或国家地区(主要有此两种类型构成),如 net(⽹络公司)、com(商业)、org(民间团体组织)、edu(教育)、gov(政府)、mil(军事)、cn(中国)、jp(⽇本)、hk(中国⾹港)
③⼆级域
⽤来标明顶级域内的⼀个特定的组织,国家顶级域下⾯的⼆级域名由国家⽹络部门统⼀管理,如 顶级域名下⾯设置的⼆级域
名:、、.edu …
④⼦域
⽤来标明顶级域内的⼀个特定的组织,国家顶级域下⾯的⼆级域名由国家⽹络部门统⼀管理,如 顶级域名下⾯设置的⼆级域
名:、、.edu …
主机
主机位于域名空间最下层,就是⼀台具体的计算机,如 www、mail、都是具体的计算机名字,可⽤www.sina.、mail.sina.来表⽰,这种表⽰⽅式称为 FQDN (完全合格域名),也是这台主机在域名中的全名
3、域名注册
域名注册是Internet中⽤于解决地址对应问题的⼀种⽅法
遵循先申请先注册原则
域名注册步骤:
准备申请资料————》寻域名注册⽹站————》查询域名————》正式申请————》申请成功
三、⽹页(HTTP/HTTPS):
1、⽹页基本概念
①⽹页
纯⽂本格式⽂件
编写语⾔为HTML
在⽤户的浏览器中被“翻译”成⽹页形式显⽰出来
②⽹站
由⼀个⼀个页⾯构成的,是多个⽹页的结合体
主页
打开⽹站后出现的第⼀个⽹页称为⽹站主页(或⾸页)
③域名
浏览⽹页时输⼊的⽹址
④ HTTP/HTTPS
⽤来传输⽹页的通信协议(是否加密),是⼀种通讯/交互的标准/规范
⑤ URL
是⼀种万维⽹寻址系统
⑥ HTML
⽤来编写⽹页的超⽂本标记语⾔
⑦超链接
超链接是将⽹站中不同⽹页链接起来的功能
⑧发布
将制作好的⽹页上传到服务器供⽤户访问的过程
2、HTML
① HTML超⽂本标记语⾔
Hyper Text Markup Language
⽹页的“源码”
浏览器:“解释和执⾏”HTML源码的⼯具
② HTML⽂档的结构
HTML⽹页
头部部分
标题部分
主体部分
⽹页内容,包括⽂本、图像等
⽰例:
<html>
<head>
<title>我的第⼀个⽹页 </title>
</head>
<body >
Hello World!
</body>
</html>
vim /etc/httpd/f
●头标签中常⽤标签:
标签描述
<title> 定义了⽂档的标题
<base> 定义了页⾯链接标签的默认链接地址
<link> 定义了⼀个⽂档和外部资源之间的关系
<meta> 定义了 HTML ⽂档中的元数据
<script> 定义了客户端的脚本⽂件
<style> 定义了 HTML ⽂档的样式⽂件
●内容标签中常⽤标签
标签描述
<table> 定义⼀个表格
<tr> 定义了表格中的⼀⾏
<td> 定义了表格中某⼀⾏的⼀列
<img> 定义了⼀个图像
<a> 定义了⼀个超链接
<p> 定义了⼀⾏
<br> 定义了换⾏
<font> 定义了字体
③⽹页基本标签2-1
⽹页摘要信息的作⽤
有利于浏览器解析
有利于搜索引擎搜索
<title>标签 #标题
<meta>标签 #元标志
④标题标签类型:
⾏控制相关标签
范围标签
图像标签
超链接标签
特殊符号
四、Web
1 Web概述
Web(World Wide Web)即全球⼴域⽹,也称为万维⽹
⼀种分布式图形信息系统
建⽴在Internet上的⼀种⽹络服务
2 Web1.0 vs Web2.0
Web1.0
以编辑为特征,⽹站提供给⽤户的内容是编辑处理后的,然后⽤户阅读⽹站提供的内容这个过程是⽹站到⽤户的单向⾏为
Web2.0
更注重⽤户的交互作⽤,⽤户既是⽹站内容的消费者(浏览者),也是⽹站内容的制造者
加强了⽹站与⽤户之间的互动,⽹站内容基于⽤户提供,⽹站的诸多功能也由⽤户参与建设,实现了⽹站与⽤户双向的交流与参与
Web2.0特征
⽤户分享、以兴趣为聚合点的社、开放的平台,活跃的⽤户
3 静态页⾯与动态页⾯
(1)静态页⾯定义
①静态⽹页是标准的HTML⽂件
②扩展名是.htm、.html
例如⽂本、图像、声⾳、Flash动画、客户端脚本和ActiveX控件及Java⼩程序等
③是⽹站建设的基础,早期⽹站⼀般都由静态⽹页制作
④没有后台数据库、不含程序和不可交互的⽹页
⑤相对更新起来⽐较⿇烦,适⽤于⼀般更新较少的展⽰型⽹站
(2)静态页⾯特点:
①每个静态⽹页都有⼀个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,⽽不含有“?”
②⽹页内容⼀经发布到⽹站服务器上,⽆论是否有⽤户访问,每个静态⽹页都是保存在⽹站服务器上的
③静态⽹页的内容相对稳定,容易被搜索引擎检索
④静态⽹页没有数据库的⽀持,在⽹站制作和维护⽅⾯⼯作量较⼤,因此当⽹站信息量很⼤时完全依靠静态⽹页制作⽅式⽐较困难
⑤静态⽹页的交互性较差,在功能⽅⾯有较⼤的限制
⑥页⾯浏览速度迅速,过程⽆需连接数据库,开启页⾯速度快于动态页⾯
(3)动态页⾯
①⽹页 URL不固定,能通过后台与⽤户交互
②在动态⽹页⽹址中有⼀个标志性的符号——“?”
③常⽤的语⾔有PHP、JSP、Python、Ruby等
(4)动态页⾯特点
①交互性
⽹页会根据⽤户的要求和选择⽽动态改变和响应,将浏览器作为客户端界⾯,这将是今后WEB发展的⼤势所趋
②⾃动更新
⽆须⼿动地更新HTML⽂档,便会⾃动⽣成新的页⾯,可以⼤⼤节省⼯作量
③因时因⼈⽽变
当不同的时间,不同的⼈访问同⼀⽹址时会产⽣不同的页⾯
五、HTTP协议概述
1、HTTP协议简介、版本
HTTP(超⽂本传输协议HyperText Transfer Protocol)协议是互联⽹上应⽤最为⼴泛的⼀种⽹络协议,它是基于TCP协议的应⽤层传输协议,简单来说就是客户端和服务端进⾏数据传输的⼀种规则。
HTTP/HTTPS是应⽤层上的协议,建⽴在传输层TCP之上,客户端通过与服务端进⾏TCP连接(三次握⼿),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接⼝来调⽤TCP协议实现。
HTTP 是⼀种⽆状态 (stateless) 协议, HTTP协议本⾝不会对发送过的请求和相应的通信状态进⾏持久化处理(存储,保存)。这样做的⽬的是为了保持HTTP协议的简单性,从⽽能够快速处理⼤量的事务, 提⾼效率。
然⽽,在许多应⽤场景中,我们需要保持⽤户登录的状态或记录⽤户购物车中的商品。由于HTTP是⽆状态协议,所以必须引⼊⼀些技术来记录管理状态,例如Cookie。
cookie和session都为了实现的是http的短期的持久化(内存/缓存⽅式,查询快、效率⽐较⾼)cookie
是缓存在⽤户端(client)浏览器中的(默认缓存⼀天),当下次客户端通过同⼀个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进⾏请求,同时服务端收到客户端请求的时候,读取到cookie⽂件,知道客户端之前的是服务器A处理的任务,为了省事⼉,省资源,⼲脆直接讲请求直接再交给服务器A处理
两者对⽐:
cookie 省服务器性能
session 更安全
1、为后⾯服务、集、功能优化做铺垫
2、具体解释了怎么解决HTTP⽆状态协议的持久化/存储。
HTTP协议的版本
HTTP 0.9:已过时
HTTP 1.0:
HTTP 1.1
HTTP 2.0
HTTP1.0和HTTP1.1之间的区别
①缓存处理
在HTTP1.0中主要使⽤header⾥的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引⼊
了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。
②带宽优化及⽹络连接的使⽤
HTTP1.0中,存在⼀些浪费带宽的现象,例如客户端只是需要某个对象的⼀部分,⽽服务器却将整个对象送过来了,并且不⽀持断点续传功能,HTTP1.1则在请求头引⼊了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就⽅便了开发者⾃由的选择以便于充分利⽤带宽和连接
③错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表⽰请求的资源与资源的当前状态发⽣冲突;410(Gone)表⽰服务器上的某个资源被永久性的删除
④ Host头处理
在HTTP1.0中认为每台服务器都绑定⼀个唯⼀的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在⼀台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享⼀个IP地址。HTTP1.1的请求消息和响应消息都应⽀持Host头
域,且请求消息中如果没有Host头域会报告⼀个错误(400 Bad Request)
⑤长连接
HTTP 1.1⽀持长连接(PersistentConnection)和请求的流⽔线(Pipelining)处理,在⼀个TCP连接上可以传送多个HTTP请求和响应,减少了建⽴和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,⼀定程度上弥补了HTTP1.0每次请求都要创建连接的缺点
2、HTTP 请求格式( GET / POST ⽅式 )
(1)GET ⽅式
①请求⾏
请求的⽅式
请求的资源路径
请求的版本协议号
②请求头(描述信息/标准化信息)
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语⾔类型
User-Agent:浏览器的信息
Accpect-Encoding:客户端可以接受的编码格式
Host:表⽰请求的ip和端⼝号
Connection:告诉服务器请求连接如何处理
Keep-Alive:通知服务器回传数据不要马上关闭,保持⼀⼩段的连接
Closed:马上关闭
(2)POST 请求⽅式
①请求⾏
请求的⽅式
请求的资源路径
请求的协议的版本号
②请求头
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语⾔类型
Referer:表⽰请求发起时,浏览器地址栏中的地址
User-Agent:浏览器的信息
Content-Type:发送的数据类型
Content-Length:发送的数据长度
③请求体:就是发送给服务器的数据
(3)GET 与POST 区别
①区别⼀:语义上的区别
Get向服务器请求数据,依照HTTP协议,get 是⽤来请求数据。
Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语义,该操作是会修改服务器上的数据
②区别⼆:服务器请求的区别
Get请求是可以被缓存,⽰例:
访问百度,访问的⽅式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容
另外Get请求只能接收ASCII码的回复
Post请求是不可以被缓存的。对于Post⽅式提交表单,刷新页⾯浏览器会弹出提⽰框“是否重新提交表单”,
Post可以接收⼆进制等各种数据形式,所以如果要上传⽂件⼀般⽤Post请求

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。