网页对象:HTML文件、JPEG图片、视频文件、动态脚本等
基本HTML文件:包含对其他对象引用的链接
对象的寻址(addressing)
URL(Uniform Resoure Locator):统一资源定位器
Scheme: //host:port/path
www(万维网缩写)
万维网并不等同互联网,万维网只是互联网所能提供的服务其中之一,是靠着互联网运行的一项服务。
万维网应用遵循超文本传输协议HTTP
(HyperText Transfer Protocol);
HTTP版本: 1.0: RFC 1945 1.1: RFC 2068
使用TCP传输服务
服务器在80端口等待客户的请求 浏览器发起到服务器的TCP连接(创建套接字Socket) 服务器接受来自浏览器的TCP连接 浏览器(HTTP客户端)与Web服务器(HTTP服务器)交换HTTP消息 关闭TCP连接
无状态(stateless):服务器不维护任何有关客户端过去所发请求的信息
HTTP连接的两种类型
非持久性连接(NonpersistentHTTP) 每个TCP连接最多允许传输一个对象 HTTP 1.0版本使用非持久性连接
持久性连接(Persistent HTTP) 每个TCP连接允许传输多个对象 HTTP 1.1版本默认使用持久性连接
RTT(Round Trip Time): 从客户端发送一个很小的数据包到服务器并返回所经历的时间
若有n个对象,则:
- 以非持续连接传输:2n RTT
- 以k并行非持续性传输:2n/k RTT
- 以非流水线持续传输:(n+1)RTT
- 以流水线持续传输:> 2 RTT
HTTP1.0和HTTP1.1的一些区别
HTTP1.0最早在网页中使用是在1996年,那个时候只是使用一些较为简单的网页上和网络请求上,而HTTP1.1则在1999年才开始广泛应用于现在的各大浏览器网络请求中,同时HTTP1.1也是当前使用最为广泛的HTTP协议。 主要区别主要体现在:
- 缓存处理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。
- 带宽优化及网络连接的使用,HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接。
- 错误通知的管理,在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除。
- Host头处理,在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)。
- 长连接,HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。
HTTP是无状态协议
- 简单
- 服务器占用资源少
- 无法跟踪用户状态
- 请求报文需要携带完整的信息
解决方案: cookie. session
FTP传输:带外控制,数据连接
- 使用2个TCP连接
- 21端口传输命令;20端口传输数据
- 控制连接持久, 数据连接非持久。
代理服务器
即web缓存器。