报文流

如果说HTTP是因特网的信使，那么HTTP报文就是它用来搬东西的包裹了

HTTP报文是在HTTP应用程序之间发送的数据块。这些数据块以一些文本形式的元信息(meta-information)开头，这些信息模式了报文的内容以及含义，后面跟着可选的数据部分。这些报文在客户端、服务器和代理之间流动。术语“流入”(inbound)、“流出”(outbound)、“上游”、“下游”都是用来描述报文方向的

报文流入源端服务器

HTTP使用术语流入和流出来描述事务处理的方向。报文流入源端服务器，工作完成后，会流回用户的Agent代理中。
在这里插入图片描述

报文的组成部分

HTTP报文是简单的格式化数据库。每条报文都包含一条来自客户端的请求，或者一条来自服务器的响应。它们由三个部分组成：

对报文进行描述的起始行(start line)
包含属性的首部(header)块
以及可选的、包含数据的**主体(body)**部分。

起始行和首部就是行分隔的ASCII文本。每行都以一个由两个字符组成的行终止符序列作为结束，其中包含一个回车符(ASCII码13)和一个换行符(ASCII码10)。这个行终止序列可以写作CRLF。

主体是一个可选的数据块。与起始行和首部不同的是，主体中可以包含文本或者二进制数据，也可以为空。

上图中，首部给出了一些与主体有关的信息：

content-type行说明了主体是什么——纯文本文档。
content-length行说明了主体有多大——19个字节

报文的语法

所有的HTTP报文都可以分为两类：

请求报文（request message）：请求报文会向Web服务器请求一个动作
响应报文（response message）：响应报文会将请求的结果返回给客户端。

在这里插入图片描述
这是请求报文的格式：

这是响应报文的格式（注意，只有起始行的语法有所不同）：
在这里插入图片描述

方法<method>：
- 客户端希望服务器对资源执行的动作
- 是一个单独的词，比如GET/HEAD/POST
请求URL<request-URL>：
- 命名了所请求的资源，或者URL路径组件的完整URL
版本<version>：
- 报文所使用的HTTP版本，其格式如下：
- HTTP/<major>.<minor>
- 其中major和minor都是整数
状态码<status>：
- 这三个数据描述了请求过程中所发生的情况
- 每个状态码的第一位数字都用于描述状态的一般类别(“成功”、”出错”等)
原因短语<reason-phrase>：
- 数字状态码的可读版本，包含行终止序列之前的所有文档
- 原因短语只对人类有意义，也就是说，HTTP/1.0 200 NOT OK和HTTP/1.0 200 OK中原因短语的含义不同，但是都会被当成成功指示处理
- 但是，请使用HTTP规范定义的状态码的原因短语示例
首部(header)：
- 可以有零个或者多个首部，每个首部都包含一个名字，后面跟着一个:，然后是一个可选的空格，接着是一个值，最后是一个CRLF
主体(entity-body)：
- 包含一个由任意数据组成的数据块
- 并不是所有的报文都包含实体。

起始行

所有的HTTP报文都以一个起始行作为开始。

请求报文的起始行说明了要做些什么。
响应报文的请示行说明了发生了什么。

请示行

请求报文请求服务器对资源进行一些操作。请求报文的起始行，即请求行，包含了一个方法和一个请求URL，以及HTTP的版本：

方法描述了服务器应该执行的操作
请求URL描述了要对哪个资源指向这个方法
HTTP版本用来告知服务器，客户端使用的是哪种HTTP

所有这些字符都由空格符分隔。

响应行

响应报文承载了状态信息和操作产生的所有结果数据，将其返回给客户端。响应报文的起始行，即响应行，包含了响应报文使用的HTTP版本、数字状态码、以及描述操作状态的文本形式的原因短语。

所有这些字符都由空格符分隔。

方法

请求行以方法作为开始，方法用来告知服务器要做些什么。比如GET /aaa HTTP/1.1中，方法就是GET

HTTP规范中定义了一组常用的请求方法：
在这里插入图片描述
另外，除了这些方法外，其他服务器可能还会实现一些自己的请求方法，这些附加方法是对HTTP规范的扩展，因此被称为扩展方法。

状态码

方法用来告诉服务器要做什么事情，状态码用来告知客户端，发生了什么事情。状态码位于响应行中，比如HTTP/1.0 200 OK中，状态码就是200

可以通过三位数字代码对不同的状态码进行分类，如下：
在这里插入图片描述

原因短语

原因短语是响应行中最后一个组件。它为状态码提供了文本形式的解释。比如，HTTP/1.0 200 OK中，原因短语就是OK

原因短语和状态码是成对出现的，原因短语是状态码的可读版本，应用程序开发者将其传递给用户，用以说明在请求期间发生了什么情况。

版本号

版本号会以HTTP/x.y的形式出现在请求和响应报文的起始行中。为HTTP应用程序提供了一种将自己所遵循的协议版本告知对方的方式。

使用版本号的目的是为使用HTTP的应用程序提供一种线索，以便相互了解对方的能力和报文格式。

首部

HTTP首部字段向请求和相应报文中添加了一些附加信息。本质上来说，它们是一些名/值对列表。比如，下面的首部行会向Content-Length首部字段赋值19：

Content-length:19

首部分类

HTTP规范定义了几种首部字段。应用程序也可以随意发明自己所用的首部。HTTP首部可以分为一下几类：

通用首部：既可以出现在请求报文中，也可以出现在响应报文中
请求首部：提供更多有关请求的信息
响应首部：提供更多有关响应的信息
实体首部：描述主体的长度和内容，或者资源自身。
扩展首部：规范中没有定义的新首部

每个HTTP首部都有一种简单的语法：名字后面跟着:，然后跟上可选的空格，在跟上字段值，最后是一个CRLF。
在这里插入图片描述

首部延续行

将长的首部行分为多行可以提高可读性，多出现的每行前面至少要有一个空格或者制表符(Tab)：
在这里插入图片描述
在这个响应报文中包含了一行Server首部，其值被分为多个延续行，该首部的完整值为“Test Server Version 1.0”。

实体的主体部分

HTTP报文的第三部分是可选的实体主体部分。实体的主体是HTTP报文的负荷。就是HTTP要传输的内容。

HTTP报文可以承载很多类型的数字数据：图片、视频、HTML文档、软件应用程序等

方法

GET

GET通常用于请求服务器发送某个资源。
在这里插入图片描述

HEAD

HEAD方法与GET方法的行为类似，但服务器在响应中只返回首部。不会返回实体的主体部分。这就允许客户端在未获取实际资源的情况下，对资源的首部进行检查。使用HEAD，可以：

在不获取资源的情况下了解资源的情况（比如，判断其类型）
通过查看响应中的状态码，看看某个对象是否存在
通过查看首部，测试资源是否被修改了。

服务器开发者必须确保返回的首部和GET请求所返回的首部完全相同。
在这里插入图片描述

PUT

与GET从服务器读取文档相反，PUT方法会向服务器写入文档。有些发布系统允许用户创建Web页面，并用PUT直接将其安装到Web服务器上去。
在这里插入图片描述
PUT方法的语义就是让服务器用请求的主体部分来创建一个由所请求的URL命名的新文档，或者，如果那个URL已经存在的话，就用这个主体来代替它。

因为PUT允许用户对内容进行修改，所以很多Web服务器都要求在执行PUT之前，用密码登录。

POST

POST用户向服务器发送数据，PUT用于向服务器上的资源中存储数据

POST方法起初是用来向服务器输入数据的。实际上，通常会用它来支持HTML的表单。表单中填好的数据通常会被送给服务器，然后由服务器将其发送到它要求的地方。

在这里插入图片描述

TRACE

客户端发起一个请求时，这个请求可能要穿过防火墙、代理、网关等。每个中间节点都可能会修改原始的HTTP请求。TRACE方法允许客户端在最终将请求发送给服务器时，看看它变成了什么样子。

TRACE请求会在目的服务器端发起一个“环回”诊断。行程最后一站的服务器会弹回一条TRACE响应，并在响应主体中携带它收到的原始请求报文。这样客户端就可以查看在所有中间HTTP应用程序组成的请求/响应链上，原始报文是否，以及如何被损坏或者修改过。

TRACE方法主要用于诊断，也就是说，用于验证请求是否如愿穿过了请求/响应链。它也是一种很好的工具，可以用来查看代理和其他程序对用户请求所产生的效果。

TRACE请求中不能带有实体的主体部分。TRANCE响应的实体主体部分包含了响应服务器收到的请求的精确副本。

OPTIONS

OPTIONS方法请求Web服务器告知其所支持的各种功能。可以询问服务器通常支持那些方法，或者对某些特殊资源支持那些方法。

这为服务器应用程序提供了一种手段，使其不用实际访问那些资源就能判定访问各种资源的最优方式。
在这里插入图片描述

DELETE

顾名思义，DELETE方法所做的事情就是请服务器删除请求URL所指定的资源。但是，客户端应用程序无法保证删除操作一定会被执行。因为HTTP规范允许服务器在不通知客户端的情况下撤销请求。
在这里插入图片描述

首部

首部和方法配合工作，共同决定了客户端和服务器能做什么事情。

通用首部

客户端和服务器都可以用的首部

Connection

HTTP协议使用TCP来管理连接方式，主要有两种连接方式，持久性连接和非持久性连接。

持久性连接

持久性连接指的是一次会话完成后，TCP连接并未关闭，第二次再次发送请求后，就不再需要建立TCP连接，而是可以直接进行请求和响应。
从HTTP 1.1开始，默认使用持久性连接。
它的一般表示形式如下：

在这里插入图片描述

keep-alive也是一个通用标头，一般Connection都会和keep-alive -起使用，keep-alive 有两个参数，一个是timeout ;另一个是max，它们的主要表现形式如下
在这里插入图片描述

timeout：指的是空闲连接必须打开的最短时间，也就是这次请求的连接时间不能少于5秒
max：值的是在连接关闭前服务器所能接收的最大请求数

非持久性连接

非持久性连接表示一次会话请求/响应后关闭连接的方式。
HTTP 1.1之前使用的连接都是非持久连接
它的一般表示形式如下：

在这里插入图片描述

Date

说明报文是什么时间创建的。

Date是一个通用标头，它可以出现在请求标头和响应标头中，它的基本表示如下
在这里插入图片描述
表示的是格林威治标准时间，这个时间要比北京时间慢八个小时

MIME-Version

给出了发送端使用的MIME版本

Trailer

仅用户当报文采用了分块传输编码时
说明在报文主体后记录了哪些首部字段
一般用法如下：

以上用例中，指定首部字段Trailer的值为Expires,在报文主体之后(分块长度0之后)出现了首部字段Expires。

Transfer-Encoding

告知接收端为了保证报文的可靠传输，对报文采用了什么编码方式。

Update

给出了发送端可能想要“升级”使用的新版本或者协议

在这里插入图片描述
上图用例中，首部字段Upgrade 指定的值为TLS/1.0 。请注意此处两个字段首部字段的对应关系，Connection 的值被指定为Upgrade。Upgrade 首部字段产生作用的对象仅限于客户端和临近服务器之间。因此，使用首部字段Upgrade时，还需要额外指定Connection: Upgrade 。对于附有首部字段Upgrade的请求，服务器可用101 Switching Protocols 状态码作为响应返回。

Via

显示了报文经过的中间节点(代理、网关)

使用Via是为了跟踪客户端和服务器之间的请求/响应路径，避免请求循环以及能够识别请求/响应链中发送者协议的功能。Via 字段由代理服务器添加，不论是正向代理还是反向代理，并且可以出现在请求标头和响应标头中。它用于跟踪消息转发。例如下图所示
在这里插入图片描述
Via后面的的1.1， 1.0表示接收服务器.上的HTTP版本，Via首部是为了跟踪路径，经常和TRACE方法一起使用

通用缓存首部

HTTP/1.0引入了第一个允许HTTP应用程序缓存对象本地副本的首部，这样就不需要总是直接从源端服务器获取了。

Cache-Control

用于随报文传送缓存指示

Pragma

另一种随报文传输指示的方式，但并不专用于缓存
从技术角度看来，Pragma是一种请求首部，从未被指定于响应首部

Pragma是http 1.1之前版本的历史遗留字段，仅作为与http的向后兼容而定义。它的一-般形式如下
在这里插入图片描述
只用于客户端发送的请求中。客户端会要求所有的中间服务器不返回缓存的资源。

如果所有的中间服务器都以实现HTTP /1.1为标准，那么直接使用Cache-Control: no-cache即可，如果不是的话，就要包含两个字段，如下
在这里插入图片描述

请求首部

请求首部是请求报文特有的。

信息部首部

它们向服务器提供了一些额外的信息，比如谁发送请求、请求源自与何处等

在这里插入图片描述

Accept首部

Accept首部为客户端提供了一种将其喜好和能力告知服务器的方式，包括它们想要什么，可以使用什么，以及它们不想要什么。这样，服务器就可以根据这些额外信息，对要发送的内容做出更明智的决定，就不需要浪费时间和带宽来发送客户端无法使用的东西
在这里插入图片描述
比如，下面的Accept首部就用来告知服务器客户端会接收与其请求相符的任意媒体类型：