客户端和服务器端一旦握手协商成功接建立连接,端点之间可以基于HTTP/2协议传递交换帧数据了。
下图为HTTP/2帧通用格式:帧头+负载的比特位通用结构:
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | Type (8) | Flags (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============================================================+ | Frame Payload (0...) ... +---------------------------------------------------------------+
帧头为固定的9个字节((24+8+8+1+31)/8=9)呈现,变化的为帧的负载(payload),负载内容是由帧类型(Type)定义。
关于帧长度,需要稍加关注: - 0 ~ 2^14(16384)为默认约定长度,所有端点都需要遵守 - 2^14 (16,384) ~ 2^24-1(16,777,215)此区间数值,需要接收方设置SETTINGS_MAX_FRAME_SIZE参数单独赋值 - 一端接收到的帧长度超过设定上限或帧太小,需要发送FRAME_SIZE_ERR错误 - 当帧长错误会影响到整个连接状态时,须以连接错误对待之;比如HEADERS,PUSH_PROMISE,CONTINUATION,SETTINGS,以及帧标识符不该为0的帧等,都需要如此处理 - 任一端都没有义务必须使用完一个帧的所有可用空间 - 大帧可能会导致延迟,针对时间敏感的帧,比如RST_STREAM, WINDOW_UPDATE, PRIORITY,需要快速发送出去,以免延迟导致性能等问题
和HTTP/1一样,HTTP/2报头字段包含一个或多个相关的键值对。报头字段会在HTTP请求/响应报头和服务器推送操作中使用。原先为文本字段,现在需要使用HTTP报头压缩进行序列化成报头分块,作为HEADERS 、 PUSH_PROMISE、CONTINUATION等帧的负载传输出去。
解压缩采用的HPACK协议,具体可参考:http://http2.github.com/http2-spec/compression.html
接收端合并接收到的帧组装成报头分块,解压缩还原报头集合。
一个完整的报头分块包含: - 单个包含报头终止标记END_HEADERS的HEADERS、PUSH_PROMISE帧,或者 - HEADERS、PUSH_PROMISE帧不包含的END_HEADERS标记,后续跟随一个或多个CONTINUATION帧,最后一个CONTINUATION帧包含了END_HEADERS标记。
报头压缩是有状态的,在一个完整的连接中,一方的压缩上下文环境,另一方的解压的上下文环境,都是需要具备的。报头解码失败需要作为连接错误COMPRESSION_ERROR对待。
报头块彼此之间离散,作为连续的同一类型帧序列存在,不存在交错帧以及来自其他类型帧或流。举一个例子,一个连续的HEADERS/CONTINUATION/PUSH_PROMISE帧序列,最后一个帧包含了END_HEADERS标记,表示一个报头完结。一个报头块逻辑上是一个帧,但是否完整取决于同类型连续的帧的最后一个包含END_HEADERS标记。
报头块作为HEADERS/PUSH_PROMISE/CONTINUATION等帧负载被一端发向另一端。接收端需要从HEADERS/PUSH_PROMISE/CONTINUATION等帧负载中进行组装报头块,执行解压还原报头集合,不管帧需要不需要被丢弃。接收端在解压时若不能够正常解压报头块,需要回应COMPRESSION_ERROR错误,然后终止连接。
规范定义了10个正式使用到帧类型,扩展实验类型的ALTSVC、BLOCKED等不在介绍之列。下面按照优先使用顺序重新排排序。
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x4 (8) | 0000 000? (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier/0x0 (32) | +=+=============================+===============================+ | Identifier (16) | +-------------------------------+-------------------------------+ | Value (32) | +---------------------------------------------------------------+ | Identifier (16) | +-------------------------------+-------------------------------+ | Value (32) | +---------------------------------------------------------------+
设置帧,接收者向发送者通告己方设定,服务器端在连接成功后必须第一个发送的帧。
字段Identifier定义了如下参数: - SETTINGS_HEADER_TABLE_SIZE (0x1),通知接收者报头表的字节数最大值,报头块解码使用;初始值为4096个字节,默认可不用设置 - SETTINGS_ENABLE_PUSH (0x2),0:禁止服务器推送,1:允许推送;其它值非法,PROTOCOL_ERROR错误 - SETTINGS_MAX_CONCURRENT_STREAMS (0x3),发送者允许可打开流的最大值,建议值100,默认可不用设置;0值为禁止创建新流 - SETTINGS_INITIAL_WINDOW_SIZE (0x4),发送端流控窗口大小,默认值2^16-1 (65,535)个字节大小;最大值为2^31-1个字节大小,若溢出需要报FLOW_CONTROL_ERROR错误 - SETTINGS_MAX_FRAME_SIZE (0x5),单帧负载最大值,默认为2^14(16384)个字节,两端所发送帧都会收到此设定影响;值区间为2^14(16384)-2^24-1(16777215) - SETTINGS_MAX_HEADER_LIST_SIZE (0x6),发送端通告自己准备接收的报头集合最大值,即字节数。此值依赖于未压缩报头字段,包含字段名称、字段值以及每一个报头字段的32个字节的开销等;文档里面虽说默认值不受限制,因为受到报头集合大小不限制的影响,个人认为不要多于2 SETTINGS_MAX_FRAME_SIZE(即2^142=32768),否则包头太大,隐患多多。
标志位: * ACK (0x1),表示接收者已经接收到SETTING帧,作为确认必须设置此标志位,此时负载为空,否则需要报FRAME_SIZE_ERROR错误
注意事项: - 在连接开始阶段必须允许发送SETTINGS帧,但不一定要发送 - 在连接的生命周期内可以允许任一端点发送 - 接收者不需要维护参数的状态,只需要记录当前值即可 - SETTINGS帧仅作用于当前连接,不针对单个流,因此流标识符为0x0 - 不完整或不合规范的SETTINGS帧需要抛出PROTOCOL_ERROR类型连接错误 - 负载字节数为6个字节的倍数,6*N (N>=0)
处理流程: - 发送端发送需要两端都需要携带有遵守的SETTINGS设置帧,不能够带有ACK标志位 - 接收端接收到无ACK标志位的SETTINGS帧,必须按照帧内字段出现顺序一一进行处理,中间不能够处理其它帧 - 接收端处理时,针对不受支持的参数需忽略 - 接收端处理完毕之后,必须响应一个包含有ACK确认标志位、无负载的SETTINGS帧 - 发送端接收到确认的SETTINGS帧,表示两端设置已生效 - 发送端等待确认若超时,报SETTINGS_TIMEOUT类型连接错误
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x1 (8) | 00?0 ??0? (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============+===============================================+ |Pad Length? (8)| +-+-------------+-----------------------------------------------+ |E| Stream Dependency? (31) | +-+-------------+-----------------------------------------------+ | Weight? (8) | +-+-------------+-----------------------------------------------+ | Header Block Fragment (*) ... +---------------------------------------------------------------+ | Padding (*) ... +---------------------------------------------------------------+
报头主要载体,请求头或响应头,同时呢也用于打开一个流,在流处于打开"open"或者远程半关闭"half closed (remote)"状态都可以发送。
字段列表: - Pad Length:受制于PADDED标志控制是否显示,8个比特表示填充的字节数。 - E:一个比特表示流依赖是否专用,可选项,只在流优先级PRIORITY被设置时有效 - Stream Dependency:31个比特表示流依赖,只在流优先级PRIORITY被设置时有效 Weight:8个比特(一个字节)表示无符号的自然数流优先级,值范围自然是(1~256),或称之为权重。只在流优先级PRIORITY被设置时有效 - Header Block Fragment:报头块分片 - Padding:填充的字节,受制于PADDED标志控制是否显示,长度由Pad Length字段决定
所需标志位: END_STREAM (0x1): 报头块为最后一个,意味着流的结束。后续可紧接着CONTINUATION帧在当前的流中,需要把CONTINUATION帧作为HEADERS帧的一部分对待 END_HEADERS (0x4): 此报头帧不需分片,完整的一个帧。后续不再需要CONTINUATION帧帮忙凑齐。若没有此标志的HEADER帧,后续帧必须是以CONTINUATION帧传递在当前的流中,否则接收者需要响应PROTOCOL_ERROR类型的连接错误。 PADDED (0x8): 需要填充的标志 PRIORITY (0x20): 优先级标志位,控制独立标志位E,流依赖,和流权重。
注意事项: - 其负载为报头块分片,若内容过大,需要借助于CONTINUATION帧继续传输。若流标识符为0x0,结束段需要返回PROTOCOL_ERROR连接异常。HEADERS帧包含优先级信息是为了避免潜在的不同流之间优先级顺序的干扰。 - 其实一般来讲,报文头部不大的情况下,一个HEADERS就可以完成了,特殊情况就是Cookie字段超过16KiB大小,不常见。
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x9 (8) | 0x0/0x4 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (32) | +=+=============================================================+ | Header Block Fragment (*) | +---------------------------------------------------------------+
字段列表: - Header Block Fragment,用于协助HEADERS/PUSH_PROMISE等单帧无法包含完整的报头剩余部分数据。
注意事项: - 一个HEADERS/PUSH_PROMISE帧后面会跟随零个或多个CONTINUATION,只要上一个帧没有设置END_HEADERS标志位,就不算一个帧完整数据的结束。 - 接收端处理此种情况,从开始的HEADERS/PUSH_PROMISE帧到最后一个包含有END_HEADERS标志位帧结束,合并的数据才算是一份完整数据拷贝 - 在HEADERS/PUSH_PROMISE(没有END_HEADERS标志位)和CONTINUATION帧中间,是不能够掺杂其它帧的,否则需要报PROTOCOL_ERROR错误
标志位: * END_HEADERS(0X4):表示报头块的最后一个帧,否则后面还会跟随CONTINUATION帧。
一个或多个DATA帧作为请求、响应内容载体,较为完整的结构如下:
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x0 (8) | 0000 ?00? (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============+===============================================+ |Pad Length? (8)| +---------------+-----------------------------------------------+ | Data (*) ... +---------------------------------------------------------------+ | Padding? (*) ... +---------------------------------------------------------------+
字段: Pad Length: 一个字节表示填充的字节长度。取决于PADDED标志是否被设置. Data: 这里是应用数据,真正大小需要减去其他字段(比如填充长度和填充内容)长度。 * Padding: 填充内容为若干个0x0字节,受PADDED标志控制是否显示。接收端处理时可忽略验证填充内容。若验证,可以对非0x0内容填充回应PROTOCOL_ERROR类型连接异常。
标志位: END_STREAM (0x1): 标志此帧为对应标志流最后一个帧,流进入了半关闭/关闭状态。 PADDED (0x8): 负载需要填充,Padding Length + Data + Padding组成。
注意事项: - 若流标识符为0x0,接收者需要响应PROTOCOL_ERROR连接错误 - DATA帧只能在流处于"open" or "half closed (remote)"状态时被发送出去,否则接收端必须响应一个STREAM_CLOSED的连接错误。若填充长度不小于负载长度,接收端必须响应一个PROTOCOL_ERROR连接错误。
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x5 (8) | 0000 ??00 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (32) | +=+=============================================================+ |Pad Length? (8)| +-+-------------+-----------------------------------------------+ |R| Promised Stream ID (31) | +-+-------------------------------------------------------------+ | Header Block Fragment (*) . . . +---------------------------------------------------------------+ | Padding (*) . . . +---------------------------------------------------------------+
服务器端通知对端初始化一个新的推送流准备稍后推送数据: - 要求推送流为打开或远端半关闭(half closed (remote))状态,否则报PROTOCOL_ERROR错误: - 承诺的流不一定要按照其流打开顺序进行使用,仅用作稍后使用 - 受对端所设置SETTINGS_ENABLE_PUSH标志位决定是否发送,否则作为PROTOCOL_ERROR错误对待 - 接收端一旦拒绝接收推送,会发送RST_STREAM帧告知对方推送无效
字段列表: - Promised Stream ID,31个比特表示无符号的自然数,为推送保留的流标识符,后续适用于发送推送数据 - Header Block Fragment,请求头部字段值,可看做是服务器端模拟客户端发起一次资源请求
标志位: END_HEADERS(0x4/00000010),此帧包含完整的报头块,不用后面跟随CONTINUATION帧了 PADDED(0x8/00000100),填充开关,决定了下面的Pad Length和Padding是否要填充,具体和HEADERS帧内容一致,不多说
优先级帧,类型值为0x6,8个字节表示。发送者测量最小往返时间,心跳机制用于检测空闲连接是否有效。
+-----------------------------------------------+ | 0x8 (24) | +---------------+---------------+---------------+ | 0x6 (8) | 0000 000? (8) | +-+-------------+---------------+-------------------------------+ |R| 0x0 (32) | +=+=============================================================+ | Opaque Data (64) | +---------------------------------------------------------------+
字段列表: - Opaque Data:8个字节负载,值随意填写。
标志位: * ACK(0x1):一旦设置,表示此PING帧为接收者响应的PING帧,非发送者。
注意事项: - PING帧发送方ACK标志位为0x0,接收方响应的PING帧ACK标志位为0x1。否则直接丢弃。其优先级要高于其它类型帧。 - PING帧不和具体流相关联,若流标识符为0x0,接收方需要响应PROTOCOL_ERROR类型连接错误。 - 超过负载长度,接收者需要响应FRAME_SIZE_ERROR类型连接错误。
优先级帧,类型值为0x2,5个字节表示。表达了发送方对流优先级权重的建议值,在流的任何状态下都可以发送,包括空闲或关闭的流。
+-----------------------------------------------+ | 0x5 (24) | +---------------+---------------+---------------+ | 0x2 (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============================================================+ |E| Stream Dependency (31) | +-+-------------+-----------------------------------------------+ | Weight (8) | +---------------+
字段列表: - E:流是否独立 - Stream Dependency:流依赖,值为流的标识符,自然也是31个比特表示。 - Weight:权重/优先级,一个字节表示自然数,范围1~256
注意事项: - PRIORITY帧其流标识符为0x0,接收方需要响应PROTOCOL_ERROR类型的连接错误。 - PRIORITY帧可在流的任何状态下发送,但限制是不能够在一个包含有报头块连续的帧里面出现,其发送时刻需要,若流已经结束,虽然可以发送,但已经没有什么效果。 - 超过5个字节PRIORITY帧接收方响应FRAME_SIZE_ERROR类型流错误。
+-----------------------------------------------+ | 0x4 (24) | +---------------+---------------+---------------+ | 0x8 (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============================================================+ |R| Window Size Increment (31) | +-+-------------------------------------------------------------+
流量控制帧,作用于单个流以及整个连接,但只能影响两个端点之间传输的DATA数据帧。但需注意,中介不转发此帧。
字段列表: - Window Size Increment,31个比特位无符号自然数,范围为1-2^31-1(2,147,483,647)个字节数,表明发送者可以发送的最大字节数,以及接收者可以接收到的最大字节数。
注意事项: - 目前流控只会影响到DATA数据帧 - 流标识符为0,影响整个连接,非单个流 - 流标识符不为空,具体流的标识符,将只能够影响到具体流 - WINDOW_UPDATE在某个携带有END_STREAM帧的后面被发送(当前流处于关闭或远程关闭状态),接收端可忽略,但不能作为错误对待 - 发送者不能发送一个窗口值大于接收者已持有(接收端已经拥有一个流控窗口值)可用空间大小的WINDOW_UPDATE帧 - 当流控窗口所设置可用空间已耗尽时,对端发送一个零负载带有END_STREAM标志位的DATA数据帧,这是允许的行为 - 流量控制不会计算帧头所占用的9个字节空间 - 若窗口值溢出,针对单独流,响应RST_STREAM(错误码FLOW_CONTROL_ERROR)帧;针对整个连接的,响应GOAWAY(错误码FLOW_CONTROL_ERROR)帧 - DATA数据帧的接收方在接收到数据帧之后,需要计算已消耗的流控窗口可用空间,同时要把最新可用窗口空间发送给对端 - DATA数据帧发送方接收到WINDOW_UPDATE帧之后,获取最新可用窗口值 - 接收方异步更新发送方窗口值,避免流停顿/失速 - 默认情况下流量控制窗口值为65535,除非接收到SETTINGS帧SETTINGS_INITIAL_WINDOW_SIZE参数,或者WINDOWS_UPDATE帧携带的窗口值大小,否则不会改变 - SETTINGS_INITIAL_WINDOW_SIZE值的改变会导致窗口可用空间不明晰,易出问题,发送者必须停止受流控影响的DATA数据帧的发送直到接收到WINDOW_UPDATE帧获得新的窗口值,才会继续发送。eg:客户端在连接建立的瞬间一口气发送了60KB的数据,但来自服务器SETTINGS设置帧的初始窗口值为16KB,客户端只能够等到WINDOW_UPDATE帧告知新的窗口值,然后继续发送传送剩下的44KB数据 - SETTINGS帧无法修改针对整个连接的流量控制窗口值 - 任一端点在处理SETTINGS_INITIAL_WINDOW_SIZE值时一旦导致流控窗口值超出最大值,都需要作为一个FLOW_CONTROL_ERROR类型连接错误对待
优先级帧,类型值为0x3,4个字节表示。表达了发送方对流优先级权重的建议值,任何时间任何流都可以发送,包括空闲或关闭的流。
+-----------------------------------------------+ | 0x4 (24) | +---------------+---------------+---------------+ | 0x3 (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (31) | +=+=============================================================+ | Error Code (32) | +---------------------------------------------------------------+
字段列表: - Error Code:错误代码,32位无符号的自然数表示流被关闭的错误原因。
注意事项: - 接收到RST_STREAM帧,需要关闭对应流,因此流也要处于关闭状态。 - 接收者不能够在此流上发送任何帧。 - 发送端需要做好准备接收接收端接收到RST_STREAM帧之前发送的帧,这个空隙的帧需要处理。 - 若流标识符为0x0,接收方需要响应PROTOCOL_ERROR类型连接错误。 - 当流处于空闲状态idle状态时是不能够发送RST_STREAM帧,否则接收方会报以PROOTOCOL_ERROR类型连接错误。
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0x7 (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (32) | +=+=============================================================+ |R| Last-Stream-ID (31) | +-+-------------------------------------------------------------+ | Error Code (32) | +---------------------------------------------------------------+ | Additional Debug Data (*) | +---------------------------------------------------------------+
一端通知对端较为优雅的方式停止创建流,同时还要完成之前已建立流的任务。
HTTP/2协议的扩展是允许存在的,在于提供额外服务。扩展包括: - 新类型帧,需要遵守通用帧格式 - 新的设置参数,用于设置新帧相关属性 - 新的错误代码,约定帧可能触发的错误
当定义一个新帧,需要注意 1. 规范建议新的扩展需要经过双方协商后才能使用 1. 在SETTINGS帧添加新的参数项,可在连接序言时发送给对端,或者适当机会发送 1. 双方协商成功,可以使用新的扩展
已知ALTSVC、BLOCKED属于扩展帧。
服务器提供给客户端当前可用的替代服务,类似于CNAME,客户端不支持可用选择忽略
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0xa (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier (32) | +=+=============================+===============================+ | Origin-Len (16) | Origin? (*) ... +-------------------------------+-------------------------------+ | Alt-Svc-Field-Value (*) ... +---------------------------------------------------------------+
字段列表: - Origin-Len: 16比特位整数,说明了Origin字段字节数 - Origin: ASCII字符串表示替代服务 - Alt-Svc-Field-Value: 包含了Alt-Svc HTTP Header Field,长度=Length (24) - Origin-Len (16)
需要注意: - 中介设备不能转发给客户端,原因就是中介自身替换处理,转发正常的业务数据给客户端就行
具体可参考:https://tools.ietf.org/html/draft-ietf-httpbis-alt-svc-06
一端告诉另一端因为受到流量控制的作用有数据但无法发送。
+-----------------------------------------------+ | Length (24) | +---------------+---------------+---------------+ | 0xb (8) | 0x0 (8) | +-+-------------+---------------+-------------------------------+ |R| Stream Identifier/0x0 (32) | +=+=============================================================+
以上记录了HTTP/2帧基本结构,10个文档定义的正式帧,以及额外的两个扩展帧。