网络相关技术点

TCP连接过程

状态码含义:

  • SYN(synchronous) - 表示建立连接
  • ACK(acknowledgment) - 表示响应
  • FIN(finish) - 表示关闭连接
  • RST(reset) - 表示重置
  • PSH(push) - 表示有Data传送
  • URG(urgent) - 表示紧急
  • Sequence Number - 顺序号码
  • Acknowledge Number - 确认号码

三次握手:

  1. 主机A发送位码为syn=1,随机产生seq number=1234567的数据包到服务器,主机B由SYN=1知道,A要求建立联机。
  2. 主机B收到请求后要确认联机信息,向A发送ack number=(主机A的seq+1),syn=1,ack=1,随机产生seq=7654321的包。
  3. 主机A收到后检查ack number是否正确,即第一次发送的seq number+1,以及位码ack是否为1,若正确,主机A会再发送ack number=(主机B的seq+1),ack=1,主机B收到后确认seq值与ack=1则连接建立成功。

四次挥手:

  1. 主机A发送位码为fin=1,seq number=(前面已经传送过来的数据的最后一个字节的序号加1)并发送,主机B由fin=1知道A要关闭连接。
  2. 主机B返回ack=1,ack number=(主机A的seq=1),随机产生seq number=1234567。然后等待主机B的socket服务关闭。
  3. 主机B的socket服务关闭后,向主机A发送fin=1,ack=1,ack number=(主机A的seq=1),seq number=(前面已经传送过来的数据的最后一个字节的序号加1)并发送。
  4. 主机A收到主机B的fin后,返回ACK=1,ack number=(最后一次发送过来的seq number加1)

TCP和UDP的区别

UDP TCP
是否连接 无连接 面向连接
是否可靠 不可靠传输,不使用流量控制和拥塞控制 可靠传输,使用流量控制和拥塞控制
连接对象个数 支持一对一,一对多,多对一和多对多交互通信 只能是一对一通信
传输方式 面向报文 面向字节流
首部开销 首部开销小,仅8字节 首部最小20字节,最大60字节
适用场景 适用于实时应用(IP电话、视频会议、直播等) 适用于要求可靠传输的应用,例如问卷传输
  • TCP向上层提供面向连接的可靠服务,UDP向上层提供无连接不可靠服务
  • 虽然UDP并没有TCP传输来的准确,但是也能在很多实用性要求高的地方有所作为
  • 对数据准确性要求高,速度可以相对较慢的,可以选用TCP

Socket

socket是一种应用程序接口,一般指的是网络中一个连接的两端,socket中通常封装了TCP和UDP的通信方式,直接使用socket就可以进行TCP或UDP的对话。

  • SOCK_STREAM - 可靠数据传输,基于TCP
  • SOCK_DGRAM - 不可靠数据传输,基于UDP

HTTP

HTTP是一个基于TCP协议的超文本传输协议。

请求体结构:

请求行 - 请求体 - 空行 - 消息体

1
2
3
4
5
GET / HTTP/1.1
Host: www.baidu.com
Connection: keep-alive
Cache-Control: max-age=0
......

响应体结构:

响应头 - 响应体 - 空行 - 消息体

1
2
3
4
5
HTTP/1.1 200 OK
Bdpagetype: 2
Bdqid: 0xb6dda1710004f934
Cache-Control: private
......

HTTP 0.9

  • 只有GET请求
  • 服务器只能回应HTML格式的字符串

HTTP 1.0

  • 增加了POST和HEAD请求
  • 可以发送任何格式的内容
  • 每次通信都必须包括头信息
  • 状态码(status code)、多字符集支持、多部分发送(multi-part type)、权限(authorization)、缓存(cache)、内容编码(content encoding)等。

HTTP 1.1

  • 持久连接:Connection: keep-alive
  • 管道机制:同一个TCP连接里面,客户端可以同时发送多个请求。
  • Content-Length 字段:声明本次回应的数据长度。
  • 分块传输编码:Transfer-Encoding: chunked,对不定长度的内容使用分块传输
  • 新增了许多动词方法:PUTPATCHHEADOPTIONSDELETE
  • 新增了Host字段,用来指定服务器的域名

HTTP 2

  • 二进制协议:将HTTP 1.1中数据头为文本,数据体为文本或二进制,改为全为二进制,统称为帧(frame):头信息帧和数据帧。
  • 多功:在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应,这样就避免了”队头堵塞”。
  • 数据流:将每个请求或回应的所有数据包,称为一个数据流(stream)。每个数据流都有一个独一无二的编号。数据包发送的时候,都必须标记数据流ID,用来区分它属于哪个数据流。另外还规定,客户端发出的数据流,ID一律为奇数,服务器发出的,ID为偶数。
  • 头信息压缩:头信息使用gzipcompress压缩后再发送;另一方面,客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,以后就不发送同样字段了,只发送索引号,这样就提高速度了。
  • 服务器推送:允许服务器未经请求,主动向客户端发送资源,这叫做服务器推送(server push)。

参考链接:互联网协议入门(一)互联网协议入门(二)HTTP 协议入门

HTTP和HTTPS

HTTPS是在HTTP的基础上对传输的内容进行了加密。

HTTPS传输就是在HTTP的传输过程上添加了ssl校验

  1. 客户端发出请求:支持的协议版本,比如TLS 1.0版;一个客户端生成的随机数,稍后用于生成”对话密钥”;支持的加密方法,比如RSA公钥加密; 支持的压缩方法。

  2. 服务器回应:确认使用的加密通信协议版本,比如TLS 1.0版本;一个服务器生成的随机数,稍后用于生成”对话密钥”;确认使用的加密方法,比如RSA公钥加密;服务器证书。

  3. 客户端回应:客户端验证服务器证书有效后,向服务器发送三个信息:一个随机数。该随机数用服务器公钥加密,防止被窃听;编码改变通知,表示随后的信息都将用双方商定的加密方法和密钥发送;客户端握手结束通知,表示客户端的握手阶段已经结束。

  4. 服务器的最后回应:将客户机发送的随机数解密后,向客户机发送两个信息:编码改变通知,表示随后的信息都将用双方商定的加密方法和密钥发送;服务器握手结束通知,表示服务器的握手阶段已经结束。

  5. 至此,整个握手阶段全部结束。接下来,客户端与服务器进入加密通信,就完全是使用普通的HTTP协议,只不过用”会话密钥”加密内容。

参考内容:SSL/TLS协议运行机制的概述

HTTP状态码

状态码 状态码英文名称 中文描述
100 Continue 继续。客户端应继续其请求
101 Switching Protocols 切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议
状态码 状态码英文名称 中文描述
200 OK 请求成功,一般用于GET与POST请求
201 Created 已创建,成功请求并创建了新的资源
202 Accepted 已接受,已经接受请求,但未处理完成
203 Non-Authoritative Information 非授权信息。请求成功。服务器已成功处理了请求,但返回的信息可能来自另一来源。
204 No Content 无内容。服务器成功处理,但未返回内容。
205 Reset Content 重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。
206 Partial Content 部分内容,服务器成功处理了部分GET请求
状态码 状态码英文名称 中文描述
300 Multiple Choices 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端选择
301 Moved Permanently 永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI
302 Found 临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI
303 See Other 查看其它地址。与301类似。使用GET和POST请求查看
304 Not Modified 所请求的资源未修改,服务器不会返回任何资源。客户端通过一个头信息指定日期之后修改的资源
305 Use Proxy 使用代理。所请求的资源必须通过代理访问
306 Unused 已经被废弃的HTTP状态码
307 Temporary Redirect 临时重定向。与302类似。使用GET请求重定向
状态码 状态码英文名称 中文描述
400 Bad Request 客户端请求的语法错误,服务器无法理解
401 Unauthorized 请求要求用户的身份认证
402 Payment Required 保留,将来使用
403 Forbidden 服务器理解请求客户端的请求,但是拒绝执行此请求
404 Not Found 服务器无法根据客户端的请求找到资源(网页)
405 Method Not Allowed 客户端请求中的方法被禁止
406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求
407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权
408 Request Time-out 服务器等待客户端发送的请求时间过长,超时
409 Conflict 服务器完成客户端的 PUT 请求时可能返回此代码,服务器处理请求时发生了冲突
410 Gone 客户端请求的资源已经不存在。通常标识资源以前有现在被永久删除了
411 Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息
412 Precondition Failed 客户端请求信息的先决条件错误
413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求
414 Request-URI Too Large 请求的URI过长(URI通常为网址),服务器无法处理
415 Unsupported Media Type 服务器无法处理请求附带的媒体格式
416 Requested range not satisfiable 客户端请求的范围无效
417 Expectation Failed 服务器无法满足Expect的请求头信息
状态码 状态码英文名称 中文描述
500 Internal Server Error 服务器内部错误,无法完成请求
501 Not Implemented 服务器不支持请求的功能,无法完成请求
502 Bad Gateway 作为网关或者代理工作的服务器尝试执行请求时,从远程服务器接收到了一个无效的响应
503 Service Unavailable 由于超载或系统维护,服务器暂时的无法处理客户端的请求
504 Gateway Time-out 充当网关或代理的服务器,未及时从远端服务器获取请求
505 HTTP Version not supported 服务器不支持请求的HTTP协议的版本,无法完成处理

参考内容:HTTP状态码