go语言体系课视频配套文档

Chatok.cn go语言聊天
Chatok.cn go语言聊天
文章作者: 全栈编程@luboke.com
版权声明: 本文章为全栈编程go语言体系课视频教程配套电子书,版权归 全栈编程@luboke.com所有,欢迎免费学习,转载必须注明出处!但禁止任何商业用途,否则将受到法律制裁!

HTTP协议详解

HTTP 超文本传输协议 (HTTP-Hypertext transfer protocol),是一个属于应用层的 面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。它于 1990 年提出,经过几年的使用与发展,得到不断地完善和扩展。它是一种详细规定了浏览器万维网服务器之间互相通信的规则,通过因特网传送万维网文档的数据传送协议。 客户端与服务端通信时传输的内容我们称之为报文.

HTTP 就是一个通信规则,这个规则规定了客户端发送给服务器的报文格式,也规定了服务器响应给客户端的报文格式。实际我们要学习的就是这两种报文。客户端发送给服务器的称为”请求报文“,服务器发响应给客户端的称为”响应报文“。

HTTP协议是Web工作的核心,所以要了解清楚Web的工作方式就需要详细的了解清楚HTTP是怎么样工作的。

HTTP是一种让Web服务器浏览器(客户端)通过Internet发送接收数据的协议,它建立在TCP协议之上,一般采用TCP80端口。它是一个请求、响应协议--客户端发出一个请求,服务器响应这个请求。在HTTP中,客户端总是通过建立一个连接与发送一个HTTP请求来发起一个事务。服务器不能主动去与客户端联系,也不能给客户端发出一个回调连接。客户端与服务器端都可以提前中断一个连接。例如,当浏览器下载一个文件时,你可以通过点击“停止”键来中断文件的下载,关闭与服务器的HTTP连接。

HTTP协议是无状态的,同一个客户端的这次请求和上次请求是没有对应关系的,对HTTP服务器来说,它并不知道这两个请求是否来自同一个客户端。为了解决这个问题, Web程序引入了Cookie机制来维护连接的可持续状态。

HTTP协议是建立在TCP协议之上的,因此TCP攻击一样会影响HTTP的通讯,例如比较常见的一些攻击:SYN Flood是当前最流行的DoS(拒绝服务攻击)与DdoS(分布式拒绝服务攻击)的方式之一,这是一种利用TCP协议缺陷,发送大量伪造的TCP连接请求,从而使得被攻击方资源耗尽(CPU满负荷或内存不足)的攻击方式。

HTTP 协议的会话方式

浏览器与 WEB 服务器的连接过程是短暂的,每次连接只处理一个请求和响应。对每一 个页面的访问,浏览器与 WEB 服务器都要建立一次单独的连接。 

浏览器到 WEB 服务器之间的所有通讯都是完全独立分开的请求和响应对。

HTTP请求包(浏览器信息)

请求报文

 

我们先来看看Request包的结构

Request包分为3部分:

  1. 第一部分叫Request line(请求行)
  2. 第二部分叫Request header(请求头)
  3. 第三部分是body(主体)。

 header和body之间有个空行

请求包的例子所示:

GET /goserials/example/ HTTP/1.1                //请求行: 请求方法 请求URI HTTP协议/协议版本

Host:www.luboke.com                            //服务端的主机名

User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4                          //浏览器信息

Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8  //客户端能接收的MIME

Accept-Encoding:gzip,deflate,sdch            //是否支持流压缩

Accept-Charset:UTF-8,*;q=0.5                 //客户端字符编码集

Connection: keep-alive                  //客户端支持的链接方式,保持一段时间链接,默认为 3000ms;

Cookie: LUBOKESESSIONID=396ERT66UIUY                 //非首次访问时,请求会携带上一次服务器响应给客户端的 Cookie信息

Referer: http://luboke.com/go1.html                //请求来自哪个页面,比如通过百度搜索到了上面的链接,那么Referer:http://www.baidu.com;如果在浏览器的地址栏中直接输入该链接地址,则Refer为空 

Content-Type: application/x-www-form-urlencoded:表单的数据类型,说明会使用 url 格式编码数据;url 编码的数据都是以“%”为前缀,后面跟随两位的 16 进制,比如“全栈编程”这两个字使用 UTF-8 的 url 编码为 "%E5%85%A8%E6%A0%88%E7%BC%96%E7%A8%8B”;

Content-Length:100:请求体的长度,这里表示 100个字节。

keyword=全栈编程:请求体内容!全栈编程 是在表单中输入的数据,keyword 是表单字段的名字。

//空行,用于分割请求头和消息体

//消息体,请求资源参数,例如POST传递的参数

HTTP协议定义了很多与服务器交互的请求方法,最基本的有4种,分别是GET,POST,PUT,DELETE。一个URL地址用于描述一个网络上的资源,而HTTP中的GET, POST, PUT, DELETE就对应着对这个资源的查,增,改,删4个操作。我们最常见的就是GET和POST了。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息。

 我们看看GET和POST的区别:

  1. 我们可以看到GET请求消息体为空,POST请求带有消息体。
  2. GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如EditPosts.aspx?name=test1&id=123456。POST方法是把提交的数据放在HTTP包的body中。
  3. GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制。
  4. GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。

HTTP响应包(服务器信息)

响应报文

我们再来看看HTTP的response包,他的结构如下:

HTTP/1.1 200 OK                                                 //状态行

Server: nginx/1.0.8                                             //服务器使用的WEB软件名及版本

Date:Date: Tue, 30 Oct 2012 04:14:25 GMT               //发送时间

Content-Type: text/html                                //服务器发送信息的类型

Transfer-Encoding: chunked                        //表示发送HTTP包是分段发的

Connection: keep-alive                                 //保持连接状态

Content-Length: 903                                     //主体内容长度

//空行 用来分割消息头和主体

<!DOCTYPE html> <html lang="en"> <head> <meta charset="utf-8" /> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0, user-scalable=0, minimal-ui"><title>PHP 教程 | php教程 | 全栈编程 | luboke.com</title><meta name="keywords" content="php 教程,php"><meta name="description" content="php 教程 php 是一种创建动态交互性站点的强有力的服务器端脚 ."><meta content="php教程" name="description" /> .....    //消息体

Response包中的第一行叫做状态行,由HTTP协议版本号状态码状态消息 三部分组成。 

响应状态码

状态码用来告诉 HTTP 客户端,HTTP 服务器是否产生了预期的 Response。HTTP/1.1 协议中定义了 5 类状态码状态码由三位数字组成,第一个数字定义了响应的类别。

1XX 提示信息 - 表示请求已被成功接收,继续处理
2XX 成功 - 表示请求已被成功接收,理解,接受
3XX 重定向 - 要完成请求必须进行更进一步的处理
4XX 客户端错误 - 请求有语法错误或请求无法实现
5XX 服务器端错误 - 服务器未能实现合法的请求

响应码对浏览器来说很重要,它告诉浏览器响应的结果.

常见的状态码

200:请求成功,浏览器会把响应体内容(通常是 html)显示在浏览器中;
404:请求的资源没有找到,说明客户端错误的请求了不存在的资源;
500:请求资源找到了,但服务器内部出现了错误;
302:重定向,当响应码为 302 时,表示服务器要求浏览器重新再发一个请求,服务器会发送一个响应头 Location,它指定了新请求的 URL 地址;

 

HTTP协议是无状态的和Connection: keep-alive的区别

无状态是指协议对于事务处理没有记忆能力,服务器不知道客户端是什么状态。从另一方面讲,打开一个服务器上的网页和你之前打开这个服务器上的网页之间没有任何联系。

HTTP是一个无状态的面向连接的协议,无状态不代表HTTP不能保持TCP连接,更不能代表HTTP使用的是UDP协议(面对无连接)。

从HTTP/1.1起,默认都开启了Keep-Alive保持连接特性,简单地说,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的TCP连接。

Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同服务器软件(如Apache)中设置这个时间。

请求实例

一次请求的request和response

上面这张图我们可以了解到整个的通讯过程,同时一个URL请求但是左边栏里面为什么会有那么多的资源请求(这些都是静态文件,go对于静态文件有专门的处理方式)。

这个就是浏览器的一个功能,第一次请求url,服务器端返回的是html页面,然后浏览器开始渲染HTML:当解析到HTML DOM里面的图片连接,css脚本和js脚本的链接,浏览器就会自动发起一个请求静态资源的HTTP请求,获取相对应的静态资源,然后浏览器就会渲染出来,最终将所有资源整合、渲染,完整展现在我们面前的屏幕上。

网页优化方面有一项措施是减少HTTP请求次数,就是把尽量多的css和js资源合并在一起,目的是尽量减少网页请求静态资源的次数提高网页加载速度,同时减缓服务器的压力。 

文章作者: 全栈编程@luboke.com
版权声明: 本文章为全栈编程go语言体系课视频教程配套电子书,版权归 全栈编程@luboke.com所有,欢迎免费学习,转载必须注明出处!但禁止任何商业用途,否则将受到法律制裁!
copyright © 2020 全栈编程@luboke.com