HTTP协议、web静态服务器-并发服务器

本是古典 何须时尚 2022-03-10 08:12 404阅读 0赞

HTTP协议简介

在web应用中,服务器把网页传给浏览器,实际上就是把网页的HTML代码发送给浏览器,让浏览器显示出来,而浏览器和服务器之间的传输协议是HTTP(超文本传输协议)

测试:

  • 安装好Chrome浏览器后,打开Chrome,在菜单中找到开发者工具,然后就可以显示开发者工具

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70

Element显示网页的结构,Network显示浏览器和服务器的通信

  • 点Network,确保第一个小红灯亮着,Chrome就会记录所有浏览器和服务器之间的通信:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 1

HTTP协议的分析

浏览器请求

当我们在地址栏输入www.sina.com时,浏览器将显示新浪的首页。在这个过程中,浏览器都干了哪些事情呢?通过Network的记录,我们就可以知道。在Network中,找到www.sina.com那条记录,点击,右侧将显示Request Headers,点击右侧的view source,我们就可以看到浏览器发给新浪服务器的请求:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 2

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 3

说明:

最主要的是前两行的分析,第一行:

GET表示一个读取请求,将从服务器获得网页数据,/表示URL的路径,/就表示首页,最后的HTTP/1.1表示HTTP协议的版本是1.1,目前HTTP协议的版本是1.1,

第二行表示请求的域名是www.sina.com。如果一台服务器有多个网站,服务器就需要通过Host来区分浏览器请求的是哪个网站

User-Agent表示的是服务器允许传输所对应的浏览器及条件

Acccept表示接受的网页的格式

服务器响应

继续往下找到Response Headers,点击view source,显示服务器返回的原始响应数据:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 4

HTTP响应分为Header和Body两部分(Body是可选项),我们在Network中看到的Header最重要的几行如下:

  1. HTTP/1.1 200 OK

200表示一个成功的响应,后面的OK是说明。

如果返回的不是200,那么往往有其他的功能,例如

  • 失败的响应有404 Not Found:网页不存在
  • 500 Internal Server Error:服务器内部出错
  • …等等…

    Content-Type: text/html

Content-Type指示响应的内容,这里是text/html表示HTML网页。

请注意,浏览器就是依靠Content-Type来判断响应的内容是网页还是图片,是视频还是音乐。浏览器并不靠URL来判断响应的内容,所以,即使URL是http://www.baidu.com/meimei.jpg,它也不一定就是图片。

HTTP响应的Body就是HTML源码,我们在菜单栏选择“视图”,“开发者”,“查看网页源码”就可以在浏览器中直接查看HTML源码:

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 5

浏览器解析过程

当浏览器读取到新浪首页的HTML源码之后,它会解析HTML,显示页面,然后根据HTML里面的各种链接,再发送HTTP请求给新浪服务器,拿到相应的图片、视频、Flash、Javascript脚本、CSS等各种资源,最终显示的是一个完整的界面;所以我们能在Network下面看到很多额外的HTTP请求

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 6

Web静态服务器-1-显示固定的界面

  1. #coding=utf-8
  2. import socket
  3. def handle_client(client_socket):
  4. "为一个客户端进行服务"
  5. recv_data = client_socket.recv(1024).decode("utf-8")
  6. request_header_lines = recv_data.splitlines()
  7. for line in request_header_lines:
  8. print(line)
  9. # 组织相应 头信息(header)
  10. response_headers = "HTTP/1.1 200 OK\r\n" # 200表示找到这个资源
  11. response_headers += "\r\n" # 用一个空的行与body进行隔开
  12. # 组织 内容(body)
  13. response_body = "hello world"
  14. response = response_headers + response_body
  15. client_socket.send(response.encode("utf-8"))
  16. client_socket.close()
  17. def main():
  18. "作为程序的主控制入口"
  19. server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  20. # 设置当服务器先close 即服务器端4次挥手之后资源能够立即释放,这样就保证了,下次运行程序时 可以立即绑定7788端口
  21. server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  22. server_socket.bind(("", 7788))
  23. server_socket.listen(128)
  24. while True:
  25. client_socket, client_addr = server_socket.accept()
  26. handle_client(client_socket)
  27. tcp_server_socket.close()
  28. if __name__ == "__main__":
  29. main()

打开浏览器,输入‘127.0.0.1:7788’,然后在浏览器就会出现一个设定好的固定网页

TCP的三次握手和四次挥手

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 7

要进行三次握手的目的是在建立连接的时候确定收发双方都已经准备好资源进行收发数据了;首先客户端向服务器发送一个数据J(SYN表示请求,ACK表示应答),如果服务器也准备好了那么就将收到的数据进行加一操作,并且同时也传输一个数字K,客户端收到消息确定服务端已经准备好了,将K加一并传给服务器告诉服务器我也已经准备好了;然后connect解堵塞,客户端和服务器连接之后进行数据传输

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MTkzMTU0MA_size_16_color_FFFFFF_t_70 8

如果客户端操作完成了,不会再需要与服务端进行通信;首先客户端主动关闭,向服务器发送FIN数据包,表示关闭发送,接着服务器端收到消息后将序号加一,表示关闭接收;当服务器向客端传输的数据的过程结束之后,服务器端会调用close,向客户端发送FIN,客户端收到消息后,将接收序号加一传回给服务器,至此服务器端和客户端都关闭了自己的收发功能

web静态服务器-2-显示需要的概念

  1. #coding=utf-8
  2. import socket
  3. import re
  4. def handle_client(client_socket):
  5. "为一个客户端进行服务"
  6. recv_data = client_socket.recv(1024).decode('utf-8', errors="ignore")
  7. request_header_lines = recv_data.splitlines()
  8. for line in request_header_lines:
  9. print(line)
  10. http_request_line = request_header_lines[0]
  11. # 正则表达式中如果^是在整个正则表达式的开始,那么表示‘开始’的作用;如果这个是在句子中间,那么代表的是一个‘否定’的含义
  12. get_file_name = re.match("[^/]+(/[^ ]*)", http_request_line).group(1)
  13. print("file name is ===>%s" % get_file_name) # for test
  14. # 如果没有指定访问哪个页面。例如index.html
  15. # GET / HTTP/1.1
  16. if get_file_name == "/":
  17. get_file_name = DOCUMENTS_ROOT + "/index.html"
  18. else:
  19. get_file_name = DOCUMENTS_ROOT + get_file_name
  20. print("file name is ===2>%s" % get_file_name) #for test
  21. try:
  22. f = open(get_file_name, "rb")
  23. except IOError:
  24. # 404表示没有这个页面
  25. response_headers = "HTTP/1.1 404 not found\r\n"
  26. response_headers += "\r\n"
  27. response_body = "====sorry ,file not found===="
  28. else:
  29. response_headers = "HTTP/1.1 200 OK\r\n"
  30. response_headers += "\r\n"
  31. response_body = f.read()
  32. f.close()
  33. finally:
  34. # 因为头信息在组织的时候,是按照字符串组织的,不能与以二进制打开文件读取的数据合并,因此分开发送
  35. # 先发送response的头信息
  36. client_socket.send(response_headers.encode('utf-8'))
  37. # 再发送body
  38. client_socket.send(response_body)
  39. client_socket.close()
  40. def main():
  41. "作为程序的主控制入口"
  42. server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
  43. server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  44. server_socket.bind(("", 7788))
  45. server_socket.listen(128)
  46. while True:
  47. client_socket, clien_cAddr = server_socket.accept()
  48. handle_client(client_socket)
  49. #这里配置服务器
  50. DOCUMENTS_ROOT = "./html"
  51. if __name__ == "__main__":
  52. main()

发表评论

表情:
评论列表 (有 0 条评论,404人围观)

还没有评论,来说两句吧...

相关阅读