python-web静态服务器-1

醉酒当歌 提交于 2019-11-27 04:44:13

一、HTTP协议

1、HTTP协议简介

在Web应用中,服务器把网页传给浏览器,实际上就是把网页的HTML代码发送给浏览器,让浏览器显示出来。而浏览器和服务器之间的传输协议是HTTP,所以:

  • HTML是一种用来定义网页的文本,会HTML,就可以编写网页;

  • HTTP是在网络上传输HTML的协议,用于浏览器和服务器的通信。

Chrome浏览器提供了一套完整地调试工具,非常适合Web开发。

2. http协议的分析

当我们在地址栏输入www.baidu.com时,浏览器将显示新浪的首页。在这个过程中,浏览器都干了哪些事情呢?通过Network的记录,我们就可以知道。在Network中,找到www.baidu.com那条记录,点击,右侧将显示Request Headers,点击右侧的view source,我们就可以看到浏览器发给新浪服务器的请求:

2.1 浏览器请求

说明

最主要的头两行分析如下,第一行:

 GET / HTTP/1.1

GET表示一个读取请求,将从服务器获得网页数据,/表示URL的路径,URL总是以/开头,/就表示首页,最后的HTTP/1.1指示采用的HTTP协议版本是1.1。目前HTTP协议的版本就是1.1,但是大部分服务器也支持1.0版本,主要区别在于1.1版本允许多个HTTP请求复用一个TCP连接,以加快传输速度。

从第二行开始,每一行都类似于Xxx: abcdefg:

 Host: www.baidu.com

表示请求的域名是www.baidu.com。如果一台服务器有多个网站,服务器就需要通过Host来区分浏览器请求的是哪个网站。

2.2 服务器响应

HTTP响应分为Header和Body两部分(Body是可选项),我们在Network中看到的Header最重要的几行如下:

HTTP/1.1 200 OK

200表示一个成功的响应,后面的OK是说明。

如果返回的不是200,那么往往有其他的功能,例如

  • 失败的响应有404 Not Found:网页不存在
  • 500 Internal Server Error:服务器内部出错
  • 302,重定向
    Content-Type: text/html

 

Content-Type指示响应的内容,这里是text/html表示HTML网页。

请注意,浏览器就是依靠Content-Type来判断响应的内容是网页还是图片,是视频还是音乐。浏览器并不靠URL来判断响应的内容,所以,即使URL是http://www.baidu.com/meitu.jpg,它也不一定就是图片。

HTTP响应的Body就是HTML源码,我们在菜单栏选择“视图”,“开发者”,“查看网页源码”就可以在浏览器中直接查看HTML源码:

浏览器解析过程

当浏览器读取到新浪首页的HTML源码后,它会解析HTML,显示页面,然后,根据HTML里面的各种链接,再发送HTTP请求给新浪服务器,拿到相应的图片、视频、Flash、JavaScript脚本、CSS等各种资源,最终显示出一个完整的页面。所以我们在Network下面能看到很多额外的HTTP请求

3. 总结

3.1 HTTP请求

跟踪了百度的首页,我们来总结一下HTTP请求的流程:

3.1.1 步骤1:浏览器首先向服务器发送HTTP请求,请求包括:

方法:GET还是POST,GET仅请求资源,POST会附带用户数据;

路径:/full/url/path;

域名:由Host头指定:Host: www.baidu.com

以及其他相关的Header;

如果是POST,那么请求还包括一个Body,包含用户数据

3.1.1 步骤2:服务器向浏览器返回HTTP响应,响应包括:

响应代码:200表示成功,3xx表示重定向,4xx表示客户端发送的请求有错误,5xx表示服务器端处理时发生了错误;

响应类型:由Content-Type指定;

以及其他相关的Header;

通常服务器的HTTP响应会携带内容,也就是有一个Body,包含响应的内容,网页的HTML源码就在Body中。

3.1.1 步骤3:如果浏览器还需要继续向服务器请求其他资源,比如图片,就再次发出HTTP请求,重复步骤1、2。

Web采用的HTTP协议采用了非常简单的请求-响应模式,从而大大简化了开发。当我们编写一个页面时,我们只需要在HTTP请求中把HTML发送出去,不需要考虑如何附带图片、视频等,浏览器如果需要请求图片和视频,它会发送另一个HTTP请求,因此,一个HTTP请求只处理一个资源(此时就可以理解为TCP协议中的短连接,每个链接只获取一个资源,如需要多个就需要建立多个链接)

HTTP协议同时具备极强的扩展性,虽然浏览器请求的是http://www.baidu.com的首页,但是新浪在HTML中可以链入其他服务器的资源,比如<img src="http://i1.baiduimg.cn/home/2013/1008/U84123.png">,从而将请求压力分散到各个服务器上,并且,一个站点可以链接到其他站点,无数个站点互相链接起来,就形成了World Wide Web,简称WWW。

3.2 HTTP格式

每个HTTP请求和响应都遵循相同的格式,一个HTTP包含Header和Body两部分,其中Body是可选的。

HTTP协议是一种文本协议,所以,它的格式也非常简单。

3.2.1 HTTP GET请求的格式:

    GET /path HTTP/1.1      Header1: Value1      Header2: Value2      Header3: Value3......

每个Header一行一个,换行符是\r\n。

3.2.2 HTTP POST请求的格式:

    POST /path HTTP/1.1      Header1: Value1      Header2: Value2      Header3: Value3        body data goes here...

当遇到连续两个\r\n时,Header部分结束,后面的数据全部是Body。

3.2.3 HTTP响应的格式:

    200 OK      Header1: Value1      Header2: Value2      Header3: Value3        body data goes here...

HTTP响应如果包含body,也是通过\r\n\r\n来分隔的。

请再次注意,Body的数据类型由Content-Type头来确定,如果是网页,Body就是文本,如果是图片,Body就是图片的二进制数据。

当存在Content-Encoding时,Body数据是被压缩的,最常见的压缩方式是gzip,所以,看到Content-Encoding: gzip时,需要将Body数据先解压缩,才能得到真正的数据。压缩的目的在于减少Body的大小,加快网络传输。

二 、案列

Web静态服务器-1

 1 #coding-=utf-8   2 '''   3 Created on 2019年8月9日   4    5 @author: Administrator   6    7 #Web静态服务器-1-显示固定的页面   8 '''   9 import socket  10 from multiprocessing import Process  11   12 def handleClient(clientSocket):  13     '用一个新进程为一个客户端进行服务'  14     recvData = clientSocket.recv(2014)  15     requestHeaderLines = recvData.splitlines()  16     for line in requestHeaderLines:  17         print(line)  18           19     'response header '  20     responseHeaderLines = 'HTTP/1.1 200 OK\r\n'  21     responseHeaderLines += '\r\n'  22       23     responseBody = 'hello world'  24       25     response = responseHeaderLines + responseBody  26     clientSocket.send(response.encode())  27     clientSocket.close()  28       29       30 def main():  31     '作为程序入口'    32     serverSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  33     #serverSocket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)  34     serverSocket.bind(('',9999))  35     serverSocket.listen()  36       37     while True:  38         clientSocket,clientAddr = serverSocket.accept()  39         p = Process(target=handleClient, args=(clientSocket,))  40         p.start()  41   42 if __name__ == '__main__':  43     main()        
webStaticServer01

 

Web静态服务器-2

 1 #coding-=utf-8   2 '''   3 Created on 2019年8月9日   4    5 @author: Administrator   6    7 #Web静态服务器-2-显示需要的页面   8 '''   9 import socket  10 from multiprocessing import Process  11 import re  12   13   14 def handleClient(clientSocket):  15     '用一个新进程为一个客户端进行服务'  16     recvData = clientSocket.recv(2014)  17     requestHeaderLines = recvData.splitlines()  18     for line in requestHeaderLines:  19         print(line)  20           21     #httpRequestMethodLine = requestHeaderLines[0].decode('utf-8')  22     #getFileName = re.match("[^/]+(/[^ ]*)", httpRequestMethodLine).group(1)  23     #print('getFileName:%s'%getFileName)  24     filename = requestHeaderLines[0].decode('utf-8').split(' ')[1]  25     print('filename:%s'%filename)  26           27     if filename == '/':  28         filename = documentRoot + "/index.html"#默认返回的页面  29     else:  30         filename = documentRoot + filename#请求的页面  31           32     print('request-filename:%s'%filename)  33       34     try:  35         f = open(filename,'r',encoding='UTF-8')  36         responseHeaderLines = 'HTTP/1.1 200 OK\r\n'  37         responseHeaderLines += '\r\n'  38         responseBody = f.read()  39         f.close()#close file  40     except Exception as e:  41         print('[error]Exception:%s'%e)  42         responseHeaderLines = 'HTTP/1.1 404 NOT FOUND\r\n'  43         responseHeaderLines += '\r\n'  44         responseBody = '=====sorry, page not found====='  45     finally:  46         response = responseHeaderLines + responseBody  47         clientSocket.send(response.encode())  48         clientSocket.close()  49           50 def main():  51     '作为程序入口'    52     serverSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)  53     #serverSocket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)  54     serverSocket.bind(('',9999))  55     serverSocket.listen()  56       57     while True:  58         clientSocket,clientAddr = serverSocket.accept()  59         p = Process(target=handleClient, args=(clientSocket,))  60         p.start()  61   62 #配置  63 documentRoot = './html'  64   65 if __name__ == '__main__':  66     main()        
webStaticServer02

 

三、服务器动态资源请求

1. 浏览器请求动态页面过程

1.1 WSGI介绍

PythonWeb服务器网关接口(Python Web Server Gateway Interface,缩写为WSGI)是Python应用程序或框架和Web服务器之间的一种接口,

WSGI接口定义非常简单,它只要求Web开发者实现一个函数,就可以响应HTTP请求。

# WSGI 规范的函数  def application(environ, start_response):      start_response('200 OK', [('Content-Type', 'text/html')])      return '<h1>Hello, Se7eN_HOU!</h1>'

上面的application()函数就是符合WSGI标准的一个HTTP处理函数,它接收两个参数:

    • environ:一个包含所有HTTP请求信息的dict对象;
    • start_response:一个发送HTTP响应的函数。

application()函数中,调用:

start_response('200 OK', [('Content-Type', 'text/html')])

1.2  运行WSGI服务

1、 Python内置了一个WSGI服务器,这个模块叫wsgiref,首先我们先实现一个hello.py文件,实现Web应用程序的WSGI处理函数

def application(environ, start_response):      start_response("200 OK",[("Content-Type","text/html")])      return "<h1>Hello,Se7eN_HOU!</h1>"

2、然后,再编写一个server.py,负责启动WSGI服务器,加载application()函数:

#coding:utf-8    # 导入wsgiref模块  from wsgiref.simple_server import make_server  from hello import application      # 创建一个服务器,IP地址为空,端口号为7788,处理的函数是application  httpServer = make_server("", 7788, application)  # 开始监听HTTP请求  httpServer.serve_forever()

3、  确保以上两个文件在同一个目录下,然后使用命令行输入python server.py来启动WSGI服务器:

houleideMacPro:WSGI Se7eN_HOU$ python server.py  127.0.0.1 - - [19/Jun/2019 15:52:37] "GET / HTTP/1.1" 200 24  127.0.0.1 - - [19/Jun/2019 15:52:37] "GET /favicon.ico HTTP/1.1" 200 244、 按Ctrl+C终止服务器。如果你觉得这个Web应用太简单了,可以稍微改造一下,从environ里读取PATH_INFO,这样可以显示更加动态的内容:
def application(environ, start_response):      start_response("200 OK",[("Content-Type","text/html")])      return "<h1>Hello,%s</h1>"%(environ["PATH_INFO"][1:] or "Se7eN_HOU")

 5、 你可以在地址栏输入用户名作为URL的一部分,

 四、案列

1、web动态服务器-1

 

  1 #coding=utf-8    2 '''    3 Created on 2019年8月9日    4     5 @author: Administrator    6 '''    7 import socket    8 from multiprocessing import Process    9 import re   10 import sys   11    12 class WSGIServer(object):   13        14     addressFamily = socket.AF_INET   15     socketType = socket.SOCK_STREAM   16     requestQueuesize = 5   17        18     def __init__(self, serverAddress):   19         #创建tcp套接字   20         #self.listenSocket = socket(self.addressFamily, self.socketType)   21         self.listenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)   22         #允许重复使用上次的套接字绑定的port   23         self.listenSocket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)   24         #绑定   25         self.listenSocket.bind(serverAddress)   26         #被动监听,并制定队列长度   27         self.listenSocket.listen(self.requestQueuesize)   28            29         #self.serverName = 'localhost'   30         #self.serverPort = serverAddress[1]   31        32     def serverForever(self):   33         #'循环运行web服务器,等待客户端的连接并为客户端服务'   34         while True:   35             #等待新客户端   36             self.clientSocket, client_address = self.listenSocket.accept()   37                38             #为每一个客户端创建新进程,   39             newClientProcess = Process(target=self.handleClient)   40             newClientProcess.start()   41             #处理完之后,关闭   42             self.clientSocket.close()   43                44     def setApp(self, application):   45         '设置此WSGI服务器调用的应用程序入口函数'   46         self.application = application          47                48     def handleClient(self):          49         self.recvData = self.clientSocket.recv(2048)   50         print('self.recvData:%s'%self.recvData)   51         if self.recvData:#过滤空   52             requestHeaderLines = self.recvData.splitlines()   53                54             for line in requestHeaderLines:   55                 print(line)   56                57             print('requestHeaderLines[0]:%s'%requestHeaderLines[0])   58             filename = requestHeaderLines[0].decode('utf-8').split(' ')[1]   59             print('filename:%s'%filename)   60                61             if filename[-3:] != '.py':   62                 if filename == '/':   63                     filename = documentRoot + "/index.html"#默认返回的页面   64                 else:   65                     filename = documentRoot + filename#请求的页面   66                        67                 print('request-filename:%s'%filename)   68                    69                 try:   70                     f = open(filename,'r',encoding='UTF-8')   71                     responseHeaderLines = 'HTTP/1.1 200 OK\r\n'   72                     responseHeaderLines += '\r\n'   73                     responseBody = f.read()   74                     f.close()#close file   75                 except Exception as e:   76                     print('[error]Exception:%s'%e)   77                     responseHeaderLines = 'HTTP/1.1 404 NOT FOUND\r\n'   78                     responseHeaderLines += '\r\n'   79                     responseBody = '=====sorry, page not found====='   80                 finally:   81                     response = responseHeaderLines + responseBody   82                     self.clientSocket.send(response.encode())   83                     self.clientSocket.close()   84             else:   85                 #处理接收到的请求头   86                 self.parseRequest()   87                 #根据接收到的请求头构造环境变量字典   88                 env = self.getEnviron()    89                 #调用应用的相应方法,完成动态数据的获取         90                 bodyContent = self.application(env, self.startResponse)   91                 #组织数据发送给客户端   92                 self.finishResponse(bodyContent)   93                94     def parseRequest(self):   95         '提取出客户端发送的request'   96         requestLine = self.recvData.splitlines()[0]   97         requestLine = requestLine.rstrip(b'\r\n')      98         print('requestLine:%s'%requestLine)   99         self.requestMethod, self.path, self.requestVersion = requestLine.split(b" ")  100         101     def getEnviron(self):   102         env = {}  103         env['wsgi.version']      = (1, 0)  104         env['wsgi.input']        = self.recvData  105         env['REQUEST_METHOD']    = self.requestMethod    # GET  106         env['PATH_INFO']         = self.path             # /index.html  107         return env  108            109     #def startResponse(self, status, response_headers, exc_info=None)       110     def startResponse(self, status, response_headers, exc_info=None):  111         serverHeaders = [  112             ('Date', 'Fri, 9 Augs 2019 14:00:00 GMT'),  113             ('Server', 'WSGIServer 0.2'),  114             ]  115         self.headers_set = [status, response_headers+serverHeaders]  116               117     def finishResponse(self,bodyContent):      118         try:  119             status, response_headers = self.headers_set  120             #response第一行  121             response = 'HTTP/1.1 {status}\r\n'.format(status=status)  122             #其他头信息  123             for header in response_headers:  124                 response += '{0}: {1}\r\n'.format(*header)  125             #添加一个换行,与body进行分开来  126             response += '\r\n'  127             #添加发送的数据  128             for data in bodyContent:  129                 response += data  130               131             self.clientSocket.send(response.encode())  132               133         finally:  134             self.clientSocket.close()     135                136                   137         138 #设定服务器的端口  139 serverAddr = (HOST, PORT) = '',9999   140 #设置服务器静态资源的路径  141 documentRoot = './html'  142 #设置服务器胴体资源路径        143 pythonRoot = './wsgiPy'          144   145 def makeServer(serverAddr, application):  146     server = WSGIServer(serverAddr)  147     server.setApp(application)  148     return server  149   150 def main():  151     if len(sys.argv) < 2:  152         sys.exit('请按照要求,制定模块名称:应用名称,例如:module:callable')  153     #获取module:callable  154     appPath = sys.argv[1]  155     print('appPath:%s'%appPath)  156     #根据冒号切割为module和callable  157     module,application = appPath.split(':')  158     #添加路径到 sys.path  159     sys.path.insert(0,pythonRoot)  160     #动态导入module变量中的指定模块  161     module = __import__(module)  162     #获取module变量中指定的模块,application变量指定的属性  163     application = getattr(module, application)  164     httpd = makeServer(serverAddr, application)  165     print('WSGIServer: Serving HTTP on port %d ...\n'%PORT)  166     httpd.serverForever()  167       168 if __name__ == '__main__':  169     main()  170       171     
webDynamicServer01

 

2、应用程序代码ctime.py

 

 1 #coding=utf-8   2 '''   3 Created on 2019年8月12日   4    5 @author: Administrator   6 '''   7 import time   8    9 def app(environ, start_response):  10     status = '200 OK'  11       12     response_headers = [  13         ("Content-Type", "text/plain")  14     ]  15       16     start_response(status, response_headers)  17       18     return [str(environ)+'--->%s\n'%time.ctime()]  19     
ctime

 

3、运行

3.1  在脚本所在的目录 按住shift +鼠标右键,右键菜单选择在此处打开命令窗口

3.2  在命令窗口运行脚本(python3 webDynamicServer01.py ctime:app)

看到如下页面即服务启动成功

3.3  在浏览器中输入http://127.0.0.1:9999/,可返回index.html

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!