python学习第十四章——网络编程
1.套接字:一个套接字就是一个socket模块中的socket类的实例,它的实例化需要3个参数:第一个参数是地址族(默认是socket.AF_INET);第二个参数是流(socket.SOCK_STREAM,默认值)或数据报(socket.SOCK_DGRAM)套接字;第三个参数是使用的协议(默认是0,使用默认值即可)。对于一个普通的套接字,不需要提供任何参数。服务器端套接字使用bind方法后,再调用listen方法去监听这个给定的地址。客户端套接字使用connect方法连接到服务器在connect方法中使用的地址与bind方法中的地址相同(在服务器端,能实现很多功能,比如使用函数socket.gethostname得到当前的主机名)。listen方法只有一个参数,即服务器未处理的连接的长度(即允许排队等待的连接数目,这些连接在停止接收之前等待接收)。服务器端套接字开始监听后,它就可以接受客户端的连接。这个步骤使用accept方法来完成。这个方法会阻塞直到客户端连接,然后改方法就返回一个格式为(client,address)的元组,client是一个客户端套接字,address是监听的地址。套接字有两个方法:send和recv(用于接收),用于传输数据。可以使用字符串参数调用send以发送数据,用一个所需的最大字节数做参数调用recv来接收数据。如果不能确定使用哪个数字比较好,1024是个很好的选择。下面是一个简单的服务器/客户机例子,例子很简单,和java中的网络编程很相似:
2.urllib和urllib2模块:这两个模块能通过网络访问文件,就像那些文件存在于你的电脑上一样。如果使用简单的下载功能,urllib就足够了,如果需要使用HTTP验证或cookie或者要为自己的协议写扩展程序的话,那么urllib2是个好的选择。
打开远程文件:
from urllib import urlopen
webpage=urlopen('http://www.python.org')
如果在线,变量webpage现在应该包含一个链接到http://www.python.org网页的类文件对象。urlopen返回的类文件对象支持close,read,readline和readlines方法,当然也支持迭代。
获取远程文件:函数urlopen提供一个能从中读取数据的类文件对象。如果希望urllib为你下载文件并在本地文件中存储一个文件的副本,那么可以使用urlretrieve。urlretrieve返回一个元组(filename,headers)而不是类文件对象,filename是本地文件的名字(由urllib自动创建),headers包含一些远程文件的信息。如果想为下载的副本指定文件名,可以在urlretrieve函数的第二个参数给出。urlretrieve('http://www.python.org','c://python_webpage.html')这个语句获取python的主页并把它存储在文件c://python_webpage.html中。可以使用urlcleanup函数清理临时文件,它不需要提供参数。
上面讲了两个常用的模块,其他的一些网络相关的模块如下图:
3.SocketServer:为了写一个使用socketserver框架的服务器,大部分代码会在一个请求处理程序中,每当服务器收到一个请求时,就会实例化一个请求处理程序,并且它的各种处理方法会在处理请求时被调用。具体调用哪个方法取决于特定的服务器和使用的处理程序类,这样可以把它们子类化,使得服务器调用自定义的处理程序集。基本的BaseRequestHandler类把所有的操作都放到了处理器的一个叫做handle的方法中,这个方法会被服务器调用。然后这个方法就会访问属性self.request中的客户端套接字。如果是用的是流,那么可以使用StreamRequestHandler类,创建了其他两个新属性,self.rfile(用于读取)和self.wfile(用于写入)。然后就能使用这些类文件对象和客户机进行通信。下面的例子是一个基于SocketServer的小型服务器:
4.使用SocketServer进行分叉和线程处理(windows不支持分叉):
使用分叉技术的服务器:
使用线程处理的服务器:
作者:uohzoaix