这篇文章运用简单易懂的例子给大家介绍怎么使用Python中的urllib模块?Python中的urllib模块该如何使用?代码非常详细,内容简单易懂,感兴趣的小伙伴们可以用来参考借鉴,希望对大家能有所帮助。
urllib模块其实就是为上一层接口提供服务的,就像我们平时读取一个本地文件一样读取ftp上面的内容数据。
先给大家来看一个例子,这个例子就是把百度的首页的网页地址爬取下来并且显示在控制台上。整个程序其实就只用了两行代码:
代码如下:
import urllib#导入模块 print urllib.urlopen('http://www.baidu.com').read()
其实它的基本语法格式是这样的:
urllib.urlopen(url[, data[, proxies]])
参数url一般表示的是一个网址,是一个远程数据的路径,而上面的远程数据的路径就是一个百度官网首页的地址,另外一个data参数表示用什么方式提交数据到url中,我们知道的就两种提交方式,post和get,也是web中常见的两种数据提交方式。而参数proxies实现一个代理作用,代理就类似于生活中的代理:找房的中介啊、代购啊这种,需要通过第三方。不过在那之前的第一步是需要创建表示远程url的类文件对象(urlopen),然后在对这个本地文件进行获取远程数据。
文件对象(urlopen),它包含多种用法:
跟操作文件对象的时候用法是一样的,包括这些:read() , readline() , readlines() , fileno() , close()
info()指的是一个远程服务器的头部信息。
getcode():返回Http状态码。geturl():返回请求的url(上面请求的url就是百度官网地址)
urllib中还可以使用其他的一些方法,用于对url进行编码、解码。有时候在某些操作中不能出现特殊符号,就需要用到urlib模块,进行编码解码,下面看看都可以进行哪些辅助操作吧
urllib.quote(string[, safe]):
对字符串进行编码。参数safe表示的是你不需要的符号;
urllib.unquote(string) :
对字符串进行解码;
urllib.quote_plus(string [ , safe ] )
与urllib.quote类似,可以对字符串进行编码,但这个方法用'+'来替换' ‘,而quote用'%20′来代替' ‘。
urllib.unquote_plus(string )
也是对字符串进行解码操作。
以上就是有关“怎么使用Python中的urllib模块?Python中的urllib模块该如何使用?”的相关内容啦,希望对你们有所帮助哦!
更多python相关文章请访问分类:python
【版权声明】本文图文出自大盘站@dapan.cc,转载请注明出处!