首页 > 编程 > Python > 正文

Python的pycurl包用法简介

2020-01-04 17:57:47
字体:
来源:转载
供稿:网友

这篇文章主要介绍了Python的pycurl包用法简介,文中罗列了其下模块中的一些常用方法,需要的朋友可以参考下

pycurl是功能强大的python的url包,是用c语言写的,速度很快,比urllib和httplib都快

调用方法:

 

 
  1. import pycurl 
  2.  
  3. c = pycurl.Curl() 
  4. c.setopt(pycurl.URL, 'http://api.minicloud.com.cn/statuses/public_timeline.xml'
  5. import StringIO #这个用到里面的write函数 
  6. b = StringIO.StringIO() 
  7. c.setopt(pycurl.WRITEFUNCTION, b.write) #把StringIO的写函数注册到pycurl的WRITEFUNCTION中,即pycurl所有获取的内容都写入到StringIO中,如果没有这一句,pycurl就会把所有的内容在默认的输出器中输出 
  8. c.perform() 
  9. print b.getvalue() 

这里有一个小例子,用来获取微博上流行的短地址对应的真实地址的

 

 
  1. import StringIO 
  2. import pycurl 
  3.  
  4. c = pycurl.Curl() 
  5. str = StringIO.StringIO() 
  6. c.setopt(pycurl.URL, "http://t.cn/aKln8T"
  7. c.setopt(pycurl.WRITEFUNCTION, str.write) 
  8. c.setopt(pycurl.FOLLOWLOCATION, 1) 
  9.  
  10. c.perform() 
  11. print c.getinfo(pycurl.EFFECTIVE_URL) 

可见pycurl是十分强大和简洁的,只是要熟悉它的很多属性,下面来看一些常用的:

pycurl.Curl() #创建一个pycurl对象的方法

pycurl.Curl(pycurl.URL, http://www.google.com.hk) #设置要访问的URL

pycurl.Curl().setopt(pycurl.MAXREDIRS, 5) #设置最大重定向次数

pycurl.Curl().setopt(pycurl.CONNECTTIMEOUT, 60)

pycurl.Curl().setopt(pycurl.TIMEOUT, 300) #连接超时设置

pycurl.Curl().setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)") #模拟浏览器

pycurl.Curl().perform() #服务器端返回的信息

pycurl.Curl().getinfo(pycurl.HTTP_CODE) #查看HTTP的状态 类似urllib中status属性

pycurl.NAMELOOKUP_TIME 域名解析时间

pycurl.CONNECT_TIME 远程服务器连接时间

pycurl.PRETRANSFER_TIME 连接上后到开始传输时的时间

pycurl.STARTTRANSFER_TIME 接收到第一个字节的时间

pycurl.TOTAL_TIME 上一请求总的时间

pycurl.REDIRECT_TIME 如果存在转向的话,花费的时间

pycurl.EFFECTIVE_URL

pycurl.HTTP_CODE HTTP 响应代码

pycurl.REDIRECT_COUNT 重定向的次数

pycurl.SIZE_UPLOAD 上传的数据大小

pycurl.SIZE_DOWNLOAD 下载的数据大小

pycurl.SPEED_UPLOAD 上传速度

pycurl.HEADER_SIZE 头部大小

pycurl.REQUEST_SIZE 请求大小

pycurl.CONTENT_LENGTH_DOWNLOAD 下载内容长度

pycurl.CONTENT_LENGTH_UPLOAD 上传内容长度

pycurl.CONTENT_TYPE 内容的类型

pycurl.RESPONSE_CODE 响应代码

pycurl.SPEED_DOWNLOAD 下载速度

pycurl.SSL_VERIFYRESULT

pycurl.INFO_FILETIME 文件的时间信息

pycurl.HTTP_CONNECTCODE HTTP 连接代码

pycurl.HTTPAUTH_AVAIL

pycurl.PROXYAUTH_AVAIL

pycurl.OS_ERRNO

pycurl.NUM_CONNECTS

pycurl.SSL_ENGINES

pycurl.INFO_COOKIELIST

pycurl.LASTSOCKET

pycurl.FTP_ENTRY_PATH

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表