爬虫下载文档的3种方法-创新互联

import urllib2,cookielib

成都创新互联公司2013年成立,先为芝罘等服务建站,芝罘等地企业,进行企业商务咨询服务。为芝罘企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

url = 'http://www.baidu.com'

print "1"
response = urllib2.urlopen(url)
print response.getcode()
print len(response.read())

print "2"
request = urllib2.Request(url)
request.add_header("user-Agent","Mozilla/5.0")
response2 = urllib2.urlopen(request)
print response2.getcode()
print len(response2.read())

print "3"
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
print response3.getcode()
print cj
print response3.read()

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


名称栏目:爬虫下载文档的3种方法-创新互联
转载来源:http://www.csruizhi.cn/article/cdgjgs.html

其他资讯

Copyright © 2007-2024 成都优众联杰科技有限公司 All Rights Reserved 蜀ICP备2024116266号
友情链接: 成都响应式网站建设 成都网站制作公司 成都网站设计 H5网站制作 网站建设推广 企业网站设计 成都营销网站制作 重庆手机网站建设 专业网站设计 达州网站设计 成都网站建设 四川成都网站制作 成都网站建设 成都网站建设 LED网站设计方案 专业网站建设 成都企业网站制作 网站建设方案 高端品牌网站建设 成都品牌网站设计 营销型网站建设 成都网站制作