python网络爬虫&&爬取图片

绝地灬酷狼 2021-12-13 01:01 595阅读 0赞
  1. 爬取学院官网数据
  2. from urllib.request import * #导入所有request urllib文件夹,request只是里面的一个模块
  3. from lxml import etree #导入lxml包
  4. import time
  5. url="http://www.llhc.edu.cn/" #爬取的地址
  6. # print(url)
  7. with urlopen(url) as html:
  8. text= html.read().decode('utf-8')# html读取、解码
  9. doc=etree.HTML(text) #解析html文档
  10. links=doc.xpath("//div[contains(@class,'pic')]/ul/li/div/img/@src")#获取数据
  11. # print(len(links))
  12. #下载资源 可以是视频音频
  13. for i in range(len(links)):
  14. # print(i)
  15. time.sleep(2)
  16. print('正在下载第%s个'%i)
  17. urlretrieve('http://www.llhc.edu.cn/'+links[i],'imgs/%s.jpg'%i) #将图片地址下载到指定目录

转载于:https://www.cnblogs.com/aloneindefeat/p/10654886.html

发表评论

表情:
评论列表 (有 0 条评论,595人围观)

还没有评论,来说两句吧...

相关阅读