爬取网页图片

系统管理员 2021-05-03 05:44 748阅读 0赞

下载表情包吧指定网页的所有图片

  1. #coding:utf-8
  2. import urllib.request
  3. import urllib.parse
  4. import urllib
  5. from bs4 import BeautifulSoup
  6. def gethtml(url): #下载网页源码
  7. request=urllib.request.Request(url,headers={
  8. "User-Agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko)Chrome/43.0.2357.130 Safari/537.36"})
  9. html=urllib.request.urlopen(request).read().decode('utf-8')
  10. return html
  11. def getjpg(html_doc): #下载图片
  12. bs=BeautifulSoup(html_doc,"html.parser")
  13. jpglist=bs.find_all('img',class_="BDE_Image") #不同网页图片标签不同,要做出改动
  14. x=1
  15. for jpgurl in jpglist:
  16. urllib.request.urlretrieve(jpgurl.get('src'),'%s.jpg' % x)
  17. x=x+1
  18. print('finished')
  19. url="https://tieba.baidu.com/p/4962109239"
  20. html_doc=gethtml(url)
  21. print('downloading.......')
  22. getjpg(html_doc)

发表评论

表情:
评论列表 (有 0 条评论,748人围观)

还没有评论,来说两句吧...

相关阅读