Python爬虫网站图片并下载到本地

逃离我推掉我的手 2022-12-30 03:40 332阅读 0赞

文章目录

    • 先看效果
    • 1、环境准备
    • 2、要爬取的网站
    • 3、程序源代码(可直接运行)

先看效果

在这里插入图片描述
在这里插入图片描述

1、环境准备

  1. import requests
  2. import re

下载requests库:

  1. pip install requests

2、要爬取的网站

  1. https://www.hippopx.com

3、程序源代码(可直接运行)

E:\test 需要在E盘下准备一个test 文件夹,当然,也可以自己更改存储路径

  1. import requests
  2. import re
  3. keyword = input("请输入中文关键字:")
  4. baseurl = 'https://www.hippopx.com/zh/search?q='+ str(keyword) +'&page='
  5. downpage = input("请输入页数:")
  6. downpage = int(downpage) + 2
  7. picList = [] # 图片列表
  8. pattern =[]
  9. num = 0
  10. for i in range(2,downpage):
  11. url = baseurl + str(i)
  12. print(url)
  13. content = requests.get(url).content.decode('utf-8')
  14. pattern = re.compile('<link itemprop="thumbnail" href="(.+?)"').findall(content)
  15. # picList.append(pattern)
  16. picList = picList + pattern
  17. print(picList)
  18. print(len(picList))
  19. # 下载图片
  20. def dowmloadPicture():
  21. # 定义全局变量
  22. global num
  23. print('找到的图片,即将开始下载图片...')
  24. for each in picList:
  25. print('正在下载第' + str(num + 1) + '张图片,图片地址:' + str(each))
  26. try:
  27. if each is not None:
  28. pic = requests.get(each, timeout=7)
  29. else:
  30. continue
  31. except BaseException:
  32. print('错误,当前图片无法下载')
  33. continue
  34. else:
  35. # 保存路径
  36. string = 'E:\test\\' + str(num) + '.jpg'
  37. fp = open(string, 'wb')
  38. fp.write(pic.content)
  39. fp.close()
  40. num += 1
  41. # 调用下载图片方法
  42. dowmloadPicture()

发表评论

表情:
评论列表 (有 0 条评论,332人围观)

还没有评论,来说两句吧...

相关阅读