python +requests 爬虫-爬取图片并进行下载到本地

向右看齐 2021-11-11 02:14 485阅读 0赞

因为写12306抢票脚本需要用到爬虫技术下载验证码并进行定位点击所以这章主要讲解，爬虫，从网页上爬取图片并进行下载到本地

爬虫实现方式：

1.首先选取你需要的抓取的URL；
2.将这些URL放入待抓取URL队列；
3.从待抓取URL队列中取出待抓取在URL，解析DNS，并且得到主机的ip，并将URL对应的网页下载下来，存储进已下载网页库中。此外，将这些URL放进已抓取URL队列。

4.分析已抓取URL队列中的URL，分析其中的其他URL，并且将URL放入待抓取URL队列， 从而进入下一个循环。（下面找的别人的图）

　　　　　　　

环境：
- python
- re
- requests
正则：

pic_url = re.findall(‘“objURL”:”(.*?)”,’,html, re.S)

小技巧：这边的正则如果你不太确定有没有匹配到的话可以使用notepad++来匹配下
- 第一步查看你需要抓取网页右击查看源代码
- 第二步把代码贴入notepad++中
- 第三步f12查询选择正则进行匹配
- 也可用这个网址：http://tool.oschina.net/regex/#

废话不多说直接上代码

import re import requests def download(html): #通过正则匹配 picurl = re.findall(‘“objURL”:”(.*?)”,’,html, re.S) i = 1 for key in picurl: print(“开始下载图片：”+key +”\r\n”) try: pic = requests.get(key, timeout=10) except requests.exceptions.ConnectionError: print(‘图片无法下载’) continue #保存图片路径 dir = ‘保存路径’ + str(i) + ‘.jpg’ fp = open(dir, ‘wb’) fp.write(pic.content) fp.close() i += 1 def main(): url = ‘https://image.baidu.com/search/index?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&sf=1&fmq=&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&fm=index&pos=history&word=lay‘ result = requests.get(url) download(result.text) if name == ‘__main‘: main()
最后找到你下载图片的文件，然后看下小绵羊的盛世美颜

转载于//www.cnblogs.com/cheng10/p/11137673.html

发表评论取消回复

表情：

评论列表（有 0 条评论，485人围观）

还没有评论，来说两句吧...

相关阅读

相关 Python爬虫入门：爬取网页内容并保存到本地实例

在Python中，我们可以通过requests库来获取网页内容，然后通过BeautifulSoup库来解析和保存这些内容。以下是一个简单的爬虫实例： 1. 首先，我们需要安装

Love The Way You Lie/ 2025年01月06日 20:48/ 0 赞/ 59 阅读

相关【python】之网络爬虫requests库爬取图片

一：Requests库的安装 >windows系统：搜索中输入CMD ![在这里插入图片描述][20200527214210107.png] 在下面的面板里

心已赠人/ 2023年10月06日 09:56/ 0 赞/ 124 阅读

相关 JAVA Jsoup爬取网页图片下载到本地

添加jsoup依赖 <dependency> <groupId>org.jsoup</groupId> <artifactId>jso

妖狐艹你老母/ 2023年07月11日 15:13/ 0 赞/ 83 阅读

相关 python爬取图片到本地文件夹

import requests import re import urllib import urllib.parse import urllib.reques

阳光穿透心脏的1/2处/ 2023年06月25日 06:29/ 0 赞/ 38 阅读

相关 Python爬虫网站图片并下载到本地

文章目录先看效果 1、环境准备 2、要爬取的网站 3、程序源代码（可直接运行）先看效果 ![在这里插入图

逃离我推掉我的手/ 2022年12月30日 03:40/ 0 赞/ 335 阅读

相关 16-python爬虫之Requests库爬取海量图片

Requests 是一个 Python 的 HTTP 客户端库。 Request支持HTTP连接保持和连接池，支持使用cookie保持会话，支持文件上传，支持自动响应内容的编

青旅半醒/ 2022年12月13日 11:22/ 0 赞/ 279 阅读

相关【爬虫入门】爬取图片并保存在本地

一、分析页面明确所需爬取的标签 -> 分析正则匹配大家都知道，图片的标签为< img src="">,所以说根据标签想获取图片的网络URL是很容易的（r’s

向右看齐/ 2022年11月29日 12:23/ 0 赞/ 324 阅读

相关 Python 使用scrapy爬虫框架爬取图片下载并保存本地

Scrapy官方文档:[http://scrapy-chs.readthedocs.io/zh\_CN/latest/index.html][http_scrapy-chs.

柔光的暖阳◎/ 2022年05月17日 01:35/ 0 赞/ 489 阅读

相关 python爬取百度图片并下载

爬取百度贴吧图片 import requests from bs4 import BeautifulSoup import urllib.req

忘是亡心i/ 2022年02月25日 14:59/ 0 赞/ 520 阅读

相关 python +requests 爬虫-爬取图片并进行下载到本地

因为写12306抢票脚本需要用到爬虫技术下载验证码并进行定位点击所以这章主要讲解，爬虫，从网页上爬取图片并进行下载到本地爬虫实现方式： 1.首先选取你需要的抓

向右看齐/ 2021年11月11日 02:14/ 0 赞/ 486 阅读