爬取网页出来为空_用python爬虫爬取股票数据

川长思鸟来 2022-10-24 02:04 391阅读 0赞

前言：

编写一个爬虫脚本，用于爬取东方财富网的上海股票代码，并通过爬取百度股票的单个股票数据，将所有上海股票数据爬取下来并保存到本地文件中

系统环境：

64位win10系统，64位python3.6,IDE位pycharm

预备知识：

BeautifulSoup的基本知识，re正则表达式的基本知识

代码：

代码解释：

第一个getHTMLText函数的作用是获得所需的网页源代码

第二个getStockList函数的作用是获得东方财富网上面上海股票的全部代码，查看网页源代码可知，股票代码的数据放在’a’标签里面，如下图所示：

因此，首先用find_all方法遍历所有’a’标签，然后在’a’标签里面提取出href部分信息，在提取出来的href信息里面，用正则表达式匹配所需的信息，“shd{6}”，即徐亚匹配例如sh200010的信息

第三个函数需要根据第二个函数得到的股票代码，拼接出一个url，在这个特定的url的网页里，使用第一个函数解析网页，首先加一个判断，如果遇到html为空，那么要继续执行下去，同样，我们也需要再加一个判断（关键之处），遇到网页不存在，

但html源代码仍然是存在的，因此接下去这个命令

stockInfo = soup.find(‘div’,attrs = {‘class’:’stock-bets’})

可能为空，如果不加判断，程序执行到这里就会报错而无法继续执行，因此添加：

if stockInfo == None:

continue

发表评论取消回复

表情：

评论列表（有 0 条评论，391人围观）

还没有评论，来说两句吧...

相关阅读

相关 Python爬虫案例：爬取网页信息

Python作为一种强大的编程语言，非常适合进行网站爬虫。以下是一个简单的爬虫案例，爬取一个网页的标题： ```python import requests from bs4

男娘i/ 2025年01月31日 02:21/ 0 赞/ 79 阅读

相关利用爬虫爬取网页连接

1 问题如何利用爬虫技术定向爬取网页连接？ 2 方法利用爬虫技术，通过实验、实践等证明提出的方法是有效的，是能够解决开头提出的问题。代码清单 1 <ta

雨点打透心脏的1/2处/ 2024年03月22日 21:52/ 0 赞/ 187 阅读

相关 MATLAB爬虫爬取股票数据

![matlab1389ca169df5ca1d.png][] > 近年来，大数据盛行，有关爬虫的教程层次不穷。那么，爬虫到底是什么呢? 什么是爬虫？百度百科是这样

深藏阁楼爱情的钟/ 2023年08月17日 16:12/ 0 赞/ 231 阅读

相关 python中文爬取网页_使用Python爬虫爬取简单网页（Python爬虫入门）-Go语言中文社区...

今天我们来看一看使用Python爬取一些简单的网页。所用工具：IDLE (Python 3.6 64-bit) 一. 爬取京东商品页面 ![8d0a127b918867

我会带着你远行/ 2022年10月27日 13:50/ 0 赞/ 383 阅读

相关爬取网页出来为空_用python爬虫爬取股票数据

前言：编写一个爬虫脚本，用于爬取东方财富网的上海股票代码，并通过爬取百度股票的单个股票数据，将所有上海股票数据爬取下来并保存到本地文件中系统环境： 64位wi

川长思鸟来/ 2022年10月24日 02:04/ 0 赞/ 392 阅读

相关爬虫如何实现每天爬取，定点爬取[以股票数据为例]

分析抓取的数据抓包框架 model main util parse db 问题所在解决方法

矫情吗；*/ 2022年07月11日 08:40/ 0 赞/ 742 阅读

相关 python爬虫爬取淘宝网页数据

O、requests 和 re 库的介绍 requests库是一个小型好用的网页请求模块，可用于网页请求，常用来编写小型爬虫安装requests可以使用pip命令：

Bertha 。/ 2022年06月07日 12:16/ 0 赞/ 637 阅读

相关 Python爬虫爬取动态网页

系统环境：操作系统：Windows8.1专业版 64bit Python：anaconda、Python2.7 Py

迈不过友情╰/ 2022年05月26日 11:48/ 0 赞/ 654 阅读

相关 node：爬虫爬取网页图片

> 代码地址如下： > [http://www.demodashi.com/demo/13845.html][http_www.demodashi.com_demo_138

素颜马尾好姑娘i/ 2022年05月11日 04:36/ 0 赞/ 418 阅读

相关 python爬虫程序，爬取网页图片

一段简单的爬取网页图片的python代码 coding=utf-8 import urllib import re url

- 日理万妓/ 2022年04月04日 15:14/ 0 赞/ 577 阅读