Python爬虫常见问题:HTTP请求与响应解析案例
在编写Python爬虫时,可能会遇到一些常见的问题。对于HTTP请求与响应的解析,这里给出一个基本案例:
导入库:
import requests
from bs4 import BeautifulSoup
发送HTTP请求:
url = "https://example.com" # 需要爬取的网站URL
response = requests.get(url)
解析HTML响应(使用BeautifulSoup):
soup = BeautifulSoup(response.text, 'html.parser')
提取所需信息(例如,所有段落的内容):
paragraphs = soup.find_all('p') # 查找所有的段落
for para in paragraphs:
content = para.get_text() # 提取段落内容
print(content) # 打印内容
以上就是一个基本的HTTP请求与响应解析案例。实际使用时,可能需要根据目标网站的具体结构进行相应的调整。
还没有评论,来说两句吧...