Python3.x爬取网易云音乐歌单

小咪咪 2021-10-25 14:22 615阅读 0赞

Python3.x爬取网易云音乐歌单

该篇紧紧是作为入门练手使用,爬取功能不包含收费音乐,也不包含无损音乐,完整代码在文章末。

分析

1. 获取请求头 header

用抓包工具fiddler/charles抓包,抓出歌单的请求头header信息。在代码中已经写好,可省去该步骤。

2. 分析歌单链接信息

打开一个歌单,地址是这样的
https://music.163.com/#/playlist?id=2944697443
我们把这个链接换成http,然后去掉/#
http://music.163.com/playlist?id=2944697443
该链接同样指向该歌单地址,我们使用这个地址。

3. 获取每首音乐的ID

用浏览器打开歌单的链接,将鼠标移至某个音乐上点检查,就能看到歌曲的id信息。如图。

在这里插入图片描述

4. 音乐的外链地址

网易云音乐的mp3文件的外链地址
http://music.163.com/song/media/outer/url?id=1374766486.mp3

根据该地址分析,我们更换不同id即可

该地址在浏览器中效果,如下图

在这里插入图片描述

该步骤,值得注意的是,根据外链mp3地址访问后,会有一个重定向,所以代码中也需要加上。

5. 保存mp3文件即可

完整代码

  1. #! python3
  2. #encoding=utf8
  3. import requests
  4. from bs4 import BeautifulSoup
  5. import urllib.request
  6. headers = {
  7. 'Referer':'http://music.163.com/',
  8. 'Host':'music.163.com',
  9. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.75 Safari/537.36',
  10. 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
  11. }
  12. play_url = 'http://music.163.com/playlist?id=2308326138'
  13. s = requests.session()
  14. response=s.get(play_url,headers = headers).content
  15. #print(response) 整个html源文件
  16. s = BeautifulSoup(response,'lxml')
  17. #print(s)
  18. main = s.find('ul',{'class':'f-hide'})
  19. #print(main)
  20. lists=[]
  21. for music in main.find_all('a'):
  22. #print('{} : {}'.format(music.text, music['href']))
  23. list=[]
  24. musicUrl='http://music.163.com/song/media/outer/url'+music['href'][5:]+'.mp3'
  25. musicName=music.text
  26. # 单首歌曲的名字和地址放在list列表中
  27. list.append(musicName)
  28. list.append(musicUrl)
  29. # 全部歌曲信息放在lists列表中
  30. lists.append(list)
  31. print(lists)
  32. # 重定向代码
  33. def get_redirect_url(url):
  34. # 重定向前的链接
  35. # url = "重定向前的url"
  36. # 请求头,这里我设置了浏览器代理
  37. headers = {
  38. 'Referer':'http://music.163.com/',
  39. 'Host':'music.163.com',
  40. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.75 Safari/537.36',
  41. 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
  42. }
  43. # 请求网页
  44. response = requests.get(url, headers=headers)
  45. # print(response.status_code) # 打印响应的状态码
  46. # print(response.url) # 打印重定向后的网址
  47. # 返回重定向后的网址
  48. return response.url
  49. #下载列表中的全部歌曲,并以歌曲名命名下载后的文件,文件位置为当前文件夹
  50. for i in lists:
  51. url=i[1]
  52. name=i[0]
  53. try:
  54. print('正在下载',name)
  55. # 直接下载会失败,把类似链接放入浏览器中发现自动重定向了一个地址。来模拟下重定向
  56. # 事先要自己手动创建一个 ‘wangyi’ 的文件夹哦
  57. # urllib.request.urlretrieve(url,'./%s.mp3'% name)
  58. urllib.request.urlretrieve(get_redirect_url(url),'./wangyi/%s.mp3'% name)
  59. print('下载成功')
  60. except:
  61. print('下载失败')

发表评论

表情:
评论列表 (有 0 条评论,615人围观)

还没有评论,来说两句吧...

相关阅读

    相关 音乐评论

    前言 我是个很喜欢听歌的人,手机里面下了几百首歌,而且还会每个月还会增加几首,因为我觉得听歌能让我活得更有趣。平常的我,喜欢听一些流行歌曲或者被翻唱突然又火起来的老歌、无