python下载酷狗音乐上的歌曲

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:TM0831

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://t.cn/A6Zvjdun

准备工作:

  • Python3.5
  • Pycharm

使用到的库:

  • requests
  • re
  • json
  • time
  • fakeuseragent

步骤:

打开酷狗音乐的官网,输入想要搜索的歌曲(例如《天后》),然后回车搜索,得到如下页面:
python下载酷狗音乐上的歌曲_第1张图片
右键检查或者按F12打开开发者工具,点击JS选项,查找到如下信息,FileName就是返回的歌手名和歌曲名信息,我们要将其提取出来:
python下载酷狗音乐上的歌曲_第2张图片
由于这个网址返回的不是标准的json格式,所以要先进行如下处理,然后再转换成json格式:

res = requests.get(url).text
js = json.loads(res[res.index('(') + 1:-2])

提取到歌曲信息之后,我们输入一个序号代表要下载的歌曲序号,然后把歌曲下载下来就好了。这里需要提取出来的是FileHash,这个值会用于构造歌曲详情的URL,该URL格式如下:

http://www.kugou.com/yy/index.php?r=play/getdata&hash=<FileHash>

打开这个链接后会一个如下图所示的Json格式文件,其中包含了歌曲名称、歌手、歌曲时长等信息,其中play_url是歌曲链接,将其提取出来使用requests中的content下载即可。
python下载酷狗音乐上的歌曲_第3张图片
运行截图:
python下载酷狗音乐上的歌曲_第4张图片
完整代码

import re
import json
import time
import requests
from fake_useragent import UserAgent

ua = UserAgent()


def get_song(song_name):
    search_url = "https://songsearch.kugou.com/song_search_v2?callback=jQuery112405132987859127838_1550204317910&page" \
                 "=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_fil" \
                 "ter=0&_=1550204317912&keyword={}".format(song_name)
    headers1 = {
        "UserAgent": ua.random
    }
    headers2 = {
        "Cookie": "kg_mid=3786e26250f01bf2c64bc515820d9752; Hm_lvt_aedee6983d4cfc62f509129360d6bb3d=1559960644; Hm_lpvt_aedee6983d4cfc62f509129360d6bb3d=1559960644; ACK_SERVER_10015=%7B%22list%22%3A%5B%5B%22bjlogin-user.kugou.com%22%5D%5D%7D; ACK_SERVER_10016=%7B%22list%22%3A%5B%5B%22bjreg-user.kugou.com%22%5D%5D%7D; ACK_SERVER_10017=%7B%22list%22%3A%5B%5B%22bjverifycode.service.kugou.com%22%5D%5D%7D; kg_dfid=0iEqIA1uep0h0AogH30Jq1Od; kg_dfid_collect=d41d8cd98f00b204e9800998ecf8427e",
        "Host": "www.kugou.com",
        "Referer": "http://www.kugou.com/",
        "UserAgent": ua.random
    }
    res = requests.get(search_url, headers=headers1)
    # print(res.text)
    start = re.search("jQuery\d+_\d+\(?", res.text)
    js = json.loads(res.text.strip().lstrip(start.group()).rstrip(")"))  # 注意:末尾有一个换行需要去掉
    song_list = js['data']['lists']

    for i in range(10):
        print(str(i + 1) + ">>>" + str(song_list[i]['FileName']).replace('', '').replace('', ''))

    num = int(input("\n请输入您想要下载的歌曲序号:"))

    print("请稍等,下载歌曲中...")
    time.sleep(1)

    file_hash = song_list[num - 1]['FileHash']

    hash_url = "http://www.kugou.com/yy/index.php?r=play/getdata&hash={}".format(file_hash)
    # print(hash_url)
    hash_res = requests.get(hash_url, headers=headers2)
    hash_js = hash_res.json()  # json格式
    # print(hash_js)
    play_url = hash_js['data']['play_url']

    # 下载歌曲
    try:
        with open("music/" + song_name + ".mp3", "wb")as fp:
            fp.write(requests.get(play_url).content)
        print("歌曲已下载完成!")
    except Exception as e:
        print(e)


if __name__ == '__main__':
    get_song(input("请输入您想要搜索的歌曲名称:"))

你可能感兴趣的:(Python爬虫)