Monkey_D_Newdun

用爬虫获取网易云音乐热门歌手评论数

转载请注明作者和出处：http://blog.csdn.net/Monkey_D_Newdun

运行平台：Windows 10

IDE：Pycharm

Python版本：3.6.0

浏览器：Chrome

前言
所需模块
步骤解析

爬取歌曲评论数
爬取热门歌手ID
爬取歌手热门单曲ID
总体代码

总结

1.前言

刚开始学Python和爬虫，由于也是网易云音乐的忠实用户，所以就想做一个网易云音乐的爬虫。本来想做一个爬取所有歌曲评论数的爬虫，发现已经有大佬写过了，并且爬取5亿多首歌评论数的工作量也有点大，所以就改做爬取当下各热门歌手每首热单的评论数，再统计一下各位歌手热单的评论总数。由于每位歌手的TOP50单曲已经集中了其绝大多数评论，所以可以近似当作他们所有歌曲的评论总数。（由于这是我第次一写博客，且刚开始学Python和爬虫所以用语上可能有些错误）

2.所需模块

urllib、BeautifulSoup、request、requests、re、json

3.步骤解析

3.1爬取歌曲评论数

进入到一首歌曲的详细页面，可以看到歌曲的ID，比如《等你下课》的ID是531051217，直接尝试使用BeautifulSoup对链接“http://music.163.com/#/song?id=531051217”进行解析，发现找不到评论信息

这是因为网易对评论数据采取的是异步传输，所以不能直接通过解析网页内容得到评论数据。打开Chrome开发者工具（Fn+f12）观察,发现奥秘在一个名为“R_SO_4_531051217?csrf_token=”的POST请求中，如下图

其中R_SO_4_后面的数字531051217为当前歌曲的ID，再观察所上传数据可以看到这里上传了两个参数：params、encSecKey,经过测试发现两个参数对每首歌都是通用的。也就是说将上面链接的歌曲ID替换后传入该参数也能获得数据

再观察服务器所返回的数据可知评论数保存在“total”中,其中“comments”存的是评论内容，“hotComments”存的是热门评论内容，如果想扒一扒评论内容就可以从这里获取。注意这些是JSON数据，到时候要解析一下

代码部分

#-*-coding:UTF-8-*-

from urllib import request
from bs4 import BeautifulSoup
import requests
import json
import re
from urllib import parse

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36"}

def comment_count(song_id):
    url="http://music.163.com/weapi/v1/resource/comments/R_SO_4_"+song_id+"?csrf_token="
    data = {
        "params": "nHfVBsNbW+WCrz7pAbdaq4uW2+4kADa+gNEfGWK7M5n36mWvsmGXsM2KzVUAeR62mhYlsSvc23I58Rf0dvg1Cglxuf5/l1wVRBCRROpjz9WuYSlWdiwXT/x45iud30RmjbTUsMSQuiehO6Ef3vHSdKWHma9pYm/eeYUF7IQ0hXI3HIz42NgwllBj4cy1XlOH",
        "encSecKey": "0587c5b45f3b0771db2b3fe449e7dd9640ab56f679d73a9189096283e776e7a9f749630c6e0fa3f947778f1588b9ec71bd779279006f352e5804036909d5d772c9572c64db575bcce675fcc9055614f1c955abb798eed602cb43945748d8b0a9ecf293cde0ef523e63c3115a1a12b7113be447fba7947090f0d98d2c37cff72a"}
    req=requests.post(url=url,headers=headers,data=data)
    req.encoding="utf-8"
    comment= json.loads(req.text)
    return comment["total"]

if __name__=="__main__":
    print(comment_count("531051217"))

运行结果

可以看到返回了评论数（这首歌是周杰伦近期超热门单曲《等你下课》，在写博客的这段时间又涨了许多评论，所以与刚刚浏览器看到的评论数有些出入）

3.2爬取热门歌手ID

打开歌手页面，用BeautifulSoup对链接“http://music.163.com/#/discover/artist”进行解析后发现也找不到歌手信息

原来歌手信息这里也是采取的异步传输，同样打开Chrome开发者工具观察网页结构，发现奥秘在一个名为“top?csrf_token=”的POST请求中

经过测试发现这个POST需要传入完整的Headers,不然得不到反馈，但要把“Accept-Encoding:gzip,deflate”去掉，不然到时候解码会报错

这个POST需要传入的数据参数和之前是一样，也是“params”和“encSecKey”两个，再观察返回的JSON数据就可以找到歌手的ID和姓名等详细信息了。这次换种方法解析这个POST，不用requests.post()，而用Request+urlopen,虽然麻烦点但是两种方法都熟悉一下。

代码部分

#-*-coding:UTF-8-*-

from urllib import request
from bs4 import BeautifulSoup
import requests
import json
import re
from urllib import parse

a_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36"
           ,"Referer": "http://music.163.com/discover/artist"
           ,"Origin": "http://music.163.com"
           ,"Host":"music.163.com"
           ,"Cookie":"_iuqxldmzr_=32; _ntes_nnid=9bab5ebb9f8ceee069cb78f0a2981abe,1518338855311; _ntes_nuid=9bab5ebb9f8ceee069cb78f0a2981abe; __utmc=94650624; __utmz=94650624.1518338856.1.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utma=94650624.44525748.1518338856.1518338856.1518341295.2; JSESSIONID-WYYY=M%2BRH6YHhfp2cVhqPvhYY8trjkopMxYU3p0mKWwFJaAXHw7UlmXOaYo%5CvvrlS8hQo%2FFydkqEhQUD56EmaA8jdh3fbWXdZ%2BuG7JCt8SeWr08UY8agb%5C%2Fs5Maq3jkD8%2BjcZoxcJtjmwNMSzZUwlTAtFNMYqr3xfWEIO6zDMzqZTx0qDrSS7%3A1518344136402; __utmb=94650624.21.10.1518341295"
           ,"Content-Type":"application/x-www-form-urlencoded"
           ,"Content-Length":"414"
           ,"Connection":"keep-alive"
           ,"Accept-Language":"zh-CN,zh;q=0.9"
           ,"Accept":"*/*"}

def artist_id():
    url="http://music.163.com/weapi/artist/top?csrf_token="
    data={"params":"uAE0hN7yRCy+plWTUJw7imQQW+wUSFRuVlFD8UTgXNfJTVLzNyqfnLRqSByCjs40san8rbwMfpasdpJRNit6vKkbQE0F7MZEgRPgSEVfXrHIB/wGiyYQ/VIaZnyTql1m",
          "encSecKey":"def9762a8c6ff1f3ae1a7ee23cbc095b3dd6c888f28e974ca00f927fd044a48cfdde49af3138aa99fa7da17fdb97809c7d1abd4ddfc40ab7ef3c0e574e56b2d623c0c23af4d08c629087fd5e1996c961af133140dc81b9fb2322aca668a8079c6cd01a0699fc860b2bb0df47b3887d563f1b18e6585198bb5d9c718a5fa92f04"}
    #用Requests和urlopen解析歌手页面的POST
    post_data = parse.urlencode(data).encode("utf-8")
    req=request.Request(url=url,headers=a_headers)
    res=request.urlopen(req,post_data)
    html=res.read().decode("utf-8")
    #解析所返回的JSON数据
    a_data=json.loads(html)
    a_list=a_data["artists"]#刚刚观察返回数据可以知道歌手的信息储存在artists键中
    id_list=[]#用一个列表储存所有歌手的id和name
    for i in range(len(a_list)):
        a_dict = {}#用一个字典储存一个歌手的id和name
        a_dict["name"]=a_list[i]["name"]
        a_dict["id"]=a_list[i]["id"]
        id_list.append(a_dict)
    return id_list

if __name__=="__main__":
    print(artist_id())

运行结果

（得到了所有歌手的姓名和ID，并且储存在一个列表中，之后会用到歌手的ID爬取歌曲信息）

3.3爬取歌手热门单曲ID

首先观察一个歌手的详情页面（如周杰伦），地址栏的id参数就决定歌手页面，我们就爬取热门50单曲的评论信息。这是尝试对页面“http://music.163.com/#/artist?id=6452”进行解析，发现还是找不到歌曲信息（真是醉了，大公司做项目果然严谨）

打开Chrome开发者工具找找玄机，发现有些信息是通过“http://music.163.com/artist?id=6452”（这尼玛少了个#号）GET请求发回来的。在返回的数据中还要仔细找一找，可以看到这50首歌曲的信息是储存在class="f-hide"的

标签中可以找到。所以用BeautifulSoup对“http://music.163.com/artist?id=歌手Id”进行解析，再用find_all("ul",class_="f-hide")就可以找到歌曲信息了

代码部分

#-*-coding:UTF-8-*-

from urllib import request
from bs4 import BeautifulSoup
import requests
import json
import re
from urllib import parse

s_url="http://music.163.com/artist"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36"}

def song_id(artist_id):
    data={"id":artist_id}#将歌手ID作为params参数传入requests.get()方法
    req=requests.get(url=s_url,headers=headers,params=data)
    req.encoding="utf-8"
    soup=BeautifulSoup(req.text,"lxml")#对返回的数据进行解析
    song_list=soup.find_all("ul",class_="f-hide")#找到class="f-hide"的标签
    song_soup=BeautifulSoup(str(song_list),"lxml")#将......
再解析一次，以便使用find_all()方法把所有标签取出来
    song_list=song_soup.find_all("a")
    id_list=[]#存歌曲ID
    name_list=[]#存歌名
    for each in song_list:
        s_id=each.get("href")#歌曲ID在标签href属性中
        s_name=each.string
        s=re.findall(r"\d+",s_id)#用正则找到href中的ID
        id_list.append(s[0])#由于re.findall()返回的是一个列表，所以用下标将ID取出
        name_list.append(s_name)
    return id_list,name_list

if __name__=="__main__":
    song_id_list,name_list=song_id(6452)
    print(song_id_list)
    print(name_list)

运行结果

（这样就找到了周杰伦热门50单曲的ID和歌名，将这些ID传入上面的comment_count()函数就可以得到每首歌曲的评论数了）

3.4总体代码

这一步主要就是将上面三个部分的代码做一个有机整合就可以了，其实就是用两个循环

#-*-coding:UTF-8-*-

from urllib import request
from bs4 import BeautifulSoup
import requests
import json
import re
from urllib import parse


a_headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36"
           ,"Referer": "http://music.163.com/discover/artist"
           ,"Origin": "http://music.163.com"
           ,"Host":"music.163.com"
           ,"Cookie":"_iuqxldmzr_=32; _ntes_nnid=9bab5ebb9f8ceee069cb78f0a2981abe,1518338855311; _ntes_nuid=9bab5ebb9f8ceee069cb78f0a2981abe; __utmc=94650624; __utmz=94650624.1518338856.1.1.utmcsr=baidu|utmccn=(organic)|utmcmd=organic; __utma=94650624.44525748.1518338856.1518338856.1518341295.2; JSESSIONID-WYYY=M%2BRH6YHhfp2cVhqPvhYY8trjkopMxYU3p0mKWwFJaAXHw7UlmXOaYo%5CvvrlS8hQo%2FFydkqEhQUD56EmaA8jdh3fbWXdZ%2BuG7JCt8SeWr08UY8agb%5C%2Fs5Maq3jkD8%2BjcZoxcJtjmwNMSzZUwlTAtFNMYqr3xfWEIO6zDMzqZTx0qDrSS7%3A1518344136402; __utmb=94650624.21.10.1518341295"
           ,"Content-Type":"application/x-www-form-urlencoded"
           ,"Content-Length":"414"
           ,"Connection":"keep-alive"
           ,"Accept-Language":"zh-CN,zh;q=0.9"
           ,"Accept":"*/*"}
s_url="http://music.163.com/artist"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36"}

def artist_id():
    url="http://music.163.com/weapi/artist/top?csrf_token="
    data={"params":"uAE0hN7yRCy+plWTUJw7imQQW+wUSFRuVlFD8UTgXNfJTVLzNyqfnLRqSByCjs40san8rbwMfpasdpJRNit6vKkbQE0F7MZEgRPgSEVfXrHIB/wGiyYQ/VIaZnyTql1m",
          "encSecKey":"def9762a8c6ff1f3ae1a7ee23cbc095b3dd6c888f28e974ca00f927fd044a48cfdde49af3138aa99fa7da17fdb97809c7d1abd4ddfc40ab7ef3c0e574e56b2d623c0c23af4d08c629087fd5e1996c961af133140dc81b9fb2322aca668a8079c6cd01a0699fc860b2bb0df47b3887d563f1b18e6585198bb5d9c718a5fa92f04"}
    #用Requests和urlopen解析歌手页面的POST
    post_data = parse.urlencode(data).encode("utf-8")
    req=request.Request(url=url,headers=a_headers)
    res=request.urlopen(req,post_data)
    html=res.read().decode("utf-8")
    #解析所返回的JSON数据
    a_data=json.loads(html)
    a_list=a_data["artists"]#所有歌手的信息储存在artists键中
    id_list=[]#用一个列表储存所有歌手的id和name
    for i in range(len(a_list)):
        a_dict = {}#用一个字典储存一个歌手的id和name
        a_dict["name"]=a_list[i]["name"]
        a_dict["id"]=a_list[i]["id"]
        id_list.append(a_dict)
    return id_list

def song_id(artist_id):
    data={"id":artist_id}#将歌手ID作为params参数传入requests.get()方法
    req=requests.get(url=s_url,headers=headers,params=data)
    req.encoding="utf-8"
    soup=BeautifulSoup(req.text,"lxml")#对返回的数据进行解析
    song_list=soup.find_all("ul",class_="f-hide")#找到class="f-hide"的标签
    song_soup=BeautifulSoup(str(song_list),"lxml")#将......
再解析一次，以便使用find_all()方法把所有标签取出来
    song_list=song_soup.find_all("a")
    id_list=[]#存歌曲ID
    name_list=[]#存歌名
    for each in song_list:
        s_id=each.get("href")#歌曲ID在标签href属性中
        s_name=each.string
        s=re.findall(r"\d+",s_id)#用正则找到href中的ID
        id_list.append(s[0])#由于re.findall()返回的是一个列表，所以用下标将ID取出
        name_list.append(s_name)
    return id_list,name_list

def comment_count(song_id):
    url="http://music.163.com/weapi/v1/resource/comments/R_SO_4_"+song_id+"?csrf_token="
    data = {
        "params": "nHfVBsNbW+WCrz7pAbdaq4uW2+4kADa+gNEfGWK7M5n36mWvsmGXsM2KzVUAeR62mhYlsSvc23I58Rf0dvg1Cglxuf5/l1wVRBCRROpjz9WuYSlWdiwXT/x45iud30RmjbTUsMSQuiehO6Ef3vHSdKWHma9pYm/eeYUF7IQ0hXI3HIz42NgwllBj4cy1XlOH",
        "encSecKey": "0587c5b45f3b0771db2b3fe449e7dd9640ab56f679d73a9189096283e776e7a9f749630c6e0fa3f947778f1588b9ec71bd779279006f352e5804036909d5d772c9572c64db575bcce675fcc9055614f1c955abb798eed602cb43945748d8b0a9ecf293cde0ef523e63c3115a1a12b7113be447fba7947090f0d98d2c37cff72a"}
    req=requests.post(url=url,headers=headers,data=data)
    req.encoding="utf-8"
    comment= json.loads(req.text)
    return comment["total"]



if __name__=="__main__":
    f=open("网易云评论.txt","w",encoding="utf-8")
    id_list=artist_id()
    for artist in id_list:
        total=0
        f.write("\n\n"+artist["name"]+"热门歌曲以及评论数：")
        song_id_list,name_list=song_id(artist["id"])
        for i in range(len(song_id_list)):
            if(name_list[i]!=None):#！！！这个地方一定要注意，下面会做说明
                total+=comment_count(song_id_list[i])
                f.write(name_list[i]+":"+str(comment_count(song_id_list[i]))+"条")
        f.write("总计："+str(total)+"条")
        print(artist["name"]+"网易云音乐热门歌曲总评论数："+str(total)+"条")
    print("抓取完毕！")

解释一下这个判断条件

if(name_list[i]!=None):

从这位歌手说起

相信你看到这歌名会有点懵逼，没错就连Python解释器也认不到它，直接给当作None处理（没想到吧，手动滑稽）

运行结果

热门歌手热门单曲TOP50总评论数，如下

（这是网页的默认歌手顺序，有兴趣的小伙伴可以自己写个排序函数排下顺序，周杰伦这570多万条评论着实有点吓人，不愧为当今华语乐坛扛把子）

每首歌的评论数也存到了文件中，如下

4总结

感觉爬取信息的关键就是要先分析好人家的网页结构~~~不然会走弯路，这个网易云音乐的爬虫也让自己学到了不少东西。想把这个过程记录下来，免得自己忘了，所以就写了这篇博客处女作。（毕竟处女作可能有很多错误之处，还请多多包涵）

深入Kotlin语言在Android开发中的应用_Android_lecture07 新职语
本文还有配套的精品资源，点击获取简介：在Android开发领域，Kotlin凭借其简洁性、安全性和强大的交互能力已经成为首选编程语言。本讲座将深入讲解Kotlin的基础语法、空安全、类型系统、高阶函数与Lambda表达式、扩展函数与属性、Anko库、协程、Android核心组件以及数据绑定。同时，还将介绍Dagger2或Hilt依赖注入、MVVM架构和AndroidJetpack组件等高级技巧，并
python模块之psutil详解_基于python调用psutil模块过程解析谢艺馨
这篇文章主要介绍了基于python调用psutils模块过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下用Python来编写脚本简化日常的运维工作是Python的一个重要用途。在Linux下，有许多系统命令可以让我们时刻监控系统运行的状态，如ps，top，free等等。要获取这些系统信息，Python可以通过subprocess模块调用并获
软件测试基础：全面入门与实践指南 AWS云计算
本文还有配套的精品资源，点击获取简介：软件测试是软件开发中的关键环节，对产品的质量和用户体验起决定性作用。本文详细介绍了软件测试的基本概念、类型、方法和过程，提供了测试工具的选择建议，并强调了持续学习、沟通协作、问题解决和业务理解的重要性。这些内容为软件测试的初学者提供了全面的入门指导和实践建议。1.软件测试基本概念与目标软件测试是确保软件质量和可靠性的关键环节，贯穿于整个软件开发生命周期。测试的
用 Neo4j GraphRAG 工具开启你的智能应用之旅步子哥 AGI通用人工智能 neo4j 人工智能
在这个人工智能飞速发展的时代，Neo4j带来了一项令人激动的创新——GraphRAG生态系统工具。这组开源工具为开发人员提供了一个全新的途径，以构建基于知识图谱的智能应用，让机器更好地理解和回应我们的查询。接下来，让我们一起探索这些工具如何帮助我们构建更智能、更准确的应用。什么是GraphRAG?GraphRAG是一种结合了检索增强生成（RAG）技术和知识图谱的解决方案。它不仅解决了大型语言模型常
Python subprocess模块学习总结 weixin_34414196 python shell 操作系统
2019独角兽企业重金招聘Python工程师标准>>>从Python2.4开始，Python引入subprocess模块来管理子进程，以取代一些旧模块的方法：如os.system、os.spawn*、os.popen*、popen2.*、commands.*不但可以调用外部的命令作为子进程，而且可以连接到子进程的input/output/error管道，获取相关的返回信息一、subprocess以
数据包的发送流程 sumatch 网络
以绿皮聊天软件为例：首先，我们两个手机的绿皮聊天软件客户端，要通信，中间会通过它们家服务器。大概长这样。但为了简化模型，我们把中间的服务器给省略掉，假设这是个端到端的通信。且为了保证消息的可靠性，我们盲猜它们之间用的是TCP协议进行通信。为了发送数据包，两端首先会通过三次握手，建立TCP连接。一个数据包，从聊天框里发出，消息会从聊天软件所在的用户空间拷贝到内核空间的发送缓冲区（sendbuffer
goGin框架教程 sumatch go golang
1.gin框架入门1.1介绍Gin是一个用Golang编写的高性能的web框架,由于http路由的优化，速度提高了近40倍。Gin的特点就是封装优雅、API友好。Gin的一些特性：快速基于Radix树的路由，小内存占用。没有反射。可预测的API性能。支持中间件传入的HTTP请求可以由一系列中间件和最终操作来处理。例如：Logger，Authorization，GZIP，最终操作DB。Crash处理
ansible批量修改主机密码(非明文) 伪烛之焰 ansible linux
一、未优化前1.在ansible服务器上面配置出加密的密码opensslpasswd-1123456>mypasswd.txtcatmypasswd.txt111I4e4LJWu$Cb91lQ7kSOnZpOEIZbeJm.2.修改mypasswd.txt在密文前面加上用户名用:号隔开root:111I4e4LJWu$Cb91lQ7kSOnZpOEIZbeJm.3.ansible分发文件到各个主机
CSS：模拟下雪效果动画制作教程 IT新时代前端 css 前端开发 web前端前端基础
下雪效果只是一类效果的名称，可以是红包雨等一些自由落体的运动效果，本文就是用纯css模拟下雪的效果，更多效果大家可以自行发挥。1.前言由于公司产品的活动，需要模拟类似下雪的效果。浏览器实现动画无非css3和canvas（还有gif），对比下css3和canvas的优缺点：动画自由度：canvas胜；复杂度：canvas胜；兼容性：canvas胜；性能：css3胜（requestAnimationF
python之subprocess模块 halazi100 #07python
从python2.4版本开始,可以用subprocess这个模块来产生子进程,并连接到子进程的标准输入/输出/错误中去，还可以得到子进程的返回值。subprocess意在替代其他几个老的模块或者函数，比如：os.systemos.spawn*os.popen*popen2.*commands.*一、subprocess.Popensubprocess模块定义了一个类：subprocess.Pope
subprocess模块篇熊猫Devin python笔记人工智能 python 开发语言
文章目录使用方法调用Python程序设置工作目录使用方法subprocess模块是Python中用于生成新的进程，连接到它们的input/output/error管道，并获取它们的返回码的模块1。下面是subprocess模块的一些主要知识点和详细教程：run()方法创建子进程：使用subprocess.run()方法可以方便地创建一个子进程并等待其完成。例如，要运行一个外部命令并获取其输出，可以
【软件测试】冒烟测试详解测试杂货铺 python 软件测试自动化测试测试工具职场和发展程序人生压力测试
视频学习：文末有免费的配套视频可观看点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快冒烟测试介绍冒烟测试一词，来源于电路板测试：电路板拼接或组装完成后，进行通电测试，如果冒烟，则说明存在缺陷。而软件应用中，对其的定义为：在软件开发过程中的一种针对软件版本包的快速基本功能验证策略，是对软件基本功能进行确认验证的手段，并非深入测试。通过冒烟测试，可以快速判断提测软件包是否具有可测性，也可以
Python 的 subprocess 介绍及如何使用 LavenLiu python subprocess
一、引言在Python中，subprocess模块为程序员提供了与操作系统命令进行交互的桥梁。无论是执行简单的shell命令，还是管理复杂的外部进程，subprocess都能很好地完成任务。通过subprocess，Python脚本可以启动新的应用程序，与其输入/输出/错误管道建立连接，并获取其返回值，这对于实现自动化任务和系统集成至关重要。subprocess模块的出现，极大地扩展了Python
Linux 内核学习(3) --- 内核中断机制小猪佩奇TONY Linux 内核学习单片机 linux
目录中断来源中断处理程序Linux中断处理程序架构获取中断信息ARMGIC申请和释放中断DTS中的配置中断处理函数中断来源根据中断的来源，中断可以分为外部中断和内部中断,内部中断的来源是CPU内部(软件中断指令，溢出，除法错误等),例如操作系统从用户态切换到内核态,需要借助于CPU的软件中断，外部中断的中断源来自于外设，由外设提出请求。根据中断是否可以被屏蔽分为可屏蔽中断和不可屏蔽中断(NMI)，
Python标准库 subprocess 模块多进程编程详解好像要长脑子了1 程序员 python 开发语言
1.1基本功能subprocess模块，允许生成新的进程执行命令行指令，python程序，以及其它语言编写的应用程序,如java,c++,rust应用等。subprocess可连接多个进程的输入、输出、错误管道，并且获取它们的返回码。asyncio也支持subprocess.许多知名库都在使用此模块创建进程，以及做为跨语言粘合工具。典型如ansible,celery，selenium等。1.2与m
【计算机组成原理】带符号整数的表示——补码与反码蒙奇D索大保姆级教学计算机组成原理(CO)408 改行学it 笔记经验分享考研
反码与补码导读一、补码1.1原码转补码1.2补码转原码二、反码三、原码、补码、反码的相互转换结语导读大家好，很高兴又和大家见面啦！！！在上一篇内容中我们介绍了有符号整数的原码形式，有符号整数的原码表示法中，我们需要了解以下内容：机器数最高位为符号位——0为正，1为负；除最高位以外的二进制位为数值位原码形式的取值范围：−(2n−1−1)～2n−1−1-(2^{n-1}-1)～2^{n-1}-1−(2
【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
在Eclipse安装时报错：Version 1.8.0_281 of the JVM is not suitable for this product CheeseZhangz 学习 eclipse windows java jdk
近日，在QQ群里看到鹏飞大佬的文章，突然想coding一发，又因为没用过Eclipse，于是开始撸IDE…可谁曾想，前方正有一堆坑…下载是一坑百度搜索Eclipse，打开官网下载，点击下载，官网的下载速度就是…满心欢喜，开局惊喜啊：(So记住这个小海豚，可爱吧~清华大学开源软件镜像站,致力于为国内和校内用户提供高质量的开源软件镜像、Linux镜像源服务,帮助用户更方便地获取开源软件https://
JVM CMS垃圾收集器详解 NewBird_jhone jvm
CMS定义和使用CMS（ConcurrentMarkSweep）垃圾收集器是一种以获取最短回收停顿时间为目标的收集器。它非常符合在注重用户体验的应用上使用。CMS垃圾收集器是一种基于“标记-清除”算法实现。在jdk8中使用CMS相关的核心参数：-XX:+UseConcMarkSweepGC：启用cms-XX:ConcGCThreads：并发的GC线程数-XX:+UseCMSCompactAtFul
微服务架构设计面试题留不住的人面试突击微服务 java 架构
微服务架构设计面试前言：我认为你们在了解了整个微服务架构之后，需要能够明白，微服务架构重点在于架构二字，这个内容搞清楚了，其实任何的架构，任何的手段都是一个工具，如何去利用这些工具解决一些问题才是最重要的。架构的本质：用最简单的手段解决复杂的问题。系统整理是复杂的没错，然而80%（数字只是一个比喻，表示大多数）的用户和80%的场景都是简单的，架构的目的就是首先保证80%的简单性问题能够得到真正简单
python 常用的内置函数猰貐的新时代 python python java 开发语言
python内置函数1.abs(x)返回绝对值返回一个数的绝对值。实参可以是整数或浮点数。如果实参是一个复数，返回它的模。2.all(iterable)如果iterable的所有元素为真（或迭代器为空），返回Truedefall(iterable): forelementiniterable: ifnotelement: returnFalse returnTrue3.any(iter
一次zookeeper Curator客户端导致JVM OOM问题的分析记录辉度并发多线程
一次JVMOOM问题的分析记录OOM问题发生在客户的开发环境，系统是一个监控系统，表现为先高CPU，页面极卡，最后发生OOM。问实施人员拿到HeapDump文件。来看看到底是内存不够用溢出了，还是发生了内存泄漏。HeapDumpjdk自带的jvisualvm可以用，但是表现在我电脑上卡的不行。Dump文件接近7G。jprofiler，商用。本次分析借用其试用的10天。Classes查看到Linke
一文讲解Java中的equals和hashCode方法 Journey_CR JavaSE java 哈希算法散列表
什么是hashCode方法？hashCode()方法的作用是获取哈希码，它会返回一个int整数，定义在Object类中，是一个本地方法；publicnativeinthashCode();为什么要有hashCode方法呢？hashCode方法主要用来获取对象的哈希码，哈希码是由对象的内存地址或者对象的属性计算出来，它是一个int类型的整数，通常是不会重复的，因此可以用来作为键值对的键，来提高查询效
c#泛型约束 LM001_csdn java c#开发语言
1.泛型约束的使用泛型约束的作用在一个泛型方法或者说泛型接口中，传入的泛型是不确定的，但是在方法体中，我们传入一个实体，要在代码块中获取实体的各种属性如：姓名、性别等，但是问题来了，由于我们的类型是在调用的时候确定的，因此在写泛型方法或接口代码的时候我们是不确定入参类型，所以就需要一个东西来确定入参有那些属性，由此泛型约束就冒出来了，当然为了更好的理解下面有代码解释—以泛型方法为例:首先我们定义一
基于Python的多元医疗知识图谱构建与应用研究（下） Allen_LVyingbo 医疗高效编程研发 python python 知识图谱健康医疗
五、基于医疗知识图谱的医疗知识图谱程序构建5.1数据层构建5.1.1数据源选择与获取在构建基于医疗知识图谱的医疗知识图谱数据层时，数据源的选择与获取至关重要。数据源的质量和丰富度直接决定了知识图谱的可靠性和实用性。医学文献是重要的数据源之一，包括学术期刊论文、医学研究报告等。这些文献包含了大量经过科学验证的医学知识，如疾病的发病机制、诊断标准、治疗方法等。可以通过专业的医学文献数据库，如PubMe
Node.js日志记录新篇章：morgan中间件的使用与优势真想骂* node.js 中间件
在Node.js的广阔生态系统中，日志记录是开发过程中不可或缺的一部分。它不仅有助于开发者追踪应用程序的运行状态，还能在出现问题时提供宝贵的调试信息。而在众多日志记录工具中，Morgan以其高效、易用和专注于HTTP请求日志的特点，成为了Node.js开发者中的热门选择。本文将深入探讨Morgan中间件的使用方法与优势，为Node.js日志记录翻开新的篇章。一、Morgan中间件简介Morgan是
MongoDB aggregate学习 mongodbsqljava
MongoDB中的aggregate主要用于数据统计平均值，求和等，并返回计算后的数据结果，有点类似sql语句中的count,sum,avg功能。一些表达式及对应功能：表达式功能$sum计算总和$avg计算平均值$min获取集合文档中最小值$max获取集合文档中最大值$push在集合文档中插入值到一个数组中$pull在集合文档中删除指定的值$addToSet在集合文档中插入值到一个数组中，如果之前
长三角国家算力枢纽节点赋能制造业数字化转型的机理与路径罗伯特之技术屋大数据与数字化的设计应用专栏人工智能
摘要长三角作为先进制造业最集聚、发展基础最雄厚、创新型经济最活跃和最具潜力的国家级创新策源地，“东数西算”工程中国家算力枢纽节点的建设，对加快推动长三角先进制造业实现升级转型具有重要意义。因此，结合当前制造业数字化转型过程中遇到的困境与问题，探寻长三角国家算力枢纽节点赋能制造业数字化转型的逻辑机理、现实挑战和实现路径，以期推动制造业转型升级和长三角区域一体化绿色高质量发展。关键词：东数西算;算力网
js常用函数整理代码简单说 javascript Vue3源码解析 javascript js函数函数整理
常用函数获取十六进制随机颜色functiongetRandomColor(){return'#'+(function(h){returnne
OpenCV相关函数〖是♂我〗 opencv 计算机视觉图像处理
一、Sobel算子函数(cv2.Sobel)功能Sobel算子是一个梯度算子，用于边缘检测。通过计算图像中像素的梯度，Sobel算子可以检测出水平和垂直方向上的边缘。参数src：输入图像。ddepth：输出图像的深度（如cv2.CV_8U,cv2.CV_64F）。一般为cv2.CV_8U（8位无符号整数）或cv2.CV_64F（64位浮动数）。dx：计算导数的x方向阶数，dx=1表示计算x方向的导
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

用爬虫获取网易云音乐热门歌手评论数

1.前言

2.所需模块

3.步骤解析

3.1爬取歌曲评论数

3.2爬取热门歌手ID

3.3爬取歌手热门单曲ID

3.4总体代码

4总结

你可能感兴趣的:(用爬虫获取网易云音乐热门歌手评论数)