Up_Long

【Python】Python网络爬虫-电视剧《平凡的荣耀》数据爬取与分析

文章目录

- 一、前言
- 二、《平凡的荣耀》数据爬取与分析
- 三、总结

一、前言

距上次更新博客，又过去很长时间了，感觉再不更新一下，自己写博客的习惯就要废了，哈哈。从去年九月份开学之后，疫情学期期末考试开学考、实验室项目软著申请和新项目设计、课程集训等事情较多，没有很多时间；然后这个学期我到大三下学期，实验室工作交接完就准备考研，之后也没有很多时间来写博客，所以赶紧来更新一下，和大家分享一些知识和心得，希望喜欢的小伙伴可以点赞、收藏和关注，哈哈。

二、《平凡的荣耀》数据爬取与分析

1 简介
旨在实现对翻拍电视剧《平凡的荣耀》综合热度的分析，计划设计数据爬取模块、数据分析模块和数据模块。具体实现思路如下。

1.数据爬取模块需求分析
在数据爬取模块，计划爬取三个部分的数据。首先，爬取电视剧演员阵容数据，实现对主演基本信息和粉丝数量的获取。其次，爬取电视剧卫视收视情况数据，实现对电视剧播出期间多个卫视收视率、收视份额和收视排名信息的获取。最后，爬取豆瓣平台该电视剧热评数据，实现对前100条热评信息的获取。

2.数据分析模块需求分析
在数据分析模块，计划对爬取的三部分数据进行数据分析。首先，通过对主演信息数据的分析，得出该剧主演是否对电视剧收视情况产生了影响。其次，通过对多卫视收视情况的分析，得出该电视剧在播出期间的持续热度与相对热度。最后，通过对豆瓣热评的分析，得出观众对该电视剧的喜爱程度。

3.数据存储模块需求分析
在数据存储模块，计划通过两种方式实现数据的存储。首先，使用json文件存储爬取模块获取的基础数据。其次，读取部分json文件，通过操作表格的方式，将主演信息、卫视收视情况和100条热评数据分别存入三个Excel表格中。

2 开发技术和环境
（1）开发环境
开发系统：Windows 10操作系统；
开发工具：Anaconda+PyCharm；
开发语言：Python3.7。
（2）文件
Json文件、Excel文档
3 系统设计
1.总体设计
本作品总体设计包括对《平凡的荣耀》的数据爬取、数据分析和数据存储三个方面。在数据爬取方面，进行主演信息、卫视收视情况和豆瓣热评爬取的设计。在数据分析方面，进行演员阵容、卫视收视热度和观众喜爱程度分析的设计。在数据存储方面，进行对提取数据使用Json和Excel两种方式存储的设计。
系统功能模块图：

2.数据存储方式
本作品通过两种方式实现对提取数据进行存储，分别是Json文件存储和Excel表格存储。在数据爬取阶段，使用Json文件存储的方式，方便将提取数据按字典格式进行保存。在数据分析阶段，使用Excel表格存储的方式，方便对提取数据进行更加直观的分析。
数据存储结构图：

4 系统实现

1.数据爬取与存储模块实现

该模块主要实现对主演基础信息、卫视收视数据和豆瓣热评数据的爬取与存储，具体实现如下。

1.1主演信息爬取与存储实现
（1）实现方案
在该部分，主要进行了两个方面信息的爬取与存储。
第一个方面，获取所有演员阵容，通过提取《平凡的荣耀》百科页面角色介绍模块中主要角色对应演员姓名及个人百科链接来实现。自定义get_actors()函数，在该函数中，使用requests库中的get()方法构造请求，使用BeautifulSoup构造方法进行解析，并使用其find()和find_all()方法进一步提取出需要信息，最后存储到json文件中。
第二个方面，获取各个演员的基础数据，通过访问获取的每个演员的百科链接，来获取每个演员姓名、出生地、出生日期、星座、血型、身高、体重和粉丝量信息。自定义get_one_actors()函数，类似于get_actors()函数实现步骤，实现数据的提取和存储。
（2）实现代码

# 获取当前路径
path = os.getcwd()
# 爬取演员信息并返回html
def get_actors():
    # 定义headers和网页
    headers = {
     
        # 'Host': 'baike.baidu.com',
        'User-Agent':'Mozilla/5.0(Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
'Cookie':__yjsv5_shitong=1.0_7_1b511363715b8341a6b858c9784cf79473ec_300_1607592679535_218.56.38.242_f194afe3; yjs_js_security_passport=e2ee49471e3e645bb94ed5b037ce6cfba6955b66_1607592680_js'
    }
    url = 'https://baike.baidu.com/item/平凡的荣耀'
    # get
    response = requests.get(url, headers=headers)
    # 将一段文档传入BeautifulSoup的构造方法,就能得到一个文档的对象, 可以传入一段字符串
    soup = BeautifulSoup(response.text, 'lxml')
    # print(soup.find_all('li'))
    # 获取角色介绍模块div数据
    first_actors = soup.find(name='div', attrs={
     'class': 'lemmaWgt-roleIntroduction'})
    # print(actors)
    # 进一步得到模块中li标签中的演员数据
    second_actors = first_actors.find_all(name='li')
    # print(second_actors)
    # 演员数据提取
    actors = []
    for second_actor in second_actors:
        actor = {
     }
        if second_actor.find(name='div', attrs={
     'class': 'role-actor'}):
            # 提取演员名称及百科链接
            actor["name"]=second_actor.find('div',{
     'class': 'role-actor'}).find('a').text
            actor['link'] = 'https://baike.baidu.com' + second_actor.find('div',{
     'class': 'role-actor'}).find('a').get('href')
        actors.append(actor)
    # print(actors)
    json_actors = json.loads(str(actors).replace("\'", "\""))
    # print(json_actors)
    file_path = path + '/电视剧数据文件/actors.json'
    file_path = file_path.replace('\\', '/')
    print(file_path)
    with open(file_path, 'w', encoding='UTF-8') as f:
        json.dump(json_actors, f, ensure_ascii=False)
# 获取每个演员的百科信息
def get_one_actors():
    read_path = path + '/电视剧数据文件/actors.json'
    read_path = read_path.replace('\\', '/')
    # 读取json数据
    with open(read_path, 'r', encoding='UTF-8') as f:
        actors = json.loads(f.read())
    headers = {
     
        # 'Host': 'baike.baidu.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
    }
    # 存提取的百科数据
    actor_infos = []
    for actor in actors:
        actor_info = {
     }
        actor_info['姓名'] = actor['name']
        # 获取请求
        response = requests.get(actor['link'], headers=headers)
        # 得到百科全部数据
        first_soup = BeautifulSoup(response.text, 'lxml')
        # 提取演员基本信息模块列表部分数据
        second_soup = first_soup.find(name='div', attrs={
     'class': 'basic-info cmn-clearfix'})
        # 得到div中的dl
        dls = second_soup.find_all(name='dl')
        # 遍历所有的dl
        for dl in dls:
            dts = dl.find_all(name='dt')
            # print(dts)
            # dds = dl.find_all(name='dd')
            # print(dds[index].text.strip())
            # 遍历单个dl的所有dt
            for dt in dts:
                # 匹配字符，通过join和split方法，提取dt中的纯文字
                if ''.join(str(dt.text).split()) == '出生地':
                    actor_info['出生地'] = dt.find_next(name='dd').text.strip().replace("\n", "")
                if ''.join(str(dt.text).split()) == '出生日期':
                    actor_info['出生日期'] = dt.find_next(name='dd').text.strip()
                if ''.join(str(dt.text).split()) == '血型':
                    actor_info['血型'] = dt.find_next(name='dd').text.strip()
                if ''.join(str(dt.text).split()) == '身高':
                    actor_info['身高'] = dt.find_next(name='dd').text.strip()
                if ''.join(str(dt.text).split()) == '体重':
                    actor_info['体重'] = dt.find_next(name='dd').text.strip()
                if ''.join(str(dt.text).split()) == '星座':
                    # print(''.join(str(dt.text)))
                    actor_info['星座'] = dt.find_next(name='dd').text.strip()
        # 获取百度数说模块
        first_fans = first_soup.find(name='div', attrs={
     'class': 'fans-portrait'})
        # 进一步得到粉丝总数部分数据
        try:
            fans = first_fans.find(name='span', attrs={
     'class': 'fans-total'}).text
            actor_info['粉丝量'] = fans
        except:
            actor_info['粉丝量'] = '未知'
        actor_infos.append(actor_info)
        json_actor_infos = json.loads(str(actor_infos).replace("\'", "\""))
        # 存
        file_path = path + '/电视剧数据文件/actor_infos.json'
        file_path = file_path.replace('\\', '/')
        with open(file_path, 'w', encoding='UTF-8') as f:
            json.dump(json_actor_infos, f, ensure_ascii=False)

1.2 卫视收视情况爬取与存储实现

（1）实现方案
在该部分，主要进行了对东方和浙江两个卫视该电视剧收视数据的爬取与存储。通过提取《平凡的荣耀》百科页面播出信息模块中收视情况部分两个卫视CSM59城在播出期间每天的收视率、收视份额和排名数据来实现。自定义get_ratings()安徽省农户，在该函数中，使用requests库中的get()方法构造请求，使用BeautifulSoup构造方法进行解析，并使用其find()和find_all()方法进一步提取出需要信息，最后将获取的两个卫视的收视情况数据分别存储到两个json文件中。
（2）实现代码

# 爬取收视情况
def get_ratings():
    # 定义headers和网页
    headers = {
     
        # 'Host': 'baike.baidu.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',   'Cookie':__yjsv5_shitong=1.0_7_1b511363715b8341a6b858c9784cf79473ec_300_1607592679535_218.56.38.242_f194afe3; yjs_js_security_passport=e2ee49471e3e645bb94ed5b037ce6cfba6955b66_1607592680_js'
    }
    url = 'https://baike.baidu.com/item/平凡的荣耀'
    # 获取response
    response = requests.get(url, headers=headers)
    # 转
    first_soup = BeautifulSoup(response.text, 'lxml')
    # 审查播出信息模块下收视情况子模块div，发现class=para
    # 提取class=para的div，因为不止收视情况div的class为该值，所以find_all
    second_soup = first_soup.find_all(name='div', attrs={
     'class': 'para'})
    # print(second_soup)
    # 遍历符合条件的div
    for d in second_soup:
        # 如果div中文本为收视情况，则匹配成功并获取它下面的一个table
        if ''.join(str(d.text).split()) == '收视情况':
            final_soup = d.find_next(name='table')
    # 得到table中的所有tr
    trs = final_soup.find_all(name='tr')
    # print(trs)
    # 定义存放两个卫视收视情况的字典
    dongfang_datas = []
    zhejiang_datas = []
    # 遍历tr,获取播出期间各个卫视的收视情况
    for tr in trs[2:]:
        dongfang = {
     }
        zhejiang = {
     }
        tds = tr.find_all(name='td')
        dongfang['播出日期'] = tds[0].text
        dongfang['收视率%'] = tds[1].text
        dongfang['收视份额%'] = tds[2].text
        dongfang['排名'] = tds[3].text
        zhejiang['播出日期'] = tds[0].text
        zhejiang['收视率%'] = tds[4].text
        zhejiang['收视份额%'] = tds[5].text
        zhejiang['排名'] = tds[6].text
        dongfang_datas.append(dongfang)
        zhejiang_datas.append(zhejiang)
        # print(tds[2].text)
    # print(dongfang_datas)
    # print(zhejiang_datas)
    # 转格式
    json_dongdang_datas = json.loads(str(dongfang_datas).replace("\'", "\""))
    json_zhejiang_datas = json.loads(str(zhejiang_datas).replace("\'", "\""))
    dongfang_path = path + '/电视剧数据文件/dongfang.json'
    dongfang_path = dongfang_path.replace('\\', '/')
    zhejiang_path = path + '/电视剧数据文件/zhejiang.json'
    zhejiang_path = zhejiang_path.replace('\\', '/')
    # 将两个卫视的收视情况存入到两个json文件中
    with open(dongfang_path, 'w', encoding='UTF-8') as f:
        json.dump(json_dongdang_datas, f, ensure_ascii=False)
    with open(zhejiang_path, 'w', encoding='UTF-8') as f:
        json.dump(json_zhejiang_datas, f, ensure_ascii=False)

1.3豆瓣热评爬取与存储实现

（1）实现方案
在该部分，主要进行了豆瓣热评数据的爬取和存储。通过提取豆瓣该电视剧页面短评模块前5页（每页20条）100条热评的评论人、评分、点赞数和评论内容来实现。自定义get_hot_comments()函数，在该函数中，使用requests库中的get()方法构造请求，使用BeautifulSoup构造方法进行解析，并使用其find()和find_all()方法进一步提取出需要信息，最后存储到json文件中。
（2）实现代码

# 爬取线上优酷热评
def get_hot_comments():
    headers = {
     
        'Host': 'movie.douban.com',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',    'Cookie':_vwo_uuid_v2=DE8F855EC24AE2DDC7761E12EAB48EAEF|c5c585e9feb33aa574682b87f0284a1c;_pk_id.100001.4cf6=45cef77f2b5a9960.1607930880.1.1607931254.1607930880.'
    }
    # 热评
    comments = []
    for i in range(5):
        url = f'https://movie.douban.com/subject/30186581/comments?start={i*20}&status=P&sort=new_score'
        # 获取全部
        responce = requests.get(url, headers=headers)
        # 转bs4
        first_soup = BeautifulSoup(responce.text, 'lxml')
        # 提取"平凡的荣耀 短评"下的评论模块
        second_soup = first_soup.find(name='div', attrs={
     'class': 'article'})
        # 提取100条热评
        first_hot_comments = second_soup.find(name='div', attrs={
     'class': 'mod-bd'})
        second_hot_comments = first_hot_comments.find_all(name='div', attrs={
     'class': 'comment'})
        # print(second_hot_comments)
        for comment in second_hot_comments:
            c = {
     }
            # 获取存用户名、观影感受和评论时间的span
            first_user = comment.find(name='span', attrs={
     'class': 'comment-info'})
            user = first_user.find(name='a').text
            date = first_user.find(name='span', attrs={
     'class': 'comment-time'})
            feel = date.find_previous(name='span')
            # print(user,date)
            c['评论人'] = user
            try:
                c['观看感受'] = feel['title']
            except:
                c['观看感受'] = '无'
            c['评论日期'] = date.text.strip()
            # 获取评论内容
            content = comment.find(name='p').text.strip().replace("\n", "")
            # print(content)
            c['内容'] = content
            # 获取存点赞数的span
            first_vote = comment.find(name='span', attrs={
     'class': 'comment-vote'})
            vote = first_vote.find(name='span', attrs={
     'class': 'votes vote-count'}).text
            c['点赞数'] = vote
            comments.append(c)
    # print(comments)
    # print(len(comments))
    # 存
    json_hot_comments = json.loads(str(comments).replace("\'", "\""))
    file_path = path + '/电视剧数据文件/hot_comments.json'
    file_path = file_path.replace('\\', '/')
    with open(file_path, 'w', encoding='UTF-8') as f:
        json.dump(json_hot_comments, f, ensure_ascii=False)

2 数据分析模块实现
该模块主要实现对该电视剧演员粉丝数量、卫视收视率和收视份额以及豆瓣观众评价的分析，具体实现如下。

2.1 演员粉丝数量分析实现
（1）实现方案
在该部分，主要进行对主演阵容中每个演员粉丝数量的分析。通过分析演员粉丝数量，来实现对该电视剧演员阵容的评价。自定义show_fans()函数，在该函数中，使用pandas库中的read_json()方法读取存放演员信息的json文件，得到主演姓名和粉丝数量；使用pyplot函数集合中的bar方法绘制粉丝数量柱状分析图；最后使用savefig方法将柱状图进行保存。
（2）实现代码

# 绘制粉丝数量图
def show_fans():
    # 读
    read_path = path + '/电视剧数据文件/actor_infos.json'
    read_path = read_path.replace('\\', '/')
    df = pd.read_json(read_path)
    actor_names = list(df['姓名'])
    actor_fans = list(df['粉丝量'])
    bar = (
        Bar()
        .add_xaxis(actor_names)
        .add_yaxis("粉丝数量", actor_fans)
        .set_global_opts(title_opts=opts.TitleOpts(title="《平凡的荣耀》主演粉丝数量分析图"))
    )
    bar.render(path + '/电视剧收视率分析图/fans.html

2.2 卫视收视情况分析实现
（1）实现方案
在该部分，主要进行对该电视剧播出期间在东方卫视和浙江卫视收视率和收视份额的分析，来实现对电视剧播出期间持续热度和相对热度的评价。
自定义show_tv_ratings(json_file)函数，在该函数中，根据形参传入json文件名，使用pandas库中的read_json()方法对特定卫视json文件进行数据提取，得到播出期间每天的收视率；使用pyplot函数集合中的plot方法绘制收视率的折线分析图；最后使用savefig方法将折线图进行保存。
自定义show_tvs_ratings()函数，在该函数中，使用pandas库中的read_json()方法读取两个卫视json文件进行数据提取，得到卫视播出期间每天的收视份额；使用pyplot函数集合中的bar方法绘制播出期间电视剧在两个卫视收视份额的柱状分析图；最后使用savefig方法将柱状图进行保存。
（2）实现代码

# 绘制单个卫视收视率变化图
def show_tv_ratings(json_file):
    # 导入json数据
    read_path = path + '/电视剧数据文件/' + json_file
    read_path = read_path.replace('\\', '/')
    # print(read_path)
    df = pd.read_json(read_path, dtype={
     '播出日期': str})
    dates = list(df['播出日期'])
    ratings = list(df['收视率%'])
    line = (
        Line()
        .add_xaxis(dates)
        .add_yaxis("收视率%", ratings, is_connect_nones=True)
    )
    if str(json_file)[:-5] == 'dongfang':
        line.set_global_opts(title_opts=opts.TitleOpts(title="《平凡的荣耀》东方卫视收视率变化趋势图"))
    else:
        line.set_global_opts(title_opts=opts.TitleOpts(title="《平凡的荣耀》浙江卫视收视率变化趋势图"))
    line.render(path + '/电视剧收视率分析图/' + str(json_file)[:-5] + '_ratings.html')
# 绘制卫视收视份额对比图
def show_tvs_ratings():
    # 导入json数据
    dongfang = path + '/电视剧数据文件/dongfang.json'
    dongfang = dongfang.replace('\\', '/')
    zhejiang = path + '/电视剧数据文件/zhejiang.json'
    zhejiang = zhejiang.replace('\\', '/')
    df1 = pd.read_json(dongfang)
    df2 = pd.read_json(zhejiang)
    # 提取需要的数据
    dongfang_dates = list(df1['播出日期'])
    dongfang_ratings = list(df1['收视份额%'])
    # zhejiang_dates = list(df2['播出日期'])
    zhejiang_ratings = list(df2['收视份额%'])
    # 绘制
    bar = (
        Bar()
        .add_xaxis(dongfang_dates)
        .add_yaxis("东方卫视", dongfang_ratings)
        .add_yaxis("浙江卫视", zhejiang_ratings)
        .set_global_opts(title_opts=opts.TitleOpts("《平凡的荣耀》收视份额变化分析图"))
    )
    bar.render(path + '/电视剧收视率分析图/tvs_ratings.html')

2.3 豆瓣热评分析实现
（1）实现方案
在该部分，主要进行对豆瓣热评中观众观影感受的分析，来实现观众对电视剧喜爱程度的评价。
自定义show_hot_comments()函数，在该函数中，使用pandas库中的read_json()方法对豆瓣热评json文件进行数据提取，得到每个观众的观影感受；使用pyplot函数集合中的pie方法绘制观众喜爱情况的饼状分析图；最后使用savefig方法将折线图进行保存。
（2）实现代码

# 绘制评论饼状图
def show_hot_comments():
    # 导入数据
    read_path = path + '/电视剧数据文件/hot_comments.json'
    read_path = read_path.replace('\\', '/')
    df = pd.read_json(read_path)
    # 提取需要数据
    feel = list(df['观看感受'])
    # print(feel)
    labels = ['力荐', '推荐', '还行', '很差', '较差', '无']
    values = [feel.count('力荐'), feel.count('推荐'), feel.count('还行'), feel.count('很差'), feel.count('较差'), feel.count('无')]
    # print(values)
    # 绘制
    pie = (
        Pie()
        .add(series_name='', data_pair=[(i, j) for i, j in zip(labels, values)])
        .set_global_opts(title_opts=opts.TitleOpts("热评前100观众评价分析"))
        .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
    )
    pie.render(path + '/电视剧收视率分析图/hot_comments.ht

3.表格存储模块实现
（1）实现方案
该模块主要实现对主演信息、多卫视收视情况和豆瓣前100热评以Excel表格的形式进行存储。分别自定义write_actor_infos()、write_tvs_ratings()和wirte_hot_comments()函数，在每个函数中，使用pandas库中read_json方法读取特定文件，并使用xlwings库中部分方法进行表格创建。
（2）实现代码

# 将热评写入execl表
def write_hot_comments():
    file_path = path + '/电视剧数据文件/hot_comments.json'
    file_path = file_path.replace('\\', '/')
    with open(file_path, 'r', encoding='utf8') as f:
        comments = json.load(f)
    # print(comments)
    title = ['评论人', '观看感受', '评论时间', '评论内容', '评论点赞数']
    # 打开Excel
    wb = xw.Book()
    sht = wb.sheets('Sheet1')
    sht.range('A1').value = title
    line = 2
    for comment in comments:  # 循环字典
        # print(list(comment.values()))
        sht.range(f'A{line}').value = list(comment.values())
        line += 1
# 将演员数据存入Excel
def write_actor_infos():
    # 读数据
    file_path = path + '/电视剧数据文件/actor_infos.json'
    file_path = file_path.replace('\\', '/')
    with open(file_path, 'r', encoding='utf8') as f:
        actor_infos = json.load(f)
    # actor_infos = list(actor_infos)
    # 定义Excel表头
    title = ['姓名', '出生地', '出生日期', '星座', '血型', '身高', '体重', '粉丝量']
    # 打开Excel
    wb = xw.Book()
    sht = wb.sheets('Sheet1')
    sht.range('A1').value = title
    # 设置写入行索引，从第2行开始
    line = 2
    # 遍历每个演员数据
    for actor in actor_infos:
        # 获取单个演员字典的key值
        keys = list(actor.keys())
        values = list(actor.values())
        # 设置key值与value值一一对应的索引
        index = 0
        # 遍历key值进行属性匹配
        for key in keys:
            # 如果是姓名存入A列
            if key == '姓名':
                # print(values[index])
                sht.range(f'A{line}').value = values[index]
                index += 1
            if key == '出生地':
                sht.range(f'B{line}').value = values[index]
                index += 1
            if key == '出生日期':
                sht.range(f'C{line}').value = values[index]
                index += 1
            if key == '星座':
                sht.range(f'D{line}').value = values[index]
                index += 1
            if key == '血型':
                sht.range(f'E{line}').value = values[index]
                index += 1
            if key == '身高':
                sht.range(f'F{line}').value = values[index]
                index += 1
            if key == '体重':
                sht.range(f'G{line}').value = values[index]
                index += 1
            if key == '粉丝量':
                sht.range(f'H{line}').value = values[index]
                index += 1
        line += 1
# 将收视率存入Excel
def write_tvs_ratings():
    dongfang = path + '/电视剧数据文件/dongfang.json'
    dongfang = dongfang.replace('\\', '/')
    zhejiang = path + '/电视剧数据文件/zhejiang.json'
    zhejiang = zhejiang.replace('\\', '/')
    with open(dongfang, 'r', encoding='utf8') as f:
        dongfang = json.load(f)
    with open(zhejiang, 'r', encoding='utf8') as f:
        zhejiang = json.load(f)
    title = ['播出日期', '收视率%', '收视份额%', '收拾排名']
    wb = xw.Book()
    sht = wb.sheets('Sheet1')
    sht.range('A1').value = '东方卫视'
    sht.range('E1').value = '浙江卫视'
    sht.range('A2:D2').value = title
    sht.range('E2:H2').value = title
    line = 3
    for d in dongfang:
        sht.range(f'A{line}:D{line}').value = list(d.values())
        line += 1
    line = 3
    for z in zhejiang:
        sht.range(f'E{line}:H{line}').value = list(z.values())
        line += 1

4.模块整合实现
（1）实现方案
该模块主要实现对数据爬取与存储、数据分析以及数据表格存储模块多个函数进行分类整合。分别自定义get_all()、show_all()和wirte_all()函数，在每个函数中，使用对应模块全部函数。
（2）实现代码

# 爬取主函数
def get_all():
    get_actors()
    time.sleep(2)
    get_one_actors()
    time.sleep(2)
    get_ratings()
    time.sleep(2)
    get_hot_comments()
    time.sleep(2)
# 绘制分析图
def show_all():
    show_fans()
    show_tv_ratings('dongfang.json')
    show_tv_ratings('zhejiang.json')
    show_tvs_ratings()
    show_hot_comments()
# 数据存入Excel表
def write_all():
    write_actor_infos()
    time.sleep(2)
    write_tvs_ratings()
    time.sleep(2)
    write_hot_comments()
    time.sleep(2)

5 结论

5.1 演员粉丝数量分析

主演粉丝数量分析柱状图：

通过上述柱状图可以看出，除3名未知粉丝数量的演员外，其他6名演员中有4名演员粉丝数量超过1千万，白敬亭粉丝数量最高达到2.7千万。可以得出，该翻拍电视剧主演粉丝基础良好，该翻拍电视剧有较好的观众基础。

5.2卫视收视情况分析

东方卫视收视率变化折线分析图

浙江卫视收视率变化折线分析图

通过上述两个收视率变化折线分析图可以看出，在该翻拍电视剧播出期间，两个卫视收视率呈现稳定上升的趋势，均有一半以上播出时间收视率超过2%，热度良好；且东方卫视在9月27日收视率破3%，热度较高。根据CMS59城收视率评价指标，电视剧收视率到达2%以上，判定收视率良好；收视率达到3%以上，判定收视率较高。可以得出，该翻拍电视剧相对热度正常偏高。

多卫视收视份额变化柱状分析图

通过上述收视份额变化柱状分析图可以看出，在该翻拍电视剧播出期间，两个卫视收视份额大部分时间高于6%，一半左右时间高于7%，部分时间段高达9%或10%。根据收视份额评价指标，电视收视份额达到7%，判定为良好；超过8%，判定为较高。可以得出，该翻拍电视剧在两个卫视的综合热度也正常偏高。
综上，该翻拍电视剧具有正常偏高的热度。

5.3 豆瓣热评分析

豆瓣前100热评观众评价分析图

通过上述观众评价饼形分析图可以看出，中等及以上评价占48%，差评占51%，未评价占1%。可以得出，在前100热评的观众中，该翻拍电视剧观影感受一般。进一步可以推测出，观众对该翻拍电视剧的喜爱程度一般。

5.4 综合分析

通过对上述三个部分的综合分析，可以得出该翻拍电视剧具有良好的演员阵容，观众基础较好。在播出期间，各卫视收视情况较好，有较高的综合热度和相对热度。同时，经过分析也得出，该翻拍电视剧观众喜爱程度一般，可能并未达到观众的心里预期。

三、总结

一个Python爬虫案例，主要对《平凡的荣耀》电视剧相关数据进行爬取和分析，案例相关代码、技术文档、数据分析图、Excel表、json文件等上传在我的csdn下载区中。

你可能感兴趣的:(Python,python,爬虫)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
Python 常用内置函数详解（七）：dir()函数——获取当前本地作用域中的名称列表或对象的有效属性列表
目录一、功能二、语法和示例一、功能dir()函数获取当前本地作用域中的名称列表或对象的有效属性列表。二、语法和示例dir()函数有两种形式，如果没有实参，则返回当前本地作用域中的名称列表。如果有实参，它会尝试返回该对象的有效属性列表。如果对象有一个名为__dir__()的方法，那么该方法将被调用，并且必须返回一个属性列表。dir()函数的语法格式如下：C:\Users\amoxiang>ipyth
pythonjson中list操作_Python json.dumps 特殊数据类型的自定义序列化操作
场景描述：Python标准库中的json模块，集成了将数据序列化处理的功能；在使用json.dumps()方法序列化数据时候，如果目标数据中存在datetime数据类型，执行操作时，会抛出异常：TypeError:datetime.datetime(2016,12,10,11,04,21)isnotJSONserializable那么遇到json.dumps序列化不支持的数据类型，该怎么办！首先，
Python 日期格式转json.dumps的解决方法 douyaoxin python json 开发语言
classDateEncoder(json.JSONEncoder):defdefault(self,obj):ifisinstance(obj,datetime.datetime):returnobj.strftime('%Y-%m-%d%H:%M:%S')elifisinstance(obj,datetime.date):returnobj.strftime("%Y-%m-%d")json.d
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
Python技能手册 - 模块module 金色牛神 Python python windows 开发语言
系列Python常用技能手册-基础语法Python常用技能手册-模块modulePython常用技能手册-包package目录module模块指什么typing数据类型int整数float浮点数str字符串bool布尔值TypeVar类型变量functools高阶函数工具functools.partial()函数偏置functools.lru_cache()函数缓存sorted排序列表排序元组排序
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
苦练Python第9天：if-else分支九剑 python后端前端人工智能
苦练Python第9天：if-else分支九剑前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众号：倔强青铜三。欢迎点赞、收藏、关注，一键三连！！！欢迎来到100天Python挑战第9天！今天我们不练循环，改磨“分支剑法”——ifelse三式：单分支、双分支、多分支，以及嵌套和三元运算符，全部实战演练，让
苦练Python第8天：while 循环之妙用 python后端前端人工智能
苦练Python第8天：while循环之妙用原文链接：https://dev.to/therahul_gupta/day-9100-while-loops-with-real-world-examples-528f作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我，微信公众
苦练Python第5天：字符串从入门到格式化 python后端人工智能前端
苦练Python第5天：字符串从入门到格式化原文链接：https://dev.to/therahul_gupta/day-5100-working-with-strings-basics-to-formatting-2kkn作者：RahulGupta译者：倔强青铜三前言大家好，我是倔强青铜三。是一名热情的软件工程师，我热衷于分享和传播IT技术，致力于通过我的知识和技能推动技术交流与创新，欢迎关注我
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情