py大法好

关于疫情的数据分析可视化

文章目录

数据挖掘案例：利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析

一、疫情数据报告网站地址
1.1 pyecharts介绍
1.2 要用到的库
1.3 爬取数据

1.3.1 方法1
1.3.2 方法2（采用）

1.地址
2.自己来获取试试看

二、爬取的数据初查看
三、爬取数据的处理

3.1 只要data的数据
3.2 再变成字典，用两次json.load
3.3 将字典命名成变量
3.4 读取字典的键

四、爬取数据的参数解析

1.lastUpdateTime
2.chinaTotal
3.chinaAdd
4.isShowAdd
5.showAddSwitch
6.chinaDayList
7.chinaDayAddList
8.dailyNewAddHistory
9.dailyDeadRateHistory
10.dailyHealRateHistory
11.areaTree
12.articleList

五、处理省份的数据

5.1 使用for循环到省份
5.2 每个省当天的数据
5.3 每个省总的数据情况
5.4 将数据变成列表再变成dataframe
5.5 查看dataframe数据
5.6 安装pyecharts和echarts-china-provinces-pypkg
5.7 删除没有用的两列

5.7.1 按照数据类型来删除datafram的列【重要】

1.先查看一下类型
2.目的
3.方法
4.参数的意思
5.我们的处理

5.8 对原数据进行覆盖
5.9 查看现在的数据

六、定义地图，填充数据

6.1 pyecharts中的地图
6.2 安装导入pyecharts
6.3 对当前的库pyecharts进行使用和讲解

6.3.1 他的地图map不支持一种格式
6.3.2 解决办法
6.3.3 导入pyecharts的Map和options（配色，标题要用到）
6.3.4 Map.add的参数
压缩
6.3.5 下一个参数写chaina，其他的国家也可以
6.3.6 运行，查看地图

七、填充地图颜色部分的说明

7.1 颜色配置放在这里

7.1.1 颜色配置必须是list包裹dict
7.1.2 1-9人之类的范围我们改一下颜色

八、打印地图
九、数据存储

9.1 看一下各个值
9.2 保存到mysql
9.3 链接数据库
9.4 保存每天的数据，行变列
9.5 数赋值给dataframe
9.6 数据类型的转换
9.7 sql语句
9.8 数据传进来了
9.9 保存数据

9.9.1 国家数据
9.9.2 中国各个省份数据

数据挖掘案例：利用Python获取新冠状病毒肺炎的疫情数据并进行可视化分析

一、疫情数据报告网站地址

网站地址:https://news.qq.com/zt2020/page/feiyan.htm

数据来源:https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5

1.1 pyecharts介绍

pyecharts在本地就可以进行交互式画图

1.2 要用到的库

request爬虫

json处理数据

pandas处理数据

import request
import json
import pandas as np

     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3

1.3 爬取数据

1.3.1 方法1

ua ，cokkies也可以不带，这个页面没有什么拦截，后面拦截的话可以再加

import requests
import json
import pandas as pd
def getData():
    url = 'https://news.qq.com/zt2020/page/feiyan.htm'
    headers = {
        'user-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'
    }
    r = requests.get(url,headers)
    if r.status_code == 200:
         return r.text
getData()

爬取到了

怎么取出来呢

bs4

正则

xpath

都可以

1.3.2 方法2（采用）

网站上找直接获取数据的地方

1.地址

这里面有每一天的数据

每个省份地级市的数据

拿出这些数据源的地址

2.自己来获取试试看

import requests
import json
import pandas as pd
def getData():
    url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5'
    headers = {
        'user-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'
    }
    r = requests.get(url,headers)
    if r.status_code == 200:
         return json.loads(r.text)
getData()

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13

json转换成字典的了

二、爬取的数据初查看

第一行不要，后面的有用

对应之前的网页，1751这些都是有的，都不用计算了

三、爬取数据的处理

3.1 只要data的数据

3.2 再变成字典，用两次json.load

3.3 将字典命名成变量

import requests
import json
import pandas as pd
def getData():
    url = 'https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5'
    headers = {
        'user-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1'
    }
    r = requests.get(url,headers)
    if r.status_code == 200:
         return json.loads(json.loads(r.text)['data'])
data_dict = getData()

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13

3.4 读取字典的键

data_dict.keys()

dict_keys([‘lastUpdateTime’, ‘chinaTotal’, ‘chinaAdd’, ‘isShowAdd’, ‘showAddSwitch’, ‘chinaDayList’, ‘chinaDayAddList’, ‘dailyNewAddHistory’, ‘dailyDeadRateHistory’, ‘dailyHealRateHistory’, ‘areaTree’, ‘articleList’])

四、爬取数据的参数解析

1.lastUpdateTime

lastUpdateTime ：最后更新时间

'2020-02-19 20:06:10'

   
   
   
   
   
   
   
   
    
    
    
    1

2.chinaTotal

chinaTotal ：累计值

confirm 确诊
heal 治愈
dead 死亡
nowConfirm 现有确诊
suspect 疑似
nowSevere 重症

{'confirm': 74281,
 'heal': 14479,
 'dead': 2009,
 'nowConfirm': 57793,
 'suspect': 5248,
 'nowSevere': 11977}

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

3.chinaAdd

chinaAdd ：每日新增和 chinaTotal字段一致

confirm 确诊
heal 治愈
dead 死亡
nowConfirm 现有确诊
suspect 疑似

nowSevere 重症

{'confirm': 1753,
 'heal': 1918,
 'dead': 139,
 'nowConfirm': -304,
 'suspect': -994,
 'nowSevere': 236}

     
     
     
     
     
     
     
     
      
      
      
      1
      
      
      
      2
      
      
      
      3
      
      
      
      4
      
      
      
      5
      
      
      
      6

4.isShowAdd

前端进行判断的状态码

5.showAddSwitch

前端进行判断的状态码

{'all': True,
 'confirm': True,
 'suspect': True,
 'dead': True,
 'heal': True,
 'nowConfirm': True,
 'nowSevere': True}

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7

6.chinaDayList

每一天的数据（2020.1.13-至今)

confirm 确诊
heal 治愈
dead 死亡
nowConfirm 现有确诊
suspect 疑似
nowSevere 重症
deadRate 死亡率
healRate 治愈率
date 日期

7.chinaDayAddList

同上一天比增加的数据

同比上一天新增加的数据和 chinaDayList字段一致

confirm 确诊
heal 治愈
dead 死亡
nowConfirm 现有确诊
suspect 疑似
nowSevere 重症
deadRate 死亡率
healRate 治愈率
date 日期

8.dailyNewAddHistory

湖北内外每天新增确诊情况对比

date 日期
hubei 湖北新增人数
country 全国的新增人数
notHubei 湖北以外的新增人数

[{'date': '01.20', 'hubei': 72, 'country': 77, 'notHubei': 5},
 {'date': '01.21', 'hubei': 105, 'country': 149, 'notHubei': 44},
 {'date': '01.22', 'hubei': 69, 'country': 131, 'notHubei': 62},
 {'date': '01.23', 'hubei': 105, 'country': 259, 'notHubei': 154},
 {'date': '01.24', 'hubei': 180, 'country': 444, 'notHubei': 264},
 {'date': '01.25', 'hubei': 323, 'country': 688, 'notHubei': 365},
 {'date': '01.26', 'hubei': 371, 'country': 769, 'notHubei': 398},
 {'date': '01.27', 'hubei': 1291, 'country': 1771, 'notHubei': 480},
 {'date': '01.28', 'hubei': 840, 'country': 1459, 'notHubei': 619},
 {'date': '01.29', 'hubei': 1032, 'country': 1737, 'notHubei': 705},
 {'date': '01.30', 'hubei': 1220, 'country': 1982, 'notHubei': 762},
 {'date': '01.31', 'hubei': 1347, 'country': 2102, 'notHubei': 755},
 {'date': '02.01', 'hubei': 1921, 'country': 2590, 'notHubei': 669},
 {'date': '02.02', 'hubei': 2103, 'country': 2829, 'notHubei': 726},
 {'date': '02.03', 'hubei': 2345, 'country': 3235, 'notHubei': 890},
 {'date': '02.04', 'hubei': 3156, 'country': 3893, 'notHubei': 737},
 {'date': '02.05', 'hubei': 2987, 'country': 3697, 'notHubei': 710},
 {'date': '02.06', 'hubei': 2447, 'country': 3143, 'notHubei': 696},
 {'date': '02.07', 'hubei': 2841, 'country': 3401, 'notHubei': 560},
 {'date': '02.08', 'hubei': 2147, 'country': 2656, 'notHubei': 509},
 {'date': '02.09', 'hubei': 2618, 'country': 3062, 'notHubei': 444},
 {'date': '02.10', 'hubei': 2097, 'country': 2484, 'notHubei': 387},
 {'date': '02.11', 'hubei': 1638, 'country': 2022, 'notHubei': 384},
 {'date': '02.12', 'hubei': 14840, 'country': 15153, 'notHubei': 313},
 {'date': '02.13', 'hubei': 4832, 'country': 5093, 'notHubei': 261},
 {'date': '02.14', 'hubei': 2420, 'country': 2644, 'notHubei': 224},
 {'date': '02.15', 'hubei': 1843, 'country': 2009, 'notHubei': 166},
 {'date': '02.16', 'hubei': 1933, 'country': 2051, 'notHubei': 118},
 {'date': '02.17', 'hubei': 1807, 'country': 1891, 'notHubei': 84},
 {'date': '02.18', 'hubei': 1693, 'country': 1751, 'notHubei': 58}]

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
    
    
    
    15
    
    
    
    16
    
    
    
    17
    
    
    
    18
    
    
    
    19
    
    
    
    20
    
    
    
    21
    
    
    
    22
    
    
    
    23
    
    
    
    24
    
    
    
    25
    
    
    
    26
    
    
    
    27
    
    
    
    28
    
    
    
    29
    
    
    
    30

9.dailyDeadRateHistory

湖北内外每天病死率

date 日期
hubeiRate 湖北病死率
countryRate 全国的病死率
notHubeiRate 湖北以外的病死率

10.dailyHealRateHistory

湖北内外每天自愈率和 dailyDeadRateHistory字段一致

date 日期
healRate 湖北治愈率
countryRate 全国的治愈率
notHubeiRate 湖北以外的治愈率

11.areaTree

现在有26个国家得病：

len(data_dict.get('areaTree'))
#26

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2

孩子就是省：

data_dict.get('areaTree')[0]['children']

   
   
   
   
   
   
   
   
    
    
    
    1

12.articleList

疫情来源的文章信息

[{'cmsId': 'PGZ2020021902567900',
  'source': 'push',
  'media': '贵州省卫生健康委员会',
  'publish_time': '2020-02-19 19:01:48',
  'can_use': 1,
  'desc': '2月19日0时至12时，贵州无新增新冠肺炎确诊病例，累计146例，死亡2例，现有疑似病例19例。',
  'url': 'https://view.inews.qq.com/a/PGZ2020021902567900',
  'title': '贵州确诊146例：无新增确诊病例'},
 {'cmsId': 'CSD2020021902212000',
  'source': 'push',
  'media': '健康山东',
  'publish_time': '2020-02-19 15:42:39',
  'can_use': 1,
  'desc': '2月19日0-12时，山东无新增新冠肺炎确诊病例，累计确诊544例；新增疑似病例2例，现有疑似病例36例。',
  'url': 'https://view.inews.qq.com/a/CSD2020021902212000',
  'title': '好消息！山东无新增确诊病例'},
 {'cmsId': '20200219A0CB1700',
  'source': 'push',
  'media': '上海发布',
  'publish_time': '2020-02-19 13:26:11',
  'can_use': 1,
  'desc': '2月19日0-12时，上海无新增新型冠状病毒肺炎确诊病例。',
  'url': 'https://view.inews.qq.com/a/20200219A0CB1700',
  'title': '上海今日0-12时无新增确诊病例'},
 {'cmsId': 'CYN2020021901739300',
  'source': 'push',
  'media': '云南发布',
  'publish_time': '2020-02-19 12:42:18',
  'can_use': 1,
  'desc': '快讯！19日0时至12时，云南累计确诊新冠肺炎173例，无新增确诊病例，死亡1例。',
  'url': 'https://view.inews.qq.com/a/CYN2020021901739300',
  'title': '云南确诊173例：新增0例、死亡1例'},
 {'cmsId': '20200219A08GMK00',
  'source': 'push',
  'media': '上海发布',
  'publish_time': '2020-02-19 11:16:09',
  'can_use': 1,
  'desc': '上海今天又有9例确诊病例痊愈出院，另有1例死亡，目前共有186例出院。',
  'url': 'https://view.inews.qq.com/a/20200219A08GMK00',
  'title': '上海今天9例确诊病例痊愈出院 1例死亡'},
 {'cmsId': 'KCV2020021901265000',
  'source': 'push',
  'media': '西藏自治区卫生健康委员会',
  'publish_time': '2020-02-19 09:55:39',
  'can_use': 1,
  'desc': '截至2月18日24时，西藏现有新冠肺炎确诊病例0例，连续20天无新增确诊或疑似病例。',
  'url': 'https://view.inews.qq.com/a/KCV2020021901265000',
  'title': '西藏连续20天无新增确诊或疑似病例'},
 {'cmsId': 'CEI2020021901123300',
  'source': 'push',
  'media': '北方新报',
  'publish_time': '2020-02-19 09:18:00',
  'can_use': 1,
  'desc': '2月18日9时至19日8时，内蒙新增新冠肺炎确诊病例2例，累计75例，新增疑似病例3例，累计17例。',
  'url': 'https://view.inews.qq.com/a/CEI2020021901123300',
  'title': '累计75例！内蒙新增确诊病例2例'},
 {'cmsId': 'LNC2020021901119800',
  'source': 'push',
  'media': '辽宁卫健委',
  'publish_time': '2020-02-19 09:16:12',
  'can_use': 1,
  'desc': '2月18日0时至24时，辽宁省无新增新型冠状病毒肺炎确诊病例，新增12例治愈出院病例。',
  'url': 'https://view.inews.qq.com/a/LNC2020021901119800',
  'title': '辽宁新增12例治愈出院病例'},
 {'cmsId': 'CYN2020021901139900',
  'source': 'push',
  'media': '云南网',
  'publish_time': '2020-02-19 09:15:06',
  'can_use': 1,
  'desc': '刚刚！云南累计确诊病例173例：新增28岁男性染病患者，其中危重1例，重症11例，仍有正在观察2212人。',
  'url': 'https://view.inews.qq.com/a/CYN2020021901139900',
  'title': '云南新增1例染病患者：累计173例'},
 {'cmsId': 'PGZ2020021901116800',
  'source': 'push',
  'media': '健康贵州',
  'publish_time': '2020-02-19 09:14:54',
  'can_use': 1,
  'desc': '2月18日12时至24时，贵州无新增新冠肺炎确诊病例，累计146例 ，新增治愈出院病例3例。',
  'url': 'https://view.inews.qq.com/a/PGZ2020021901116800',
  'title': '贵州确诊146例：新增0例感染者'}]

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12
    
    
    
    13
    
    
    
    14
    
    
    
    15
    
    
    
    16
    
    
    
    17
    
    
    
    18
    
    
    
    19
    
    
    
    20
    
    
    
    21
    
    
    
    22
    
    
    
    23
    
    
    
    24
    
    
    
    25
    
    
    
    26
    
    
    
    27
    
    
    
    28
    
    
    
    29
    
    
    
    30
    
    
    
    31
    
    
    
    32
    
    
    
    33
    
    
    
    34
    
    
    
    35
    
    
    
    36
    
    
    
    37
    
    
    
    38
    
    
    
    39
    
    
    
    40
    
    
    
    41
    
    
    
    42
    
    
    
    43
    
    
    
    44
    
    
    
    45
    
    
    
    46
    
    
    
    47
    
    
    
    48
    
    
    
    49
    
    
    
    50
    
    
    
    51
    
    
    
    52
    
    
    
    53
    
    
    
    54
    
    
    
    55
    
    
    
    56
    
    
    
    57
    
    
    
    58
    
    
    
    59
    
    
    
    60
    
    
    
    61
    
    
    
    62
    
    
    
    63
    
    
    
    64
    
    
    
    65
    
    
    
    66
    
    
    
    67
    
    
    
    68
    
    
    
    69
    
    
    
    70
    
    
    
    71
    
    
    
    72
    
    
    
    73
    
    
    
    74
    
    
    
    75
    
    
    
    76
    
    
    
    77
    
    
    
    78
    
    
    
    79
    
    
    
    80

五、处理省份的数据

5.1 使用for循环到省份

for province in data_dict.get('areaTree')[0]['children']:
    print(province['name'])

湖北
广东
河南
浙江
湖南
安徽
江西
江苏
重庆
山东
四川
黑龙江
北京
上海
河北
福建
广西
陕西
云南
海南
贵州
山西
天津
辽宁
甘肃
吉林
新疆
内蒙古
宁夏
香港
台湾
青海
澳门
西藏

5.2 每个省当天的数据

for province in data_dict.get('areaTree')[0]['children']:
    print(province['today'])

{‘confirm’: 1693, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 3, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 5, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 4, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 2, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 2, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 6, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 6, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 6, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 4, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 2, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 2, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 3, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: False}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 2, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 1, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}
{‘confirm’: 0, ‘confirmCuts’: 0, ‘isUpdated’: True}

today是今日新增没有什么用

5.3 每个省总的数据情况

for province in data_dict.get('areaTree')[0]['children']:
    print(province['total'])

{‘confirm’: 61682, ‘suspect’: 0, ‘dead’: 1921, ‘deadRate’: ‘3.11’, ‘showRate’: False, ‘heal’: 9128, ‘healRate’: ‘14.80’, ‘showHeal’: True, ‘name’: ‘湖北’}
{‘confirm’: 1331, ‘suspect’: 0, ‘dead’: 5, ‘deadRate’: ‘0.38’, ‘showRate’: False, ‘heal’: 571, ‘healRate’: ‘42.90’, ‘showHeal’: True, ‘name’: ‘广东’}
{‘confirm’: 1262, ‘suspect’: 0, ‘dead’: 19, ‘deadRate’: ‘1.51’, ‘showRate’: False, ‘heal’: 552, ‘healRate’: ‘43.74’, ‘showHeal’: True, ‘name’: ‘河南’}
{‘confirm’: 1173, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 544, ‘healRate’: ‘46.38’, ‘showHeal’: True, ‘name’: ‘浙江’}
{‘confirm’: 1008, ‘suspect’: 0, ‘dead’: 4, ‘deadRate’: ‘0.40’, ‘showRate’: False, ‘heal’: 542, ‘healRate’: ‘53.77’, ‘showHeal’: True, ‘name’: ‘湖南’}
{‘confirm’: 986, ‘suspect’: 0, ‘dead’: 6, ‘deadRate’: ‘0.61’, ‘showRate’: False, ‘heal’: 424, ‘healRate’: ‘43.00’, ‘showHeal’: True, ‘name’: ‘安徽’}
{‘confirm’: 934, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘0.11’, ‘showRate’: False, ‘heal’: 362, ‘healRate’: ‘38.76’, ‘showHeal’: True, ‘name’: ‘江西’}
{‘confirm’: 631, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 296, ‘healRate’: ‘46.91’, ‘showHeal’: True, ‘name’: ‘江苏’}
{‘confirm’: 555, ‘suspect’: 0, ‘dead’: 5, ‘deadRate’: ‘0.90’, ‘showRate’: False, ‘heal’: 254, ‘healRate’: ‘45.77’, ‘showHeal’: True, ‘name’: ‘重庆’}
{‘confirm’: 544, ‘suspect’: 0, ‘dead’: 3, ‘deadRate’: ‘0.55’, ‘showRate’: False, ‘heal’: 225, ‘healRate’: ‘41.36’, ‘showHeal’: True, ‘name’: ‘山东’}
{‘confirm’: 514, ‘suspect’: 0, ‘dead’: 3, ‘deadRate’: ‘0.58’, ‘showRate’: False, ‘heal’: 177, ‘healRate’: ‘34.44’, ‘showHeal’: True, ‘name’: ‘四川’}
{‘confirm’: 470, ‘suspect’: 0, ‘dead’: 12, ‘deadRate’: ‘2.55’, ‘showRate’: False, ‘heal’: 108, ‘healRate’: ‘22.98’, ‘showHeal’: True, ‘name’: ‘黑龙江’}
{‘confirm’: 393, ‘suspect’: 0, ‘dead’: 4, ‘deadRate’: ‘1.02’, ‘showRate’: False, ‘heal’: 145, ‘healRate’: ‘36.90’, ‘showHeal’: True, ‘name’: ‘北京’}
{‘confirm’: 333, ‘suspect’: 0, ‘dead’: 2, ‘deadRate’: ‘0.60’, ‘showRate’: False, ‘heal’: 186, ‘healRate’: ‘55.86’, ‘showHeal’: True, ‘name’: ‘上海’}
{‘confirm’: 306, ‘suspect’: 0, ‘dead’: 4, ‘deadRate’: ‘1.31’, ‘showRate’: False, ‘heal’: 136, ‘healRate’: ‘44.44’, ‘showHeal’: True, ‘name’: ‘河北’}
{‘confirm’: 293, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 96, ‘healRate’: ‘32.76’, ‘showHeal’: True, ‘name’: ‘福建’}
{‘confirm’: 244, ‘suspect’: 0, ‘dead’: 2, ‘deadRate’: ‘0.82’, ‘showRate’: False, ‘heal’: 76, ‘healRate’: ‘31.15’, ‘showHeal’: True, ‘name’: ‘广西’}
{‘confirm’: 242, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 89, ‘healRate’: ‘36.78’, ‘showHeal’: True, ‘name’: ‘陕西’}
{‘confirm’: 173, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘0.58’, ‘showRate’: False, ‘heal’: 60, ‘healRate’: ‘34.68’, ‘showHeal’: True, ‘name’: ‘云南’}
{‘confirm’: 163, ‘suspect’: 0, ‘dead’: 4, ‘deadRate’: ‘2.45’, ‘showRate’: False, ‘heal’: 79, ‘healRate’: ‘48.47’, ‘showHeal’: True, ‘name’: ‘海南’}
{‘confirm’: 146, ‘suspect’: 0, ‘dead’: 2, ‘deadRate’: ‘1.37’, ‘showRate’: False, ‘heal’: 69, ‘healRate’: ‘47.26’, ‘showHeal’: True, ‘name’: ‘贵州’}
{‘confirm’: 131, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 61, ‘healRate’: ‘46.56’, ‘showHeal’: True, ‘name’: ‘山西’}
{‘confirm’: 128, ‘suspect’: 0, ‘dead’: 3, ‘deadRate’: ‘2.34’, ‘showRate’: False, ‘heal’: 64, ‘healRate’: ‘50.00’, ‘showHeal’: True, ‘name’: ‘天津’}
{‘confirm’: 121, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘0.83’, ‘showRate’: False, ‘heal’: 55, ‘healRate’: ‘45.45’, ‘showHeal’: True, ‘name’: ‘辽宁’}
{‘confirm’: 91, ‘suspect’: 0, ‘dead’: 2, ‘deadRate’: ‘2.20’, ‘showRate’: False, ‘heal’: 62, ‘healRate’: ‘68.13’, ‘showHeal’: True, ‘name’: ‘甘肃’}
{‘confirm’: 90, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘1.11’, ‘showRate’: False, ‘heal’: 36, ‘healRate’: ‘40.00’, ‘showHeal’: True, ‘name’: ‘吉林’}
{‘confirm’: 76, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘1.32’, ‘showRate’: False, ‘heal’: 14, ‘healRate’: ‘18.42’, ‘showHeal’: True, ‘name’: ‘新疆’}
{‘confirm’: 75, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 9, ‘healRate’: ‘12.00’, ‘showHeal’: True, ‘name’: ‘内蒙古’}
{‘confirm’: 71, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 42, ‘healRate’: ‘59.15’, ‘showHeal’: True, ‘name’: ‘宁夏’}
{‘confirm’: 63, ‘suspect’: 0, ‘dead’: 2, ‘deadRate’: ‘3.17’, ‘showRate’: False, ‘heal’: 4, ‘healRate’: ‘6.35’, ‘showHeal’: True, ‘name’: ‘香港’}
{‘confirm’: 23, ‘suspect’: 0, ‘dead’: 1, ‘deadRate’: ‘4.35’, ‘showRate’: False, ‘heal’: 2, ‘healRate’: ‘8.70’, ‘showHeal’: True, ‘name’: ‘台湾’}
{‘confirm’: 18, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 15, ‘healRate’: ‘83.33’, ‘showHeal’: True, ‘name’: ‘青海’}
{‘confirm’: 10, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 5, ‘healRate’: ‘50.00’, ‘showHeal’: True, ‘name’: ‘澳门’}
{‘confirm’: 1, ‘suspect’: 0, ‘dead’: 0, ‘deadRate’: ‘0.00’, ‘showRate’: False, ‘heal’: 1, ‘healRate’: ‘100.00’, ‘showHeal’: True, ‘name’: ‘西藏’}

数据说明：这些数据目前是字典

对于pandas数据分析

我们要把这些数据变成dataframe

然后可以导入到excel或者SQL中

5.4 将数据变成列表再变成dataframe

province_list = list()
for province in data_dict.get('areaTree')[0]['children']:
    province_info = province['total']
    province_info['name'] = province['name']
    province_list.append(province_info)
province_df = pd.DataFrame(province_list)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

#按照数据类型删除列
#include=包含什么类型, exclude=不包含什么类型
province_df = province_df.select_dtypes(exclude=['bool'])

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

5.5 查看dataframe数据

province_df

   
   
   
   
   
   
   
   
    
    
    
    1

5.6 安装pyecharts和echarts-china-provinces-pypkg

pip install pyecharts -i https://pypi.douban.com/simple

pip install echarts-china-provinces-pypkg -i https://pypi.douban.com/simple

5.7 删除没有用的两列

5.7.1 按照数据类型来删除datafram的列【重要】

1.先查看一下类型

province_list = list()
for province in data_dict.get('areaTree')[0]['children']:
    province_info = province['total']
    province_info['name'] = province['name']
    province_list.append(province_info)
province_df = pd.DataFrame(province_list)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

#按照数据类型删除列
#include=包含什么类型, exclude=不包含什么类型
province_df = province_df.select_dtypes(exclude=['bool'])

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

province_df.info()

   
   
   
   
   
   
   
   
    
    
    
    1

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 34 entries, 0 to 33
Data columns (total 7 columns):
confirm     34 non-null int64
dead        34 non-null int64
deadRate    34 non-null object
heal        34 non-null int64
healRate    34 non-null object
name        34 non-null object
suspect     34 non-null int64
dtypes: int64(4), object(3)
memory usage: 1.9+ KB

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10
    
    
    
    11
    
    
    
    12

2.目的

把两组布尔值的删掉

3.方法

#按照数据类型删除列
#include=包含什么类型, exclude=不包含什么类型
province_df = province_df.select_dtypes(exclude=['bool'])

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

4.参数的意思

include是包含什么类型

exclude是不包含什么类型

是两个选项

两个都不包含也可以写在一起

5.我们的处理

不包含布尔值

5.8 对原数据进行覆盖

province_df = province_df.select_dtypes(exclude=['bool'])#对原数据进行覆盖

   
   
   
   
   
   
   
   
    
    
    
    1

5.9 查看现在的数据

province_df

   
   
   
   
   
   
   
   
    
    
    
    1

六、定义地图，填充数据

6.1 pyecharts中的地图

6.2 安装导入pyecharts

pip install pyecharts -i https://pypi.douban.com/simple

pip install echarts-china-provinces-pypkg -i https://pypi.douban.com/simple

6.3 对当前的库pyecharts进行使用和讲解

6.3.1 他的地图map不支持一种格式

不认识series

我们刚才的pandas就是一列一列的series

6.3.2 解决办法

可以用tolist把省份的名称和累计确诊的数据转换成list

province_name = province_df.name.tolist()

province_confirm = province_df.confirm.tolist()

6.3.3 导入pyecharts的Map和options（配色，标题要用到）

from pyecharts.charts import Map

from pyecharts import options as opts #配色标题

6.3.4 Map.add的参数

压缩

因为索引是一样的，所以可以进行压缩，然后用for循环

china_map = Map()
#定义地图,填充数据
china_map.add('全国疫情分布',[tup for tup in zip(province_name,province_confirm)],'china')

这是一个列表生成器

尝试看一下

for tup in zip(province_name, province_confirm):
    print(tup)

(‘湖北’, 61682)
(‘广东’, 1331)
(‘河南’, 1262)
(‘浙江’, 1173)
(‘湖南’, 1008)
(‘安徽’, 986)
(‘江西’, 934)
(‘江苏’, 631)
(‘重庆’, 555)
(‘山东’, 544)
(‘四川’, 514)
(‘黑龙江’, 470)
(‘北京’, 393)
(‘上海’, 333)
(‘河北’, 306)
(‘福建’, 293)
(‘广西’, 244)
(‘陕西’, 242)
(‘云南’, 173)
(‘海南’, 163)
(‘贵州’, 146)
(‘山西’, 131)
(‘天津’, 128)
(‘辽宁’, 121)
(‘甘肃’, 91)
(‘吉林’, 90)
(‘新疆’, 76)
(‘内蒙古’, 75)
(‘宁夏’, 71)
(‘香港’, 63)
(‘台湾’, 23)
(‘青海’, 18)
(‘澳门’, 10)
(‘西藏’, 1)

6.3.5 下一个参数写chaina，其他的国家也可以

china_map = Map()
#定义地图,填充数据
china_map.add('全国疫情分布',[tup for tup in zip(province_name,province_confirm)],'china')

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

6.3.6 运行，查看地图

七、填充地图颜色部分的说明

人数不同，颜色不同的配色

7.1 颜色配置放在这里

#填充
china_map.set_global_opts(title_opts=opts.TitleOpts(title='中国加油!武汉加油!'),\
                          visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3

7.1.1 颜色配置必须是list包裹dict

7.1.2 1-9人之类的范围我们改一下颜色

#颜色配置 必须是一个list包裹dict
pieces = [
    {'min':1,'max':9,'color':'#FFE0E0'},
    {'min':10,'max':99,'color':'#FFC0C0'},
    {'min':100,'max':499,'color':'#FF9090'},
    {'min':500,'max':999,'color':'#FF6060'},
    {'min':1000,'max':9999,'color':'#FF3030'},
    {'min':10000,'color':'#DD0000'},

]

china_map = Map()
#定义地图,填充数据
china_map.add(‘全国疫情分布’,[tup for tup in zip(province_name,province_confirm)],‘china’)
#填充
china_map.set_global_opts(title_opts=opts.TitleOpts(title=‘中国加油!武汉加油!’),
visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))
#打印地图
china_map.render_notebook()

八、打印地图

#打印地图
china_map.render_notebook()

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2

九、数据存储

9.1 看一下各个值

import requests
import json
import pandas as pd
from sqlalchemy import create_engine

def getData():
url = ‘https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5’
headers = {
‘user-agent’: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36’
}
r = requests.get(url,headers)
if r.status_code == 200:
return json.loads(json.loads(r.text)[‘data’])
data_dict = getData()

data_dict.keys()

   
   
   
   
   
   
   
   
    
    
    
    1

dict_keys(['lastUpdateTime', 'chinaTotal', 'chinaAdd', 'isShowAdd', 'showAddSwitch', 'chinaDayList', 'chinaDayAddList', 'dailyNewAddHistory', 'dailyDeadRateHistory', 'dailyHealRateHistory', 'areaTree', 'articleList'])

   
   
   
   
   
   
   
   
    
    
    
    1

9.2 保存到mysql

9.3 链接数据库

#配置数据库链接字符串
conn = "mysql+pymysql://root:[email protected]:3306/info?charset=utf8"

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2

9.4 保存每天的数据，行变列

#保存每天的总数据
total = data_dict['chinaTotal']
total['date'] = data_dict['lastUpdateTime'].split()[0]
total_df = pd.DataFrame(pd.Series(total)).T

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

9.5 数赋值给dataframe

#保存每天的总数据
total = data_dict['chinaTotal']
total['date'] = data_dict['lastUpdateTime'].split()[0]
total_df = pd.DataFrame(pd.Series(total)).T

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

9.6 数据类型的转换

改类型，现在都是字符串

int32更小节省空间、

-1是不要改最后一列

#数据类型转换
for i in total_df.iloc[:,:-1].columns:
    total_df.loc[:,i] = total_df.loc[:,i].astype('int32')
total_df.loc[:,'date'] = pd.to_datetime(total_df.loc[:,'date'])

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4

total_df.iloc[:,:-1].astype('int32').info()

<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 1 entries, 0 to 0
Data columns (total 6 columns):
confirm 1 non-null int32
heal 1 non-null int32
dead 1 non-null int32
nowConfirm 1 non-null int32
suspect 1 non-null int32
nowSevere 1 non-null int32
dtypes: int32(6)
memory usage: 104.0 bytes

改好了：

#数据类型转换
for i in total_df.iloc[:,:-1].columns:
    total_df.loc[:,i] = total_df.loc[:,i].astype('int32')
total_df.loc[:,'date'] = pd.to_datetime(total_df.loc[:,'date'])
total_df.info(0)

<class ‘pandas.core.frame.DataFrame’>
RangeIndex: 1 entries, 0 to 0
Data columns (total 7 columns):
confirm 1 non-null int32
heal 1 non-null int32
dead 1 non-null int32
nowConfirm 1 non-null int32
suspect 1 non-null int32
nowSevere 1 non-null int32
date 1 non-null datetime64[ns]
dtypes: datetime64[ns](1), int32(6)
memory usage: 112.0 bytes

最后一列是data

特别处理了

9.7 sql语句

#sql语句
total_df.to_sql('china_total',conn,index=False,if_exists='append')

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2

9.8 数据传进来了

9.9 保存数据

9.9.1 国家数据

country_list = list()
for country in data_dict['areaTree']:
#     print(data_dict['lastUpdateTime'],country['name'],country['today'],country['total'])
    country_dict = country['total']
    country_dict['add_confirm'] = country['today']['confirm']
    country_dict['name'] = country['name']
    country_dict['date'] = data_dict['lastUpdateTime']
    country_list.append(country_dict)
country_df = pd.DataFrame(country_list)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9

#删除bool值
country_df= country_df.select_dtypes(exclude=['bool'])
#把比例修改成浮点型
country_df.loc[:,['deadRate','healRate']] = country_df.loc[:,['deadRate','healRate']].astype('float32')
#把时间修改成时间序列类型
country_df.date = pd.to_datetime(country_df.date)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

country_df.to_csv('country_df.csv')

   
   
   
   
   
   
   
   
    
    
    
    1

9.9.2 中国各个省份数据

city_list = list()
for pro in data_dict['areaTree'][0]['children']:
    for city in pro['children']:
        city_dict = city['total']
        city_dict['add_confirm'] = city['today']['confirm']
        city_dict['city_name'] = city['name']
        city_dict['province_name'] = pro['name']
        city_dict['date'] = data_dict['lastUpdateTime']
        city_list.append(city_dict)
city_df = pd.DataFrame(city_list)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6
    
    
    
    7
    
    
    
    8
    
    
    
    9
    
    
    
    10

#删除bool值
city_df= city_df.select_dtypes(exclude=['bool'])
#把比例修改成浮点型
city_df.loc[:,['deadRate','healRate']] = city_df.loc[:,['deadRate','healRate']].astype('float32')
#把时间修改成时间序列类型
city_df.date = pd.to_datetime(city_df.date)

   
   
   
   
   
   
   
   
    
    
    
    1
    
    
    
    2
    
    
    
    3
    
    
    
    4
    
    
    
    5
    
    
    
    6

city_df.to_excel('city_df.xlsx',sheet_name='city',index =False)

   
   
   
   
   
   
   
   
    
    
    
    1


            
                                            
            
                
                    
                    点赞
                    5
                    
                    收藏
                    分享
                    
                                            
                                            
                        
                        
                        
                        
                            文章举报
                        
                    
                                        
            
                        
        
            
                
                                        
                                
            
                                    汪雯琦
                                        
                发布了492 篇原创文章 · 获赞 553 · 访问量 6万+
            
                            
                                        私信
                    
                                                        已关注

你可能感兴趣的:(数据分析项目实战1)

一篇文章带你了解-selenium工作原理详解程序员笑笑软件测试 selenium 测试工具软件测试自动化测试功能测试程序人生职场和发展
前言Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
Selenium工作原理详解天才测试猿 selenium 测试工具自动化测试软件测试测试用例 python 职场和发展
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用
设计模式之装饰器模式周努力. 设计模式设计模式装饰器模式
装饰器模式(Decorator)依然是我们设计模式中的结构型模式，其中的构造思想仍然是对多个类进行组合使用，以达成系统调用实现指定功能的设计模式。装饰器模式不论在我们日常开发过程中还是在我们提升技术阅读源码过程中都是比较常见的，但是整体学习这个模式的思路难度不大，接下来我将详细讲解此设计模式。目录1.概念2.代码实现3.应用场景4.装饰器模式与代理模式的区别1.概念我们前期所讲到的适配器模式，是连
git runner 配置_gitlab-ci配置详解(一) 夏天的sunnyrain git runner 配置
近期因为折腾gitlab-ci，专门去翻了很多文档，想想貌似自己挺傻的。按照官网教程本来biubiubiu就弄好了，非自己折腾了好几天，还没啥积累，真是作。想想唯一能积累的就是ci的配置详解了。该文基于最新版GitLabCommunityEdition10.1.1和GitLabRunner9.5.1-1使用.gitlab-ci.yml配置你的项目这篇文档描述了.gitlab-ci.yml的用法，本
OpenManus 架构的详细技术实现大势下的牛马搭建本地gpt 架构 OpenManus Manus Agent
一、OpenManus架构的详细技术实现1.核心分层架构的深度解析底层：LLM层模型选择与适配：OpenManus允许用户替换底层LLM（如mPLUG-Owl3、Qwen、Llama等），通过统一接口调用模型API，实现跨模型兼容性Prompt工程设计：用户输入的自然语言指令通过精心设计的Prompt转换为结构化指令。例如，PlanningTool使用预定义的Prompt模板（如请将任务分解为可执
新书速览|云原生Kubernetes自动化运维实践全栈开发圈云原生运维 kubernetes
《云原生Kubernetes自动化运维实践》本书内容：《云原生Kubernetes自动化运维实践》以一名大型企业集群运维工程师的实战经验为基础，全面系统地阐述Kubernetes（K8s）在自动化运维领域的技术应用。《云原生Kubernetes自动化运维实践》共16章，内容由浅入深，逐步揭示K8s的原理及实际操作技巧。第1章引领读者踏入Kubernetes的世界，详细介绍其起源、核心组件的概念以及
05.列表标签龙哥带你学编程 #html css
一、列表简介列表是网页中最常用的一种数据排列方式。有序列表：有先后顺序之分无序列表：无先后顺序之分定义列表：带有特殊含义的列表二、有序列表1、语法格式有序列表中的各个列表项是有顺序的…列表项列表项注意：ol和li是配合一起使用的，不可以单独使用；ol的子标签只能是li标签，不能是其他标签。2、基本特征有序列表是由有顺序的列表项组成的有序列表一般采用数字或字母作为顺序，默认采用数字顺序是块元素独占一
C# 设计模式之桥接模式鲤籽鲲 C#c#设计模式桥接模式
总目录前言1基础介绍定义：将抽象部分与实现部分分离，使它们都可以独立地变化。桥模式不能只认为是抽象和实现的分离，它其实并不仅限于此。其实两个都是抽象的部分，更确切的理解，应该是将一个事物中多个维度的变化分离。一个维度可以认为是抽象部分，另一个维度可以认为是实现部分，而这两个维度可以独立扩充和维护。桥接模式中的角色：抽象化角色(Abstraction)：定义抽象类的接口，一般为抽象类，规范Refin
一文读懂什么是服务器小熊猫Q 服务器科普服务器运维
服务器基础介绍介绍服务器相关基础知识，如服务器分类、组成、机箱内部构造等，个人公众号：SRE杂谈，欢迎关注1、什么是服务器？服务器品牌有惠普、戴尔、浪潮、华为、华三、曙光等，各厂商服务器型号存在差异，惠普DL380G10、戴尔PowerEdgeR750、浪潮NF5280M5、华为2288HV5、曙光R6230HA一般用SN序列号和资产编号来对服务器进行标识，其中SN为唯一标识2、服务器演进2.1、
第十五届蓝桥杯省赛PythonB组B题【数字串个数】题解（AC）信奥郭老师蓝桥杯职场和发展
设n=10000n=10000n=10000。法一枚举333的个数以及777的个数，假设333的个数为iii，777的个数为jjj，那么非3,73,73,7的个数即为n−i−jn-i-jn−i−j。在长度为nnn的字符串中选取iii的方案数为CniC^i_nCni，在剩余n−in-in−i个位置选取jjj个的方案数为Cn−ijC^j_{n-i}Cn−ij，剩余位置个数为n−i−jn-i-jn−i−
WRF移动嵌套结合伏羲模型与CFD（PALM）高精度多尺度降尺度分析研究 Hardess-god WRF 算法人工智能
随着大气科学与数值模拟技术的发展，高精度多尺度气象模拟日益成为科研与应用的热点问题。本文将详细介绍如何使用WRF移动嵌套技术结合伏羲（Fuxi）模型，并通过CFD模型PALM实现精细化降尺度，以满足城市或区域局地精细化气象预报的需求。1.技术路线概述WRF移动嵌套（MovingNesting）：动态调整高分辨率嵌套网格位置，追踪天气系统（如台风、强对流系统）以提高局地预报精度。伏羲（Fuxi）模型
Fluent 与 Openfoam 网格比较 Hardess-god CFD 服务器
ANSYSFluent和OpenFOAM是两个广泛使用的计算流体动力学（CFD）软件，它们在网格生成、处理和使用方面存在一些基本差异。这些差异主要源于两者的设计哲学、目标用户群体和工作流程。以下是Fluent和OpenFOAM在网格生成方面的一些关键比较：1.网格生成工具ANSYSFluent:Fluent通常与ANSYSWorkbench集成使用，后者提供了一个强大的网格生成工具（如ANSYSM
postgreSQL数据库常用语法东木月关系型数据库：MySQL PostgreSQL postgresql 数据库 database
postgreSQL常用语法1、CRUD增删改查创建用户角色createuserldcwithpassword'ldc-';创建数据库createDATABASEschool_infoENCODING='utf-8'--指定字符集TABLESPACE=
遗传算法均匀变异 huahua20190514
importnumpyasnpimportrandompop_1=np.array([[1,11,21,9,16,10,8,17],[2,12,22,10,17,11,9,18],[3,13,23,11,18,12,10
纯「牛马」的逻辑玩儿不转了！求职面试职场创业创业者
又在微信群里被「声讨」了，距离上次这等待遇也过去一段时间了，让人有点「怀念」呢～（别瞎想，我不是字母！）我想此刻趁这心情还未消散殆尽，把近期一直想说但没说的话先说一遍，也暂时不管它是否严谨了，看完想吐槽就尽管来吧！麻木的纯「牛马」们在2022年11月末，ChatGPT的横空出世拉开了AI时代的帷幕，迄今为止两年多过去了，相关基础设施和上层应用已经涌现并迭代了很多版本。在这期间，很多人都至少听说过几
【赵渝强老师】在Docker中运行达梦数据库数据库docker
Docker是一个客户端服务器（Client-Server）架构。Docker客户端和Docker守护进程交流，而Docker的守护进程是运作Docker的核心，起着非常重要的作用（如构建、运行和分发Docker容器等）。达梦官方提供了DM8在Docker容器中进行部署的镜像文件，下面通过具体的步骤进行演示。视频讲解如下：https://www.bilibili.com/video/BV1yBfB
01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员量子位
一个超越DeepSeekGRPO的关键RL算法出现了！用上该算法后，Qwen2.5-32B模型只经过RL训练，不引入蒸馏等其他技术，在AIME2024基准上拿下50分，优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen，且DAPO使用的训练步数还减少了50%。这个算法名为DAPO，字节、清华AIR联合实验室SIALab出品，现已开源。论文通讯作者和开源项目负责人都
CSP-J备考冲刺必刷题（C++） | AcWing 1253 家谱热爱编程的通信人 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】Acwing：1253.家谱-AcWing题库
重塑家用机器人大脑！云鲸旗舰机型逍遥002搭载旭日5正式开售量子位
2025年3月20日，全球家庭清洁机器人明星品牌云鲸智能携最新一代旗舰机型——云鲸逍遥002，亮相中国家电及消费电子博览会（AWE）。该产品以”AI智能深度清洁“为核心，基于地瓜机器人全新一代旭日5智能计算芯片，推出首创的双目AI视觉感知自适应系统，以10TOPs的端侧算力与180万点/秒的3D稠密深度点云生成能力，为家庭场景带来毫米级障碍测距精度与语义级环境理解，是家庭清洁机器人智能化演进的又一
“三分钟”带你看懂批次管理!（一） wms系统
一、批次管理的定义与重要性1.批次管理的定义：批次管理是一种针对产品或物料的管理方法，它将同一生产周期或相同条件下生产、具有一致质量特征、生产信息和使用属性的产品组作为一个批次，进行分类、标识、追踪和管理。2.批次管理的重要性：提高可追溯性：精准追踪物料和产品的来源、去向及生命周期，在质量问题或召回需求出现时，能快速锁定问题批次，降低损失。增强质量控制：监控不同批次产品的质量指标，及时发现和分析质
分析K8S中Node状态为`NotReady`问题网络飞鸥 Kubernetes kubernetes 容器云原生
在Kubernetes（k8s）集群中，Node状态为NotReady通常意味着节点上存在某些问题，下面为你分析正常情况下节点应运行的容器以及解决NotReady状态的方法。正常情况下Node节点应运行的容器1.kubeletkubelet是节点上的核心组件，它负责与控制平面通信，管理节点上的容器生命周期。它通常作为系统服务运行，而不是以容器形式存在，但也有使用容器化部署的情况。2.kube-pr
GitLab：构建自动化流水线教程_2024-07-18_02-20-35.Tex chenjj4003 游戏开发 gitlab 自动化运维 github 安全 git elasticsearch
GitLab：构建自动化流水线教程GitLab基础介绍GitLab的历史与发展GitLab是一个开源的版本控制系统，最初由乌克兰开发者DmitriyZaporozhets和ValerySizov在2011年创建。它最初是作为GitHub的替代品而设计的，旨在提供一个自我托管的Git仓库管理解决方案。随着时间的推移，GitLab不断发展，引入了持续集成/持续部署（CI/CD）功能，使其成为一个全面的
【2017-2025】Adobe Photoshop【PS】软件下载安装 adkjcbqvblq adobe photoshop ui
获取安装包https://pan.baidu.com/s/1NLUthiAyC2chlSEwbf1LRQ?pwd=4ppq1.起源与发展1.1初试啼声AdobePhotoshop的历史可以追溯到1987年，当时由托马斯·诺尔（ThomasKnoll）和他的兄弟约翰·诺尔（JohnKnoll）共同开发。托马斯在父亲的帮助下，开始了图像处理的编程尝试。他们的初始产品是一个用于Mac系统的程序，最初名为
NVMe（Non-Volatile Memory Express）详解美好的事情总会发生高速接口嵌入式硬件硬件工程智能硬件
一、NVMe的定义与核心特性NVMe（非易失性内存主机控制器接口规范）是一种基于PCIe总线的高性能存储协议，专为固态硬盘（SSD）设计，旨在替代传统的AHCI协议（如SATA）。其核心特性包括：低延迟：命令队列深度提升至64K（AHCI仅32），减少I/O等待时间（典型延迟<100μs）。高吞吐量：支持PCIe4.0x4带宽（8GB/s），PCIe5.0x4可达16GB/s。多队列并行：支持多核
行业分析---小米汽车2024全年财报智能汽车人人工智能行业研究汽车自动驾驶
1背景其实，关于小米汽车，笔者之前已经多次介绍过了，包括小米汽车成功的原因、智驾进展以及雷军个人的魅力，见博客《自动驾驶---小米汽车智驾进展》和《微自传系列---雷军》。小米汽车取得的成绩，出乎很多人的意料，其它新势力车企花了5---10年的时间，小米汽车三年就成功造出了第一辆车，在小米SU7月销2万+的同时，获得了非常不错的口碑。并且在刚刚发布的财报中，小米汽车在第一个完整财年的财务表现也是相
清华出品DeepSeek教程1-7版：前沿技术学习的黄金资源库你好ITgg pdf
《清华出品DeepSeek教程1-7版：前沿技术学习的黄金资源库》「DeepSeek清华资料」共7册链接：https://pan.quark.cn/s/b8d8760976ca「DeepSeek使用手册大全」链接：https://pan.quark.cn/s/52c234062a2e「DeepSeek资料合集」链接：https://pan.quark.cn/s/71c8604f0e8a「DeepS
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测计算机C9硕士_算法工程师人工智能 YOLO 目标检测遥感
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测，从安装依赖项、准备数据集、配置YOLOv8、训练和评估模型以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1加载预训练模型或自定义模型4.训练模型5.评估模型6.构建GUI应用程序（可选）以下文字及代码仅供参考。遥感目标检测，AI-TOD数据集aitod，训练集11214张，测试集集14018，验证集
蓝桥杯2024年第十五届省赛真题-魔法巡游（Python）罄竹_ python刷题 python 蓝桥杯算法
前言本文参考了FJ_EYoungOneC的文章思路，并且修改了该文章的某些理解上的偏差。一、题目题目来源：dotcpp题目描述在蓝桥王国中，两位魔法使者，小蓝与小桥，肩负着维护时空秩序的使命。他们每人分别持有N个符文石，这些石头被赋予了强大的力量，每一块上都刻有一个介于1到109之间的数字符号。小蓝的符文石集合标记为s1,s2,...,sN，小桥的则为t1,t2,...,tN。两位魔法使者的任务是
设计模式之桥接模式周努力. 设计模式设计模式桥接模式 java
目录1.概念2.代码实现3.应用场景桥接模式(BridgePattern)也是我们结构型设计模式的一种，桥接模式整体来说对于开发者需要深刻理解好抽象类这个概念，而且比较考验在开发前就要设计好桥接点来进行开发，所以整体的理解难度我认为是比较高，接下来我将从概念和一个示例来演示该模式。1.概念桥接模式就是将抽象与实现解藕，使两者都可以独立变化。在现实生活中，某些类具有两个或多个维度的变化，如图形既可按
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。