xiaosakun

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析

pandas是python中的数据分析库，matplotlib、pyecharts是python中的数据可视化库。
容大教育人工智能班数据分析阶段实战项目：人工智能相关职位数据分析
小组成员：雷坤、韦民童、李波、陶宇
项目周期5天，数据分析为第2天的需求。

0.下载数据集

小组成员利用爬虫收集各大招聘网站的人工智能相关岗位信息，小组分工：

姓名	网站	网址
雷坤	中华英才网	www.chinahr.com
李波	智联招聘	www.zhaopin.com
韦民童	拉勾网	www.lagou.com
陶宇	前程无忧51job	www.51job.com

本文中使用的数据集是前程无忧51job网站爬虫收集的职位信息。
数据集下载链接: https://pan.baidu.com/s/1XyKcm_KlV5jO6aQSQMWb7A 密码: wyar

1.观察数据

1.1解压压缩文件

将压缩文件解压，如下图所示：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第1张图片

image.png

1.2打开jupyter notebook

在人工智能职位信息_前程无忧51job文件夹同级目录下打开powershell
powershell输入命令并运行:jupyter notebook

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第2张图片

image.png

1.3新建dataAnalysis.ipynb文件

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第3张图片

新建ipynb文件.png

新建ipynb文件完成后重命名，重命名按钮位置如下图所示：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第4张图片

image.png

1.4.查看数据

import pandas as pd
df = pd.read_csv('人工智能.csv', engine='python', encoding='utf8')
print(df.shape)
print(len(df.columns), df.columns)
df.head()

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第5张图片

image.png

2.数据处理

2.1 删除空行

print('删除空行前共有%d行' %len(df))
df = df.dropna(how='all')
print('删除空行后共有%d行' %len(df))

上面一段代码的运行结果如下：

删除空行前共有14383行
删除空行后共有14304行

从上面的运行结果可以看出，一共删除了14383-14304=79行。

3.绘制词云图

3.1 词频统计

利用jieba库进行中文分词，jieba.cut方法的返回值数据类型为生成器generator。

import pandas as pd
import jieba

df = pd.read_csv('人工智能.csv', engine='python', encoding='utf8')
allText = ' '.join(df.jobRequirement.dropna().map(str.lower))
top200_keyword = pd.value_counts(list(jieba.cut(allText))).iloc[:200]
print(top200_keyword.iloc[:50])

通过上面一段代码运行可以查看分词后统计词频排名前50的关键词。
本文作者通过分词统计词频和手动添加关键词的方法形成关键词词库。

3.2 下载人工智能关键词词库

此词库是本文作者观察数据后根据现实情况编辑的词库，只有43个关键词。
读者绘制词云图时可以自行尝试多添加关键词。
关键词词库下载链接: https://pan.baidu.com/s/1o-yrnZe6cyqJaYTuLcR1HA 密码: q6yi
下载后将词库放到人工智能职位信息_前程无忧51job文件夹中。

3.3 编写代码

利用str对象的count方法可以统计字符串中某个子字符串出现的次数，这个方法效率非常高。

from pyecharts import WordCloud
import pandas as pd

def drawWordCloud(allText):
    with open('keyword.txt', encoding='utf-8') as file:
        keyword_list = [k.strip() for k in file.readlines()]
    count_list = []
    for keyword in keyword_list:
        count_list.append(allText.count(keyword))
    top20_keyword = pd.Series(count_list, index=keyword_list).sort_values(ascending=False).iloc[:10]
    print(top20_keyword)
    wordcloud = WordCloud(width=900, height=600)
    wordcloud.add('', keyword_list, count_list, word_size_range=[20,100])
    return wordcloud

df = pd.read_csv('人工智能.csv', engine='python', encoding='utf8')
allText = ' '.join(df.jobRequirement.dropna().map(str.lower))
print('字符串allText变量的长度:',len(allText))
drawWordCloud(allText)

上面一段代码的运行结果如下：

字符串allText变量的长度: 7164775
人工智能 13262
培训 12148
算法 6389
大数据 5486
科技 5249
计算机 5145
互联网 4954
上海 3597
北京 3139
机器学习 2681
dtype: int64

绘制的词云图：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第6张图片

词云图.png

分析结论：
人工智能培训很火热，工作中对算法要求多，与大数据相关度高。

4.全国城市的岗位需求量分析

4.1 数据处理

招聘信息当中的工作地点信息在tags字段中，该字段以“|”为分隔符，包含工作地点workPlace、工作经验要求experienceRequirement、学历要求educationRequirement、招聘人数、发布时间publishTime这5个字段。
工作地点workPlace以“-”为分隔符，包含市和区。

import pandas as pd

df = pd.read_csv('人工智能.csv', engine='python', encoding='utf8')
workPlace = df.tags.dropna().map(lambda x:x.split('|')[0].strip())
city = workPlace.map(lambda x:x.split('-')[0])
region = workPlace.map(lambda x:x.split('-')[1] if len(x.split('-'))>1 else '')

4.2 统计地区岗位需求量

city_jobCount = city.value_counts(ascending=False).iloc[:10]
city_jobCount

上面一段代码的运行结果如下：

上海 3027
北京 1835
深圳 1647
广州 1259
杭州 1158
成都 553
武汉 545
南京 448
苏州 406
石家庄 290
Name: tags, dtype: int64

4.3 数据可视化-柱形图

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.figure(figsize=(10,6))
city_jobCount.plot(kind='bar')
plt.show()

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第7张图片

柱形图.png

4.4 分析结论

从上面的运行结果可以看出，人工智能相关职位上海需求量最高，之后分别是北京、深圳、广州、杭州、成都等城市。

5.上海地区的岗位需求量分析

5.1 统计上海各区岗位需求量

import pandas as pd

df = pd.read_csv('人工智能.csv', engine='python', encoding='utf8')
workPlace = df.tags.dropna().map(lambda x:x.split('|')[0].strip())
city = workPlace.map(lambda x:x.split('-')[0])
region = workPlace.map(lambda x:x.split('-')[1] if len(x.split('-'))>1 else '')
shanghai_region = region[city=='上海']
region_count_series = shanghai_region.value_counts().drop([''])
region_count_series

上面一段代码的运行结果如下：

浦东新区 579
徐汇区 347
嘉定区 266
杨浦区 224
静安区 162
闵行区 148
宝山区 131
普陀区 106
黄浦区 103
松江区 99
奉贤区 77
长宁区 72
虹口区 63
青浦区 54
金山区 28

5.2 数据可视化-热力图

安装pyecharts库绘制热力图需要的中国城市地图库，cmd命令：pip install echarts-china-cities-pypkg

from pyecharts import Map

map1 = Map('上海各区岗位需求量', width=900, height=800)
attr = region_count_series.index
value = region_count_series.values/region_count_series.max() * 100
map1.add('', attr, value, maptype='上海', is_visualmap=True, is_label_show=True)
map1

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第8张图片

热力图.png

5.3 数据可视化-饼图

from pyecharts import Pie

attr = region_count_series.index
value = region_count_series.values
pie = Pie('上海各区岗位需求占比', title_pos='center', width = 900, height=600)
pie.add('', attr, value, is_label_show=True, legend_pos='left', legend_orient="vertical",)
pie

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第9张图片

饼图.png

5.4 分析结论

从上面的运行结果可以看出，上海市的人工智能相关职位需求量浦东新区最高，之后分别是徐汇区、嘉定区、杨浦区、静安区等。

6.学历要求分析

该数据分析部分由李波完成，使用pyecharts库绘制饼图。
数据集为智联招聘网站爬虫收集的数据。
数据集下载链接: https://pan.baidu.com/s/1W5F9OZph3PnunAahj68fUw 密码: bf8t

6.1 定义绘制饼图函数

定义drawPie函数，需要传入2个参数，第1个参数series是传入的可迭代对象，第2个参数title是图的标题。

from pyecharts import Pie
import pandas as pd

def drawPie(series, title):
    series = pd.Series(series)
    count_series = series.value_counts(ascending=False)
    count_series = count_series[count_series/count_series.sum()>0.01]
    pie = Pie(title, title_pos='center', width=900, height=600)
    pie.add("", count_series.index, count_series.values, 
            radius=[30, 75],       
            is_label_show=True, 
            legend_orient='vertical',        
            legend_pos='left') 
    return pie

6.2 数据处理和可视化-饼图

df = pd.read_excel('人工智能_李波.xls')
df.columns = [k.strip() for k in df.columns]
drawPie(df.educationRequirement, '学历要求占比饼图')

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第10张图片

学历要求占比饼图.png

6.3 分析结论

人工智能相关岗位的学历要求占比最大的为大专，明显违背实际情况。
造成此结果的可能原因如下：
1.智联招聘网站对于招聘信息的审核不严格。
2.智联招聘网站搜索的返回结果混乱，不能给求职者带来有效信息。
3.没有做删除非人工智能岗位信息条目的数据清洗操作。

6.4 前程无忧51job网站对比

项目第4天重新进行了数据处理
前程无忧51job网站经过数据处理的数据集下载链接: https://pan.baidu.com/s/1KGvJ8ZtN37kL5y05-dC-Kg 密码: wa92

import pandas as pd

df = pd.read_csv('51job.csv')
drawPie(df.educationRequirement, '学历要求占比饼图')

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第11张图片

学历要求占比饼图.png

通过上面2个网站的对比分析，51job网站的职位学历要求更符合人工智能岗位的实际情况。

6.5 拉勾网对比

下面代码成功运行的前提是6.1节的画饼图函数drawPie先运行。
拉勾网数据集下载链接: https://pan.baidu.com/s/1nxaVTsPKttgleZ5oY1139w 密码: 7cm6
在数据集文件夹中编辑代码文件，代码如下：

keyword_list = ['NLP', '机器学习', '人工智能', '人脸识别', '深度学习',
               '算法研究员', '图像识别', '无人驾驶', '语音识别']
fileName_list = [k+'.csv' for k in keyword_list]
df_list = [pd.read_csv(open(fileName, encoding='utf8')) for fileName in fileName_list]
df_all = pd.concat(df_list)
df_all = df_all.reset_index(drop=True)
drawPie(df_all['学历要求'].str.strip('及以上'), '学历要求占比饼图-拉勾网')

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第12张图片

学历要求占比饼图-拉勾网.png

对比分析结论：
1.51job网站的职位学历要求更符合人工智能岗位的实际情况。
2.拉勾网的职位学历要求更高，可以在拉勾网找较高标准的工作。

7.人工智能相关职位的薪资对比

数据集是拉勾网人工智能相关职位招聘信息，即6.5节的数据集。

7.1 数据处理

import pandas as pd 

keyword_list = ['NLP', '机器学习', '人工智能', '人脸识别', '深度学习',
               '算法研究员', '图像识别', '无人驾驶', '语音识别']
fileName_list = [k+'.csv' for k in keyword_list]
df_list = [pd.read_csv(open(fileName, encoding='utf8')) for fileName in fileName_list]
salary_list = [df['薪资区间'].dropna() for df in df_list]  
salary_list2 = [salary[salary.str.contains('-')] for salary in salary_list]
salary_list3 = [salary.map(lambda x:x.lower().replace('k','000')) for salary in salary_list2]

7.2 查看数据

for salary in salary_list3:
    print(len(salary))

上面一段代码的运行结果如下：

445
897
448
450
447
448
899
235
445

7.3 数据转换

获取各种人工智能相关职位薪酬的较低值、较高值、平均值。
对于列表推导式、匿名函数要比较熟练才能看懂下面的代码。
Series对象的map方法需要传入一个参数，参数数据类型为函数对象，返回值数据类型也为Series。
Seies对象的quantile方法可以得到从小到大排序位置的数，例如quantile(0.5)得到从小到大排序50%位置的数，即中位数；quantile(0.25)得到从小到大排序25%位置的数，即下四分位数；quantile(0.75)得到从小到大排序75%位置的数，即上四分位数。

import numpy as np
salaryLow_list = [salary.map(lambda x:int(x.split('-')[0])).quantile(0.5) for salary in salary_list3]
salaryHigh_list = [salary.map(lambda x:int(x.split('-')[1])).quantile(0.5) for salary in salary_list3]
salaryAvg_list = [salary.map(lambda x:np.average([int(k) for k in x.split('-')])).quantile(0.5) for salary in salary_list3]

7.4 数据可视化-柱状图

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.figure(figsize=(18,8))
min_x = range(1, 42, 5)
max_x = range(2, 43, 5)
avg_x = range(3, 44, 5)
plt.bar(min_x, salaryLow_list, color='b', label='薪酬较低值')
plt.bar(max_x, salaryHigh_list, color='r', label='薪酬较高值')
plt.bar(avg_x, salaryAvg_list, color='g', label='薪酬平均值')
plt.xticks(range(2, 58, 5), keyword_list, fontsize=16)
plt.xlabel('人工智能相关职位', fontsize=12)
plt.ylabel('薪酬', fontsize=20)
plt.legend(fontsize=16)
plt.show()

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第13张图片

各种职位对比柱形图.png

7.5 取薪酬平均值作图

import numpy as np
salaryLow_list = [salary.map(lambda x:int(x.split('-')[0])).mean() for salary in salary_list3]
salaryHigh_list = [salary.map(lambda x:int(x.split('-')[1])).mean()  for salary in salary_list3]
salaryAvg_list = [salary.map(lambda x:np.average([int(k) for k in x.split('-')])).mean()  for salary in salary_list3]

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
plt.figure(figsize=(18,8))
min_x = range(1, 42, 5)
max_x = range(2, 43, 5)
avg_x = range(3, 44, 5)
plt.bar(min_x, salaryLow_list, color='b', label='薪酬较低值')
plt.bar(max_x, salaryHigh_list, color='r', label='薪酬较高值')
plt.bar(avg_x, salaryAvg_list, color='g', label='薪酬平均值')
plt.xticks(range(2, 44, 5), keyword_list, fontsize=16)

plt.xlabel('人工智能相关职位', fontsize=12)
plt.ylabel('薪酬', fontsize=20)
plt.legend(fontsize=16)
plt.show()

上面一段代码的运行结果如下：

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析_第14张图片

各种职位对比柱形图2.png

从上面的运行结果可以看出，采用数据的平均值和中值作图相差不大，比较具有可信度。
结论如下：
1.9种人工智能相关职位中，NLP的薪资待遇最高
2.深度学习、算法研究员的薪资待遇也不错
3.人工智能相关职位的较低薪资在1.5万左右
4.人工智能相关职位的平均薪资在2万左右
5.人工智能相关职位的较高薪资在3万左右

8.项目经理心得

1.分配给组员的需求要明确
2.表格名字段名统一
3.说明文档需要配图

jmeter录制过滤_Jmeter录制pc脚本 weixin_39757040 jmeter录制过滤
1.打开jmeter后可以看到左边窗口有个“测试计划”和“工作台”，右键“测试计划”，添加Threads(Users)→线程组，再右键线程组→添加配置元件→Http请求默认值Http请求默认值窗口下---在web服务器处的“服务器名称或IP”填上网址或IP(本地就填localhost的IP，端口填你部署的服务器端口，路径就填写域名后面的路径。2.可以有可以无。[作用：清楚所有录制的记录信息]3.右
python界面小游戏贪吃蛇_用Python实现童年小游戏贪吃蛇 weixin_39627052 python界面小游戏贪吃蛇
贪吃蛇作为一款经典小游戏，早在1976年就面世了，我最早接触它还是在家长的诺基亚手机中。尽管贪吃蛇的历史相对比较久远，但它却有着十分顽强的生命力，保持经久不衰，其中很重要的原因便是游戏厂家不断的对其进行更新迭代。现在，这款游戏无论是游戏场景、规则等都变得十分丰富。接下来，我们看一下如何通过Python简单的实现这款小游戏。规则要有游戏主界面、贪吃蛇、食物能够控制贪吃蛇移动并获取食物贪吃蛇吃了食物后
python怎么安装pymysql_Python中操作mysql的pymysql模块详解 weixin_39634876
前言pymsql是Python中操作MySQL的模块，其使用方法和MySQLdb几乎相同。但目前pymysql支持python3.x而后者不支持3.x版本。本文测试python版本：2.7.11。mysql版本：5.6.24一、安装pip3installpymysql二、使用操作1、执行SQL#!/usr/bin/envpytho#-*-coding:utf-8-*-importpymysql#创
用python操作浏览器的三种方式_经验 | python 操作浏览器的三种方式 weixin_39642619
第一种：selenium导入浏览器驱动，用get方法打开浏览器，例如：importtimefromseleniumimportwebdriverdefmac():#browser=webdriver.Chrome()#browser=webdriver.Firefox()browser=webdriver.Ie()browser.implicitly_wait(5)browser.get("htt
python与mysql交互_Python和Mysql交互 weixin_39703561 python与mysql交互
安装引入模块~安装mysql模块sudoapt-getinstallpython-mysqldb~在文件中引入模块importMySQLdbConnection对象用于建立与数据库的连接，创建对象：调用connect()方法conn=MySQLdb.connect(参数列表)其中参数列表有：host:连接的mysql主机，如果本机是'localhost'；port:连接的mysql主机的端口，默认
方舟生存进化mysql_基于MySQL 的 SQL 优化总结_卡盟,辅助 weixin_36307344 方舟生存进化mysql
SonarQube搭建手记dnf辅助基于MySQL的SQL优化总结在数据库运维过程中，优化SQL是DBA团队的一样平常义务。例行SQL优化，不仅可以提高程序性能，还能减低线上故障的概率。现在常用的SQL优化方式包罗但不限于：营业层优化、SQL逻辑优化、索引优化等。其中索引优化通常通过调整索引或新增索引从而到达SQL优化的目的。索引优化往往可以在短时间内发生异常伟大的效果。---来自美团手艺团队SQ
python中redirect如何传值_传递参数时重定向 - python 叫我柴先生
在烧瓶中，我可以这样做:render_template("foo.html",messages={'main':'hello'})如果foo.html包含{{messages['main']}}，则页面将显示hello。但是，如果有一条通往foo的路线怎么办:@app.route("/foo")defdo_foo():#dosomelogicherereturnrender_template("f
方舟生存进化mysql_一分钟明了MySQL聚簇索引和非聚簇索引_rust辅助,方舟生存进化辅助... 突发奇想的饭粒方舟生存进化mysql
SpringBoot整合rabbitmq辅助MySQL的InnoDB索引数据结构是B树，主键索引叶子节点的值存储的就是MySQL的数据行，通俗索引的叶子节点的值存储的是主键值，这是了解聚簇索引和非聚簇索引的条件什么是聚簇索引？很简单记着一句话：找到了索引就找到了需要的数据，那么这个索引就是聚簇索引，以是主键就是聚簇索引，修改聚簇索引实在就是修改主键。什么是非聚簇索引？索引的存储和数据的存储是星散的
程序执行原理（科普） weixin_30832983 python 操作系统
程序执行原理（科普）目标计算机中的三大件程序执行的原理程序的作用01.计算机中的三大件计算机中包含有较多的硬件，但是一个程序要运行，有三个核心的硬件，分别是：CPU中央处理器，是一块超大规模的集成电路负责处理数据／计算内存临时存储数据（断电之后，数据会消失）速度快空间小（单位价格高）硬盘永久存储数据速度慢空间大（单位价格低）CPU内存硬盘思考题计算机中哪一个硬件设备负责执行程序？CPU内存的
Hibernate中文版教程：快速入门与实践焦虑中
本文还有配套的精品资源，点击获取简介：Hibernate是一个高效的JavaORM框架，它通过对象关系映射简化数据库操作，使得开发人员能以面向对象的方式处理数据。本教程旨在为初学者提供一份详尽的Hibernate指南，涵盖了实体管理、会话管理、查询语言HQL、缓存机制等核心功能。教程还介绍了配置文件、映射文件、CriteriaAPI、CascadeType和FetchType、事务处理、关联映射、
鸿蒙系统是怎样一种系统,鸿蒙系统pc版怎么安装鸿蒙系统pc版安装教程焦虑中鸿蒙系统是怎样一种系统
鸿蒙系统pc版安装教程1.插入U盘，打开U盘制作软件rufus3.1。2.插入设备选项，选中下载的华为鸿蒙系统镜像文件，其他默认，点击开始。3.链接下载点击是，勾选以ISO镜像模式写入4.点击OK，等待U盘启动制作并写入华为鸿蒙系统完成5.把制作好的U盘插入电脑，开机启动按F12，选择U盘启动，台式机一般为：Delete键笔记本一般为：F2键惠普笔记本一般为：F10键联想笔记本一般为：F12键苹果
C#中的异步编程模型神之王楠 c#
在C#中，async和await关键字是用于异步编程的重要部分，它们允许你以同步代码的方式编写异步代码，从而提高应用程序的响应性和吞吐量。这种异步编程模型在I/O密集型操作（如文件读写、网络请求等）中特别有用，因为它允许线程在等待I/O操作完成时释放，从而执行其他工作。基本概念async：这是一个修饰符，用于标记一个方法、lambda表达式或匿名方法为异步的。异步方法包含一个或多个await表达式
C# 异步编程场景小码编匠 C#基础语法 c#异步编程 .net
前言异步编程允许程序在等待某些操作（如文件读写、网络请求等）完成时，不必阻塞主线程，从而可以继续执行其他任务。这种非阻塞的特性对于提高应用程序的并发性和响应速度至关重要。C#通过async和await关键字，以及Task类，为异步编程提供了简洁而强大的支持。本文将深入探讨C#中的异步编程场景，包括其基本概念、工作原理以及如何在实际开发中应用异步编程技术。我们将通过实例演示如何利用C#的异步特性来编
Flask 和阿里云 OSS 实现文件上传功能 ivwdcwso 开发 flask 阿里云 python oss
在本教程中,我们将学习如何使用Flask框架和阿里云对象存储服务(OSS)来创建一个简单而强大的文件上传应用。这个应用将允许用户通过Web界面上传文件,然后将文件安全地存储到阿里云OSS中,并返回可访问的文件URL。准备工作在开始之前,请确保您已经完成以下准备工作:安装Python(推荐Python3.7+)安装Flask:pipinstallflask安装阿里云OSSSDK:pipinstall
redis 工具类封装 swadian2008 Spring Boot redis redis spring boot java
目录1-在springboot项目的pom.xml2-在application.properties中配置redis参数3-编写redis的配置类4-编写redis的工具类5-测试类RedisController.java1-在springboot项目的pom.xml在配置文件里加入redis的jar依赖4.0.0com.demo.springbootspringbootdemo1.0-SNAPS
LeetCode 1426 题：数元素解题全解析 MasterNeverDown leetcode 算法职场和发展
LeetCode1426题：数元素解题全解析在算法的世界里，每一道题目都是一次挑战与探索。今天，我们来深入剖析LeetCode上的一道有趣题目——1426.数元素。一、题目剖析给定一个整数数组arr，这里有着独特的计数规则：对于元素x，唯有当x+1也在数组arr中时，这个x才能被记为1个数。特别要注意的是，若数组arr中有重复的数，每个重复的数都要单独依据此规则进行计算。比如，示例1中输入arr=
Leetcode416. 分割等和子集会流泪de鱼 Leetcode 算法数据结构动态规划
Leetcode416.分割等和子集题目：给你一个只包含正整数的非空数组nums。请你判断是否可以将这个数组分割成两个子集，使得两个子集的元素和相等。示例1：输入：nums=[1,5,11,5]输出：true解释：数组可以分割成[1,5,5]和[11]。示例2：输入：nums=[1,2,3,5]输出：false解释：数组不能分割成两个元素和相等的子集。题解：动态规划：数组长度ntarget\tex
【区间DP】力扣3040. 相同分数的最大操作数目 II hlc@ 动态规划精选 leetcode 深度优先算法
给你一个整数数组nums，如果nums至少包含2个元素，你可以执行以下操作中的任意一个：选择nums中最前面两个元素并且删除它们。选择nums中最后两个元素并且删除它们。选择nums中第一个和最后一个元素并且删除它们。一次操作的分数是被删除元素的和。在确保所有操作分数相同的前提下，请你求出最多能进行多少次操作。请你返回按照上述要求最多可以进行的操作次数。示例1：输入：nums=[3,2,1,2,3
HarmonyOS Next模型剪枝方法与实践 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中模型剪枝相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、模型剪枝原理与类型（一）基本原理在HarmonyOSNext的模型世界里，模型剪枝就像是给一棵枝繁叶茂的大树修剪枝叶，去除那些对整体结
HarmonyOS Next模型轻量化中的数据处理优化 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中模型轻量化相关的数据处理优化技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。一、数据处理对模型轻量化的影响（一）重要性分析在HarmonyOSNext的模型世界里，数据处理就像是为模型准备食材的厨师
鸿蒙Next应用国际化：语言与区域设置 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在应用国际化中语言与区域设置方面的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在当今全球化的应用开发中，提供多语言支持和灵活的区域设置功能是满足不同用户需求的关键。鸿蒙Next系统为开发者提供了丰
鸿蒙Next权限申请全攻略：系统授权与用户授权之道 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）在开发多语言电商平台方面的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在鸿蒙Next系统的应用开发中，权限申请是确保应用合法、安全且功能完备的关键环节。正确理解并运用系统授权与用户授权机制，不仅能
HarmonyOS Next企业级设备认证解决方案：基于Device Certificate Kit的多层级身份验证 SameX-4869 harmonyos php 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。在企业数字化转型的浪潮中，大量设备接入企业网络，保障设备的合法性和安全性成为了至关重要的任务。基于华为鸿蒙HarmonyOSNext系统，利用Devi
鸿蒙Next之数据同步艺术之一：方舟数据管理揭秘 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。本文将介绍华为鸿蒙HarmonyOSNext中的核心数据管理框架——方舟数据管理（ArkData），并探讨其在HarmonyOS系统中的角色和重要性。
[20250119]-前端面试题——React篇前端
[20250119]-前端面试题——React篇面试问题记录问题1请简单介绍一下React18有哪些更新。回答：React18的主要更新包括：并发渲染：React18引入了并发渲染（ConcurrentRendering），使得React能在后台进行渲染工作，避免阻塞UI更新，提升性能。自动批处理：React18会自动批处理多次setState更新，减少不必要的渲染，提升性能。useIdHook：
leetcode:37. 解数独关东老樊 leetcode leetcode 算法数据结构
题目链接：37.解数独文章目录题目描述思路代码题目描述编写一个程序，通过填充空格来解决数独问题。数独的解法需遵循如下规则：数字1-9在每一行只能出现一次。数字1-9在每一列只能出现一次。数字1-9在每一个以粗实线分隔的3x3宫内只能出现一次。（请参考示例图）数独部分空格内已填入了数字，空白格用‘.’表示。示例1：输入：board=[[“5”,“3”,“.”,“.”,“7”,“.”,“.”,“.”,
LeetCode第211场周赛t3 5545. 无矛盾的最佳球队（排序+最大上升子序列和的dp） harry1213812138 每年一题算法题解 dp 最大上升子序列
题目描述：假设你是球队的经理。对于即将到来的锦标赛，你想组合一支总体得分最高的球队。球队的得分是球队中所有球员的分数总和。然而，球队中的矛盾会限制球员的发挥，所以必须选出一支没有矛盾的球队。如果一名年龄较小球员的分数严格大于一名年龄较大的球员，则存在矛盾。同龄球员之间不会发生矛盾。给你两个列表scores和ages，其中每组scores[i]和ages[i]表示第i名球员的分数和年龄。请你返回所有
百度指数+selenium+request+比特指纹浏览器+pywebview+pandas+flask过程性万山y python selenium 爬虫 flask pandas
1.cookies和headrs问题使用selenium获得的cookies测试没有问题，但是获得的heards头不可以使用，经过测试比较需要添加或者修改几项重点的heards为{'Cipher-Text':'1704885072633_1704970047346_SlMkwPX0ZnotTaSrpOEx50xhLlPT5iMH867nxTtYuapcdPhsh2d2ooVE2F+RSm+yhIF
C#中的异步编程(Async) 流浪打工人 c#编程 c#开发语言异步编程
文章目录C#中的异步编程(Async)前言示例代码C#中的异步编程(Async)前言所谓的异步，就是指代码在运行的过程中，不会发生阻塞，例如我们玩游戏的时候，游戏在下载资源或者在加载本地资源时，要能够接收UI的输入，如果代码阻塞，表现就是游戏卡死，点了没反应，这个是我们不能接受的，所以异步编程在某些应用场合非常重要，是必不可少的。在c#中，使用异步编程需要用到Async、await等关键字，还需要
@Scope(“prototype“) HYUJKI java 原型模式 java 开发语言单例模式
@Scope("prototype")是Spring框架中用于定义Bean作用域的注解之一，它的主要作用是将一个Bean定义成原型作用域（PrototypeScope）。在原型作用域下，每次从Spring容器中请求这个Bean时，都会创建一个新的实例。@Scope("prototype")的作用默认作用域：单例（SingletonScope）在Spring中，Bean的默认作用域是单例（@Scop
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析

0.下载数据集

1.观察数据

1.1解压压缩文件

1.2打开jupyter notebook

1.3新建dataAnalysis.ipynb文件

1.4.查看数据

2.数据处理

2.1 删除空行

3.绘制词云图

3.1 词频统计

3.2 下载人工智能关键词词库

3.3 编写代码

4.全国城市的岗位需求量分析

4.1 数据处理

4.2 统计地区岗位需求量

4.3 数据可视化-柱形图

4.4 分析结论

5.上海地区的岗位需求量分析

5.1 统计上海各区岗位需求量

5.2 数据可视化-热力图

5.3 数据可视化-饼图

5.4 分析结论

6.学历要求分析

6.1 定义绘制饼图函数

6.2 数据处理和可视化-饼图

6.3 分析结论

6.4 前程无忧51job网站对比

6.5 拉勾网对比

7.人工智能相关职位的薪资对比

7.1 数据处理

7.2 查看数据

7.3 数据转换

7.4 数据可视化-柱状图

7.5 取薪酬平均值作图

8.项目经理心得

你可能感兴趣的:(基于pandas、matplotlib、pyecharts的人工智能相关职位招聘市场数据分析)