N刻后告诉你

[数据分析实战][37] 基于pandasql和plotly的数据科学家薪资分析与可视化 @ShowMeAI

参考资料：

数据科学家赚多少？数据全分析与可视化-ShowMeAI

前言

代码实际跑过一遍，原文中有一些错误，都已经修改过来了。大多数修改的地方都用“修改”标注了。要查看相应内容建议使用搜索“修改”查看。

1 导入工具库
2 加载数据集
3 数据预处理
4 数据分析&可视化
5 分析结论

导入工具库

# For loading data
import pandas as pd
import numpy as np

# For SQL queries
import pandasql as ps

# For ploting graph / Visualization
import plotly.graph_objects as go
import plotly.express as px
from plotly.offline import iplot
import plotly.figure_factory as ff

import plotly.io as pio
import seaborn as sns
import matplotlib.pyplot as plt

# To show graph below the code or on same notebook
from plotly.offline import init_notebook_mode
init_notebook_mode(connected=True)

# To convert country code to country name
import country_converter as coco

import warnings
warnings.filterwarnings('ignore')

加载数据集

# 利用pd.read_csv读取数据集
salaries = pd.read_csv("./ds_salaries数据集/ds_salaries.csv")
salaries.head()

# Function query to execute SQL queries
def query(query):
    return ps.sqldf(query)

query("""
        select *
        from salaries
        limit 5
""")

数据预处理

# 去掉无用的"Unnamed: 0"这一列
salaries = salaries.drop("Unnamed: 0", axis=1)
salaries

# 查看数据中缺失值的情况
salaries.isna().sum()

# employee_residence 和 company_location 使用的是短国家代码。我们映射替换为国家的全名以便于理解
salaries["employee_residence"] = coco.convert(names = salaries["employee_residence"], to="name")
salaries["company_location"] = coco.convert(names = salaries["company_location"], to="name")
salaries

"""
将experience_level缩写变成全称
CN: Entry level(入门级)

MI: Mid Level(中级)

SE: Senior Level(高级)

EX: Expert Level(资深专家级)
"""
salaries["experience_level"] = query("""SELECT 
                                          REPLACE(
                                            REPLACE(
                                              REPLACE(
                                                REPLACE(
                                                  experience_level, 'MI', 'Mid level'), 
                                                                    'SE', 'Senior Level'), 
                                                                    'EN', 'Entry Level'), 
                                                                    'EX', 'Expert Level') 
                                        FROM 
                                          salaries""")
salaries

"""
对工作形式也做全称替换
FT: Full Time （全职）
PT: Part Time （兼职）
CT：Contract （合同制）
FL：Freelance （自由职业）
"""
salaries['employment_type'] = query("""SELECT 
                                          REPLACE(
                                            REPLACE(
                                              REPLACE(
                                                REPLACE(
                                                  employment_type, 'PT', 'Part Time'), 
                                                                    'FT', 'Full Time'), 
                                                                    'FL', 'Freelance'), 
                                                                    'CT', 'Contract') 
                                        FROM 
                                          salaries""")
salaries

"""
数据集中公司规模字段处理
S：Small （小型）
M：Medium （中型）
L：Large （大型）
采用salaries.repalce({company_size: {}})函数来做替换
注意inplace=True进行本地修改
"""
replace_rule = {"S": "Small", "M": "Medium", "L": "Large"}
salaries.replace({"company_size": replace_rule}, inplace=True)

salaries

"""
对远程比率字段也做一些处理
采用salaries["remote_ratio"].repalce()函数来做替换
"""
replace_rule = {100: 'Fully Remote', 50: 'Partially Remote', 0: 'Non Remote Work'}
salaries["remote_ratio"].replace(replace_rule, inplace=True)

salaries

数据分析&可视化

# 数据科学领域Top10多的职位是？
top10_jobs = query("""\
    select job_title, count(*) as job_count
    from salaries
    group by job_title
    order by job_count desc
    limit 10
""")

# 绘制条形图
data = go.Bar(x = top10_jobs["job_title"], y = top10_jobs["job_count"], # 横轴，纵轴数据
             text = top10_jobs["job_count"], textposition = "outside",  # 标记在纵轴上的文本，位置在内部
             textfont = dict(size = 12, color = "black"),               # 字号是12，颜色是白色
             marker = dict(color = px.colors.qualitative.Alphabet,      # 条形图颜色
                          opacity = 0.9,        # 不透明度
                          line_color = "black", # 条形图外框线的颜色
                          line_width = 1)       # 条形图外框线的宽度
             )

layout = go.Layout(title = {'text': "Top 10 Data Science Jobs",  # 粗体标题
                            'x':0.5},                                   # 居中显示
                   xaxis = dict(title = 'Job Title'), # x轴标题
                   yaxis = dict(title = 'Total'),     # y轴标题
                   width = 900,  # 宽
                   height = 600) # 高


fig = go.Figure(data = data, layout = layout) # 生成画图对象
fig.update_layout(plot_bgcolor = '#f1e7d2',   # 图像背景
                 paper_bgcolor = '#f1e7d2')   # 画布背景
fig.show()                                    # 展示图像

# 饼图展示
fig = px.pie(top10_jobs, values="job_count", names="job_title", color_discrete_sequence=px.colors.qualitative.Alphabet) # 生成图片对象

fig.update_layout(title = {'text': "Distribution of job positions",  # 标题
                            'x':0.5}, # 居中
                   width = 900,
                   height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2', # 这行其实没用，因为饼图没有背景
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 拥有最多数据科学家的国家
top10_com_loc = query("""
                    SELECT company_location AS company,
                    Count(*) AS job_count
                    FROM salaries
                    GROUP BY company
                    ORDER BY job_count DESC
                    LIMIT 10
""")


data = go.Bar(x = top10_com_loc['company'], y = top10_com_loc['job_count'],
             text = top10_com_loc["job_count"], textposition = "outside",
             textfont = dict(size = 12,
                            color = 'black'),
             marker = dict(color = px.colors.qualitative.Alphabet,
                          opacity = 0.9,
                          line_color = 'black',
                          line_width = 1))


layout = go.Layout(title = {'text': "Top 10 Data Science Countries", 
                            'x':0.5, 'xanchor': 'center'},
                   xaxis = dict(title = 'Countries', tickmode = 'array'),
                   yaxis = dict(title = 'Total'),
                   width = 900,
                   height = 600)


fig = go.Figure(data = data, layout = layout)
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 统计各国支付的标准化工资(美元)的总和，并绘制地形图
temp_df = salaries.groupby('company_location')['salary_in_usd'].sum().reset_index() # reset_index将series变成了dataframe
temp_df['salary_scale'] = np.log10(temp_df['salary_in_usd']) # 对salar_in_usd取对数,用于表示颜色，修改，这里应该是temp_df


fig = px.choropleth(temp_df, locationmode = 'country names', locations = "company_location", # 数据源，指定位置的模式，位置的数据
                   color = "salary_scale", hover_name = "company_location", # 对应的颜色， 对应的名称
                   hover_data = temp_df[['salary_in_usd']],  # 挂的数字，必须是dataframe
                    color_continuous_scale = 'Jet',
                   )


fig.update_layout(title={'text':'Salaries across the World', 
                         'xanchor': 'center','x':0.5})
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 平均工资(按照货币类型分组),选择top14
df = salaries.groupby('salary_currency', as_index = False)['salary_in_usd'].mean().sort_values('salary_in_usd', ascending = False) # 修改
# 第一个salary_in_usd最好加上两层中括号，使得到的是一个dataframe，这里只加了一层是因为as_index=False保证了它是一个dataframe
# 在分组的时候指定as_index = False再聚合 和 先分组聚合reset_index()的效果是一样的

# Selecting top 14
df = df.iloc[:14]
fig = px.bar(df, x = 'salary_currency', # px.bar也可以画柱状图
            y = 'salary_in_usd',
            color = 'salary_currency',
            text = round(df['salary_in_usd']),
            color_discrete_sequence = px.colors.qualitative.Safe,
            )

fig.update_traces(textposition="outside") # 将文本放在外面
fig.update_layout(title={'text':'Average salary as a function of currency', 
                         'xanchor': 'center','x':0.5},
                 xaxis_title = 'Currency',
                 yaxis_title = 'Mean Salary')
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 平均工资(按照所在地分组),选择top14
df = salaries.groupby(['company_location'], as_index = False)[['salary_in_usd']].mean().sort_values('salary_in_usd', ascending = False)


#Selecting top 14
df = df.iloc[:14]
fig = px.bar(df, x = 'company_location',
            y = 'salary_in_usd',
            text = df['salary_in_usd'].apply(lambda x: str(round(x/1000, 2))+"k".format(x)), # 修改
            color = 'company_location',
            color_discrete_sequence = px.colors.qualitative.Dark2,
            )

fig.update_traces(textposition="outside") # 将文本放在外面
fig.update_layout(title = {'text': "Average salary as a function of company location", 
                            'x':0.5, 'xanchor': 'center'},
                   xaxis = dict(title = 'Company Location', tickmode = 'array'),
                   yaxis = dict(title = 'Mean Salary'),
                   width = 900,
                   height = 600)


fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 数据科学工作经验水平分布
job_exp = query("""
            SELECT experience_level, Count(*) AS job_count
            FROM salaries
            GROUP BY experience_level
            ORDER BY job_count ASC
""")


# 绘制水平柱状图
data = go.Bar(x = job_exp['job_count'], y = job_exp['experience_level'],
              orientation = 'h', text = job_exp['job_count'], # orientation表示朝向,'h'表示水平
              marker = dict(color = px.colors.qualitative.Alphabet,
                          opacity = 0.9,
                          line_color = 'white',
                          line_width = 2))


layout = go.Layout(title = {'text': "Jobs on Experience Levels",
                           'x':0.5, 'xanchor':'center'},
                  xaxis = dict(title='Total'),
                  yaxis = dict(title='Experience lvl'),
                  width = 900,
                  height = 600)

fig = go.Figure(data = data, layout = layout)
fig.update_layout(plot_bgcolor = '#f1e7d2', 
                  paper_bgcolor = '#f1e7d2')
fig.show()

# 数据科学工作就业类型分布
job_emp = query("""
SELECT employment_type,
COUNT(*) AS job_count
FROM salaries
GROUP BY employment_type
ORDER BY job_count ASC
""")


data =  go.Bar(x = job_emp['job_count'], y = job_emp['employment_type'], 
               orientation ='h',text = job_emp['job_count'],
               textposition ='outside',
               marker = dict(color = px.colors.qualitative.Alphabet,
                             opacity = 0.9,
                             line_color = 'white',
                             line_width = 2))


layout = go.Layout(title = {'text': "Jobs on Employment Type",
                           'x':0.5, 'xanchor': 'center'},
                   xaxis = dict(title='Total', tickmode = 'array'),
                   yaxis =dict(title='Emp Type lvl'),
                   width = 900,
                   height = 600)


fig = go.Figure(data = data, layout = layout)
fig.update_layout(plot_bgcolor = '#f1e7d2', 
                  paper_bgcolor = '#f1e7d2')
fig.show()

# 数据科学工作数量趋势(2020-2022)
job_year = query("""
    SELECT work_year, COUNT(*) AS 'job count'
    FROM salaries
    GROUP BY work_year
    ORDER BY 'job count' DESC
""")


data = go.Scatter(x = job_year['work_year'], y = job_year['job count'], # go模块绘制散点图
                  marker = dict(size = 20,            # 散点大小
                                line_width = 1.5,     # 散点的外框线宽
                                line_color = 'white', # 散点的外框线颜色
                                color = px.colors.qualitative.Alphabet), # 散点颜色
                  line = dict(color = '#ED7D31', width = 4), 
                  mode = 'lines+markers') # 散点和线都画


layout  = go.Layout(title = {'text' : "Data Science jobs Growth (2020 to 2022)",
                             'x' : 0.5, 'xanchor' : 'center'},
                    xaxis = dict(title = 'Year'),
                    yaxis = dict(title = 'Jobs'),
                    width = 900,
                    height = 600)


fig = go.Figure(data = data, layout = layout)
fig.update_xaxes(tickvals = ['2020','2021','2022'])
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 数据科学工作薪水分布
salary_usd = query("""
                    SELECT salary_in_usd 
                    FROM salaries
""")

# 绘制直方图和核密度曲线
plt.figure(figsize = (20, 8))
sns.set(rc = {'axes.facecolor' : '#f1e7d2',   # 背景颜色
             'figure.facecolor' : '#f1e7d2'}) # 图形颜色

p = sns.histplot(salary_usd["salary_in_usd"], 
                kde = True,         # 计算核密度估计,用一条或多条线来近似分布
                alpha = 1,          # 透明度,如果是distplot则没有这个参数
                fill = True,        # 填充直方图下面的空间,默认为True
                edgecolor = 'black',# 直方图的外框颜色为黑色
                linewidth = 1       # 直方图的外框线宽
                )
p.axes.lines[0].set_color("orange") # 核密度曲线的颜色标为橙色
plt.title("Data Science Salary Distribution \n", fontsize = 25)
plt.xlabel("Salary", fontsize = 18)
plt.ylabel("Count", fontsize = 18)
plt.show()

# 薪酬最高的10大数据分析工作
salary_hi10 = query("""
    SELECT job_title,
    salary
    FROM salaries
    ORDER BY salary_in_usd DESC
    LIMIT 10
""") # 修改

data = go.Bar(x = salary_hi10['salary'],
             y = salary_hi10['job_title'],
             orientation = 'h',
             text = salary_hi10['salary'],
             textposition = 'inside',
             insidetextanchor = 'middle', # 文本锚点在中间
             textfont = dict(size = 13, color = 'black'),
             marker = dict(color = px.colors.qualitative.Alphabet,
                           opacity = 0.9,
                           line_color = 'black',
                           line_width = 1))

layout = go.Layout(title = {'text': "Top 10 Highest paid Data Science Jobs",
                           'x':0.5,
                           'xanchor': 'center'},
                   xaxis = dict(title = 'salary', tickmode = 'array'),
                   yaxis = dict(title = 'Job Title'),
                   width = 900,
                   height = 600)
fig = go.Figure(data = data, layout = layout)
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 不同岗位平均薪资与排名
salary_av10 = query("""
    SELECT job_title,
    ROUND(AVG(salary_in_usd)) AS salary
    FROM salaries
    GROUP BY job_title
    ORDER BY salary DESC
    LIMIT 10
""")

data = go.Bar(x = salary_av10['salary'],
             y = salary_av10['job_title'],
             orientation = 'h',
             text = salary_av10['salary'],
             textposition = 'inside',
             insidetextanchor = 'middle',
              textfont = dict(size = 13,
                             color = 'black'),
              marker = dict(color = px.colors.qualitative.Alphabet,
                           opacity = 0.9,
                           line_color = 'white',
                           line_width = 2))

layout = go.Layout(title = {'text': "Top 10 Average paid Data Science Jobs",
                           'x':0.5,
                           'xanchor': 'center'},
                   xaxis = dict(title = 'salary', tickmode = 'array'),
                   yaxis = dict(title = 'Job Title'),
                   width = 900,
                   height = 600)
fig = go.Figure(data = data, layout = layout)
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 数据科学薪资趋势
salary_year = query("""
    SELECT ROUND(AVG(salary_in_usd)) AS salary,
    work_year AS year
    FROM salaries
    GROUP BY work_year
    ORDER BY salary DESC
""") # 修改

data = go.Scatter(x = salary_year['year'],
                  y = salary_year['salary'],
                  marker = dict(size = 20,
                  line_width = 1.5,
                  line_color = 'black',
                  color = '#ED7D31'),
                  line = dict(color = 'black', width = 4), mode = 'lines+markers')

layout = go.Layout(title = {'text' : "Data Science Salary Growth (2020 to 2022) ",
                            'x' : 0.5,
                            'xanchor' : 'center'},
                   xaxis = dict(title = 'Year'),
                   yaxis = dict(title = 'Salary'),
                   width = 900,
                   height = 600)


fig = go.Figure(data = data, layout = layout)
fig.update_xaxes(tickvals = ['2020','2021','2022'])
fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 经验水平&薪资

salary_exp = query("""
    SELECT experience_level AS 'Experience Level',
    salary_in_usd AS Salary
    FROM salaries
""")

# 绘制小提琴图
fig = px.violin(salary_exp, x = 'Experience Level', y = 'Salary', color = 'Experience Level', box = True)

fig.update_layout(title = {'text': "Salary on Experience Level
经验水平&薪资",
                            'xanchor': 'center','x':0.5},
                   xaxis = dict(title = 'Experience level'),
                   yaxis = dict(title = 'salary', 
                                ticktext = [-300000, 0, 100000, 200000, 300000, 400000, 500000, 600000, 700000]),
                   width = 900,
                   height = 600)

fig.update_layout(paper_bgcolor= '#f1e7d2', 
                  plot_bgcolor = '#f1e7d2', 
                  showlegend = False)
fig.show()

# 不同经验水平的薪资趋势
tmp_df = salaries.groupby(['work_year', 'experience_level']).median() # 按照工作年份和经验水平分组,只有数字类型会被求中位数
tmp_df.reset_index(inplace = True)
display(tmp_df.head()) # 修改:打印dataframe的开头五行

fig = px.line(tmp_df, x='work_year', y='salary_in_usd', color='experience_level', symbol="experience_level") # 绘制多条折线图

fig.update_layout(title = {'text': "Median Salary Trend By Experience Level
不同经验水平的薪资趋势", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Working Year', tickvals = [2020, 2021, 2022], tickmode = 'array'),
                  yaxis = dict(title = 'Salary'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 年份&薪资分布
year_gp = salaries.groupby('work_year')
hist_data = [year_gp.get_group(2020)['salary_in_usd'],
             year_gp.get_group(2021)['salary_in_usd'],
            year_gp.get_group(2022)['salary_in_usd']]
group_labels = ['2020', '2021', '2022']

fig = ff.create_distplot(hist_data, group_labels, show_hist = False) #  绘制多条核密度曲线


fig.update_layout(title = {'text': "Salary Distribution By Working Year
年份&薪资分布", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Salary'),
                  yaxis = dict(title = 'Kernel Density'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 就业类型&薪资
salary_emp = query("""
    SELECT employment_type AS 'Employment Type',
    salary_in_usd AS Salary
    FROM salaries
""")

# 绘制箱线图
fig = px.box(salary_emp,x='Employment Type',y='Salary',
       color = 'Employment Type')


fig.update_layout(title = {'text': "Salary by Employment Type", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Employment Type'),
                  yaxis = dict(title = 'Salary'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 公司规模分布
comp_size = query("""
                SELECT company_size,
                COUNT(*) AS count
                FROM salaries
                GROUP BY company_size
""")

# 绘制环形图(饼图中间镂空)
data = go.Pie(labels = comp_size['company_size'], 
              values = comp_size['count'].values, # .values可写可不写
              hoverinfo = 'label',                # 移动到饼图上时会显示的信息
              hole = 0.5, # 中间镂空
              textfont_size = 16,
              textposition = 'auto')
fig = go.Figure(data = data)


fig.update_layout(title = {'text': "Company Size", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = ''),
                  yaxis = dict(title = ''),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 不同公司规模的经验水平比例

df = salaries.groupby(['company_size', 'experience_level']).size() # size()聚合方法是考虑有多少行,一定返回series,count()会考虑每列,如果有空值就不计入
comp_s = np.round(df['Small'].values / df['Small'].values.sum(),2) # values得到的是ndarray,这里的计算用到广播
comp_m = np.round(df['Medium'].values / df['Medium'].values.sum(),2)
comp_l = np.round(df['Large'].values / df['Large'].values.sum(),2)

fig = go.Figure()
categories = ['Entry Level', 'Expert Level','Mid level','Senior Level']

# 绘制极坐标图
fig.add_trace(go.Scatterpolar( # add_trace方法增加一条轨迹
    r = comp_s,
    theta = categories, # 设置角坐标
    fill = 'toself',    # 起点和终点连线,形成闭环的图形
    name = 'Company Size S'))

fig.add_trace(go.Scatterpolar(
    r = comp_m,
    theta = categories,
    fill = 'toself',
    name = 'Company Size M'))

fig.add_trace(go.Scatterpolar(
    r = comp_l,
    theta = categories,
    fill = 'toself',
    name = 'Company Size L'))

fig.update_layout(
    polar = dict(
    radialaxis = dict(range = [0, 0.6])), # 极坐标幅度为[0. 0.6]
    showlegend = True,
)


fig.update_layout(title = {'text': "Proportion of Experience Level In Different Company Sizes", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = ''),
                  yaxis = dict(title = ''),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 不同公司规模&工作薪资
salary_size = query("""
    SELECT company_size AS 'Company size',
    salary_in_usd AS Salary
    FROM salaries
""")

fig = px.box(salary_size, x='Company size', y = 'Salary',
             color = 'Company size')



fig.update_layout(title = {'text': "Salary by Company size", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Company size'),
                  yaxis = dict(title = 'Salary'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# WFH（远程办公）和 WFO 的比例
rem_type = query("""
    SELECT remote_ratio,
    COUNT(*) AS total
    FROM salaries
    GROUP BY remote_ratio
""")


data = go.Pie(labels = rem_type['remote_ratio'], values = rem_type['total'].values,
             hoverinfo = 'label',
             hole = 0.4,
             textfont_size = 18,
             textposition = 'auto')

fig = go.Figure(data = data)

fig.update_layout(title = {'text': "Remote Ratio", 
                            'x':0.5, 'xanchor': 'center'},
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 薪水受Remote Type影响程度
salary_remote = query("""
    SELECT remote_ratio AS 'Remote type',
    salary_in_usd AS Salary
    From salaries
""")

fig = px.box(salary_remote, x = 'Remote type', y = 'Salary', color = 'Remote type')



fig.update_layout(title = {'text': "Salary by Remote Type", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Remote type'),
                  yaxis = dict(title = 'Salary'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

# 不同经验水平&远程比率
exp_remote = salaries.groupby(['experience_level', 'remote_ratio']).size() # 修改:得到series
display(exp_remote.head())
exp_remote = exp_remote.reset_index().rename(columns={0: 'cnt'})
display(exp_remote.head())
print(exp_remote.index)
fig = px.histogram(exp_remote, x = 'experience_level',
                  y = 'cnt', color = 'remote_ratio',
                  barmode = 'group', # 同一组的条形图不堆叠
                  text_auto = True)


fig.update_layout(title = {'text': "Respondent Count In Different Experience Level Based on Remote Ratio", 
                            'x':0.5, 'xanchor': 'center'},
                  xaxis = dict(title = 'Experience Level'),
                  yaxis = dict(title = 'Number of Respondents'),
                  width = 900,
                  height = 600)

fig.update_layout(plot_bgcolor = '#f1e7d2',
                 paper_bgcolor = '#f1e7d2')
fig.show()

分析结论

数据科学领域Top3多的职位是数据科学家、数据工程师和数据分析师。

数据科学工作越来越受欢迎。员工比例从2020年的11.9%增加到2022年的52.4%。

美国是数据科学公司最多的国家。

工资分布的IQR在62.7k和150k之间。

在数据科学员工中，大多数是高级水平，而专家级则更少。

大多数数据科学员工都是全职工作，很少有合同工和自由职业者。

首席数据工程师是薪酬最高的数据科学工作。

数据科学的最低工资（入门级经验）为4000美元，具有专家级经验的数据科学的最高工资为60万美元。

公司构成：53.7%中型公司，32.6%大型公司，13.7%小型数据科学公司。

工资也受公司规模影响，规模大的公司支付更高的薪水。

62.8%的数据科学是完全远程工作，20.9%是非远程工作，16.3%是部分远程工作。

数据科学薪水随时间和经验积累而增长

你可能感兴趣的:(数据分析师,数据分析,plotly,python)

python 创建子图_在python中以绘图方式创建子图 weixin_39899691 python 创建子图
Iamfairlynewtopythonandploty(<3monthsofactualcodingatthispoint).Iamtryingtocreatesubplotsinplotly.Ihavecreatedgraphsinplotlyusingthecodebelow(codesnippetsattachedbelowaswell),butIcan'tseemtogetthemtow
pythonsubplot_python matplotlib中的subplot函数使用详解郝志鹄 pythonsubplot
python里面的matplotlib.pylot是大家比较常用的，功能也还不错的一个包。基本框架比较简单，但是做一个功能完善且比较好看整洁的图，免不了要网上查找一些函数。于是，为了节省时间，可以一劳永逸。我把常用函数作了一个总结，最后写了一个例子，以后基本不用怎么改了。一、作图流程：1.准备数据，，3作图，4定制，5保存，6显示1.数据可以是numpy数组，也可以是list2创建画布：impor
基于MapReduce的气候数据分析赵谨言论文毕业设计经验分享
标题:基于MapReduce的气候数据分析内容:1.摘要本文聚焦于基于MapReduce的气候数据分析。背景在于随着全球气候变化问题日益严峻，海量气候数据的高效处理和分析成为关键。目的是利用MapReduce技术对气候数据进行有效挖掘，以揭示气候变化规律和趋势。方法上，采用MapReduce编程模型对大规模气候数据进行分布式处理，通过数据的映射和归约操作实现并行计算。结果表明，运用该技术能显著提高
python 替换字符串 Aa123456789_55 pandas python 数据库开发语言
在Python中，替换字符串可以通过多种方式实现，具体取决于您的需求和上下文。以下是几种常见的方法：1.使用str.replace()方法str.replace(old,new[,count])是最常用的字符串替换方法。它会将字符串中的所有匹配项替换为新的字符串。old:要被替换的子字符串。new:用来替换的新字符串。count(可选):替换的最大次数。如果未指定，则替换所有匹配项。示例代码：or
python数据可视化玩转Matplotlib subplot子图操作，四个子图（一包四），三个子图，子图拉伸_python subplot 2401_83817843 程序员 python 信息可视化 matplotlib
大锤爱编程的博客_CSDN博客-大数据,Go,数据分析领域博主Matplotlib是一个流行的Python可视化库，它提供了许多功能来创建各种类型的图表。其中一个功能是子图，它允许您在单个图表中绘制多个图。一、创建子图要创建子图，请使用plt.subplots()函数。该函数接受三个参数：行数、列数和子图编号。以下是一个简单的示例：importmatplotlib.pyplotaspltfig,a
python subplot函数应用 - 创建多个子图 Aa123456789_55 图形展示代码学习 python 开发语言
subplot语法：plt.subplot是Matplotlib库中的一个非常有用的函数，用于在一个图形窗口中创建多个子图plt.subplot函数用于在当前图形窗口中创建并激活一个子图。其基本语法如下：plt.subplot(nrows,ncols,index)参数详解：nrows:子图的行数。这是指整个图形窗口将被分成多少行子图。ncols:子图的列数。这是指整个图形窗口将被分成多少列表子图。
图像分割基础：使用Python和scikit-image库 0dayNu1L 机器学习项目实战 python 人工智能机器学习
大家好，今天我们将一起探讨图像分割的基础知识，并使用Python编程语言以及scikit-image库来实现一个简单的图像分割示例。图像分割是图像处理中的一项重要技术，它允许我们将图像划分为多个部分或对象，这对于图像分析和计算机视觉任务至关重要。0dayNu1L-CSDN博客目录一、环境准备二、图像分割示例1.导入必要的库2.读取并显示图像3.创建标签数组并进行阈值分割4.使用颜色表示标签三、结果
pythoneasyinstall安装第三方库_【Python使用】Python安装第三方包（easy_install和pip工具）... 不死鹰阿江
本文是对python的第三方包/模块的安装的说明，官方下载第三方包的地址为：https://pypi.org/。1.工具安装部署1.1setuptools安装部署(easy_install)easy_install是由PEAK(PythonEnterpriseApplicationKit)开发的setuptools包里带的一个命令，它用来自动地从http://pypi.python.org/sim
Python库 - skimage 司南锤 PYTHON库 python 开发语言
skimage是scikit-image的缩写，是一个用于图像处理的Python库。提供了丰富的图像处理功能，包括图像滤波、边缘检测、形态学操作、特征提取、图像分割等。skimage是基于NumPy数组构建的，因此可以与NumPy和其他科学计算库（如scipy和matplotlib）无缝集成。安装可以使用pip来安装skimage：pipinstallscikit-image主要模块skimage
scikit-image（Scikit-image 是用于图像处理的 Python 包，使用原生的 NumPy 数组作为图像对象） Clark-dj 图像处理 python numpy
Scikitimage中文开发手册-开发者手册-腾讯云开发者社区-腾讯云昨天搜索一个函数时无意间发现这个网站，今天来学习一下，仅作学习笔记。measureskimage.measure.approximate_polygon（coords，...）近似具有指定公差的多边形链。skimage.measure.block_reduce（image，block_size）通过对局部块应用函数来下采样图像
python`print`函数中flush参数需要重新演唱 Python python
print函数中flush参数在计算机中，输出通常会被缓冲，这意味着数据不会立即发送到目标位置（如控制台或文件），而是先存储在内存中的一个缓冲区里。这样做的好处是可以提高性能，因为一次性发送大量数据通常比逐个发送数据更高效。然而，在某些情况下，你可能希望立即看到输出，而不是等待缓冲区填满或程序结束。这时就可以使用flush参数来强制刷新缓冲区。flush参数的作用flush参数是一个布尔值，默认是
python的print函数中file_【Python-1】初解print函数 weixin_39849762
print(*objects,sep='',end='\n',file=sys.stdout,flush=False)Printobjectstothetextstreamfile,separatedbysepandfollowedbyend.sep,end,fileandflush,ifpresent,mustbegivenaskeywordarguments.print函数可将对象以字符串的形
python之tkinter库的frame组件谷晓光 python
frame作用就是为了布局，将一组组件作为一个整体放在一个frame中，也方便对这一组组件进行控制。frame组件作为其他组件的框架，将布局分为一个个单独的空间，配合其他布局函数以实现复杂的界面布局。语法：Frame(父对象，参数列表，……)Frame(master=none,**options)(class)参数：参数名称属性举例或备注background或bg组件背景颜色borderwidth
Python, Java 开发鱼类养殖大全APP Geeker-2025 python java
开发一个“鱼类养殖大全APP”是一个非常有意义的项目，特别是对于水产养殖从业者、鱼类爱好者和研究人员来说。该APP可以帮助用户了解鱼类的养殖知识、疾病防治、饲料管理、水质监测等内容，并提供个性化的养殖建议。以下是开发该APP的详细思路和技术实现方案，分别针对Python和Java。---###**功能需求分析**1.**鱼类信息展示**：-提供常见鱼类的基本信息（如名称、图片、生活习性、适宜水温、
编程提示工程高级技巧：从入门到精通 SuperMale-zxq AI编程——程序员的进阶之路 java python c++AI编程人工智能
编程提示工程高级技巧：从入门到精通开篇：当代码与语言的边界变得模糊想象这样一个场景：一位开发者坐在电脑前，面对一个复杂的数据处理任务。传统做法是打开IDE，花几小时编写、调试和优化代码。但今天，他只是打开了AI编程助手，输入了这样一段文字：“创建一个Python函数，读取CSV文件中的销售数据，按季度汇总，并生成一个显示趋势的可交互图表。数据包含日期、产品ID、销售额和区域字段。”几秒钟后，屏幕上
Python(语句) 高育良00003 python 开发语言
一.赋值语句将一个值赋给变量x=5#将5赋给变量xx1=x+6#计算x+6并将结果赋给x1二.条件语句条件语句用于根据不同的条件来执行不同的代码块。语法：if条件表达式1:需注意别漏掉:语句块1elif条件表达式2:语句块2...elif条件表达式n:语句块nelse:语句块(其他)三.循环语句用于重复执行一段代码，知道满足某条件3.1for循环遍历可迭代对象（列表，集合等都行）遍历：经历一遍可迭
一篇文章让你实现前端JS 、 Golang 、 Python如何接入DeepSeek大模型实现自己的AI 一只理智恩 AI 前端后端 python golang javascript
本文将通过三种技术栈实现与DeepSeek大模型的对话交互，提供可直接运行的代码示例及详细注释。一、通用准备步骤1.获取API密钥登录DeepSeek开发者平台创建应用获取DEEPSEEK_API_KEY2.创建测试环境#项目结构deepseek-demo/├──frontend/#前端代码│└──index.html├──go-backend/#Golang后端│└──main.go├──py-
python+MySQL+HTML实现自习室座位管理系统 IT小本本 python python mysql html
自习室座位管理系统项目介绍自习室座位管理系统是一个基于PythonFlask框架开发的Web应用，旨在提供高效、便捷的自习室座位预约和管理功能。该系统适用于学校图书馆、自习室等场所，帮助管理员有效管理座位资源，同时为学生提供便捷的座位预约服务。功能特点1、用户认证模块用户注册：学生可以注册账号，填写个人信息用户登录：支持学生和管理员登录找回密码：通过邮箱验证重置密码2、座位管理模块座位预约：学生可
Python物联网与传感器数据分析 master_chenchengg python python 办公效率 python开发 IT
Python物联网与传感器数据分析开场白：连接物理世界与数字宇宙物联网的魅力：让物体开口说话Python：编织万物互联的魔法传感器：感知世界的触角数据捕获：从现实世界到数字领域传感器类型概览：温度、湿度、光照及其他Python与硬件接口：树莓派的奇妙旅程实时数据流：如何捕捉每一刻的变化数据处理：挖掘数字宝藏的秘密数据清洗：让数据焕发光彩数据分析：揭秘模式与趋势异常检测：识别噪声与干扰可视化展示：讲
市场波动中的风险管理与策略优化 Q3990385023 区块链
市场波动中的风险管理与策略优化在市场交易中，价格的波动性为投资者提供了交易机会，但同时也带来了风险。如何在市场不确定性中进行有效的风险管理，并优化交易策略，是每位交易者都需要思考的问题。本文将探讨市场波动的影响因素、如何通过合理的资金管理降低风险，以及如何利用数据分析提升交易稳定性。一、市场波动的核心影响因素1.供需关系变化市场价格的波动主要受到供需关系的影响。无论是受宏观经济政策影响，还是市场预
9种Python数据可视化方案，让财务数据焕发生命力 IT小本本 python 信息可视化数据分析数据挖掘
想象一下：你即将向董事会展示季度财务报告，面对的是一群已经看过无数PPT的高管。你是选择用普通的柱状图和折线图，还是用能够直观展示收入、支出、利润动态关系的交互式仪表板？本文将通过一个完整的Python财务数据可视化案例，展示如何将枯燥的财务数据转变为直观、动态且富有洞察力的可视化作品。场景：财务分析的可视化挑战李总是一家快速成长的科技公司CFO，每月需要向董事会汇报公司的财务状况。尽管他精通Ex
Pytorch 小记第八回：GoogleNet卷积神经网络模型代码 Start_Present pytorch cnn 神经网络分类 python 深度学习
本次小记，提供了一份基于pytorch的GoogleNet卷积神经网络模型的代码。除此之外，对代码中不容易理解的部分进行了讲解。本代码的平台是PyCharm2024.1.3，python版本3.11numpy版本是1.26.4，pytorch版本2.0.0+cu118，d2l的版本是1.0.3importnumpyasnpimporttorchfromtorchimportnnfromtorchv
python编程基础与案例集锦,python编程案例教程答案青峰235 python 开发语言信息可视化
大家好，小编来为大家解答以下问题，python编程案例教程航空工业出版社课后答案，python编程案例教程答案航空工业出版社，现在让我们一起来看看吧！1.整理字符串输入整理用户输入的问题在编程过程中极为常见。通常情况下，将字符转换为小写或大写就够了，有时你可以使用正则表达式模块「Regex」完成这项工作python编程代码画樱花。但是如果问题很复杂，可能有更好的方法来解决：user_input="
python列表排序方法从大到小,python列表排序sorted 青峰235 windows python linux 人工智能
本篇文章给大家谈谈python列表排序的方法有几种，以及python列表排序方法从大到小，希望对各位有所帮助，不要忘了收藏本站喔。Pythonlist内置sort()方法用来排序，也可以用python内置的全局sorted()方法来对可迭代的序列排序生成新的序列。1）排序基础简单的升序排序是非常容易的python引用turtle画蝴蝶。只需要调用sorted()方法。它返回一个新的list，新的l
mac怎么查python的版本_Mac下如何查看Python的版本？ A格调 mac怎么查python的版本
[1，terminal:input:whichpython2,terminal:input:python--->importsys---->printsys.pathok!goodluck!!]问题：Mac下如何查看Python的版本？系统：MacOSX软件：Python编程语言：Python[Mac配置Python开发环境(Eclipse+Pydev+Python)1、首先下载MAC版的64位E
macbook air怎么安装python_Python3安装完全攻略 Mac篇-Go语言中文社区郑丢丢 macbook air怎么安装python
前言：mac系统自带python，不过以当前mac系统的最新版本为例，自带的python版本都是2.X版本，虽然不影响老版本项目的运行，但是python最新的3.X版本的一些语法与2.X版本并不相同，网上的教程大神们也肯定都更新出了最新版的教程，我们不论是学习还是使用，当然用最新版会更好一点。我的电脑是MacBookAir，系统版本是最新的macOSCatalina10.15.1一、熟悉系统自带的
Python中使用vlc库实现视频播放功能小白教程 python python 音视频开发语言 Python视频播放功能 Python中使用vlc库 vlc视频播放
文章目录前言1.环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库2.基础播放示例3.常用播放控制功能4.事件监听5.播放网络流媒体6.结合GUI库制作视频播放器（以Tkinter为例）前言本教程主要包含打开文件、播放和停止按钮，能够实现基本的视频播放控制功能。1.环境准备1.1Python安装访问Python官方网站，根据你的操作系统（Windows、Mac或Linux
如何在Mac电脑中查看自己的python安装环境亲爱的自己 Python学习 python
如何在Mac电脑中查看自己的python安装环境步骤一：在终端中输入“python”步骤二：输入以下两行代码即可看出安装路径importsysprint(sys.path)
如何检查Mac电脑是否已安装Python环境 =蜗牛= mac python python3 环境
1、Python简介Python是一种高级编程语言，由荷兰程序员吉多·范罗苏姆（GuidovanRossum）于1989年底发明，并于1991年首次发布。它的设计理念强调代码的可读性和简洁的语法，使得程序员能够以较少的代码行数表达思想，从而提高开发效率。Python的名字来源于吉多·范罗苏姆喜欢的喜剧团体“蒙提·派森”（MontyPython），这也体现了Python社区幽默、开放的文化氛围。2、
Mac终端shell查看及修改默认python版本进击的西西弗斯知识总结 python shell macos
首先，查看当前默认Python解释器的情况在shell中输入以下命令来查看当前python解释器的默认调用路径：whichpython输出结果（不同设备可能不同）：/usr/bin/python在shell中逐行输入下面命令，来调用python并查看python解释器和模块库包的调用路径：python3importsyssys.path输出结果：（不同设备结果不同）['/Library/Devel
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep