HHAoW

美国人口与种族变迁史--数据可视化

介绍

知识点

可视化设置

数据准备

数据集介绍：

数据可视化

各州各种族人口数分布

人口与人口增长率

种族及人口变化率

所有种族

所有种族的人口增长率与总人口增长率散点图

黑人与亚裔

人口结构

各年龄组构成的人口结构

新生儿出生率

性别分布

总结

介绍

作为一个移民国家，美国的种族和人口问题全方位地影响着美国各州的政治、经济、文化和司法，本实验通过对美国人口普查局与美国国家卫生统计中心自 1990 以来调查获得的长达 29 年的美国人口和种族数据的分析，研究及可视化了美国在此期间的人口和种族的变迁史。

知识点

散点图接口及其参数的使用
漏斗图的绘制
画布上多子图的绘制
散点图的数据拟合
颜色条的绘制和应用
数据对数变换技巧

可视化设置

输入并执行魔法命令%matplotlib inline，同时将全局字体大小设置为 20 号，设置显示负数，去除图例边框、右侧坐标轴、顶部坐标轴。

import warnings
import matplotlib.pyplot as plt
%matplotlib inline

# 屏蔽代码运行过程中出现的警告信息，主要是屏蔽 pandas 的 .loc 警告问题
warnings.filterwarnings("ignore")

fontsize = 20
plt.rcParams['xtick.labelsize'] = fontsize
plt.rcParams['ytick.labelsize'] = fontsize
plt.rcParams['axes.labelsize'] = fontsize
plt.rcParams['axes.titlesize'] = fontsize
plt.rcParams['legend.fontsize'] = fontsize
plt.rcParams['legend.frameon'] = False  # 去除图例边框
plt.rcParams['axes.unicode_minus'] = False  # 显示负数
plt.rcParams['axes.spines.right'] = False  # 去除右侧坐标轴
plt.rcParams['axes.spines.top'] = False  # 去除顶部坐标轴

数据准备

数据集介绍：

本数据集来源于美国人口普查局与美国国家卫生统计中心，该数据集统计了美国自 1990 至 2019 年期间，各年度全美 51 州各年度性别（Gender）、种族（Race）、年龄段（Age Group）的人口数（Population），数据集中的 Mean Age 字段根据 Age Group 求算术平均得到。

导入数据并查看前 5 行。

import pandas as pd

df = pd.read_csv('American_Race_Gender_Population.csv')
df.head()

数据可视化

各州各种族人口数分布

本实验主要用到的可视化对象为散点图，散点图是继实验一介绍的条形图后，用作描述性统计、数据挖掘、数据预测的第二大类可视化图形，图元素主要包括点的位置，点的形状和点的大小。

选择 1990 和 2019 两个年份，将数据集按照州（State）、种族（Race）进行人口数（Population）聚合并按照人口数升序排序。聚合后，将聚合数据集中的 State、Race 特征分别映射至散点图 x、y 坐标，将 Population 人口数特征映射至点的颜色（c）和大小（s）。

plt.rcParams['figure.figsize'] = (20, 5)

for year in [1990, 2019]:
    data = df.loc[df['Year'] == year]

    # 各州按照总人口数升序排序
    state_order = data.groupby(['State'])[
        'Population'].sum().sort_values().index
    # 将 State 字段设置为有序字段
    data['State'] = data['State'].astype(
        pd.api.types.CategoricalDtype(state_order, ordered=True))

    # 获取州、种族的聚合结果，并按州升序排序
    data = data.groupby(['State', 'Race'], as_index=False)[
        'Population'].sum().sort_values(['State'])

    plt.scatter(
        x=data['State'],
        y=data['Race'],
        c=data['Population'],
        s=data['Population']*0.0001,
        ec='tab:blue',
        cmap=plt.cm.Accent,
        alpha=0.8)

    ax = plt.gca()

    # 将x轴刻度标签旋转90度
    ax.tick_params(axis='x', rotation=90)

    # 调节y轴显示范围
    ax.set_ylim(-0.5, 3.5)

    plt.title('Population Distribution of States of American in Year %d' % year)
    plt.show()  # 关闭当前图层以绘制下一幅图

从输出结果可以看出：

各州人口数。根据 2019 年统计数据，美国人口数最多的三个州分别为 California、Texas、Florida；
种族人口数。美国人口种族分布上，白人（White）显著地占据着主体地位，排名第二的种族为黑人（Black or African American），随后是亚裔（Asian or Pacific Islander）；
各州人口变迁。对比 1990 年与 2019 年，按照人口数排序后的 x 轴，可以发现 29 年间，美国各州表现出不同速率的人口增长率，1990 年总人数排名第二的 New York 已悄然在 2019 年排名第四。

人口与人口增长率

提取数据集中 1990 和 2019 两年的数据，通过数据透视计算各州人口增长率（Pupulation Changed %），通过数据聚合计算各州 2019 年总人口数（Population），将上述分步计算结果合并并挑选需要的特征后查看前 5 行。

data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]

# 计算美国各州人口增长率
pop_change = data.pivot_table(
    index='State', columns='Year', values='Population',aggfunc='sum')
pop_change['Pupulation Changed/%'] = 100 * \
    (pop_change[2019]-pop_change[1990])/pop_change[1990]
pop_change

# 计算美国2019年各州总人口数
pop = df.loc[df['Year'] == 2019].groupby(['State'])['Population'].sum()

# # 将人口增长率与白人增长率数据合并并筛选需要的特征
data = pd.concat([pop, pop_change], axis=1)[
    ['Population', 'Pupulation Changed/%']]

data.head()

将人口总数与人口增长率数据分别映射到散点图 x、y 坐标及点颜色和大小。

plt.rcParams['figure.figsize'] = (14, 7)

x = data['Population']
y = data['Pupulation Changed/%']

plt.scatter(x, y,
            marker='o', 
            s=data['Population']*0.0001, 
            c=data['Population'],
            cmap=plt.cm.Blues_r,
            edgecolors='gray')  # 散点图标记的轮廓及填充颜色

plt.xlabel('Population')
plt.ylabel('Pupulation Changed /%')

plt.axhline(y=y.mean(),color='tab:red',label='Avg Changed Ratio: %.2f%%'%(y.mean()))

plt.legend()

s = data.index

for xpos, ypos, text in zip(x, y, s):
    plt.text(xpos, ypos, text, size=16,va='bottom',ha='left')

plt.title('Population & Pupulation Changed (Compared to Year 1990) of American')

从输出结果可以看出：

全美各州在 1990 - 2019 年间的人口平均增长率为 32.72%；
在人口最大的四个州中，Califonia 人口增长率与平均水平相当，Texas 与 Florida 有了超平均数的增长，而 New York 不出意外地没有达到平均增长率；
在人口增速方面 Nevada 和 Arizona 两州有着最好的表现。

对于人口数量较少和人口增速不明显的多数州，其数据被压缩至平均线以下的 0 轴附近，可通过将数据进行对数变换（log）的方法，将数据均匀分布。

import numpy as np

plt.rcParams['figure.figsize'] = (14, 7)

x = np.log(data['Population'])
y = np.log(data['Pupulation Changed/%'])

plt.scatter(x, y,
            marker='o',
            s=data['Population']*0.0001,
            c=data['Population'],
            cmap=plt.cm.Blues,
            label='Changed of States of American',
            edgecolors='gray')  # 散点图标记的轮廓及填充颜色

plt.xlabel('log (Population)')
plt.ylabel('log (Pupulation Changed /%)')


s = data.index

for xpos, ypos, text in zip(x, y, s):
    plt.text(xpos, ypos, text, size=16, va='bottom', ha='left')

plt.title('Population & Pupulation Changed (Compared to Year 1990) of American')

从输出结果可以看出，数据在对数坐标系下，分散变得十分均匀，各数据点被均匀拉开。

种族及人口变化率

通过以下代码计算各州人口增长率与白人增长率，计算原理与总人口增长率计算原理相同。

data = df.loc[(df['Year'] == 1990) |(df['Year'] == 2019) ]

# 计算美国各州人口增长率
pop_change=data.pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
pop_change['Pupulation Changed/%']=100*(pop_change[2019]-pop_change[1990])/pop_change[1990]
pop_change

# 计算美国各州白人人口增长率
white_change=data.loc[data['Race']=='White'].pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
white_change['White Changed/%']=100*(white_change[2019]-white_change[1990])/white_change[1990]
white_change

# 将人口增长率与白人增长率数据合并
changed=pd.concat([pop_change,white_change],axis=1)

# 挑选主要字段
changed=changed[['Pupulation Changed/%','White Changed/%']]

# 展示前5行数据
changed.head()

将各州人口增长率与各州白人增长率分别映射到散点图，通过 np.ployfit 拟合其关系并绘制拟合曲线，同时绘制 y = x 曲线，该曲线表示，种族增长率与人口增长率一致。

plt.rcParams['figure.figsize'] = (10, 6)

x = changed['Pupulation Changed/%']
y = changed['White Changed/%']

# 绘制各州人口及白人增长数据
plt.scatter(x, y,
            marker='o',s=120,
            label='Changed of States of American',
            edgecolors='tab:red',facecolor='white') # 散点图标记的轮廓及填充颜色

plt.xlabel('Pupulation Changed /%')
plt.ylabel('White Race Changed /%')

# 拟合增长率曲线

f_1 = np.polyfit(x, y,deg=1)

# 绘制拟合的增长曲线
plt.plot(x,np.polyval(f_1, x),
         lw=2,color='tab:orange',label='Increase Ratio of White Race')

# 绘制平衡增长曲线  y=x
plt.plot(np.linspace(0,150,20),
         np.linspace(0,150,20),
         color='tab:blue',
         label='Increase Ratio of Balance',ls='--',lw=3)

plt.legend()

plt.text(25,75,'District of Columbia',fontsize=20,color='tab:red',ha='center',va='bottom')
plt.text(155,120,'Nevada',fontsize=20,color='tab:red',ha='center',va='bottom')

plt.title('Population & White Race Changed of States of American')

从输出结果可以看出：

种族增长率与人口增长率有很好的线性关系，与 y = x 平衡线对比，白人在各州的增长率斜率小于平衡线斜率（橘色线斜率 < 蓝色线），说明白人增速稍低于平衡增速；
District of Columbia 州种族增长率显著高于平均水平，白人增速明显。

所有种族

用类似数据处理过程获得全部种族人口增长率与种族增长率数据。

data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]

# 计算美国各州人口增长率
changed = data.pivot_table(index='State', columns='Year', values='Population',aggfunc='sum')
changed['Pupulation Changed /%'] = 100 * \
    (changed[2019]-changed[1990])/changed[1990]


race_columns = ['Pupulation Changed /%']
for race in ['American Indian or Alaska Native', 'Asian or Pacific Islander', 'Black or African American', 'White']:

    # 计算美国各种族人口增长率
    race_change = data.loc[data['Race'] == race].pivot_table(
        index='State', columns='Year', values='Population',aggfunc='sum')
    race_change[race+' Changed /%'] = 100 * \
        (race_change[2019]-race_change[1990])/race_change[1990]

    # 将人口增长率与各族人口增长率数据合并
    changed = pd.concat([changed, race_change], axis=1)

    race_columns.append(race+' Changed /%')

# 挑选主要字段
changed = changed[race_columns]

# 展示前5行数据
changed.head()

通过plt.subplots接口生成一张画布 fig 和 2 * 2 的子图对象，在每个子图对象分别绘制每个种族的增长率数据。

plt.rcParams['figure.figsize'] = (12, 8)

# 生成 2 * 2 的画布，并共享所有子图x，y轴范围
fig, axs = plt.subplots(2, 2, sharex=True, sharey=True)
# 将 2 * 2 的子图对象展平成 1 * 4的子图对象
axs = axs.ravel()  

x = changed['Pupulation Changed /%']

for i, race in enumerate(race_columns[1:]):

    ax = axs[i]
    y = changed[race]

    # 绘制各州人口及白人增长数据
    ax.scatter(x, y,
               marker='o', s=120,
               edgecolors='tab:red', facecolor='white')  # 散点图标记的轮廓及填充颜色
    # 拟合增长率曲线
    f_1 = np.polyfit(x, y, deg=1)

    # 绘制拟合的增长曲线
    ax.plot(x, np.polyval(f_1, x),
            lw=2, color='tab:orange')

    # 绘制平衡增长曲线  y=x
    ax.plot(np.linspace(0, 150, 20),
            np.linspace(0, 150, 20),
            color='tab:blue',
            label='Increase Ratio of Balance', ls='--', lw=3)

    ax.legend(fontsize=17)
    ax.set_title(race,fontsize=17)

    # 第一列和最后一行分别显示y坐标轴标题和x坐标轴标题
    if i in [2, 3]:
        ax.set_xlabel('Pupulation Changed /%')
    if i in [0, 2]:
        ax.set_ylabel('Race Changed /%')

# 添加画布标题
fig.suptitle('Population & Race Changed of States of American\n',
             size=25, va='bottom')

# 调整子图间距为紧凑
plt.tight_layout()

从输出结果可以看出：

American Indian or Alaska Native 本土原著名的种族增长率正逐步放缓，其斜率小于平均线；
Asian or Pacific Islander 亚裔种族增长率为四个种族中最高；
Black or African American 黑人虽然在增长率上不及亚裔，但在个别州有较为显著增长（图形上表现出大量的偏离拟合曲线点）；
White 占据人口主要数量的白人与全美总人口增长率大致相当。

所有种族的人口增长率与总人口增长率散点图

通过以下过程，将所有种族人口增长率数据进行纵向拼接。

data = df.loc[(df['Year'] == 1990) |(df['Year'] == 2019) ]

# 计算美国各州人口增长率
changed=data.pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
changed['Pupulation Changed /%']=100*(changed[2019]-changed[1990])/changed[1990]

race_changes=pd.DataFrame()

for race in ['American Indian or Alaska Native', 'Asian or Pacific Islander', 'Black or African American','White']:
    
    # 计算美国各州各种族人口增长率
    race_change=data.loc[data['Race']==race].pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
    race_change['Race Changed /%']=100*(race_change[2019]-race_change[1990])/race_change[1990]
    race_change['Race']=race

    # 将人口增长率与各种族人口增长率数据合并
    race_change=pd.concat([changed,race_change],axis=1)
    
    race_changes=pd.concat([race_changes,race_change],axis=0)

# 挑选主要字段
race_changes=race_changes[['Pupulation Changed /%','Race Changed /%','Race']]

# 展示前5行数据
race_changes.head()

通过 seaborn 的 scatterplot 接口绘制所有种族的人口增长率与总人口增长率散点图，从输出结果可以看出，该图是将 2 * 2 的子图进行了合并展示，并通过颜色将各种族进行了区分。

import seaborn as sns
plt.rcParams['figure.figsize'] = (10, 7)

sns.scatterplot(
    x='Pupulation Changed /%',
    y='Race Changed /%',
    hue='Race', # 将种族列传入hue，不同种族会输出不同颜色
    s=200,
    alpha=0.8,
    data=race_changes,
)

plt.ylim(-80, 800)
ax = plt.gca()

# 获取图例对象及图例标签对象
h, l = ax.get_legend_handles_labels()
# 第0个图例对象是图例标题，此处将其删除，不显示
ax.legend(h[1:], l[1:], ncol=2, loc=2, fontsize=18)

# 绘制平衡增长曲线  y=x
plt.plot(np.linspace(0, 150, 20),
        np.linspace(0, 150, 20),
        color='tab:red',
        label='Increase Ratio of Balance', ls='--', lw=5)

plt.title('Population & Race Changed of States of American\n',
          size=25, va='bottom')

从输出结果可以看出：

白人增长率数据点与平衡线（红色）分布最为一致；
少数族裔相比白人有着较高的人口增长率。

黑人与亚裔

黑人和亚裔人口增长率有着较为亮眼地表现，以下数据处理过程获得了各州黑人及亚裔的不同增长率。

data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]

# 计算美国各州人口增长率
changed = pd.DataFrame()
race_columns = []
for race in ['Asian or Pacific Islander', 'Black or African American']:

    # 计算美国各州白人人口增长率
    race_change = data.loc[data['Race'] == race].pivot_table(
        index='State', columns='Year', values='Population',aggfunc='sum')
    race_change[race+' Changed /%'] = 100 * \
        (race_change[2019]-race_change[1990])/race_change[1990]

    # 将人口增长率与白人增长率数据合并
    changed = pd.concat([changed, race_change], axis=1)

    race_columns.append(race+' Changed /%')

# 挑选主要字段
changed = changed[race_columns]

# 展示前5行数据
changed.head()

将各州亚裔和黑人种族人口增长率分别映射到 x、y 将增长率超 300% 的州用不同颜色进行标记。

plt.rcParams['figure.figsize'] = (15, 8)

x = changed['Asian or Pacific Islander Changed /%']
y = changed['Black or African American Changed /%']

plt.scatter(x, y,
            marker='o', s=120,
            label='Changed of States of American',
            edgecolors='tab:red', facecolor='white')  # 散点图标记的轮廓及填充颜色

plt.xlabel('Asian or Pacific Islander Changed /%')
plt.ylabel('Black or African American Changed /%')


for i in range(len(changed)):
    limit_changed = 300
    # 亚裔增长更快的州
    if (changed.iloc[i, 0] > limit_changed) & (changed.iloc[i, 1] < limit_changed):
        color = 'tab:blue'
    # 黑人增长更快的州
    elif (changed.iloc[i, 1] > limit_changed) & (changed.iloc[i, 0] < limit_changed):
        color = 'tab:red'
    # 亚裔和黑人增长均较快的州
    elif (changed.iloc[i, 1] > limit_changed) & (changed.iloc[i, 0] > limit_changed):
        color = 'tab:orange'
    else:
        color = 'black'

    plt.text(changed.iloc[i, 0], changed.iloc[i, 1], changed.index[i],
             fontsize=20, color=color, ha='center', va='bottom')


plt.title('Asian or Pacific Islander & Black or African American Race Changed of States of American')

从运行结果可以看出：

亚裔增长主要发生在以 Georgia 为代表的蓝色州；
黑人增长主要发生在以 Idaho 为代表的红色州；
亚裔和黑人在 North Dakota、South Dakota、Nevada 三个州均有较高的增长；
亚裔和黑人的增长，在一定程度下，带有一定的地区性特色。

人口结构

各年龄组构成的人口结构

将数据集按年份和平均年龄进行聚合，并将年份、平均年龄、人口数映射到散点图。

plt.rcParams['figure.figsize'] = (18, 8)

data = df

# # 获取州、种族的聚合结果，并按升序排序
data = data.groupby(['Year','Mean Age'],as_index=False)['Population'].sum().sort_values(['Population'])

plt.scatter(
    x=data['Year'],
    y=data['Mean Age'],
    c=data['Population'],
    s=data['Population']*0.00003,
    ec='tab:gray',
    cmap=plt.cm.RdBu_r,
    alpha=0.8)

ax = plt.gca()

# 不显示左侧和底部纵坐标轴
ax.spines['left'].set_visible(False)
ax.spines['bottom'].set_visible(False)

# 显示 y 轴网格线
ax.grid(b=True,axis='y',lw=1)

plt.ylabel('Mean Age')

plt.title('Population Distribution of Age Group of American From Year 1990 to Year 2019')

从运行结果可以看出，美国人口结构正趋向于老龄化，表现在：

1990 年：人口结构按年龄组分布，呈现出 20 - 40 岁的单峰分布；
2019 年：原先的20 - 40 岁已转移至 40-70 岁年龄组，1990 年以来的新生儿逐渐转移至 20-40 年龄组，呈现出双峰分布。

各年龄组构成的人口结构

将平均年龄字段按照 20，40，70 三个节点进行切分，获得青年、壮年、中年、老年 4 个年龄分组段，聚合各分组段人数后用漏斗图可视化 1990 年的人口结构。

from pyecharts import options as opts
from pyecharts.charts import Funnel

data = df.loc[df['Year'] == 1990]
# 将平均年龄进行数据切分，生成新的组
data['Age Group3'] = pd.cut(
    data['Mean Age'],
    bins=[0, 20, 40, 70, 100],
    labels=['Youth(<20)', 'Prime(20-40)', 'Middle(40-70)', 'Old(>70)'])
data = data.groupby(['Age Group3'], as_index=False)['Population'].sum()
data['Population'] = data['Population']/np.sum(data['Population'])*100

funel = Funnel()
funel.add(
    " ",
    [list(z) for z in zip(data['Age Group3'], data['Population'])],
    sort_='none',
    label_opts=opts.LabelOpts(position="inside"),
)
funel.set_global_opts(
    title_opts=opts.TitleOpts(
        title="Population Struction of American Year 1990",),
    legend_opts=opts.LegendOpts(
        pos_top='5%', textstyle_opts=opts.TextStyleOpts(font_size=15)),
)
funel.render_notebook()

从输出结果可以看出：

1990 年的美国人口结构以 20-40 的壮年为主。

data = df.loc[df['Year'] == 2019]
data['Age Group3'] = pd.cut(
    data['Mean Age'],
    bins=[0, 20, 40, 70, 100],
    labels=['Youth(<20)', 'Prime(20-40)', 'Middle(40-70)', 'Old(>70)'])
data = data.groupby(['Age Group3'], as_index=False)['Population'].sum()
data['Population'] = data['Population']/np.sum(data['Population'])*100

funel = Funnel()
funel.add(
    " ",
    [list(z) for z in zip(data['Age Group3'], data['Population'])],
    sort_='none',
    label_opts=opts.LabelOpts(position="inside"),
)
funel.set_global_opts(
    title_opts=opts.TitleOpts(
        title="Population Struction of American Year 2019",),
    legend_opts=opts.LegendOpts(
        pos_top='5%', textstyle_opts=opts.TextStyleOpts(font_size=15)),
)
funel.render_notebook()

从运行结果可以看出：

时过境迁，2019 年美国人口结构已悄然下移。

新生儿出生率

统计各州 <1 和 1-4 两个年龄组（Age Group）的年度人口增长率，分析各州新生儿出生率，数据处理过程详见代码注释。

data = df

# 选出平均年龄小于 3 的样本数据，即对应 <1 和 1-4 两个年龄组
data = data.loc[data['Mean Age'] < 3]

# 空 df 对象，装各州处理后数据
state_data = pd.DataFrame()

for state in list(set(data['State'])):
    # 聚合得到每个州总人数
    tmp = data.loc[data['State'] == state].groupby(
        ['Year'], as_index=False)['Population'].sum()

    # 将 Population 列移位 1 个周期，获得新的特征列 Population Last Year 即 去年总人口数
    tmp['Population Last Year'] = tmp.shift()['Population']

    # 新生儿出生率计算原理为  100*（当年人口数 - 去年人口数） / 去年人口数
    tmp['Birth Increase Ratio /%'] = 100 * (tmp['Population']-tmp['Population Last Year']) / tmp['Population Last Year']

    # 由于 1990 年没有上年数据，因此其增长率计算结果为空值，将其增长率填充为 0
    tmp['Birth Increase Ratio /%'].fillna(value=0, inplace=True)
    tmp['State'] = state

    # 将所有州的数据进行列方向上的合并
    state_data = pd.concat([state_data, tmp])

state_data = state_data.sort_values('Population')

# 查看前 5 行数据
state_data.head()

散点图颜色映射的数据，可通过plt.colorbar生成的颜色条做辅助可视化，方便读者阅读每个颜色点对应的绝对数值，其原理是将散点图返回的 mappable 对象传入plt.colorbar中，plt.colorbar生成的颜色条（cbar），其颜色板和显色数据区域通过散点图接口中的 cmap、vmin、vmax等参数控制。

plt.rcParams['figure.figsize'] = (18, 8)

# 生成画布并新增子图，111 表示 1行1列第1个子图
ax = plt.figure().add_subplot(111)

# ax.scatter 接口返回的 mappable 对象，用以传入 plt.colorbar 接口中，实现颜色与数据在颜色条上的映射
mappable = ax.scatter(
    x=state_data['State'],
    y=state_data['Year'],
    c=state_data['Birth Increase Ratio /%'],
    s=np.abs(state_data['Birth Increase Ratio /%'])*50,  # 将增长率为负值的数据取绝对值
    ec='gray',
    vmin=-7,  # 颜色条映射数据最小值
    vmax=7,  # 颜色条映射数据最大值
    cmap=plt.cm.RdBu_r,
)


# 将 x 轴刻度标签旋转 90 度
ax.tick_params(axis='x', rotation=90)
ax.spines['left'].set_visible(False)
ax.spines['bottom'].set_visible(False)

# 添加 1993、2009 两条水平辅助线
ax.axhline([1993], xmin=0.05, xmax=0.95, color='tab:red')
ax.axhline([2009], xmin=0.05, xmax=0.95, color='tab:blue')

# 添加颜色条
cbar=plt.colorbar(
    mappable=mappable,
    ax=ax,
    aspect=40,  # 颜色条的长宽比例  =长度/宽度
    pad=0.005,  # 散点图和颜色条的间距
    fraction=0.02  # 散点图和颜色条在画布上宽度的比例  =颜色条宽度/散点图宽度
)

ax.set_title(
    'Birth Increase Ratio of States of American from Year 1990 to 2019')

从输出结果可以看出：

人口基数最大的 California， 1993 年以后新生儿出生率一直处于下降阶段；
大多数州在 2009 年以后均呈现出新生儿出生率下降状况；
North Dakota 和 District of Columbia 两州阶段性地出现婴儿潮。

性别分布

选择 1990 、2010、 2019 三个年份，将数据集按照性别（Gender）、种族（Race）进行人口数（Population）聚合并按升序排列。聚合后，将聚合数据集中的 Gender、Race 特征分别映射至散点图 x、y 坐标，将 Population 人口数特征映射至点大小（s），将 Gender 映射至点颜色（c）。

fig, axs = plt.subplots(1, 3, figsize=(15, 6), sharey=True, sharex=True)

for i, year in enumerate([1990, 2010, 2019]):
    ax = axs[i]
    data = df.loc[df['Year'] == year].groupby(
        ['Gender', 'Race'], as_index=False)['Population'].sum().sort_values('Population')
    data

    ax.scatter(
        x=data['Gender'],
        y=data['Race'],
        c=data['Gender'].apply(lambda x: 'tab:red' if x ==
                               'Female' else 'tab:blue'),
        s=data['Population']*0.00007,
        ec='gray',
    )

    ax.set_ylim(-0.5, 4)
    ax.set_xlim(-1, 1.5)
    ax.set_title('Year %d' % year)

    if i > 0:
        ax.spines['left'].set_visible(False)

fig.suptitle('Population Distribution Varies with Gender of USA',
             size=25, va='bottom')

从输出结果可以看出，各种族在选定的3个年份并未呈现出显著差异，说明美国的人口结构中，性别分布相对均匀。

总结

本实验以散点图为主要绘图对象，对美国 1990 - 2019 年期间人口与种族变迁做了研究，通过分析和可视化，得出以下结论：

美国是以白人为主体种族的国家，在各大州白人的数量和占比都具有绝对优势；
在过去的 29 年间，白人一直保持着与美国国家人口增速相同的增长速率；
黑人和亚裔作为仅次于白人排名的种族，在过去 29 年间有了较高的增速，且主要人口增速表现出一定的地域性；
美国在人口结构上，正逐渐趋向于老龄化，与此同时，新生儿出生率自 2009 年以后有了较为明显的下降；
各种族在统计期内性别比例未出现较明显的失衡。

本次实验中，我们学会了：

散点图接口及其参数的使用。
漏斗图的绘制。
画布上多子图的绘制。
散点图的数据拟合。
颜色条的绘制和应用。
数据对数变换技巧。

你可能感兴趣的:(数据可视化,信息可视化,numpy,pandas,matplotlib)

金指云智能仓储管理：材料企业降本增效新引擎金烽科技大数据运维团队开发制造 sass
在材料生产行业，仓储管理是影响企业成本与运营效率的关键环节。金指云凭借贴合行业需求的智能仓储管理功能，通过物联网技术与数字化手段，实现仓储全流程精细化管控，助力企业解决原料损耗、库存积压等难题。物联网监控，筑牢原料防护网金指云利用RFID电子标签与温湿度传感器，构建起仓储环境实时监测体系。每批次铜材、钛合金等原料入库时，都会被赋予唯一的RFID电子标签，详细记录材料规格、入库时间等信息。遍布仓库的
数据可视化——折线图殇城碎梦. python基础学习 python
#导入所需要的包importmatplotlib.pyplotasplt#设置图表样式plt.style.use('seaborn-v0_8')#增强中文字体配置-添加更多系统字体确保兼容性#增强中文字体配置-优先Windows系统常用字体plt.rcParams["font.family"]=["sans-serif"]plt.rcParams["font.sans-serif"]=["SimH
基于Python+Vue的个性化教学可视化系统设计与实现django 源码哆哆*V+ymhydo 毕设 python vue.js django
文章目录前言系统实现效果前台用户功能模块后台管理功能模块Python技术介绍Django框架介绍预期达到的目标设计思路详细视频演示技术路线解决的思路性能/安全/负载方面可行性分析论证为什么选择我们
数据呈现高阶技巧：散点图与桑基图的独特价值
在数据可视化的工具箱中，有些图表看似小众，却能解决特定场景的分析难题。当你需要探索两个变量的关联，或追踪复杂的流量路径时，散点图和桑基图会成为强大的武器。本文将深入解析这两种图表的适用场景、分析逻辑和实战案例，帮你突破传统图表的局限，挖掘更深入的业务洞察。一、散点图：探索变量关系，发现群体特征散点图的核心价值在于展示大样本中两个变量的分布关系。它不像柱状图那样聚焦分类对比，也不像折线图那样追踪时间
实时数据可视化的“心跳”设计：毫秒级延迟下的动态图表抗闪烁优化方案大美工控设计师信息可视化数据分析数据挖掘
内容摘要在实时数据可视化中，动态图表的抗闪烁优化是一个关键问题。毫秒级的数据更新频率虽然能提供极高的实时性，但也容易导致图表闪烁，严重影响用户体验。这种闪烁不仅让人眼花缭乱，还可能掩盖重要的数据变化。那么，如何在保持毫秒级更新的同时，有效减少图表闪烁呢？本文将深入探讨动态图表抗闪烁的优化方案，从技术原理到实际应用，为你揭示如何打造平滑、流畅的实时数据可视化效果。第一章：实时数据可视化的“心跳”现象
2023-09-05水逆【日更830天】平白书
从周日开始陆陆续续接到几个不太好的“信息”或者事件。一是我和老公帮老爸挪动位置的时候发现他热乎乎的。结合我周末在家听到他震天动地的咳嗽声，让我心惊肉跳的。第一次测右边咯吱窝，36.7度。第二次测左侧咯吱窝，老公看了脱口而出37.8度，我直接瞪眼了。后来老公瞬间改口36.8度……我真！第三次测右边咯吱窝，36.9度。好吧，我开始找药，还失神打破了一只体温计。二是老二中耳炎后，上周日忽然对我们说听力下
怎么能得到各种淘宝优惠券呢？领取淘宝优惠券的平台有哪些? 氧惠评测
要得到各种淘宝优惠券，可以通过以下几种途径：一、使用第三方优惠券平台除了直接在淘宝平台领取外，还可以使用第三方优惠券平台来获取更多的优惠券资源。这些平台通常会与淘宝商家合作，提供额外的优惠券和返利服务。以下是一些常见的领取淘宝优惠券的平台：氧惠APP特点：氧惠APP不仅提供了淘宝的优惠券，还涵盖了其他主流电商平台和生活服务平台，如美团、饿了么等。它以其全面的优惠信息和精准的推荐系统赢得了用户的喜爱
你在互联网上逾期的任何一笔钱，都已经昭然天下欧阳风Plus
图片发自App昨天发现花呗不能用了，打开查看，显示无法使用花呗服务（看图）图片发自App突然不能用了，我心情有些糟，一是花呗还有些余额，更重要的是，我在支付宝的信用受到质疑。我赶紧查看了芝麻信用，依然是605分，显示信用良好。我聚精会神思索了一圈，支付宝的欠款都归还了，网商贷，花呗，备用金等。我想唯一的原因是我在其他网贷平台的逾期信息被共享到支付宝，因此花呗无法使用了。前阵子就看到相关信息，说是各
网络数据分层封装与解封过程的详细说明两圆相切网络规划设计师网络
网络数据分层封装全流程数据封装流程（发送端）-CSDN优化版OSI层次封装动作数据单元关键头部信息示例应用层添加应用层协议头部报文(Message)GET/index.htmlHTTP/1.1Host:www.example.com表示层数据加密/压缩PPDUTLSv1.3RecordLayerContentType:ApplicationData会话层添加会话控制标识SPDUSIPCall-ID
江枫沈棠《为爱入赘》最新章节阅读_(为爱入赘)全章节免费在线阅读_江枫沈棠《为爱入赘》完结版免费阅读_江枫沈棠热门小说_江枫沈棠《为爱入赘》完结版免费阅读_为爱入赘全文免费阅读完整版全集小说
江枫沈棠《为爱入赘》最新章节阅读_(为爱入赘)全章节免费在线阅读_江枫沈棠《为爱入赘》完结版免费阅读_江枫沈棠热门小说_江枫沈棠《为爱入赘》完结版免费阅读_为爱入赘全文免费阅读主角配角：江枫沈棠简介：9可青梅竹马的情谊摆在面前，她潜意识排除了林晟的所有嫌疑只是动作越来越不耐烦我和兄弟看在眼里，满心讽刺沈娇烦躁地伸手揉乱头发，才打电话给出租车公司找那天开车司机的信息巧合的是，那个出租车司机像是跟货车
【100天自律挑战】Day85:一个好校长就是一所好学校萌萌要开心吖
早晨五点多坐上客车回家，打开朋友圈看到最多的信息就是我们扎鲁特一中出了高考状元，这是65年以来，第一个考上清华大学的学子，并且有8名学生考了600分以上的好成绩，我下了客车，打车回家，出租车司机也在和我探讨这个问题，我门都不约而同的赞同，一中的校长和老师们都很给力，这次一中取得的良好佳绩也给予了我们家乡莘莘学子们以莫大的鼓励，让更多的学子感受到只要踏踏实实努力，未来就会充满希望。这个时候，我才深刻
如何利用与对抗信息茧房 thqby
我们生活在一个信息爆炸的时代，这是一个最好的时代，也是一个最坏的时代。随着短视频B站、抖音等视频网站的崛起，自媒体信息以前所未有的速度快速膨胀，这些信息不断的消耗着我们的注意力和时间，我们沉浸其中，压缩了我们在别处的时间，如何看待这种现象呢？如何让信息流为我们所用，让我们成为信息的主宰者，这个问题我想了很久，也挣扎了很久，于是决定做一期关系信息管理的视频分享给大家。我们知道抖音的推荐是基于内容的推
Python Matplotlib中的fontdict参数说明 @MMiL PyBuild python matplotlib pandas numpy
文章目录1fontdict参数的常用属性1.1使用示例1.2其他注意事项1.3结合其他参数各位老板好,在Python的Matplotlib库中，fontdict参数用于定义文本属性的字典。这些属性包括字体大小、颜色、样式等，主要用于控制标题、标签和其他文本元素的显示效果。通过将fontdict传递给相关函数（如plt.title、plt.xlabel等），可以自定义文本的外观。1fontdict参
【安全等保】华为安全等保二、三级方案精讲【附全文阅读】智慧化智能化数字化方案服务器网络数据库华为安全等保安全等级保护二级安全等保方案三级安全等保方案
华为安全等保二、三级方案围绕网络安全等级保护制度，构建“一个中心三重防护”体系（安全管理中心、安全通信网络、安全区域边界、安全计算环境）。方案覆盖定级、备案、整改、测评、监督全流程，针对二、三级保护对象提供差异化产品组合（如二级基础版含NGFW、主机杀毒、日志审计；三级增强版增配IPS、APT沙箱等），强调合规要求与技术防护结合，应对网络攻击、数据泄露等风险，保障信息系统安全。详细总结一、等保制度
77-7 带出节奏快感习凤教练
此为77个文案技巧的第7篇——带出节奏快感。77-7我们一些人写文案时，总想要带入很多信息，害怕因为写的不全而遗漏点什么。殊不知这样会降低传达速度。相反，节奏感较快的文案就能瞬间进入人心，代入感很强。『见』在设计文案或者商品名称之前，要务必记住带出节奏快感。介绍三种方式及其案例：第一种：试着透过命令句例如：喂~喝茶啰！吃饭时间到了！第二种：设计冷笑话例如：色狼退场ICOCA（出发吧）第三种：以功能
你猜，北京今天的雨到底会有多大？四哥叨逼叨
从昨天下午开始，身处北京的朋友陆续从多个新闻平台收到了8月12日京津冀地区将迎来特大暴雨的信息。一时间好多用人单位也是“如临大敌”，或温馨提示，或调整作息，到底多大的雨要让北京市实行弹性工作制，大家充满了好奇。今天早上，四哥特意比平常早起了半个小时，迫不及待地想一睹雨势“盛况”，不过雨一直不下，气氛不算融洽，在同个屋檐下，我渐渐感到心在变化。不过专家提示：大雨警报还没有解除，不是从午后开始，就是在
京东优惠券软件叫什么?公认好用的京东优惠券平台氧券超好用
京东优惠券软件大揭秘：公认好用的京东优惠券平台推荐在京东购物，怎样才能用最少的钱买到心仪的商品？京东优惠券软件无疑是一个不错的选择。今天，我们就来揭秘一下京东优惠券软件的奥秘，并推荐几个公认好用的京东优惠券平台。一、京东优惠券软件是什么？京东优惠券软件是一种可以帮助用户在京东购物时获得优惠的辅助工具。这些软件通常能提供京东内部优惠券、返利等信息，让用户在购物时节省开支，实现更实惠的购物体验。二、公
为什么用Pytorch帮客户训练好了模型还要提供模型结构？ yuanpan pytorch 人工智能机器学习
如果我在训练模型后生成好了一个模型文件：mnist_model.pth我想把这个模型文件给第三方使用，而不告诉他模型定义的结构等信息，那么第三方是不是就用不起来这个模型？答案：是的。如果只提供.pth文件而不告知模型结构，第三方确实无法直接使用该模型。原因和解决方案如下：1.为什么无法直接使用？.pth文件仅保存参数：torch.save(model.state_dict(),'mnist_mod
五级电子病历系统专业截图与标注工具
本文还有配套的精品资源，点击获取简介：电子病历系统是医疗信息化的关键，而五级系统是中国卫生信息化建设中的重要标准。这款“五级电子病历指定截图工具”是为五级电子病历系统专门设计的专业辅助工具，提供高效的信息获取和处理功能。它不仅具备定制化的截图功能，还有录屏和标注功能，旨在帮助医疗工作者更快速准确地完成截图，并通过视频记录和编辑提高工作效率。这款工具通过提供专业截图、录屏和标注能力，专为医疗行业的信
python学习打卡：DAY 18 推断聚类后簇的类型西西西仓鼠 python训练营 python 学习聚类
@浙大疏锦行聚类后的分析：推断簇的类型知识点回顾：推断簇含义的2个思路：先选特征和后选特征通过可视化图形借助ai定义簇的含义科研逻辑闭环:通过精度判断特征工程价值作业：参考示例代码对心脏病数据集采取类似操作，并且评估特征工程后模型效果有无提升。在聚类分析中，推断簇的类型是理解数据内在结构和业务意义的关键步骤。以下是系统化的推断方法及常见簇类型的总结：一、簇的基本类型明显分离的簇特征：不同簇中任意两
掌握 RAG：使用 Langchain 和 Ollama 创建本地智能应用程序知世不是芝士 langchain 人工智能 ai大模型大语言模型 ollama 本地部署大模型大模型技术
引言随着大型语言模型（LLMs）的兴起，我们见证了一种新的工具类别的诞生。然而，LLMs也存在局限性，尤其是当面对需要最新信息或专有数据的商业用例时。本文将介绍如何通过微调和RAG来解决这些问题。LLMs的局限性传统LLMs训练成本高昂，且只能访问公共信息。对于商业用途，需要模型能够提供基于内部知识的最新回应。文章介绍了两种解决这一问题的方法：微调和RAG。微调微调是针对特定数据集进一步训练预训练
福袋生活是什么？福袋生活怎么赚钱？氧惠评测
福袋生活是广州市福袋生活信息科技有限公司旗下一家多元化社交电商导购平台，它以APP为载体，社群为媒介，汇集衣食住行、吃喝玩乐等生活服务板块，为用户提供优惠与便捷服务。福袋生活的主要特点和功能包括以下几个方面：福袋生活是什么？综合返利券商品平台：福袋生活集合了多家知名电商平台（如淘宝、天猫、京东、拼多多等）的优惠券信息，用户可以在平台上搜索并领取优惠券，享受购物优惠。即使没有优惠券，用户也可以通过福
2022-06-24 f0a097af1041
2022年6月24日爱的开启第75日，肯定自己：1、每年这个时间，是高考生成绩公布的时候，每年这个时间，所有考生及家长最激动人心的时间，我也睡不着，在关注这个问题，太激动了，十年寒窗苦读，学子们就等着这天的果实与收获。2、可是在这个特殊的日子里，居然幼儿园大班的小朋友要上一年级了，教育局主管部门在那里等候审核孩子们的信息，大班老师们带着信息步入教育局，配合审核工作。
Python爬虫实战：研究Korean库相关技术 ylfhpy 爬虫项目实战 python 爬虫 easyui korean
一、引言1.1研究背景与意义随着韩流文化在全球的传播，韩语网页内容急剧增加。韩国在科技、娱乐等领域的信息具有重要研究价值。然而，韩语独特的黏着语特性（如助词体系、词尾变化）给信息处理带来挑战。传统爬虫缺乏对韩语语言特点的针对性处理，本研究旨在开发一套完整的韩语网页内容分析系统，填补这一技术空白。1.2研究目标与方法研究目标：设计高效的韩语网页爬虫框架实现精准的韩语内容识别与处理构建多维度的韩语内容
Python爬虫实战：研究Genius库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 genius
1.引言在当今数字化时代，音乐数据的分析与挖掘成为了音乐学、计算机科学等领域的研究热点。歌词作为音乐的重要组成部分，蕴含着丰富的情感、文化和社会信息。通过对歌词数据的分析，可以揭示音乐风格的演变、流行趋势的变化以及社会情绪的波动等。Genius是一个专注于歌词解析与音乐知识分享的平台，拥有大量的歌词文本以及用户对歌词的注释和解读。Genius提供了API接口，允许开发者获取歌曲、艺术家和歌词等信息
Prometheus搭建和 Node_Exporter搭建强_子 prometheus
1.Prometheus和Node_Exporter的关系●Prometheus:是一个开源的监控和告警工具，能够从各种数据源（如NodeExporter）拉取指标，并存储这些指标。它提供了一个强大的查询语言（PromQL），可以用来分析和可视化监控数据。●Node_Exporter:是Prometheus的一个官方插件，用于收集主机系统的硬件和操作系统级别的指标（如CPU使用率、内存使用情况、磁
【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
心情压抑的一天z 风铃_12bf
今天是星期一，但是心情莫名地感到有丝丝的压抑感，或许是今天是7月1号，省工伤系统第一次正式使用，预感到有很多的问题，或许是又到了月初，又要写月报表，又要清理好手头上的工作，以腾出时间完成月报表，又或许是上星期积累了一些单据，要这个星期清理，且单据中有自己讨厌的一家医院的单据和另外一家从未做过的私人医院单据，这两份单据都不好处理。上午，因为省系统首次使用，自己又没用参加过培训，又在群信息里留意到省系
在汕头叙叙旧生命印记
回想在汕头工作的日子，已远离整整8个年头。日子不回看，不知有多少，屈指一算，这么久远！在汕头的日子，简单！当时的同事，能全聚聚的次数还没有过，每次只能有一二个老同事，或是加些新同事。很是开心的，叙旧的同时也能看到大家的不一样。有些老同事，已经离开公司有新的发展，每次碰面总能看到大家各自安好。因在不同公司，有着不同文化，彼此的交流总能学习到不一样的信息。一直告诉自己，学习是无时无刻，随时随地。三人行
渗透攻击红队百科全书绝不原创的飞龙渗透
据说原始扫描件有病毒，我就解析Xref提取图片然后重新生成了一份。我也拿不到纸质书，根据网上流传的版本加工了一下，不清楚是肯定的。其他的不说了，懂的都懂。目录第一章信息搜集1.1主机发现1.2关联信息生成1.3开放漏洞情报1.4开源情报信息搜集(OSINT)1.5GithubHacking1.6GoogleHacking1.7Gitlcret1.8Mailsniper.psl获取Outlook所有
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的