让机器理解语言か

【数据可视化】案例一：美国人口与种族变迁史

实验介绍

作为一个移民国家，美国的种族和人口问题全方位地影响着美国各州的政治、经济、文化和司法，本实验通过对美国人口普查局与美国国家卫生统计中心自 1990 以来调查获得的长达 29 年的美国人口和种族数据的分析，研究及可视化了美国在此期间的人口和种族的变迁史。

知识点

散点图接口及其参数的使用
漏斗图的绘制
画布上多子图的绘制
散点图的数据拟合
颜色条的绘制和应用
数据对数变换技巧

输入并执行魔法命令 %matplotlib inline，同时将全局字体大小设置为 20 号，设置显示负数，去除图例边框、右侧坐标轴、顶部坐标轴。

import warnings
import matplotlib.pyplot as plt
%matplotlib inline

# 屏蔽代码运行过程中出现的警告信息，主要是屏蔽 pandas 的 .loc 警告问题
warnings.filterwarnings("ignore")

# 将全局字体大小设置为 20 号
fontsize = 20
plt.rcParams['xtick.labelsize'] = fontsize
plt.rcParams['ytick.labelsize'] = fontsize
plt.rcParams['axes.labelsize'] = fontsize
plt.rcParams['axes.titlesize'] = fontsize
plt.rcParams['legend.fontsize'] = fontsize

plt.rcParams['legend.frameon'] = False  # 去除图例边框
plt.rcParams['axes.unicode_minus'] = False  # 显示负数
plt.rcParams['axes.spines.right'] = False  # 去除右侧坐标轴
plt.rcParams['axes.spines.top'] = False  # 去除顶部坐标轴

数据准备

数据集介绍：

本数据集来源于美国人口普查局与美国国家卫生统计中心，该数据集统计了美国自 1990 至 2019 年期间，各年度全美 51 州各年度性别（Gender）、种族（Race）、年龄段（Age Group）的人口数（Population），数据集中的 Mean Age 字段根据 Age Group 求算术平均得到。

导入数据并查看前 5 行。

import pandas as pd

df = pd.read_csv('https://labfile.oss.aliyuncs.com/courses/3023/American_Race_Gender_Population.csv')
df.head()

	Age Group	State	Gender	Race	Year	Population	Mean Age
0	1-4	Alabama	Female	American Indian or Alaska Native	1990	419.0	2.5
1	1-4	Alabama	Female	American Indian or Alaska Native	1991	445.0	2.5
2	1-4	Alabama	Female	American Indian or Alaska Native	1992	379.0	2.5
3	1-4	Alabama	Female	American Indian or Alaska Native	1993	344.0	2.5
4	1-4	Alabama	Female	American Indian or Alaska Native	1994	352.0	2.5

各州各种族人口数分布

本实验主要用到的可视化对象为散点图，散点图是继条形图后，用作描述性统计、数据挖掘、数据预测的第二大类可视化图形，图元素主要包括点的位置，点的形状和点的大小。

选择 1990 和 2019 两个年份，将数据集按照州（State）、种族（Race）进行人口数（Population）聚合并按照人口数升序排序。聚合后，将聚合数据集中的 State、Race 特征分别映射至散点图 x、y 坐标，将 Population 人口数特征映射至点的颜色（c）和大小（s）。

plt.rcParams['figure.figsize'] = (20, 5)  # 图像显示大小

for year in [1990, 2019]:
    data = df.loc[df['Year'] == year]  # df.loc() 根据行/列的标签进行查询

    # 各州按照总人口数升序排序
    state_order = data.groupby(['State'])[  # 按列State进行分组，按Population数据列的和进行升序排序
        'Population'].sum().sort_values().index    # 取出排序后的序号
    # 将 State 字段设置为有序字段
    data['State'] = data['State'].astype(   # astype函数用于将数据类型转换成指定类型。
        pd.api.types.CategoricalDtype(state_order, ordered=True))
# pandas.api.types.CategoricalDtype(categories = None, ordered = None) :该类对于指定独立于数值的分类数据的类型很有用，有类别和顺序。

    # 获取州、种族的聚合结果，并按州升序排序 
    data = data.groupby(['State', 'Race'], as_index=False)[ # 按列'State', 'Race'进行分组，求出人口总数，按State数据列的和进行升序排序
        'Population'].sum().sort_values(['State'])

    plt.scatter(
        x=data['State'],  # x轴为州
        y=data['Race'],   # y轴为种族
        c=data['Population'],           # 点的颜色，按人口的多少来划分
        s=data['Population']*0.0001,    # 点的大小：根据画出来的图的情况进行调节
        ec='tab:blue',       # 
        cmap=plt.cm.Accent,  # cmap相当于多个调色盘的合集。当选取一个色盘（viridis）后，从参数c获取到的数值，映射到色盘对应的颜色上。
        alpha=0.8)   # alpha：散点的透明度（[0, 1]之间的数，0表示完全透明，1则表示完全不透明）。

    ax = plt.gca()  # gca()进行坐标轴的移动
    ax.tick_params(axis='x', rotation=90) # 将x轴刻度标签逆时针旋转90度  
    ax.set_ylim(-0.5, 3.5) # 调节y轴显示范围

    plt.title('Population Distribution of States of American in Year %d' % year)
    plt.show()  # 关闭当前图层以绘制下一幅图

从输出结果可以看出：

各州人口数。根据 2019 年统计数据，美国人口数最多的三个州分别为 California、Texas、Florida；
种族人口数。美国人口种族分布上，白人（White）显著地占据着主体地位，排名第二的种族为黑人（Black or African American），随后是亚裔（Asian or Pacific Islander）；
各州人口变迁。对比 1990 年与 2019 年，按照人口数排序后的 x 轴，可以发现 29 年间，美国各州表现出不同速率的人口增长率，1990 年总人数排名第二的 New York 已悄然在 2019 年排名第四。

人口与人口增长率

提取数据集中 1990 和 2019 两年的数据，通过数据透视计算各州人口增长率（Pupulation Changed %），通过数据聚合计算各州 2019 年总人口数（Population），将上述分步计算结果合并并挑选需要的特征后查看前 5 行。

# 取出指定列'Year'的1990和2019数据
data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]   

# 计算美国各州人口增长率
pop_change = data.pivot_table(
    index='State', columns='Year', values='Population',aggfunc='sum')
# values：要做计算的数据 ，对谁求和/求均值/计算个数等
# index：确定行参数，可以是多个。单个’‘，多个[’‘,’‘]表示
# columns：确定列参数，可以是多个。单个’‘，多个[’‘,’']
# aggfunc：要计算的函数，mean求均值、sum求和、size计算个数
pop_change['Pupulation Changed/%'] = 100 * \            # 加上一列'Pupulation Changed/%'
    (pop_change[2019]-pop_change[1990])/pop_change[1990]
pop_change

# 计算美国2019年各州总人口数
pop = df.loc[df['Year'] == 2019].groupby(['State'])['Population'].sum()

# # 将人口增长率与白人增长率数据合并并筛选需要的特征
data = pd.concat([pop, pop_change], axis=1)[    # 在列上做合并
    ['Population', 'Pupulation Changed/%']]

data.head()

State	Population	Pupulation Changed/%
Alabama	4903185.0	21.064652
Alaska	731545.0	32.217282
Arizona	7278717.0	97.571264
Arkansas	3017804.0	28.058301
California	39512223.0	31.885389

将人口总数与人口增长率数据分别映射到散点图 x、y 坐标及点颜色和大小。

plt.rcParams['figure.figsize'] = (14, 7)  #  # 图像显示大小（长, 宽）
 
x = data['Population']            # x变量
y = data['Pupulation Changed/%']  # y变量

plt.scatter(x, y,
            marker='o',                  # 点的形状
            s=data['Population']*0.0001, # 点的大小
            c=data['Population'],        # 点的颜色
            cmap=plt.cm.Blues_r,         # 调色板，与c配合使用
            edgecolors='gray')  # 散点图标记的轮廓及填充颜色

plt.xlabel('Population')
plt.ylabel('Pupulation Changed /%')
# 画均值线
plt.axhline(y=y.mean(),color='tab:red',label=f'Avg Changed Ratio:{y.mean():.2f}%')

plt.legend()   # 添加图例

s = data.index # 取出索引

for xpos, ypos, text in zip(x, y, s):    # 将坐标（x,y）和索引（州）打包然后遍历
    plt.text(xpos, ypos, text, size=16,va='bottom',ha='left')  # 设置文字说明

plt.title('Population & Pupulation Changed (Compared to Year 1990) of American') # 设置标题

从输出结果可以看出：

全美各州在 1990 - 2019 年间的人口平均增长率为 32.94%；
在人口最大的四个州中，Califonia 人口增长率与平均水平相当，Texas 与 Florida 有了超平均数的增长，而 New York 不出意外地没有达到平均增长率；
在人口增速方面 Nevada 和 Arizona 两州有着最好的表现。

对于人口数量较少和人口增速不明显的多数州，其数据被压缩至平均线以下的 0 轴附近，可通过将数据进行对数变换（log）的方法，将数据均匀分布。

import numpy as np

plt.rcParams['figure.figsize'] = (14, 7)

x = np.log(data['Population'])            # 将数据进行对数变换（log）
y = np.log(data['Pupulation Changed/%'])  # 将数据进行对数变换（log）

plt.scatter(x, y,
            marker='o',
            s=data['Population']*0.0001,
            c=data['Population'],
            cmap=plt.cm.Blues,
            label='Changed of States of American',
            edgecolors='gray')  # 散点图标记的轮廓及填充颜色

plt.xlabel('log (Population)')
plt.ylabel('log (Pupulation Changed /%)')


s = data.index

for xpos, ypos, text in zip(x, y, s):
    plt.text(xpos, ypos, text, size=16, va='bottom', ha='left')

plt.title('Population & Pupulation Changed (Compared to Year 1990) of American')

从输出结果可以看出，数据在对数坐标系下，分散变得十分均匀，各数据点被均匀拉开。

种族及人口变化率

白人

通过以下代码计算各州人口增长率与白人增长率，计算原理与总人口增长率计算原理相同。

# 在原表中指定列'Year'的1990和2019数据
data = df.loc[(df['Year'] == 1990) |(df['Year'] == 2019) ]

# 计算美国各州人口增长率
pop_change=data.pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')# 数据透析表:列为年份，1990和2019两列
pop_change['Pupulation Changed/%']=100*(pop_change[2019]-pop_change[1990])/pop_change[1990]# 在原表新增一列人口变化率
pop_change

# 计算美国各州白人人口增长率
white_change=data.loc[data['Race']=='White'].pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
white_change['White Changed/%']=100*(white_change[2019]-white_change[1990])/white_change[1990]
white_change

# 将人口增长率与白人增长率数据合并
changed=pd.concat([pop_change,white_change],axis=1) # 将两个表按列合并，共6列

# 挑选主要字段
changed=changed[['Pupulation Changed/%','White Changed/%']]  # 取出'Pupulation Changed/%'和'White Changed/%'两列

# 展示前5行数据
changed.head()

Year	Pupulation Changed/%	White Changed/%
State
Alabama	21.064652	15.051925
Alaska	32.217282	18.947448
Arizona	97.571264	85.805934
Arkansas	28.058301	23.990308
California	31.885389	19.912456

将各州人口增长率与各州白人增长率分别映射到散点图，通过 np.ployfit 拟合其关系并绘制拟合曲线，同时绘制 y = x 曲线，该曲线表示，种族增长率与人口增长率一致。

plt.rcParams['figure.figsize'] = (10, 6)

x = changed['Pupulation Changed/%']
y = changed['White Changed/%']

# 绘制各州人口及白人增长数据
plt.scatter(x, y,
            marker='o',s=120,
            label='Changed of States of American',
            edgecolors='tab:red',facecolor='white') # 散点图标记的轮廓及填充颜色

plt.xlabel('Pupulation Changed /%')
plt.ylabel('White Race Changed /%')

# 拟合增长率曲线

f_1 = np.polyfit(x, y,deg=1)   # 对（x, y）得到拟合多项式系数f_1，自由度为1

# 绘制 白人人口增长率 拟合的增长曲线
plt.plot(x,np.polyval(f_1, x), # np.polyval(f_1,x)计算多项式的函数值。返回在x处多项式的值，p为多项式系数
         lw=2,color='tab:orange',label='Increase Ratio of White Race') # lw:线宽

# 绘制平衡增长曲线  y=x
plt.plot(np.linspace(0,150,20), # 等差数列：在0~150之间划分20个点；因为线性为“--”，所以这里只是规定了0~150的范围
         np.linspace(0,150,20),
         color='tab:blue',
         label='Increase Ratio of Balance',ls='--',lw=3)

plt.legend()    # 添加图例

# 添加文字说明
plt.text(25,75,'District of Columbia',fontsize=20,color='tab:red',ha='center',va='bottom')
plt.text(155,120,'Nevada',fontsize=20,color='tab:red',ha='center',va='bottom')

plt.title('Population & White Race Changed of States of American')

从输出结果可以看出：

种族增长率与人口增长率有很好的线性关系，与 y = x 平衡线对比，白人在各州的增长率斜率小于平衡线斜率（橘色线斜率 < 蓝色线），说明白人增速稍低于平衡增速；
District of Columbia 州种族增长率显著高于平均水平，白人增速明显。

所有种族

用类似数据处理过程获得全部种族人口增长率与种族增长率数据。

data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]

# 计算美国各州人口增长率
changed = data.pivot_table(index='State', columns='Year', values='Population',aggfunc='sum')
changed['Pupulation Changed /%'] = 100 * \
    (changed[2019]-changed[1990])/changed[1990]


race_columns = ['Pupulation Changed /%']
for race in ['American Indian or Alaska Native', 'Asian or Pacific Islander', 'Black or African American', 'White']:

    # 计算美国各种族人口增长率
    race_change = data.loc[data['Race'] == race].pivot_table(
        index='State', columns='Year', values='Population',aggfunc='sum')   # 数据透析表：两列1990和2019
    race_change[race+' Changed /%'] = 100 * \          # 每次新增一列种族人口变化率
        (race_change[2019]-race_change[1990])/race_change[1990]

    # 将人口增长率与各族人口增长率数据合并
    changed = pd.concat([changed, race_change], axis=1)  

    race_columns.append(race+' Changed /%')    # 加入各种族人口变化率标签
# race_change加入循环前是3列，每个循环都是3列，所以changed总共是15列
# 挑选主要字段
changed = changed[race_columns]  # 取出种族人口变化率标签的那五列

# 展示前5行数据
changed.head()

Year	Pupulation Changed /%	American Indian or Alaska Native Changed /%	Asian or Pacific Islander Changed /%	Black or African American Changed /%	White Changed /%
State
Alabama	21.064652	135.798817	289.331931	31.059229	15.051925
Alaska	32.217282	47.064691	217.124410	58.636664	18.947448
Arizona	97.571264	91.725016	436.006760	270.124184	85.805934
Arkansas	28.058301	178.132082	442.256511	30.806671	23.990308
California	31.885389	167.208411	123.198473	22.854617	19.912456

通过 plt.subplots 接口生成一张画布 fig 和 2 * 2 的子图对象，在每个子图对象分别绘制每个种族的增长率数据。

plt.rcParams['figure.figsize'] = (12, 8)

# 生成 2 * 2 的画布，并共享所有子图x，y轴范围
fig, axs = plt.subplots(2, 2, sharex=True, sharey=True)
# fig代表整个图像，ax代表坐标轴和画的子图，通过下标获取需要的子区域。

axs = axs.ravel()  # 将 2 * 2 的子图对象展平成 1 * 4的子图对象，下面好遍历所有子图

x = changed['Pupulation Changed /%']  # x均为总人口变化率

for i, race in enumerate(race_columns[1:]): # 取出四个种族的人口变化率（除了总人口变化率之外）

    ax = axs[i]        # 遍历每个子图
    y = changed[race]  # y为对应种族的人口变化率

    # 绘制各州人口及白人增长数据
    ax.scatter(x, y,
               marker='o', s=120,     # 散点的形状和大小
               edgecolors='tab:red', facecolor='white')  # 散点图标记的轮廓及填充颜色
    # 拟合增长率曲线
    f_1 = np.polyfit(x, y, deg=1)  # 对（x, y）得到拟合多项式系数f_1，自由度为1（即多项式次数为1）

    # 绘制拟合的增长曲线
    ax.plot(x, np.polyval(f_1, x), # 计算多项式的函数值。返回在x处多项式的值，f_1为多项式系数，元素按多项式降幂排序
            lw=2, color='tab:orange')

    # 绘制平衡增长曲线  y=x
    ax.plot(np.linspace(0, 150, 20),
            np.linspace(0, 150, 20),
            color='tab:blue',
            label='Increase Ratio of Balance', ls='--', lw=3)

    ax.legend(fontsize=17)
    ax.set_title(race,fontsize=17)

    # 第一列和最后一行分别显示y坐标轴标题和x坐标轴标题
    if i in [2, 3]:
        ax.set_xlabel('Pupulation Changed /%')  # 在画第三和第四个图的时候标注x轴标题
    if i in [0, 2]: 
        ax.set_ylabel('Race Changed /%')        # 在画第一和第三个图的时候标注y轴标题

# 添加画布标题
fig.suptitle('Population & Race Changed of States of American\n',
             size=25, va='bottom')

# 调整子图间距为紧凑
plt.tight_layout()

从输出结果可以看出：

American Indian or Alaska Native 本土原著名的种族增长率正逐步放缓，其斜率小于平均线；
Asian or Pacific Islander 亚裔种族增长率为四个种族中最高；
Black or African American 黑人虽然在增长率上不及亚裔，但在个别州有较为显著增长（图形上表现出大量的偏离拟合曲线点）；
White 占据人口主要数量的白人与全美总人口增长率大致相当。

通过以下过程，将所有种族人口增长率数据进行纵向拼接。

data = df.loc[(df['Year'] == 1990) |(df['Year'] == 2019) ]

# 计算美国各州人口增长率
changed=data.pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
changed['Pupulation Changed /%']=100*(changed[2019]-changed[1990])/changed[1990]

race_changes=pd.DataFrame() # 创建二维数组

for race in ['American Indian or Alaska Native', 'Asian or Pacific Islander', 'Black or African American','White']:
    
    # 计算美国各州各种族人口增长率
    race_change=data.loc[data['Race']==race].pivot_table(index='State',columns='Year',values='Population',aggfunc='sum')
    race_change['Race Changed /%']=100*(race_change[2019]-race_change[1990])/race_change[1990]  # 新增一行该种族的人口变化率
    race_change['Race']=race          # 新增一行该种族的名称
 
    # 将人口增长率与各种族人口增长率数据合并
    race_change=pd.concat([changed,race_change],axis=1)       # 按列拼接   
    race_changes=pd.concat([race_changes,race_change],axis=0) # 按列拼接完再进行按行拼接

# 挑选主要字段
race_changes=race_changes[['Pupulation Changed /%','Race Changed /%','Race']]

# 展示前5行数据
race_changes.head()

Year	Pupulation Changed /%	Race Changed /%	Race
State
Alabama	21.064652	135.798817	American Indian or Alaska Native
Alaska	32.217282	47.064691	American Indian or Alaska Native
Arizona	97.571264	91.725016	American Indian or Alaska Native
Arkansas	28.058301	178.132082	American Indian or Alaska Native
California	31.885389	167.208411	American Indian or Alaska Native

通过 seaborn 的 scatterplot 接口绘制所有种族的人口增长率与总人口增长率散点图，从输出结果可以看出，该图是将 2 * 2 的子图进行了合并展示，并通过颜色将各种族进行了区分。

import seaborn as sns
plt.rcParams['figure.figsize'] = (10, 7)

sns.scatterplot(
    x='Pupulation Changed /%',
    y='Race Changed /%',
    hue='Race', # 将种族列传入hue，不同种族会输出不同颜色
    s=200,
    alpha=0.8,
    data=race_changes,
)

plt.ylim(-80, 800)
ax = plt.gca()

# 获取图例对象及图例标签对象
h, l = ax.get_legend_handles_labels()
# 第0个图例对象是图例标题，此处将其删除，不显示
ax.legend(h[1:], l[1:], ncol=2, loc=2, fontsize=18)

# 绘制平衡增长曲线  y=x
plt.plot(np.linspace(0, 150, 20),
        np.linspace(0, 150, 20),
        color='tab:red',
        label='Increase Ratio of Balance', ls='--', lw=5)

plt.title('Population & Race Changed of States of American\n',
          size=25, va='bottom')

从输出结果可以看出：

白人增长率数据点与平衡线（红色）分布最为一致；
少数族裔相比白人有着较高的人口增长率。

黑人与亚裔

黑人和亚裔人口增长率有着较为亮眼地表现，以下数据处理过程获得了各州黑人及亚裔的不同增长率。

data = df.loc[(df['Year'] == 1990) | (df['Year'] == 2019)]

# 计算美国各州人口增长率
changed = pd.DataFrame()
race_columns = []
for race in ['Asian or Pacific Islander', 'Black or African American']:

    # 计算美国各州白人人口增长率
    race_change = data.loc[data['Race'] == race].pivot_table(
        index='State', columns='Year', values='Population',aggfunc='sum')
    race_change[race+' Changed /%'] = 100 * \
        (race_change[2019]-race_change[1990])/race_change[1990]

    # 将人口增长率与白人增长率数据合并
    changed = pd.concat([changed, race_change], axis=1)

    race_columns.append(race+' Changed /%')

# 挑选主要字段
changed = changed[race_columns]

# 展示前5行数据
changed.head()

Year	Asian or Pacific Islander Changed /%	Black or African American Changed /%
State
Alabama	289.331931	31.059229
Alaska	217.124410	58.636664
Arizona	436.006760	270.124184
Arkansas	442.256511	30.806671
California	123.198473	22.854617

将各州亚裔和黑人种族人口增长率分别映射到 x、y 将增长率超 300% 的州用不同颜色进行标记。

plt.rcParams['figure.figsize'] = (15, 8)

x = changed['Asian or Pacific Islander Changed /%']
y = changed['Black or African American Changed /%']

plt.scatter(x, y,
            marker='o', s=120,
            label='Changed of States of American',
            edgecolors='tab:red', facecolor='white')  # 散点图标记的轮廓及填充颜色

plt.xlabel('Asian or Pacific Islander Changed /%')
plt.ylabel('Black or African American Changed /%')


for i in range(len(changed)):
    limit_changed = 300
    # 亚裔增长更快的州
    if (changed.iloc[i, 0] > limit_changed) & (changed.iloc[i, 1] < limit_changed):
        color = 'tab:blue'
    # 黑人增长更快的州
    elif (changed.iloc[i, 1] > limit_changed) & (changed.iloc[i, 0] < limit_changed):
        color = 'tab:red'
    # 亚裔和黑人增长均较快的州
    elif (changed.iloc[i, 1] > limit_changed) & (changed.iloc[i, 0] > limit_changed):
        color = 'tab:orange'
    else:
        color = 'black'

    plt.text(changed.iloc[i, 0], changed.iloc[i, 1], changed.index[i],
             fontsize=20, color=color, ha='center', va='bottom')


plt.title('Asian or Pacific Islander & Black or African American Race Changed of States of American')

从运行结果可以看出：

亚裔增长主要发生在以 Georgia 为代表的蓝色州；
黑人增长主要发生在以 Idaho 为代表的红色州；
亚裔和黑人在 North Dakota、South Dakota、Nevada 三个州均有较高的增长；
亚裔和黑人的增长，在一定程度下，带有一定的地区性特色。

人口结构

各年龄人数随年份变化

将数据集按年份和平均年龄进行聚合，并将年份、平均年龄、人口数映射到散点图。

plt.rcParams['figure.figsize'] = (18, 8)

data = df

# # 获取州、种族的聚合结果，并按升序排序
data = data.groupby(['Year','Mean Age'],as_index=False)['Population'].sum().sort_values(['Population'])

plt.scatter(
    x=data['Year'],
    y=data['Mean Age'],
    c=data['Population'],
    s=data['Population']*0.00003,
    ec='tab:gray',
    cmap=plt.cm.RdBu_r,
    alpha=0.8)

ax = plt.gca()

# 不显示左侧和底部纵坐标轴
ax.spines['left'].set_visible(False)
ax.spines['bottom'].set_visible(False)

# 显示 y 轴网格线
ax.grid(b=True,axis='y',lw=1)

plt.ylabel('Mean Age')

plt.title('Population Distribution of Age Group of American From Year 1990 to Year 2019')

从运行结果可以看出，美国人口结构正趋向于老龄化，表现在：

1990 年：人口结构按年龄组分布，呈现出 20 - 40 岁的单峰分布；
2019 年：原先的20 - 40 岁已转移至 40-70 岁年龄组，1990 年以来的新生儿逐渐转移至 20-40 年龄组，呈现出双峰分布。

各年龄组构成的人口结构

将平均年龄字段按照 20，40，70 三个节点进行切分，获得青年、壮年、中年、老年 4 个年龄分组段，聚合各分组段人数后用漏斗图可视化 1990 年的人口结构。

!pip install pyecharts==1.7.1

from pyecharts import options as opts
from pyecharts.charts import Funnel

data = df.loc[df['Year'] == 1990]
# 将平均年龄进行数据切分，生成新的组
data['Age Group3'] = pd.cut(
    data['Mean Age'],
    bins=[0, 20, 40, 70, 100],
    labels=['Youth(<20)', 'Prime(20-40)', 'Middle(40-70)', 'Old(>70)'])
data = data.groupby(['Age Group3'], as_index=False)['Population'].sum()
data['Population'] = data['Population']/np.sum(data['Population'])*100

funel = Funnel()
funel.add(
    " ",
    [list(z) for z in zip(data['Age Group3'], data['Population'])],
    sort_='none',
    label_opts=opts.LabelOpts(position="inside"),
)
funel.set_global_opts(
    title_opts=opts.TitleOpts(
        title="Population Struction of American Year 1990",),
    legend_opts=opts.LegendOpts(
        pos_top='5%', textstyle_opts=opts.TextStyleOpts(font_size=15)),
)
funel.render_notebook()

从输出结果可以看出：1990 年的美国人口结构以 20-40 的壮年为主。

data = df.loc[df['Year'] == 2019]
data['Age Group3'] = pd.cut(
    data['Mean Age'],
    bins=[0, 20, 40, 70, 100],
    labels=['Youth(<20)', 'Prime(20-40)', 'Middle(40-70)', 'Old(>70)'])
data = data.groupby(['Age Group3'], as_index=False)['Population'].sum()
data['Population'] = data['Population']/np.sum(data['Population'])*100

funel = Funnel()
funel.add(
    " ",
    [list(z) for z in zip(data['Age Group3'], data['Population'])],
    sort_='none',
    label_opts=opts.LabelOpts(position="inside"),
)
funel.set_global_opts(
    title_opts=opts.TitleOpts(
        title="Population Struction of American Year 2019",),
    legend_opts=opts.LegendOpts(
        pos_top='5%', textstyle_opts=opts.TextStyleOpts(font_size=15)),
)
funel.render_notebook()

从运行结果可以看出，时过境迁，2019 年美国人口结构已悄然下移。

新生儿出生率

统计各州 <1 和 1-4 两个年龄组（Age Group）的年度人口增长率，分析各州新生儿出生率，数据处理过程详见代码注释。

data = df

# 选出平均年龄小于 3 的样本数据，即对应 <1 和 1-4 两个年龄组
data = data.loc[data['Mean Age'] < 3]

# 空 df 对象，装各州处理后数据
state_data = pd.DataFrame()

for state in list(set(data['State'])):
    # 聚合得到每个州总人数
    tmp = data.loc[data['State'] == state].groupby(
        ['Year'], as_index=False)['Population'].sum()

    # 将 Population 列移位 1 个周期，获得新的特征列 Population Last Year 即 去年总人口数
    tmp['Population Last Year'] = tmp.shift()['Population']

    # 新生儿出生率计算原理为  100*（当年人口数 - 去年人口数） / 去年人口数
    tmp['Birth Increase Ratio /%'] = 100 * (tmp['Population']-tmp['Population Last Year']) / tmp['Population Last Year']

    # 由于 1990 年没有上年数据，因此其增长率计算结果为空值，将其增长率填充为 0
    tmp['Birth Increase Ratio /%'].fillna(value=0, inplace=True)
    tmp['State'] = state

    # 将所有州的数据进行列方向上的合并
    state_data = pd.concat([state_data, tmp])

state_data = state_data.sort_values('Population')

# 查看前 5 行数据
state_data.head()

	Year	Population	Population Last Year	Birth Increase Ratio /%	State
29	2019	29043.0	29625.0	-1.964557	Vermont
28	2018	29625.0	30004.0	-1.263165	Vermont
27	2017	30004.0	30234.0	-0.760733	Vermont
26	2016	30234.0	30539.0	-0.998723	Vermont
25	2015	30539.0	30609.0	-0.228691	Vermont

散点图颜色映射的数据，可通过 plt.colorbar 生成的颜色条做辅助可视化，方便读者阅读每个颜色点对应的绝对数值，其原理是将散点图返回的 mappable 对象传入 plt.colorbar 中，plt.colorbar 生成的颜色条（cbar），其颜色板和显色数据区域通过散点图接口中的 cmap、vmin、vmax等参数控制。

plt.rcParams['figure.figsize'] = (18, 8)

# 生成画布并新增子图，111 表示 1行1列第1个子图
ax = plt.figure().add_subplot(111)

# ax.scatter 接口返回的 mappable 对象，用以传入 plt.colorbar 接口中，实现颜色与数据在颜色条上的映射
mappable = ax.scatter(
    x=state_data['State'],
    y=state_data['Year'],
    c=state_data['Birth Increase Ratio /%'],
    s=np.abs(state_data['Birth Increase Ratio /%'])*50,  # 将增长率为负值的数据取绝对值
    ec='gray',
    vmin=-7,  # 颜色条映射数据最小值
    vmax=7,  # 颜色条映射数据最大值
    cmap=plt.cm.RdBu_r,
)


# 将 x 轴刻度标签旋转 90 度
ax.tick_params(axis='x', rotation=90)
ax.spines['left'].set_visible(False)
ax.spines['bottom'].set_visible(False)

# 添加 1993、2009 两条水平辅助线
ax.axhline([1993], xmin=0.05, xmax=0.95, color='tab:red')
ax.axhline([2009], xmin=0.05, xmax=0.95, color='tab:blue')

# 添加颜色条
cbar=plt.colorbar(
    mappable=mappable,
    ax=ax,
    aspect=40,  # 颜色条的长宽比例  =长度/宽度
    pad=0.005,  # 散点图和颜色条的间距
    fraction=0.02  # 散点图和颜色条在画布上宽度的比例  =颜色条宽度/散点图宽度
)

ax.set_title(
    'Birth Increase Ratio of States of American from Year 1990 to 2019')

从输出结果可以看出：

人口基数最大的 California， 1993 年以后新生儿出生率一直处于下降阶段；
大多数州在 2009 年以后均呈现出新生儿出生率下降状况；
North Dakota 和 District of Columbia 两州阶段性地出现婴儿潮。

性别分布

选择 1990 、2010、 2019 三个年份，将数据集按照性别（Gender）、种族（Race）进行人口数（Population）聚合并按升序排列。聚合后，将聚合数据集中的 Gender、Race 特征分别映射至散点图 x、y 坐标，将 Population 人口数特征映射至点大小（s），将 Gender 映射至点颜色（c）。

fig, axs = plt.subplots(1, 3, figsize=(15, 6), sharey=True, sharex=True)

for i, year in enumerate([1990, 2010, 2019]):
    ax = axs[i]
    data = df.loc[df['Year'] == year].groupby(
        ['Gender', 'Race'], as_index=False)['Population'].sum().sort_values('Population')
    data

    ax.scatter(
        x=data['Gender'],
        y=data['Race'],
        c=data['Gender'].apply(lambda x: 'tab:red' if x ==
                               'Female' else 'tab:blue'),
        s=data['Population']*0.00007,
        ec='gray',
    )

    ax.set_ylim(-0.5, 4)
    ax.set_xlim(-1, 1.5)
    ax.set_title('Year %d' % year)

    if i > 0:
        ax.spines['left'].set_visible(False)

fig.suptitle('Population Distribution Varies with Gender of USA',
             size=25, va='bottom')

从输出结果可以看出，各种族在选定的3个年份并未呈现出显著差异，说明美国的人口结构中，性别分布相对均匀。

实验总结

本实验以散点图为主要绘图对象，对美国 1990 - 2019 年期间人口与种族变迁做了研究，通过分析和可视化，得出以下结论：

美国是以白人为主体种族的国家，在各大州白人的数量和占比都具有绝对优势；
在过去的 29 年间，白人一直保持着与美国国家人口增速相同的增长速率；
黑人和亚裔作为仅次于白人排名的种族，在过去 29 年间有了较高的增速，且主要人口增速表现出一定的地域性；
美国在人口结构上，正逐渐趋向于老龄化，与此同时，新生儿出生率自 2009 年以后有了较为明显的下降；
各种族在统计期内性别比例未出现较明显的失衡。

本次实验中，我们学会了：

散点图接口及其参数的使用。
漏斗图的绘制。
画布上多子图的绘制。
散点图的数据拟合。
颜色条的绘制和应用。
数据对数变换技巧。

你可能感兴趣的:(Python数据分析,信息可视化,python,数据分析)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
npm proxy setting kjndppl [Node.js JavaScript npm https proxy password
清理npmconfigdeletehttp-proxynpmconfigdeletehttps-proxy具体设置步骤如下：1.执行npmconfig后，将看到下一行提示信息npmconfigls-ltoshowalldefaults.2.执行npmconfigls-l后，在一大长串的settign中找出userconfig项(大概位于倒数第4项)[b]userconfig[/b]="C:\\Us
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
cesium添加原生MVT矢量瓦片方案 zhu_zhu_xia cesium vue arcgis cesium webgl javascript
项目中需要基于cesium接入mvt格式的服务并支持属性拾取查询，通过一系列预研测试，最后选择cesium-mvt-imagery-provider开源插件完成，关键源码信息如下：npmicesiumcesium-mvt-imagery-provider//安装依赖包//加载图层importCesiumMVTImageryProviderfrom"cesium-mvt-imagery-provid
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
小林渗透入门：burpsuite+proxifier抓取小程序流量 ξ流ぁ星ぷ132 小程序 web安全安全性测试网络安全安全
目录前提：代理：proxifier：步骤：bp证书安装bp设置代理端口：proxifier设置规则：proxifier应用规则：结果：前提：在介绍这两个工具具体实现方法之前，有个很重要的技术必须要大概了解才行---代理。代理：个人觉得代理，简而言之，就是在你和服务器中间的一个中间人，来转达信息。那为什么要代理呢，因为这里的burpsuite要抓包，burpsuite只有做为中间代理人才可以进行拦截
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
android查看so路径
之前遇到过一个问题，apk中有一个so无法确定其路径，是由哪个依赖引入的，网上查询一番后这里记录一下。build.gradle中添加如下任务//列出所有包含有so文件的库信息tasks.whenTaskAdded{task->if(task.name=='mergeDebugNativeLibs'){//如果是有多个flavor，则用mergeFlavorDebugNativeLibs的形式tas
Docker指定网桥和指定网桥IP
$dockernetworklsNETWORKIDNAMEDRIVER7fca4eb8c647bridgebridge9f904ee27bf5nonenullcf03ee007fb4hosthostBridge默认bridge网络,我们可以使用dockernetworkinspect命令查看返回的网络信息，我们使用dockerrun命令是将网络自动应用到新的容器Host如果是hosts模式，启动容
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它