费弗里

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色

本文对应代码和数据已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes

1 简介

　　通过前面的文章，我们已经对geopandas中的数据结构、坐标参考系、文件IO以及基础可视化有了较为深入的学习，其中在基础可视化那篇文章中我们提到了分层设色地图，可以对与多边形关联的数值属性进行分层，并分别映射不同的填充颜色，但只是开了个头举了个简单的例子，实际数据可视化过程中的分层设色有一套策略方法。

　　作为基于geopandas的空间数据分析系列文章的第五篇，通过本文你将会学习到基于geopandas和机器学习的分层设色。

2 基于geopandas的分层设色

　　地区分布图（Choropleth maps，又叫面量图）作为可能是最常见的一种地理可视化方法，其核心是对某个与矢量面关联的数值序列进行有意义的分层，并为这些分层选择合适美观的色彩，最后完成对地图的着色，优点是美观且直观，即使对地理信息一窍不通的人，也能通过颜色区分出不同面之间的同质性与异质性：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第1张图片

图1

　　但同样地，如果对数据分层采取的方法有失严谨没有很好的遵循数据特点，会很容易让看到图的人产生出不正确的判断，下面我们按照先分层，后设色的顺序进行介绍。

2.1 基于mapclassify的数据分层

　　上一篇文章中我们提到过,，在geopandas.GeoDataFrame.plot()中，参数scheme对应的数据分层是基于第三方库mapclassify实现的，因此要想对geopandas中的数据分层有深入的了解，我们就得先来了解一下mapclassify中的各种数据分层算法，用到的数据是系列文章前几期使用地滚瓜烂熟的新冠肺炎疫情数据，数据处理过程同上一篇文章，这里不再解释：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第2张图片

图2

2.1.1 BoxPlot

　　BoxPlot即箱线图，是统计学中使用到的一种方法：对个数为\(n\)观测数据从小到大进行排序，分别得到位置处于\(0.25n\)、\(0.5n\)以及\(0.75n\)的观测值，称为\(Q_{1}\)、\(Median\)以及\(Q_{3}\)（即第一四位数、中位数和第三四分位数），并定义\(Q_{3}-Q_{1}\)为\(IQR\)，以\(Q_{1}-1.5IQR\)为下限，以\(Q3+1.5IQR\)为上限，将小于下限或大于上限的观测值作为离群异常值，最后用图像的形式表达上述计算结果，如图2的上图，而图2的下图对应着概率估计，可以看出，箱线图法实际上是基于概率估计的一种异常值剔除方法，因为离群值只有\(0.0035*2=0.007\)的概率会出现，即如果你想要找出数据中的异常高低值，BoxPlot是不错的选择：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第3张图片

图3

　　在mapclassify中我们使用BoxPlot()来为数据实现箱线图分层：

import mapclassify as mc

# 对各省2020-03-08对应的累计确诊数量进行分层
bp = mc.BoxPlot(temp['province_confirmedCount'])
# 查看数据分层结果
bp

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第4张图片

图4

　　可以看出通过箱线图法将数据分成了五类，其中异常值只有1个即为湖北省，下面我们配合geopandas来对上述结果进行可视化，和上一篇文章一样，按照省级单位名称连接我们的疫情数据与矢量数据：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第5张图片

图5

　　接着对其进行可视化，在上一篇文章图28的基础上，将scheme参数改为BoxPlot，又因为箱线图可以看作无监督问题，故分层数量k在这里无效，删去：

fig, ax = plt.subplots(figsize=(10, 10))

ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax,
                                                 column='province_confirmedCount',
                                                 cmap='Reds',
                                                 missing_kwds={
                                                     "color": "lightgrey",
                                                     "edgecolor": "black",
                                                     "hatch": "////",
                                                     "label": "缺失值"
                                                 },
                                                 legend=True,
                                                 scheme='BoxPlot',
                                                 legend_kwds={
                                                     'loc': 'lower left',
                                                     'title': '确诊数量分级',
                                                     'shadow': True
                                                 })

ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax,
                                                  edgecolor='grey',
                                                  linewidth=3,
                                                  alpha=0.4)

ax.axis('off')
plt.suptitle('新型冠状肺炎累计确诊数量地区分布', fontsize=24) # 添加最高级别标题
plt.tight_layout(pad=4.5) # 调整不同标题之间间距
ax.text(-2800000, 1300000, '* 原始数据来源：丁香园，\n其中台湾及香港数据缺失') # 添加数据说明

fig.savefig('图6.png', dpi=300)

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第6张图片

图6

　　咋看起来没问题，但是如果你仔细观察左下角的图例会发现前两行范围颜色是重复的，且数值范围是错乱的，这是geopandas.GeoDataFrame.plot()中涉及箱线图法的一个小bug，遇到这种问题不用慌，如果你在上一篇文章中去我的Github仓库查看过创作图29对应的代码，一定会想到既然geopandas自身有bug，那我们用matplotlib中的mpatches和legend自定义图例就可以啦，而为了自定义的图例色彩与geopandas映射出的保持一致，我们需要额外使用到matplotlib中的get_cmap(cmap)来制作可独立导出颜色的cmap方案实例，譬如我们这里是Reds，就需要按照前面bp的有记录数量的分层结果，从Reds中产生同样5个档次的颜色，具体操作过程如下：

import matplotlib.patches as mpatches

fig, ax = plt.subplots(figsize=(10, 10))

ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax,
                                                 column='province_confirmedCount',
                                                 cmap='Reds',
                                                 missing_kwds={
                                                     "color": "lightgrey",
                                                     "edgecolor": "black",
                                                     "hatch": "////",
                                                     "label": "缺失值"
                                                 },
                                                 scheme='BoxPlot')

handles, labels = ax.get_legend_handles_labels() #get existing legend item handles and labels

ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax,
                                                  edgecolor='grey',
                                                  linewidth=3,
                                                  alpha=0.4)

# 实例化cmap方案
cmap = plt.get_cmap('Reds')

# 得到mapclassify中BoxPlot的数据分层点
bp = mc.BoxPlot(temp['province_confirmedCount'])
bins = bp.bins

# 制作图例映射对象列表
LegendElement = [mpatches.Patch(facecolor=cmap(_*0.25), label=f'{int(max(bins[_], 0))} - {int(bins[_+1])}') 
                 for _ in range(5)] + \
                [mpatches.Patch(facecolor='lightgrey', edgecolor='black', hatch='////', label='缺失值')]

# 将制作好的图例映射对象列表导入legend()中，并配置相关参数
ax.legend(handles = LegendElement, loc='lower left', fontsize=10, title='确诊数量分级', shadow=True, borderpad=0.6)

ax.axis('off')
plt.suptitle('新型冠状肺炎累计确诊数量地区分布(截至2020年03月04日)', fontsize=24) # 添加最高级别标题
plt.title('数据分层方法：BoxPlot', fontsize=18)
plt.tight_layout(pad=4.5) # 调整不同标题之间间距
ax.text(-2900000, 1250000, '* 原始数据来源：丁香园，\n其中台湾及香港数据缺失') # 添加数据说明

fig.savefig('图7.png', dpi=300)

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第7张图片

图7

　　可以看到，通过自定义图例的方式，虽然麻烦了一点，但是我们不仅修复了图例的bug，还为其添加了更加完善的细节，如图形修改为矩形，范围修改为整数。

2.1.2 EqualInterval

　　EqualInterval即等间距，是最简单的一种分层方法，它在原数据最小值与最大值间以等间距的方式划分出k个层次，mapclassify中对应等间距法的类为EqualInterval()：

bp = mc.EqualInterval(temp['province_confirmedCount'])
# 查看数据分层结果
bp

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第8张图片

图8

　　可以看到对于分布非常不均匀的新冠肺炎确诊数量数据来说，这种方法表现得十分糟糕，中间三个类都没有记录落入，如果使用这种方法强行绘图，效果就会类似上一篇文章中地区分布图部分，最开始那个糟糕的效果那样只有湖北一个地方是最深的暗红色，而其他地方皆为最淡的色阶，这里就不重复演示。

2.1.3 FisherJenks

　　在了解mapclassify中的FisherJenks之前，我们先来了解一下什么是Jenks Natural Breaks：

Jenks Natural Breaks

　　Jenks Natural Breaks旨在为1维数据计算合适的划分点，使得不同组之间的差距尽可能大的同时组内差距尽可能小，其思路非常简单，举一个简单的例子进行说明：

　　对于一组待分割的序列\(X=[4, 5, 9, 10]\)，现在需要为其找到将原始数据分为\(k=2\)部分的方法，那么实际上就有\([4], [5, 9, 10]\)、\([4, 5], [9, 10]\)以及\([4, 5, 9],[10]\)这三种切分方法，现定义sum of squared deviations for array mean（简称SDAM）：

\[SDAM=\sum_{i=1}^{n}(X_{i}-\bar{X})^{2} \]

　　以及针对每一种数据分层方法，在其分出的每一组\(G_{i}\)上计算组内离差平方和并累加所有组的结果，定义为sum of squared deviations for class means（简称SDCM_ALL）：

\[SDCM\_ALL=\sum_{i=1}^{k}\sum_{j=1}^{|G_{i}|}(G_{ij}-\bar{G_{i}})^2 \]

　　有了\(SDAM\)和\(SDAM\_ALL\)，现在对分组优劣定义一个评判指标goodness of variance fit（简称GVF），取值范围为\([0,1]\)，越高越好：

\[GVF=(SDAM-SCDM)/SDAM \]

　　这样我们就可以对每一种分组方案进行评价，譬如对我们上面简单的例子：

\[SDAM=(4-7)^2+(5-7)^2+(9-7)^2+(10-7)^2=26 \\ SDCM_{1}=[(4-4)^2]+[(5-8)^2+(9-8)^2+(10-8)^2]=14 \\ SDCM_{2}=[(4-4.5)^2+(5-4.5)^2]+[(9-9.5)^2+(10-9.5)^2]=1 \\ SDCM_{3}=[(4-6)^2+(5-6)^2+(9-6)^2]+[(10-10)^2]=14 \]

　　则对应各种方案的GVF计算如下：

\[GVF_{1}=GVF_{3}=(26-14)/26=0.46 \\ GVF_{2}=(26-1)/26=0.96 \]

　　可以看出第二种方案\([4, 5], [9, 10]\)的分层方法效果最好，也与我们对数据的直观感觉相贴合，这就是Jenks Natural Breaks的基本思路，但这种暴力遍历所有分组方案的做法对数据数量及选择分组的个数很敏感，尤其是对分组数量，一旦分组数量过于多，待筛选计算的方案数量就变成了天文数字，下面我来告诉大家为什么：

　　定义长度为\(n\)的序列\(X=[x_{1},x_{2},...,x_{n}]\)。且满足\(i\leq{j}\)时\(x_{i}\leq{x_{j}}\)，即整个序列从小到大单调递增，那么将其分成\(k\)组的过程，可以分解为先选择第一组，且为了保证右边剩余\(k-1\)个组每组至少有1个数据分配，则第一组有\(n-k+1\)种分配方式，而第一组包含的数字数量\(n_{1}\)确定之后，剩余\(n-n_{1}\)个数据的继续分组又可以视为独立的递归分组过程，因此最终需要考虑的方案个数用公式表达起来有些复杂，但是换成计算机中的递归过程就变得一目了然，我经过思考和纸上的推演，写出了下面所示的递归函数f(n, k)来实现方案总数的计算：

def f(n, k):

    # 若k退化为2，则显然需要n - 1种方案，譬如4个数字分2组有3种方案
    if k == 2:
        return n - 1

    else:
        # 若k未退化为2，则继续递归过程
        return sum([f(n-_, k-1) for _ in range(1, n - k + 2)])

　　有了这个递归函数，我们就可以来直观的看一看为什么不能选择太多分组，首先我们对长度为100的序列分为5组试试：

f(100, 3)
Out[11]: 4851

　　可以看到待选择的方案才4851个，还是很少的，那么我们接下来将组数提高到5：

f(100, 5)
Out[12]: 3764376

　　发生了什么？随着递归深度的增大，待选择方案数量一下子就提高到三百多万个！再切换成7试一下：

f(100, 7)
Out[13]: 1120529256

　　在跑上述代码时，明显能感受到计算花费时间的激增，最终结果也达到惊人的11亿多！看到这，我们就明白了，原始的Jenks Natural Breaks算法虽然很有效，但如果以暴力遍历的方式计算，其复杂度是难以应付日常需求的，为了对其进行优化，以在少量的计算时间内计算出尽可能靠谱的分组结果，一系列改良加速方法被提出，而mapclassify中的FisherJenks，即为jenks教授在论文Fisher, W. D., 1958, On grouping for maximum homogeneity.的基础上提出的改良算法，但这是一个很神秘的算法，根据https://macwright.org/2013/02/18/literate-jenks.html 中的介绍，jenks教授的原始论文没有留下数字化资料，一直为堪萨斯大学地理学系所私有，而随着1996年jenks教授的离世，原论文需要到2072年版权才能到期公开，所以我们现在在各种GIS类软件以及各种开源软件包中使用到的fisher jenks算法，均是对最初的一段Fortran代码的移植和改造，这也成了一段未解之谜，感兴趣的读者可以去https://stat.ethz.ch/pipermail/r-sig-geo/2006-March/000811.html 了解更多。

　　回到我们的主题，搞清楚了FisherJenks的计算目标之后，我们同样利用mapclassify计算分层结果，其默认分层为5：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第9张图片

图9

　　可以看到，在这种方式下，数据的分组较为合理，同样将geopandas.GeoDataFrame.plot()中的参数设置为FisherJenks绘制出图10：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第10张图片

图10

　　与BoxPlot相比差距还是比较明显，处于第二级严重程度的省份只有河南、广东及浙江，更贴近数据的自然层次结构。

2.1.4 NaturalBreaks

　　等下！上一小结中的FisherJenks不就是我们俗称的自然断点法吗，怎么又来了个NaturalBreaks？其实我在翻看mapclassify的官方文档看到这里时，也很疑惑，于是我仔细研究了NaturalBreaks对应的源代码，追根溯源，WHAT?，竟然是k-mean算法，而且直接调用的scikit-learn的KMEANS。。。

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第11张图片

图11

　　不过也可以理解，毕竟k-means就是在找数据中组内相似度尽可能高且组间差异尽量大的簇，关于k-means我想我就不需要赘述了，毕竟是最基础的数据挖掘算法之一，而scikit-learn里默认的KMEANS使用的k-means++初始方式，只是在原始k-means基础上，修改了后续初始点的概率密度，使得k-means算法更加鲁棒稳定，下面直接来看NaturalBreaks的数据分层结果：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第12张图片

图12

　　和FisherJenks的结果竟然一样，但如果你多运行几次会发现这个结果不是完全固定的，由于k-means随机初始迭代起点，因此不同次运行的结果可能会有轻微差别（图13），在数据量很大时，基于快速聚类法的NaturalBreaks是较为理想的数据分层选择：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第13张图片

图13

　　配合geopandas绘图只需要把scheme参数修改为NaturalBreaks即可，因为跟FisherJenks类似，这里就不再赘述。

2.1.5 JenksCaspall

　　mapclassify中的JenksCaspall本质上为k-medians聚类，其首先根据分层层数\(k\)在数据中找到\(k-1\)个分位数点，将原始数据等分为数量尽可能相同的\(k\)份并以这\(k\)份数据的中位数作为各自的初始点，接着基于k-medians的思想，迭代计算为每个样本点找到与其距离更近的中位数点，并以此重新划分分层以及重新计算各分层中位数点，直至每个数据对应的分层标签不再变化，再将每个分层中数据的最大值作为间断点，下面我们从mapclassify源代码中抽出该部分代码，对其迭代过程可视化，具体的代码较多，请在文章开头的Github仓库中对应本文路径下查看：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第14张图片

图14

　　其中颜色区分对应迭代轮次的数据分层归属，虚线代表对应迭代轮次的间断点，仔细可以看出在迭代过程中数据分层的变化情况。

　　用JenksCaspall数据分层出来的结果，无论数据分布如何，每个分层内部的数据个数都较为均匀，下面我们用JenksCaspall来划分省份疫情严重情况：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第15张图片

图15

　　可以看到被分到最严重级别的不再只有湖北省，当你希望数据分层个数较为均匀时，JenksCaspall是个不错的选择。

2.1.6 HeadTailBreaks

　　HeadTailBreaks是一种较为崭新的数据分层方法，出自Head/Tail Breaks: A New Classification Scheme for Data with a Heavy-Tailed Distribution（https://www.tandfonline.com/doi/abs/10.1080/00330124.2012.700499 ），专门用于对具有重尾特点的数据进行分层，所谓重尾即在整个数据中，较小的值数量往往较多，而最大的位于头部的值数量很少，其数据分布呈现出“尾重头轻”的特点：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第16张图片

图16

　　这种典型如人口密度分布数据，数值较低的点往往数量众多，聚集在尾部，形成重尾，HeadTailBreaks的优点是可以尽量在地区分布图中真实反映原始数据的分布特点，如图17（https://sites.google.com/site/thepowerofcartography/head-tail-breaks），左边是FisherJenks，右边是HeadTailBreaks，可以看出，右图相对于左图更好地体现了原始数据的重尾特点，最浅色的图斑数量明显多于次浅色的图斑：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第17张图片

图17

　　在geopandas中使用时传入scheme='HeadTailBreaks'即可（由于新冠肺炎各省份确诊数量数据尾部和头部最大值之间没有较为连续的中间值过渡，不太适合用此方法故不作演示）。

2.1.7 Quantiles

　　Quantiles即分位数，原理很简单，根据分位数点对原数据进行等分：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第18张图片

图18

　　利用Quantiles对确诊数量分组可视化：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第19张图片

图19

2.1.8 Percentiles

　　同样是使用分位数对数据进行分层，Percentiles提供了参数pct以允许用户以百分位数的形式传入自定义分隔点，譬如我们将[1, 50, 99, 100]作为pct的传入值，则分组结果如下：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第20张图片

图20

　　每个传入的百分位点其左边到上一个分隔点为止，包括其本身，将被分到同一组，对应的图像如图21，在geopandas中使用时除了设置scheme='Percentiles'之外，还要在另一个字典型参数classification_kwds中传入{'pct': 百分位数列表}：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第21张图片

图21

2.1.9 StdMean

　　StdMean的思想类似前面的箱线图，不同的是箱线图属于非参数方法，而StdMean建立在正态分布为基础的经验法则之上，即对于正态分布而言，68%的数据将分布在距离均值1个标准差之内，95%的数据在2个标准差之内，99.7%的数据在3个标准差之内，即对原始数据标准化之后，根据距离样本均值的不同标准差范围来划分数据，mapclassify中的StdMean默认按照[-2, -1, 1, 2]来划分：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第22张图片

图22

2.1.10 UserDefined

　　关于数据分层最后要介绍的是自定义分层，即按照用户输入的分隔点来自由划分数据集，譬如我们按照新浪新闻疫情地图的划分方式：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第23张图片

图23

　　结合geopandas使用时除了设置scheme='UserDefined'以外，还要设置classification_kwds中的bins=分隔点列表：

fig, ax = plt.subplots(figsize=(10, 10))

ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax,
                                                 column='province_confirmedCount',
                                                 cmap='Reds',
                                                 missing_kwds={
                                                     "color": "lightgrey",
                                                     "edgecolor": "black",
                                                     "hatch": "////",
                                                     "label": "缺失值"
                                                 },
                                                 legend=True,
                                                 scheme='UserDefined',
                                                 classification_kwds={
                                                     'bins': [9, 99, 499, 999, 9999]
                                                 },
                                                 legend_kwds={
                                                     'loc': 'lower left',
                                                     'title': '确诊数量分级',
                                                     'shadow': True
                                                 })

ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax,
                                                  edgecolor='grey',
                                                  linewidth=3,
                                                  alpha=0.4)

ax.axis('off')
plt.suptitle('新型冠状肺炎累计确诊数量地区分布', fontsize=24) # 添加最高级别标题
plt.tight_layout(pad=4.5) # 调整不同标题之间间距
ax.text(-2800000, 1300000, '* 原始数据来源：丁香园，\n其中台湾及香港数据缺失') # 添加数据说明

fig.savefig('图24.png', dpi=300)

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第24张图片

图24

2.2 色彩方案的选择

　　前面已经详细介绍了数据分层常用的各种方法及使用场景，“分层”的部分做完之后，就到了设色的部分，其实色彩搭配是比较主观的事情，但想要自己创造出美观合理的配色方案并不是容易的事情，下面我们来介绍两种选择配色方案的方法。

2.2.1 基于palettable的配色

　　下面我要给大家介绍的Python第三方库palettable在我之前关于词云图的一篇文章中介绍stylecloud时介绍过，是专门帮助我们为可视化作品配色的。

　　palettable不依赖其他三方库，纯Python实现，其强大之处在于内置了数量惊人的经典配色方案，囊括了CartoColors、cmocean、Colorbrewer2、Cubehelix、Light & Bartlein、matplotlib、MyCarta、Scientific、Tableau以及The Wes Anderson Palettes blog中的大量经典配色方案：

palettable.cartocolors.diverging
palettable.cartocolors.qualitative
palettable.cartocolors.sequential
palettable.cmocean.diverging
palettable.cmocean.sequential
palettable.colorbrewer.diverging
palettable.colorbrewer.qualitative
palettable.colorbrewer.sequential
palettable.lightbartlein.diverging
palettable.lightbartlein.sequential
palettable.matplotlib
palettable.mycarta
palettable.scientific.diverging
palettable.scientific.sequential
palettable.tableau
palettable.wesanderson

　　使用起来非常简单，譬如如果我们想要使用palettable.cmocean.sequential中的色彩，其中cmocean表示色彩来源，sequential表示连续型色彩，就可以先在对应的示例网页下查看所有方案：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第25张图片

图25

　　比如我对其中的Dense方案很中意：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第26张图片

图26

　　就可以按照如下方式，先从palettable中导入对应颜色，譬如我们导入Dense_20，20表示其自带的离散色彩数量，并查看其自带的离散色彩RGB值、离散色盘以及连续色盘示例：

from palettable.cmocean.sequential import Dense_20
from pprint import pprint

print('对应离散颜色：')
pprint(Dense_20.colors)
print('离散：')
Dense_20.show_discrete_image()
print('连续:')
Dense_20.show_continuous_image()

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第27张图片

图27

　　使用.mpl_colormap将其转换为matplotlib可接受的cmap数据结构，作为cmap参数值传入绘图部分即可：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第28张图片

图28

　　如果想要翻转映射方向，换成Dense_20_r再重复上述操作即可：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第29张图片

图29

　　更多palettable自带色彩方案，可以在https://jiffyclub.github.io/palettable/ 下查看探索。

2.2.2 基于图片主色的配色

　　我们在生活中偶然会看到配色方案让人眼前一亮的海报或画作，这时如果你想将这些作品中的主要颜色也应用到自己的可视化作品上，可以参考我下面的做法，这里以我很喜欢的贾樟柯导演的《一直游到海水变蓝》中文版海报为例：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第30张图片

图30

　　思路是抽取所有像素点的RGB三通道值，分别作为三个特征，输入k-means中进行聚类，将聚类数量设置为你想要提取出的主色数量：

from sklearn.cluster import KMeans

# 构建特征
rgb = pd.DataFrame([sea[x][y] for x in range(sea.shape[0]) for y in range(sea.shape[1])],
             columns=['r', 'g', 'b'])

# k-means聚类，其中n_clusters表示聚类数量，n_jobs=-1表示开启所有核心并行运算
model = KMeans(n_clusters=5, n_jobs=-1)
model.fit(rgb) # 训练模型

# 提取聚类簇重心，即我们需要的主色，绘制调色板
plt.bar([i for i in range(model.cluster_centers_.__len__())], 
        height=[1 for i in range(model.cluster_centers_.__len__())],
        color=[tuple(c) for c in (model.cluster_centers_ / 255.)],
        width=1)
plt.axis('off')

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第31张图片

图31

　　再来个例子，提取《一直游到海水变蓝》海外版海报主色：

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第32张图片

图32

　　对应提取到的5种主色如图33：
　　

（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色_第33张图片

图33

　　类似的，你可以试着提取你喜爱的平面作品的主色。

　　以上就是本文的全部内容，如有笔误望指出。

你可能感兴趣的:(（数据科学学习手札79）基于geopandas的空间数据分析——深入浅出分层设色)

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
什么是证书吊销列表？CRL 解释 WoTrusSSL ssl https
数字证书是安全在线互动的支柱，用于验证身份和确保加密通信。但是，当这些证书被盗用或滥用时，必须立即撤销它们以维持信任。这就是证书撤销列表(CRL)的作用所在。CRL由证书颁发机构(CA)维护，对于识别和撤销已撤销的证书，防止其造成危害至关重要。在本指南中，我们将探讨什么是CRL、它们如何运作以及为什么它们对网络安全至关重要。什么是证书吊销列表(CRL)？证书吊销列表(CRL)是证书颁发机构(CA)
有必要获得WHQL测试认证吗，有什么好处？
什么是WHQL认证？WHQL是MicrosoftWindowsHardwareQualityLab的缩写，中文意思是Windows硬件设备质量实验室，主要是对Windows操作系统的兼容性测试，检验硬件产品和驱动程序在windows系统下的兼容性和稳定性。当某一硬件或软件通过WHQL测试时，制造商可以在其产品包装和广告上使用“DesignedforWindows”标志。该标志可以证明硬件或软件已经
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
上位机知识篇---SD卡&U盘镜像
常用的镜像烧录软件balenaEtcherbalenaEtcher是一个开源的、跨平台的工具，用于将操作系统镜像文件（如ISO和IMG文件）烧录到SD卡和USB驱动器中。以下是其使用方法、使用场景和使用注意事项的介绍：使用方法下载安装：根据自己的操作系统，从官方网站下载对应的安装包。Windows系统下载.exe文件后双击安装；Linux系统若下载的是.deb文件，可在终端执行“sudodpkg-
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号