Ritannn

读《A survey on semi-supervised learning》（二）

4 包装方法

包装方法是半监督学习中最古老和最广为人知的算法之一（Zhu，2008）。他们利用一个或多个有监督的基础学习器，用原始标记数据和先前未标记的数据迭代训练这些数据，这些数据是用来自学习器早期迭代的预测增强的。后者通常被称为伪标签数据。该程序通常包括训练和伪标记两个交替的步骤。在训练步骤中，一个或多个有监督的分类器在标记的数据上训练，也可能是以前迭代的伪标记数据。在伪标签步骤中，生成的分类器用于为先前未标记的对象推断标签；学习器对其预测最有信心的数据点进行伪标记，以便在下一次迭代中使用。

包装方法的一个显著优点是，它们可以用于几乎任何有监督的基础学习器。有监督的基础学习器可能完全不知道包装方法，包装方法简单地讲伪标签样本传递给基础学习器，就像它们是常规标签样本一样。尽管一些包装方法需要基础学习器提供概率预测，但许多依赖于多个基础学习器的包装方法不需要。对于任何特定的包装方法，其基础的半监督学习假设取决于所使用的基础学习器。从这个意义上说，包装方法本身不能认为是一种学习方法：只有当它与一组特定的基础学习器组合在一起时，它才成为一种完整的学习方法。

Triguero等人（2015）最近发表了对包装方法的全面调查。除了提供一个概述的方法，他们也提出了一个包装方法的分类方法，基于（1）有多少分类器使用，（2）是否使用不同类型的分类器，（3）是否使用单一视图或多视点数据（即数据是否分成多个功能子集）。这种分类法为了解包装方法提供了有价值的见解。

我们提出了一个不太复杂的分类法，重点介绍了文献中研究过的三种相对独立的包装方法类型。首先，我们考虑自训练（self-training），它使用一个监督分类器，迭代地对自己最自信地预测进行再训练。其次，我们考虑了协同训练（co-training），这是自训练的一种扩展，将多个分类器迭代地根据彼此最自信的预测进行再训练。分类器应该具有足够的多样性，这通常通过对给定对象或特征的不同子集进行操作来实现。最后，我们考虑伪标签增强方法（pseudo-labelled boosting methods）。与传统的增强方法一样，它们通过顺序构建单个分类器来构建分类器集成，其中每个分类器在有标记的数据上训练，在未标记的数据上训练之前分类器最自信的预测。

4.1 自训练

自训练方法（有时也成为自学习方法）时最基本的伪标签方法（Triguero等人，2015）。它们由一个单独的监督分类器组成，该分类器在有标记的数据和在算法之前迭代中已被伪标记的数据上进行迭代训练。

在自训练过程的开始，只对标记的数据训练一个有监督的分类器。生成的分类器用于获得未标记数据点的预测。然后，将最自信的预测添加到标记数据集，并对原始标记数据和新获得的伪标记数据进行监督分类器训练。这个过程通常时迭代的，直到没有更多的未标记的数据。

自训练最早由Yarowsky（1995）提出，是一种在文本文档中进行词义消歧的方法，即根据上下文预测词义。从那时起，自训练的一些应用和变化被提出。例如，Rosenberg等人（2005）将自训练应用于目标检测问题，并显示出当时最先进的目标检测模型更好的性能。Dopido等人（2013）开发了一种用于高光谱图像分类的自训练方法。他们使用领域知识来选择一组候选的未标记样本，并用训练有素的分类器做出的预测对这些样本中信息量最大的进行伪标记。

自训练范式允许大量的设计决策，包括选择伪标签数据，在算法的后续迭代中重用伪标签数据，以及停止标准。选择伪标签数据的过程特别重要，因为它决定了哪些数据最终进入分类器的训练集。在典型的自训练设置中，这种选择是基于预测置信度，置信度估计的质量显著影响算法性能。其中，未标记的样本的预测概率排序反映真实置信度排序。

如果由校准良好的概率预测，则可以直接使用各自的概率。在这种情况下，自训练方法是迭代的，而不是增量的，因为未标记数据点的标签概率在每一步都要重新估计。在这种情况下，方法变得类似于期望最大化（EM；Dempster等人，1977）。它已经在朴素贝叶斯的背景下得到了很好的研究，这是固有的概率（Nigam和Ghani，2000；Nigam等人，2000，2006）。Wu等人（2021b）最近将带有朴素贝叶斯分类器的半监督EM应用于电子商务网站的假货评论检测问题。

不支持鲁棒概率预测的算法可能需要自适应，以从自训练中获益。决策树就是一个典型的例子：如果不进行任何修改和修剪，预测概率估计（通常根据带有特定标签的叶子中的样本比例计算）通常质量很低。这主要归因于大多数决策树学习算法都明确地试图最小化树节点中的杂质，从而鼓励小叶子和高度偏差的概率估计（Provose和Domingos，2003）。Tanha等人（2017）试图用两种不同的方法来客服这个问题。首先，他们采用现有的几种方法，如嫁接（grafting？）和拉普拉斯校正，直接改进预测概率估计。其次，他们使用一种基于局部距离的度量来确定实例之间的置信度排名：一个未标记数据点的预测置信度是基于该点与每个类别的标记数据之间的马氏距离的绝对差。使用这种方法，他们在决策树和随机森林（决策树的集合）的性能上都得到了改善（Tanha等人，2017）。

Leistner等人（2009）也利用自训练来改进随机森林。对于未标记数据 $\large x\in X_U$ ，他们不是根据估计的后验分布 $\large p(y|x)$ 对每棵树的每一个未标记数据点进行独立的伪标记，而是用预测的最有可能的标签进行标记。此外，他们提出了一个基于包外误差的停止准则：当包外误差（这是泛化误差的无偏估计）增加时，训练停止。

根据定义，自训练中的基础学习器不知道包装方法的存在。因此，他们必须在每次自训练迭代中完全重新训练。然而，当分类器可以增量训练时（即在给定数据的单个数据点或子集上优化目标函数），完全可以采用类似于自训练的迭代伪标记方法。不必在每次迭代中重新训练整个算法，数据点可以在整个训练过程中进行伪标记。Lee（2013）将这种方法应用于神经网络，并提出了伪标签方法。由于在早期训练阶段预测的伪标签通常不太可靠，伪标签数据的权重会随着时间的推移而增加。伪标签方法与自训练明显相似，但不同之处在于分类器不会在每个伪标签步骤之后重新训练：相反，它使用新的伪标签数据进行优化，因此在技术上偏离了板状方法范式。

关于自训练算法的理论性质的演技还很有限。Haffari和Sarkar（2007）对自训练的几种变体进行了理论分析，并显示了与基于图的方法的联系。Culp和Michailidis（2008）分析了一种带有多个基础学习器的自训练变体的收敛性，并考虑了与基于图的方法的联系。

4.2 协同训练

协同训练是自训练对多监督分类器的扩展。在协同训练中，两个或多个监督分类器对标记数据进行迭代训练，在每次迭代中，将它们最自信的预测添加到其他监督分类器的标记数据集。为了使协同训练成功，重要的是基础学习器在它们的预测中不存在太强的相关性。如果是的话（指相关性很强），它们相互提供有用信息的潜力的有限的。在文献中，这种情况通常被称为多样性（diversity）标准（Wang和Zhou，2010）。Zhou和Li（2010）对基于多个学习器的半监督学习方法进行了调查。他们将这些方法统称为基于分歧的方法。这是因为他们观察到，协同训练方法利用了多个学习器之间的分歧：它们通过未标记的数据交换信息，不同的学习器预测不同的标记。

为了促进分类器的多样性，早期的协同训练主要是依赖于数据的多个不同视图的存在，这些视图通常对应于特征集的不同子集。例如，在处理视频数据时，数据可以自然地分解为可视和音频数据。这种协同训练方法属于更广泛的多视图学习方法，其中也包括广泛的监督学习算法。Xu等人（2013）对多视角学习进行了全面的研究。我们在第4.2.1节中涵盖了多视角协同训练方法。在许多现实世界的问题场景中，没有已知的数据的独特试图。单视图协同训练方法通过自动将数据分割成不同的视图或促进学习算法本身的多样性来解决这个问题；我们将在第4.2.2节中介绍这些方法。在第4.2.3节中，我们还简要讨论了多个分类器组合成单一目标函数的共正则化方法。

4.2.1 多视图协同训练

协同训练的基本形式时Blum和Mitchell（1998）提出的。在他们的开创性论文中，他们构建出两个分类器，分别训练给定数据的两个不同视图，即特征子集。在每个训练步骤之后，每个视图的最有信心的预测被添加到另一个视图的标记数据集中。Blum和Mitchell将协同训练算法应用到大学网页的分类中，使用网页文本和从外部来源链接到网页锚文本作为两个不同的视图。该算法及变体已成功应用到多个领域，最显著的是自然语言处理。

Blum和Mitchell（1998）的原始协同训练算法依靠两个主要假设获得成功：（1）每个单独的特征子集应该满足以在给定的数据集上获得良好的预测，（2）给定类标签，特征子集应该是条件独立的。可以简单地理解第一个假设：如果两个特征子集中的一个不足以形成良好的预测，使用该集合的分类器永远不会对组合方法的整体性能做出积极贡献。第二个假设与多样性标准有关：如果特征子集在给定类别标签的情况下是条件独立的，那么个体分类器的预测不太可能是强相关的。正式来说，对于任何数据点 $\large x_i=x_i^{(1)} \times x_i^{(2)}$ ，分别分解为 $\large x_i^{(1)}$ 和 $\large x_i^{(2)}$ ，条件独立假设等于 $\large p(x_i^{(1)}|X_i^{(2)},y_i)=p(x_i^{(1)}|y_i)$ 。Dasgupta等人（2002）表明，在上述假设下，通过促进学习器个体之间的一致性可以减少泛化误差。

在实践中，第二个假设通常是不满意的：即使存在自然分裂的特性，如在Blum和Mitchell（1998）所建立的实验中，一个视图中包含的信息不太可能没有提供其他的信息视图当条件类标签（Du等人，2011）。以大学网页分类为例，网页链接的锚文本确实可以包含有关网页内容的线索，即使已知网页被分类为教师的主页。例如，如果链接的锚文本是“工程学院院长”，那么在页面的文本中，人们更有可能找到工程学院院长的消息，而不是其他任何人的消息。因此，已经考虑了几种替代这一假设的方法。

Abeny（2002）表明，弱独立假设对于成功的协同训练是充分的。Balcan等人（2005）进一步放宽了条件独立假设，认为一个弱得多的假设——他们称之为膨胀假设——是充分的，在某种程度上是必要的。扩展假设表明，这两种视图不是高度相关的，而且个人分类器从来不会自信地做出错误的预测。

Du等人（2011）研究了实证方法，以确定充分性和独立性假设的持有程度。他们提出了几种自动将特征集分割成两个视图的方法，并表明所得到的经验独立性和充分性于协同训练算法的性能呈正相关，表明特征分割充分性和独立性能够产生良好的分类器。

4.2.2 单视图协同训练

如Du等人（2011）所示，即使在已知先验的给定特征集中没有自然分裂（natural split？），协同训练也可以成功。这一观察结果在关于协同训练的文献中得到了呼应，在这种所谓的单一视图的环境中，由许多不同的方法来应用协同训练。

Chen等人（2011）试图通过在每次协同训练迭代中自动分割特征集来减轻对预定义不相交特征集的需求。他们提出了一个与协同训练相关的单一优化问题，结合了特征集应该是不相关的要求和Balcna等人（2005）提出的膨胀假设。他们在一个部分合成的数据集上展示了这种方法很有前景的结果，其中每个数据点的多视图是自动生成的。Wang和Zhou（2010）从基于图的角度探讨了协同训练成功的充分必要条件，其中标签传播对每个学习器交替应用。这种方法的缺点是，尽管受到协同训练的启发，但它不能应用于任意的监督学习算法而不进行修改：类似于协同训练的操作嵌入到目标函数中，而目标函数是直接优化的。

已经提出了几种将单视图数据集分割成多个视图的技术。例如Wang等人（2008b）建议生成k个数据的随机投影，并将这些投影作为k个不同分类器的视图。Zhang和Zheng（2009）提出利用主成分分析将数据投影到一个低维子空间上，并通过贪婪地选择方差最大的变换特征来构造伪视图。Yaslan和Cataltepe（2010）没有将数据转换为不同的基础（basis？），而是迭代地为每个视图选择特征，优先考虑相对于给定标签具有高互信息的特征。

将类似于协同训练的算法应用到没有明确视图的数据集的进一步方法关注于在分类器中引入多样性的其他方法。例如，可以对监督算法使用不同的超参数（Wang和Zhou，2007；Zhou和Li，2005a），或者使用不同的算法（Goldman和Zhou，2000；Xu等人，2012；Zhou和Goldman，2004）。Wang和Zhou（2007）对为什么协同训练在单视图下有效进行了理论和实证分析。研究表明，学习器之间的多样性与他们的共同表现正相关。Zhou和Li（2005b）提出了三训练（tri-training），即三个分类器交替训练。当三个分类器中的两个对给定数据点的预测达成一致时，该数据点连同各自的标签被传递到另一个分类器。至关重要的是，三训练不依赖于个体分类器的概率预测，因此可以应用于更广泛的监督学习算法。

三训练方法的作者建议将其扩展到三个以上的学习器——特别是随机森林（Li和Zhou，2007）。这种方法被称为协同森林（co-forest），首先在所有标记的数据上独立训练决策树。然后，在每个迭代中，每个分类器接收伪标记数据，在所有其他分类器对未标记的数据进行联合预测的基础上：如果预测数据点的类 $\widehat y_i$ 的得分超过了一个确定的阈值，这个伪标记数据点就会被传递给分类器。然后，所有的决策树都在它们的标记和伪标记数据上重新训练。在下一次迭代中，所有先前的伪标记数据都被再次视为未标记数据。我们注意到，当树的数量接近无穷时，这种方法就变成了一种自训练的形式。

协同森林包括一种机制，通过基于预测置信度对新标记数据进行加权，来减少伪标记步骤中可能错误标记的数据点的影响。Deng和Zu Guo（2011）试图通过去除“可疑的”伪标记来进一步防止可能标记错误的数据点的影响。在每一个伪标记步骤之后，将每个伪标记数据点的预测与k个最近邻（既有标记的也有伪标记的）的（伪）标记进行比较：在不匹配的情况下，将从中删除伪标记。

我们注意到，在现有的关于协同森林的文献中，森林的大小一直是被限制在6棵树。经验表明，在有监督的随机森林中，随着树的数量的增加，性能可以显著提高（Oshiro等人，2012）。因此，与随机森林相比，协同森林中树的数量可能会极大地影响相对性能。

4.2.3 协同正则化

协同训练方法通过以伪标记的形式在分类器之间传递信息来减少分类器之间的分歧。此外，协同训练的隐含目标是最小化分类器集成的错误率。Sindhwani等人提出了在单一目标函数中明确这些性质。他们提出了协同正则化，在正则化框架中，集成质量和基础学习器之间的分歧同时得到优化。关键思想是使用一个由两项组成的目标函数：一个用于惩罚由集成做出的错误判断，另一个用于直接惩罚基础分类器的不同预测。为了在这个框架中处理逐视图噪声，Yu等人（2011）引入了贝叶斯协同训练，该训练使用图形模型来组合多个视图的数据，并使用基于核的方法进行协同正则化。Christoudias等人（2009）对该模型进行了扩展，以处理每个数据点的不同的噪声水平。

协同训练可以看作是一个针对协同正则化目标的贪婪优化策略。目标函数的两个组成部分以交替的形式最小化：集成的预测误差通过独立训练基础学习器最小化，分类器之间的分歧通过将一个分类器的预测转播到其他分类器，就好像它们是ground truth（？）一样。然而，我们注意到，一般的协同正则化目标不必使用包装方法进行优化，而且许多协同正则化算法使用不同的方法。

4.3 Boosting

集成分类器由多个基础分类器组成，这些分类器经过训练后用于形成组合预测（Zhou，2012）。集成学习最简单的形式是独立训练k个基础分类器并聚合它们的预测。除了这种简单的方法，监督集成学习还有两个主要的分支：bagging和boosting。在bagging方法中，每个基础学习器提供一组数据点，这些数据点从原始数据集（bootstrapping）均匀随机采样，并进行替换。当训练完成时，将它们的输出进行聚合，形成集成的预测。另一方面，在boosting方法中，每个基础学习器都依赖于之前的基础学习器：它提供了完整的数据集，但对数据点施加了权重。数据点的权重是基于之前的基础学习器对的性能，因此较大的权重被分配给错误分类的数据点。最终的预测是作为基础分类器的预测的线性组合得到的。

从技术上讲，boosting以一种贪婪的方式构造了分类器的加权集成。令 $F_{T-1}(x)=\sum_{t=1}^{T-1}\alpha_t\cdot h_t(x)$ 表示T-1时刻权值为 $\alpha_t$ 的分类器的集成。此外，令 $l(\widehat y,y)$ 表示预测标签 $\widehat y$ 对标签为的数据点的损失函数。在算法的每次迭代中，一个带有确定权重 $\alpha_T$ 的额外分类器加入到继承中来，于是有了损失函数

需要最小化。请注意，在时刻T时，集成 $F_{T-1}$ 是固定的。对于损失函数的特定选择，例如 $l(\widehat y,y)=exp(-\widehat y\cdot y)$ ，优化问题产生看一个确定的加权分类问题，并允许我们使用训练数据上的的损失来表示最优 $\alpha_T$ 。

根据定义，bagging方法的基础学习器是独立训练的。因此，唯一真正的半监督bagging方法是将自训练应用于个体基础学习器。然而，协同训练与bagging方法密切相关：分类器相互作用的唯一方式是交换伪标记数据；除此之外，分类器可以同时独立地训练。然而，大多数协同训练方法并不使用bootstrapping方法，这是bagging方法的典型特征。另一方面，在boosting中，基础学习器之间有一种内在的依赖性。因此，通过在每个学习步骤后引入伪标记数据，boosting方法可以很容易地扩展到半监督设置；这种思想产生了半监督boosting方法。

半监督boosting方法在过去的二十年中得到广泛的研究。AdaBoost（Freund和Schapire，1997），梯度boosting和XGBoosting（Chen和Guestrin，2016）等监督boosting方法的成功，为将boosting引入半监督设置提供了充足的动力。此外，自训练和协同训练的伪标记方法可以很容易地扩展到boosting方法。

4.3.1 SSMBoost

Grandvalet等人首次尝试半监督boosting方法，他们将AdaBoost扩展到半监督设置。他们提出了一种半监督boosting方法（Grandvalet等人，2001），后来他们从梯度boosting的角度扩展和激发了这种算法。基于当前集成的预测和正在构建的基础学习器的预测，定义了一个未标记数据的损失函数。采用多种损失函数进行实验；作者报告了使用新组合分类器的预期损失的最强结果。因此，基础分类器的加权误差 $\epsilon _t$ 适用于包含为标记数据点，导致权重项 $\alpha _t$ 也依赖于未标记数据。

至关重要的是，SSMBoosting不会给未标记的数据点分配伪标签。因此，它需要半监督基础学习器来使用未标记的数据，因此本质上是半监督的，这与大多数其他半监督boosting算法（包装方法）不同。然而，这里包含了SSMBoost，因为它构成了所有其它形式的半监督boosting算法的基础，这些算法不需要半监督基础学习器。

4.3.2 ASSEMBLE

ASSEMBLE算法（Adaptive Supervised Ensemble的简称）在每次迭代后对未标记的数据点进行伪标记，并将这些伪标记数据点用于构建下一个分类器，从而减少了对半监督基础学习器的要求（Bennett等人，2002）。如其作者所示，ASSEMBLE有效地最大化了函数空间中的分类间隔（classification margin）。

由于ASSEMBLE中使用伪标记，所以决定将哪些未标记的数据点传递给下一个基础学习器并非易事。Benntt等人（2002）提出使用bootstrapping——即抽样法，均匀随机，用标记数据点和未标记数据点替换个数据点。

4.3.3 SemiBoost

半监督boosting算法SemiBoost依靠流形假设，利用基于图的方法（Mallapragada等人，2009）的原则，解决了基础学习器使用的数据点选择问题。每个未标记的数据点被分配一个伪标签，并基于一个预定义的领域图计算相应的预测置信度，该领域图编码数据点之间的相似性。然后，将这些未标记数据点的子集添加到标记数据点集合中，用于下一个基础学习器。样本被这个子集选中的概率与它的预测置信度成正比。Grabner等人（2008）成功地将SemiBoost应用于视频中的目标跟踪。

SemiBoost使用标准boosting分类模型，将最终标签预测表示为单个学习器预测的线性组合。然而，它的代价函数与前面描述的半监督boosting方法有很大的不同。Mallapragada等人（2009）认为，一个成功的测试数据标记应该符合以下三个要求。首先，对于距离较近的未标记数据点，未标记数据的预测标记应该是一致的。其次，未标记数据的预测标记应与附近标记数据点的标记保持一致。第三，被标记数据点的预测标记应与器真实标记相对应。这些需求以约束优化问题的形式表示，其中前两个目标函数捕获，最后一个作为约束。换句话说，SemiBoost算法用boosting来解决优化问题

$minimize_{F_T} \mathfrak{L}_L(\widehat y,A,F_T)+\lambda\cdot \mathfrak L_U(\widehat y,A,F_T)\\subject to \widehat y_i=y_i,i=1,...,l,$ （1）

其中 $\mathfrak{L}_L$ 和 $\mathfrak{L}_U$ 分别是表示未标记数据与合并的标记数据和未标记数据之间不一致的代价函数， $\lambda \in \mathbb{R}$ 是控制成本项相对权重的常数；A是一个n*n的对称矩阵，表示数据点之间的成对相似性。最后表示分类器集成在T时刻的联合预测函数。我们注意到，式（1）中的优化目标与基于图的方法中遇到的成本函数非常相似（见第6.3节和第7章），因为它倾向于一致性地标记相同流形上的数据点的分类器。然而，在基于图的方法中，通常没有标记-无标记和未标记-未标记之间的区别。

4.3.4 其它半监督boosting方法

上述三种方法构成了半监督boosting研究的核心。该领域的进一步工作包括RegBoost，它与SemiBoost一样，在其目标函数中包括本地标签一致性（Chen和Wang，2011）。在RegBoost中，这一项也依赖于边际分布p(x)估计的局部密度。已经经过了几次尝试，将标签一致性正则化扩展到多类环境（Tanha等人，2012；Valizadegan等人，2008）。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
Apache HBase基础（基本概述，物理架构，逻辑架构，数据管理，架构特点，HBase Shell） May--J--Oldhu HBase HBase shell hbase物理架构 hbase逻辑架构 hbase
NoSQL综述及ApacheHBase基础一.HBase1.HBase概述2.HBase发展历史3.HBase应用场景3.1增量数据-时间序列数据3.2信息交换-消息传递3.3内容服务-Web后端应用程序3.4HBase应用场景示例4.ApacheHBase生态圈5.HBase物理架构5.1HMaster5.2RegionServer5.3Region和Table6.HBase逻辑架构-Row7.
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
《中国特殊教育》专注知识产权服务13937636601 职称评审知网期刊核心期刊核心期刊职称评审
刊物名称《中国特殊教育》刊号国内CN11-3826/G4国际ISSN1007-3728投稿须知1．征稿范围及各类稿件的要求特殊教育与心理学研究各领域的实证研究、综述、教学改革研究等，具体研究领域包括全纳教育、特殊教育理论、听力障碍、视力障碍、智力障碍、学习障碍、自闭症、情绪与行为障碍、康复与治疗、超常儿童教育、特殊群体教育（留守儿童、流动儿童、孤儿、小团伙、网络成瘾儿童、工读学生）等1.1实证类稿
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa