hellozhxy

机器学习模型在携程海外酒店推荐场景中的应用

导读

互联网企业的核心需求是“增长”，移动互联时代下的在线旅游业也不例外。随着大数据、云计算和人工智能等技术的不断进步，通过算法和模型来实现增长已成为核心。

近年来推荐系统迅速崛起，主要解决在信息过载的情况下，帮助用户高效获取感兴趣的信息，同时帮助企业最大限度的吸引用户、留存用户、增加用户黏性、提高用户转化率。因此个性化的推荐服务对于在线旅游业也变得非常重要，通过推荐能够将用户从众多的旅行选择中解放出来，指导用户快速找到感兴趣的项目，大大简化用户的旅行计划和购买。

在线旅游服务商 (OTA)提供的应用中包含酒店、航班、旅游产品、攻略等各个环节和产品。其中酒店涉及到的推荐场景较多，例如城市热门酒店推荐、附近同类型酒店推荐、机票页酒店交叉推荐、Meta着陆页相似酒店推荐、信息流推荐等。大部分场景都实现了个性化的推荐服务，其核心就是一组酒店与一组用户相匹配的挑战。

推荐准确性取决于如何利用可用信息，这些信息主要包括物品信息(I)、用户信息(U)及上下文信息(C)等，例如给定的酒店特征、酒店的位置吸引力、用户的购买历史等。将这些信息构建一个函数 f(U,I,C)，预测用户对特定候选酒店的喜好程序，再根据喜好程度对所有候选酒店进行排序，生成推荐列表。见图1推荐系统逻辑框架。

推荐系统排序模型在推荐系统中占据绝对核心的地位，很多公司也都在提出并尝试一些前沿的算法和推荐模型。而机器学习和深度学习模型正在变得越来越复杂，将这种复杂模型推上线，模型响应速度就可能变得很慢，因此对推荐系统的数据流和工程实现产生新的挑战。

如何做到海量数据的实时处理、特征的实时提取、线上模型服务过程的数据实时获取以及工程能力与技术方案的平衡等，成为模型上线的重要挑战。本文主要探讨OTA酒店推荐方面常用的在线部署模型以及技术架构，并从核心之外的角度审视推荐系统的不同技术模块及优化思路。

图1 推荐系统逻辑框架

一、酒店推荐系统的技术架构

实际推荐系统中主要解决的问题可以分为两类，数据部分以及算法模型部分。其中数据部分融合了数据离线批处理、实时流处理的数据流框架。算法模型部分则是集训练 (training)、评估 (evaluation)、部署 (deployment)、线上推断 (online inference) 为一体的模型框架。目前通用的推荐系统技术架构如图2所示。

图2 推荐系统的技术架构示意图

1.1 数据部分

推荐系统的数据部分主要负责用户、物品、上下文的信息收集与处理。并且按实时性强弱，分别在三种平台上进行处理。客户端是最接近用户的环节，也是能够实时收集用户会话内行为及上下文特征的地方，这些特征随http请求一起到达服务器端是常用的请求推荐结果的方式。

随着Storm、Spark Streaming、Flink等流计算平台的日益成熟，利用流计算平台进行准实时的特征处理已经成为当前推荐系统的主要模式。流计算平台并非完全实时的平台，每次需要等待并处理一小批日志，以流的形式进行微批处理（mini batch），系统可能无法在3分钟内把session内部的行为历史存储到特征数据库（如Redis）中。但它的优势是能够进行一些简单的特征统计的计算，比如一个物品在该时间窗口内的曝光次数，点击次数、一个用户的页面浏览时长等。

大数据离线数据处理主要是利用Spark等分布式批处理计算平台对全量特征进行计算和抽取。主要用于模型训练和离线评估，以及将特征保存入特征数据库，供之后的线上推荐模型使用。

酒店推荐系统中的实时特征部分主要来源于用户的实时点击行为数据和一些上下文信息（如GPS获得的地点信息等），通过Storm或Flink进行准实时流处理，将用户实时行为数据解析入特征数据库Redis。

离线特征部分主要包含用户和酒店两部分的特征。其中用户离线特征主要由用户画像（CRM）提供，包含数据库中用户的订单和浏览历史信息等，并且严格遵守欧盟通用数据保护条例（GDPR）。酒店离线特征主要包含酒店的基础信息，如星级、评分等。由于特征维度及样本量较大，离线特征数据的清洗与预处理通常在Spark平台上进行，后将处理好的特征数据落入HDFS的Hive表并同步至Redis缓存中。离线特征与实时特征合并供线上模型使用。下面代码展示Hive表数据同步Redis的方法：

1.2 模型部分

模型部分是推荐系统的主体，一般由召回层、排序层、补充策略与算法层组成。召回层一般利用高效的召回规则、算法或者简单的模型，快速从海量的候选集中召回用户可能感兴趣的物品。排序层利用排序模型对筛选的候选集进行精排序。排序层是推荐系统产生效果的重点，后面部分将重点介绍一些主流推荐模型和酒店推荐上的应用。

补充策略与算法层也被称为再排序层，再将推荐列表返回用户之前，根据新鲜度、多样性等指标结合补充策略与算法进行一定调整，最终形成用户可见的推荐列表。从召回所有候选物品集，到最后产生推荐列表，这一过程一般称为模型服务过程。

在线环境进行模型服务之前，需要通过模型训练确定模型结构及参数值，并生成模型文件。另外，为了评估推荐模型的效果，方便模型的迭代优化，推荐模型部分有离线评估和线上A/B测试等多种线上线下评估模式。

二、酒店推荐系统的工程实现

如何将离线训练好的模型部署在线上的生成环境，进行线上实时推断，一直是业界难点。目前酒店推荐场景中主要用到两种部署推荐模型的主流方法，一是利用PMML转换并部署模型，二是Tensorflow Serving方式。

2.1 利用PMML转换并部署模型

酒店推荐场景中由于实时数据量较大，通常采用SOA框架实现分布式服务，完成模型服务过程。但绝大部分SOA框架都是Java或C++语言编写，而预测模型大多是基于Python语言。因此常用预测模型标记语言（Predictive ModelMarkup Language，以下简称PMML）重新实现算法模型，然后将模型封装成类，通过JAVA调用这个类来进行预测。由python封装的模型可以通过sklearn中的sklearn2pmml函数实现PMML文件转换。XGBoost模型需要JPMML-XGBoost命令行转换工具，转换命令为：

XGBoost模型需要生成.model模型文件和 .fmap特征映射文件。.model文件可以通过save_model函数生成。

2.2 Tensorflow Serving

上面的方法也适用于Tensorflow生成的模型，但由于Tensorflow模型文件往往较大，且PMML文件无法优化，使用起来比较麻烦。本质上讲，Tensorflow Serving的工作流程和PMML类工具的流程是一致的。不同之处在于，Tensorflow定义了自己的模型序列化标准。

利用Tensorflow自带的模型序列化函数可将训练好的模型参数和结构保存至某文件路径。路径下包括variables文件夹和saved_model.pbtxt文件。variable文件夹下包含各个变量的状态（断点），有*.data和*.index两类文件。*.data记录变量的内容。*.index文件用于将变量名映射到*.data中的变量数据。.pbtxt文件是包含SavedModel、MetaGraphs、Graphs、签名等的二进制protobuf。模型文件通常由自身的Python API生成，然后由Tensorflow的客户端库（如JAVA或C++库）来加载模型并进行在线预测。以下代码展示了使用SavedModelBuilder 构建 SavedModel 的典型方法：

添加Tensorflow相关依赖后Java导入已保存的模型方法为：

具体的酒店实时推荐工程架构如图3所示。

图3 酒店实时推荐工程架构

三、Embedding技术在酒店推荐中的应用

Embedding方法已成为应用最广泛的深度学习技术。通过低维的向量表示一个对象，可以同时表达对象之间的潜在关系，即向量之间的距离反应对象之间的相似性。该方法的流行始于自然语言处理领域对于词向量生成问题的研究，发展到其他应用领域的物品也可以通过某种方式生成其向量化表示，例如旅游领域对酒店进行Embedding，并对酒店进行相似度计算，因此成为常用的推荐系统召回层技术。

Embedding技术中最著名的就是Word2vec模型，用于生成对词的向量表达。而对于用户购买序列中的商品或者用户浏览序列中的酒店使用的Embedding方法称为Item2vec方法。

在酒店召回层我们采用了酒店Embedding技术计算相似度，召回候选酒店集。在Word2vec方法中词的上下文即为邻近词的序列，而词的序列其实等价于一系列连续操作的item序列。因此，我们将用户一次浏览会话中连续点击的酒店序列作为训练语料，学习酒店的向量表示。抽取用户的连续点击如表1所示。酒店间的共现为正样本，且按照酒店的频率分布进行负样本采样。

表1 用户在同一个会话下的酒店连续点击记录

uid	sessionid	hotelid
001	1	1701976, 480887, 1525866, 846838
002	4	686430,1542818,993356,1525732,1525866,688217,1701976,1007025

酒店嵌入矩阵（Embeddingmatrix）的行数为酒店的总个数，列数为嵌入维度。酒店相似度使用余弦相似度。将相似度得分从高到低排序，选取TopN酒店做候选酒店。酒店向量生成使用的是Word2vec模型中的Skip-Gram模型。Skip-Gram神经网络模型训练一个带有单个隐含层的简单神经网络来执行某个预测任务，训练好的模型并不用于实际预测，其真正目的是获取输入层-隐含层的权重矩阵，将这些权重值视为词向量。

图4展示了当skip_window = 2时（即仅选输入词前后各两个词和输入词进行组合），训练样本是如何产生的（蓝色代表输入词，方框内代表位于窗口内的单词）。通过输入文本中成对的单词来训练神经网络，其输出概率代表着到词典中每个词有多大可能性跟输入单词同时出现。

图4 训练样本生成

每个词wt都决定了wt+j，基于极大似然估计方法，希望所有样本的条件概率p(wt+j|wt)之积最大，这里使用对数概率。因此Word2vec的目标函数如公式(1)所示。

(1)

基于训练数据需要构建词汇表并对单词做one-hot编码。神经网络结构如图5所示。假设从训练数据中抽取出10000个唯一不重复的单词组成词汇表，则模型的输入为10000维的向量，输出也是10000维的向量。每一维输出都是一个概率，代表当前词是输入样本时输出词的概率大小。

图5 Skip-Gram神经网络

隐含层不使用激活函数，输出层使用softmax计算输出概率。由于权重矩阵规模非常大，通过梯度下降更新权重是相当慢的，并且需要大量的训练数据避免过拟合。因此通常对优化目标采用负采样方法，即每个训练样本的训练只会更新一小部分的模型权重，从而降低计算负担。Skip-Gram模型的Tensorflow核心代码如下所示：

Word2vec和由其衍生出的Item2vec是Embedding技术的基础性方法，但都是建立在序列样本的基础上。在互联网场景下，数据对象之间更多呈现的是图结构。典型的场景是由用户行为数据生成的物品关系图，如图6(a)(b) 所示，以及由属性和实体组成的知识图谱,如图6(c)所示。

图6 物品关系图与知识图谱

由于用户浏览酒店的模式不一定呈现序列结构，而是一种关系图结构，我们后期尝试Graph Embedding中的DeepWalk方法对图结构中的节点酒店进行Embedding。即在由酒店组成的图结构上进行随机游走（如图7所示），产生大量酒店序列，然后将这些物品序列作为训练样本输入Word2vec进行训练，得到酒店的Embedding。在DeepWalk算法中，需要定义随机游走的跳转概率，即到达节点vi后，下一步遍历vi的邻接点vj的概率。见公式(2)。

图7 随机游走

(2)

其中ε是物品关系图中所有边的集合。如果物品关系图是有向有权图，则N+(vi)是节点vi所有的出边集合，Mij是节点vi到节点vj边的权重。如果物品关系图是无向无权图，则权重Mij将为常数1，且N+(vi)是节点vi所有边的集合。酒店推荐场景采用无权无向图结构进行训练。

四、酒店推荐系统中的模型应用

深度学习之前传统的推荐模型发展主要由这几部分组成：协同过滤算法族、逻辑回归模型族、因子分解机模型族以及组合模型，思路演化主要是增强泛化能力、保留记忆能力、挖掘特征组合关系。

经典的协同过滤算法曾是推荐系统的首选模型，并且衍生出矩阵分解模型，能够更好的处理稀疏共现矩阵问题，增强模型的泛化能力。在酒店推荐中我们也常常将协同过滤作为召回层的算法使用。与协同过滤仅利用用户和物品之间的显式或隐式反馈信息相比，逻辑回归能够利用和融合更多用户、物品及上下文特征。并发展出来因子分解机模型FM，加入二阶部分，使模型具备进行特征组合的能力。在此基础上又发展出域感知因子分解机FFM，进一步加强因子分解机特征交叉的能力。

另外为了融合多个模型优点，将不同模型组合使用成为推荐模型常用的方法。Facebook提出的GBDT+LR[ 梯度提升决策树+逻辑回归 ] 组合模型是在业界影响力较大的组合方式。其中GBDT作为有监督的特征转换器，对于连续型特征和离散特征分别做离散化非线性变换和笛卡尔乘积的特征组合，将实数向量转换为简单的二进制值向量，构造新特征向量。LR用于新特征向量的训练，并取得比单独使用两个模型都好的结果。组合模型中体现的特征工程模型化的思想，成为深度学习推荐模型的主要思想之一。

酒店推荐系统仍然延续通常意义上的CTR（Click- through rate）预估类的优化目标，其任务核心衍生为把推荐问题当作分类问题对待，预测用户点击某个酒店的概率CTR，并且返回用户一组按CTR从高到低排序的酒店列表。因此也称为搜索排序系统。

酒店推荐场景亦属于高度稀疏数据，往往需要解决记忆/泛化问题及特征交互问题。因此深度学习模型的优势就展现出来，通过学习一种低维的特征向量表示（Dense Embedding），深度神经网络已经表现出自动学习复杂特征交互的潜力。并且通过较少的特征工程，可以从稀疏特征中更好的泛化去发现特征关联。深度学习推荐模型大量借鉴并融合了深度学习在图像、语音及自然语言处理方向的成果，在模型结构上进行了快速的演化。主要有以下几种演变方向。

（1）改变神经网络的复杂结构，从单层神经网络模型AutoRec到经典的Deep Crossing（深度特征交叉），增加了深度神经网络的层数和结构复杂度。

（2）改变特征交叉方式，例如NeuralCF（神经网络协同过滤）和PNN（基于积操作的神经网络）模型。

（3）组合模型，主要是指Wide&Deep模型及其后续变种Deep&Cross、DeepFM等，通过组合不同特点、优势互补的网络，提升模型的综合能力。

（4）注意力机制与推荐模型的结合，主要包括FM与注意力机制的AFM和DIN（深度兴趣网络）。

（5）其他结合方式（序列模型、强化学习与推荐模型的结合等）。

以下简单介绍几种在推荐模型演化过程中常用的模型结构和原理。

4.1 Factorization Machines（因式分解机）

对于一个给定的特征向量，线性回归建模时采用的函数是

（3）

其中， W0和为模型参数。方程中各特征分量xi和xj (i≠j)之间相互独立，即中仅考虑单个的特征分量，而没有考虑特征分量之间的相互关系。因此将改写为：

（4）

公式中增加了任意两个不同特征之间的关系。但是在稀疏数据中，这样的建模方式存在一个缺陷，对于训练数据中未出现交互的特征分量，不能对相应的参数进行估计。而在类似推荐这种高度稀疏数据场景中，样本中出现未交互的特征分量是很普遍的。

为了克服上面的缺陷，针对每个维度的特征分量xi引入辅助向量

其中为超参数， wij改写为

则模型方程可以改写为：

由于对应一种矩阵分解技术，因此模型方程的方法称为Factorization Machines。该模型方程可以证明在线性时间0(kn) 内计算，并且方程可以进一步推导为：

(6)

FactorizationMachines的Tensorflow核心实现代码如下：

4.2 Wide & Deep Learning

深度学习存在过度泛化的问题，当用户与物品交互较少即特征向量稀疏时推荐一些与用户不相关的项目（例如用户有特定的偏好或者一些小众项目），这种情况下大多数项目不应该被推荐，但是Dense Embedding会给出非0的预测，因此不相关的项目也会被推荐。而进行特征交叉乘积变换的线性模型能够记忆这些特殊情况或例外规则，并且使用更少的参数。Google在2016年提出了Wide& Deep模型，很好的结合了线性模型的记忆能力和深度神经网络的泛化能力，在训练过程中同时优化2个模型的参数，从而达到整体模型的预测能力最优。模型结构如图9所示。

图9 Wide & Deep模型结构

Wide部分就是LR，输入特征包含了原始特征和交叉特征。Deep部分是MLP网络，隐含层的激活函数使用ReLUs=max(0,a)，输入特征包含了连续的特征和embedding特征。对于一个逻辑回归任务Wide & Deep模型预测方程为：

（7）

其中Y是二分类标签，σ(.)是sigmoid函数，∅(x)是原始特征的交叉乘积转换。Wwide是所有线性模型的权重向量，Wdeep是应用于最后激活层输出的权重。

Wide& Deep建模可以使用Tensorflow高级API，建模步骤如下：

（1）选择Wide部分的特征（wide_columns）：稀疏基础特征和交叉特征。

（2）选择Deep部分的特征（deep_columns）：连续型特征、类别特征（编码）。

（3）将Wide & Deep特征合并输入模型（DNNLinearCombinedClassifier）。

4.3 FTRL 算法

Wide& Deep模型训练方面常使用结合 L1 正则的Follow-the-regularized-leader (FTRL) 算法进行Wide部分训练，而Deep部分使用AdaGrad算法进行训练。

其中FTRL算法可以实施于在线学习，对模型参数进行实时更新，在处理诸如逻辑回归之类的带非光滑正则化项的凸优化问题上性能非常出色。像Batch Gradient Descent 等优化算法，是对一批样本进行一次求解，得到一个全局最优解。而实际CTR预测需要更快速地更新模型，模型的参数需要针对每一个新来样本进行一次迭代。因此可以通过工程上实现FTRL算法，从而快速更新模型的参数。FTRL算法的特征权重更新公式为：

（8）

其中是针对每个特征维度的学习率。如果特征 A 比特征 B变化快，那么在维度 A 上面的学习率应该比维度 B 上面的学习率下降得更快。维度i的学习率定义为：

（9）

在Logistic Regression中，假设σ(a)=1/(1+exp(-a))是sigmoid函数，yt∈{0,1}，需要预测Pt=σ(Wt)，损失函数使用LogLoss函数：

（10）

梯度.Logistic Regression的FTRL算法为：

4.4 DeepFM

Wide & Deep 模型中需要宽度部分和深度部分两类不同的输入，而宽度部分仍然需要依赖大量的特征工程工作。2018年提出的DeepFM 模型结合了分解向量机（FM）和深度神经网络（DNN），既能学习复杂的低阶与高阶特征交互又不需要原始特征以外的特征工程，并且允许端到端的学习方式。模型结构如图10所示。嵌入层（Dense Embedding）将原始输入向量压缩到低维稠密向量，作为FM和深度部分的输入。因此不同于Wide & Deep 模型，DeepFM的FM部分和深度部分共享相同的输入向量，从而可以进行端到端的训练。

图10 DeepFM 模型结构

尽管不同Field的输入长度不同，但是Embedding之后的Dense vector的长度均为k。Dense vector其实就是输入层到Embedding层该神经元相连的k条线的权重，即。这k个值组合起来就是我们在FM中所提到的辅助向量vi，即FM和深度神经网络的共享输入向量。其中深度部分可以使用不同的神经网络结构。如图所示DeepFM模型是一种并行结构，预测结果可以表示为：

（11）

DeepFM 模型的Tensorflow核心实现代码如下：

五、酒店推荐系统评估

推荐系统一般分为离线评估和在线评估两部分。离线评估的指标主要是机器学习模型常用的一些评估指标，包括准确率、精确率与召回率、F1-Score、AUC值等。在线评估的主要方式是A/B测试，主要评估指标有点击率、转化率、点击排名等。

为了测试模型效果，我们选取了某一个酒店推荐场景，并抽取100万左右数据作为训练样本。其中正样本为用户点击，负样本为有露出但用户未点击，并对数据集做样本平衡处理。特征部分不赘述。模型离线表现如表2所示。

表2 模型离线表现对比

Model	AUC (5000 iters)
Logistic Regression	0.597
Xgboost	0.737
XGBoost+LR	0.75
FM	0.599
Wide & Deep	0.799
DeepFM	0.80

在线测试部分使用A/B测试，其中A版本为旧版本，推荐算法基于规则推荐，B版本为新版本，使用XGBoost模型进行酒店点击率预测并排序，同时使用基于酒店的协同过滤算法进行候选酒店召回。工程上线参考第三部分描述。A/B实验周期为一个月，使用的评估指标包括酒店平均点击率及酒店订单量等。其中酒店平均点击率增长25.35%，酒店订单量总增长率为27.31%，效果较显著。更多模型结构将会持续上线实验。

六、推荐系统中的一些问题

在构建推荐系统的过程中，推荐模型的作用是重要的，但并不是推荐系统的全部。推荐系统需要解决的问题是综合性的，包含特征选取和处理、召回层设计、实时性要求、模型在线学习以及冷启动和推荐多样性问题等。这里主要探讨一下冷启动和推荐多样性问题。

冷启动问题主要包括用户冷启动（新用户注册，无历史行为）、物品冷启动（新物品加入，无用户交互历史）和系统冷启动问题（无任何相关历史数据）三类。主流的冷启动策略是基于规则的冷启动过程，在这过程中可以丰富用户和物品特征，从而通过推荐模型进行个性化推荐。

另外也可以通过主动学习、迁移学习和探索利用机制。最经典的启发式探索利用方法为几个Bandit算法，如Thompson Sampling算法和UCB（Upper Confidence Bound）算法，二者都是利用了分布的不确定性作为探索强弱的依据。UCB算法流程如下：

（1）假设有K个老虎机，对每个老虎机进行随机摇臂m次，获得老虎机受益的初始化经验期望。

（2）用t表示至今摇臂的总次数，用nj表示第j个老虎机至今被摇臂的次数，计算每个老虎机的UCB值：

（3）选择UCB值最大的老虎机i摇臂，并观察其收益Xi,t。

（4）根据Xi,t更新老虎机i的收益期望值。

（5）重复第2步。

ThompsonSampling算法和UCB算法都是工程中常用的探索与利用方法，不但可以解决冷启动问题，还可以发掘用户新兴趣，增加推荐结果的多样性，减少大量同质化内容同时出现时用户的厌倦情绪。可以说探索与利用的思想是所有推荐系统不可或缺的补充。

参考文献

[1] 《深度学习推荐系统》，王喆

[2] H.B. McMahan, G. Holt, D. Sculley, M. Young, D. Ebner, J. Grady, L. Nie, T.Phillips, E. Davydov, D. Golovin, S. Chikkerur, D. Liu, M. Wattenberg, A. M.Hrafnkelsson, T. Boulos, and J. Kubica, “Ad click prediction: a view from thetrenches,” in ACM SIGKDD, 2013.

[3]X. He, J. Pan, O. Jin, T. Xu, B. Liu, T. Xu, Y. Shi, A. Atallah, R. Herbrich,S. Bowers, and J. Q. Candela, “Practical lessons from predicting clicks on adsat facebook,” in ADKDD, 2014, pp. 5:1–5:9.

[4] S.Rendle, “Factorization machines,” in ICDM.

[5]H. Cheng, L. Koc, J. Harmsen, T. Shaked, T. Chandra, H. Aradhye, G. Anderson,G. Corrado, W. Chai, M. Ispir, R. Anil, Z. Haque, L. Hong, V. Jain, X. Liu, andH. Shah, “Wide & deep learning for recommender systems,” CoRR, vol.abs/1606.07792, 2016.

[6]Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He, and ZhenhuaDong, “DeepFM:AnEnd-to-End Wide & Deep Learning Framework for CTR Prediction,”arXivpreprint arXiv:1804.04950, 2018

你可能感兴趣的:(机器学习)

Python day15
@浙大疏锦行Pythonday15.内容：复习日本周主要的内容是一些常见的机器学习流程以及其中的部分内容标签编码以及连续特征的处理：归一化和正态化等。图像的绘制：热力图、Shap图等的绘制超参数优化算法：网格搜索、贝叶斯以及启发式算法模拟退火、遗传算法等不平衡数据集的处理：过采样以及欠采样。
Lecture 5：Training versus Testing 薛家掌柜的
回顾一下前四个Lecture，Lecture1讲的是找一个使得（也就是），Lecture2讲的是使得，Lecture3讲的是机器学习的分类，Lecture4讲的是让。那么，我们就有两个核心问题需要解决了。我们如何保证尽可能地靠近？我们如何使得足够小？而在这两个问题里面，假设集大小又扮演着什么样的角色？应该多大呢？如果是一个很小的，能够满足，但是可选的假设又太少了。如果是一个很大的，可选的假设很多，
Python 生物信息学秘籍第三版（四）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/9694cf42f7d741c69225ff1cf52b0efe译者：飞龙协议：CCBY-NC-SA4.0第十一章：生物信息学中的机器学习机器学习在许多不同的领域中都有应用，计算生物学也不例外。机器学习在该领域有着无数的应用，最古老且最为人熟知的应用之一就是使用主成分分析（PCA）通过基因组学研究种群结构。随着该领域的蓬勃发展，还有许多其他潜在的应
【机器学习&深度学习】什么是量化？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、量化的基本概念1.1量化对比示例1.2量化是如何实现的？二、为什么要进行量化？2.1解决模型体积过大问题2.2降低对算力的依赖2.3加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化（GradientQuantiz
MATLAB 基于图像处理的杂草识别技术鱼弦 matlab 图像处理计算机视觉
MATLAB基于图像处理的杂草识别技术1.系统介绍杂草识别是精准农业中的重要环节，基于图像处理的杂草识别技术利用计算机视觉和机器学习算法，自动识别田间杂草，为精准施药提供决策支持。本系统基于MATLAB实现杂草图像处理，包括图像预处理、特征提取、分类识别等模块。2.应用场景精准农业:自动识别田间杂草，实现精准施药，减少农药使用量。生态监测:监测农田杂草种类和分布，评估生态环境。植物保护:识别有害杂
Python 机器学习：NumPy 实现朴素贝叶斯分类器 Python编程之道 Python编程之道 python 机器学习 numpy ai
Python机器学习：NumPy实现朴素贝叶斯分类器关键词：朴素贝叶斯分类器、NumPy、机器学习、概率模型、条件概率、拉普拉斯平滑、向量化计算摘要：本文系统讲解朴素贝叶斯分类器的核心原理，基于NumPy实现高效的算法框架，涵盖从概率理论到工程实现的完整流程。通过数学公式推导、代码实现和鸢尾花数据集实战，展示如何利用向量化计算优化概率估计，解决特征独立性假设下的分类问题。同时分析算法优缺点及实际应
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
股票基金量化开源平台对比 Mr.小海开源开源金融
股票基金量化开源平台对比分析报告引言研究背景与意义在金融科技快速发展的背景下，量化交易已成为现代金融市场中投资者追求高效与精准交易的核心工具。通过程序化方式，投资者能够迅速处理海量市场数据，制定并执行复杂交易策略，其高效性、低情绪干扰及策略多样性等优势显著[1]。特别是随着人工智能技术的深化，2025年基于深度学习与机器学习的开源量化工具持续涌现，推动行业向数据驱动转型——量化交易将决策逻辑从经验
开源基金/股票量化平台调研报告 Mr.小海金融
开源基金/股票量化平台调研报告引言调研背景与目的近年来，随着人工智能技术的持续深化，量化交易领域迎来了深刻变革。2025年，基于深度学习和机器学习的开源工具不断涌现，不仅在技术层面实现突破，更在实际应用中展现出强大竞争优势，推动行业创新与升级[1].作为融合数学、统计与计算机技术的科技驱动型金融策略，量化交易通过自动化与数据驱动方法提升投资决策效率与准确性，已成为金融机构与投资者追求超额收益的重要
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
Java云原生安全矩阵：从代码到运行时的量子级防御墨夶 Java学习资料6 java 云原生安全
核心架构：SpringSecurity与Envoy的“量子态防御”基于声明式安全的“波函数坍缩”API网关的“暗物质过滤”代码示例：SpringSecurity的量子态权限控制威胁检测的“超弦理论”基于行为分析的“量子隧穿”异常检测实时日志的“引力波监测”代码示例：机器学习驱动的异常行为检测加密与密钥管理的“暗能量引擎”敏感数据的“量子态加密”密钥的“黑洞事件视界”保护代码示例：BCrypt与JW
入门勤学奋进小郎君
了解机器学习标签需要通过机器学习模型判断出的结果特征机器学习模型进行判断的条件（可以是很多的变量）模型机器学习判断的工具降低损失线性回归y=mx+b其中：y指的是温度（以摄氏度表示），即我们试图预测的值。m指的是直线的斜率。x指的是每分钟的鸣叫声次数，即输入特征的值。b指的是y轴截距。2018-10-31_155803.png但是这样会对一些样本有误差，而我们的目的就是得到将误差降到最低的模型降低
第 20 课时：GPU 管理和 Device Plugin 工作机制（车漾）阿里云云原生 CNCF X 阿里巴巴云原生技术公开课阿里云 Kubernetes CNCF 专家团队 CNCF 专家团队 CNCF 专家团队 Kubernetes
本文将主要分享以下几个方面的内容：需求来源GPU的容器化Kubernetes的GPU管理工作原理课后思考与实践需求来源2016年，随着AlphaGo的走红和TensorFlow项目的异军突起，一场名为AI的技术革命迅速从学术圈蔓延到了工业界，所谓AI革命从此拉开了帷幕。经过三年的发展，AI有了许许多多的落地场景，包括智能客服、人脸识别、机器翻译、以图搜图等功能。其实机器学习或者说是人工智能，并不是
主流编程语言全景图：从Python到Rust的深度解析万能小贤哥 python rust 开发语言
2024年编程语言生态报告显示，全球开发者使用的语言数量已达260+，但真正主导行业的不到20种。本文带你穿透技术迷雾，掌握8大核心语言的本质差异。一、选择编程语言的黄金标准图表代码二、八大主流语言对比解析1.Python-通用胶水语言特性：动态类型+缩进语法丰富的库生态（20万+包）GIL全局锁限制并发适用场景：python#机器学习示例（TensorFlow）importtensorflowa
边缘智能革命：嵌入式机器学习如何让万物“思考” 万能小贤哥机器学习人工智能
当智能手表精准识别你的健身动作，工业传感器预测设备故障于毫秒之间，农业传感器自动调节灌溉水量——这些并非科幻场景，而是嵌入式机器学习（EmbeddedMachineLearning,或TinyML）正在悄然重塑的现实。这场发生在设备边缘的智能革命，正将AI从云端的数据中心拉近到我们指尖的每一台设备中。一、嵌入式机器学习：定义与核心价值嵌入式机器学习是指在资源极端受限的微控制器（MCU）、微处理器（
KL散度：信息差异的量化标尺 | 从概率分布对齐到模型优化的核心度量
不对称性、计算本质与机器学习的普适应用本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与数学本质KL散度（Kullback-LeiblerDivergence）用于衡量两个概率分布PPP和QQQ的差异程度，定义为：DKL(P∥Q)=∑x∈XP(x)log⁡P(x)Q(x)(离散形式)D_
深度学习：让 AI 拥有 “思考” 能力的核心技术田园Coder 人工智能科普人工智能科普
1.深度学习：突破传统的AI“进阶版”1.1什么是深度学习？深度学习是机器学习的一个分支，它通过模拟人脑神经网络的多层结构，让AI能够自动学习数据中的复杂特征，从而完成更高级的认知任务。例如，传统机器学习需要人类手动提取“猫有尖耳朵、胡须”等特征，而深度学习能直接从原始图片中，自主学习从像素到轮廓、再到整体形态的多层特征，最终实现更精准的识别。这种“自主提取特征”的能力，让深度学习突破了传统AI的
117、Python机器学习：数据预处理与特征工程技巧多多的编程笔记 python 机器学习开发语言
Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
学习笔记(39):结合生活案例，介绍 10 种常见模型宁儿数据安全 #机器学习学习笔记生活
学习笔记(39):结合生活案例，介绍10种常见模型线性回归只是机器学习的“冰山一角”！根据不同的任务场景（分类、回归、聚类等），还有许多强大的模型可以选择。下面我用最通俗易懂的语言，结合生活案例，介绍10种常见模型及其适用场景：一、回归模型（预测连续值，如房价）1.决策树（DecisionTree）原理：像玩“20个问题”游戏，通过一系列判断（如“面积是否>100㎡？”“房龄是否0.5就判为“会”
LLM系统性学习完全指南（初学者必看系列） GA琥珀 LLM 学习人工智能语言模型
前言这篇文章将系统性的讲解LLM（LargeLanguageModels,LLM）的知识和应用。我们将从支撑整个领域的数学与机器学习基石出发，逐步剖析自然语言处理（NLP）的经典范式，深入探究引发革命的Transformer架构，并按时间顺序追溯从BERT、GPT-2到GPT-4、Llama及Gemini等里程碑式模型的演进。随后，我们将探讨如何将这些强大的基础模型转化为实用、安全的应用，涵盖对齐
python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S