akirameiao

Google推荐系统Wide & Deep Learning for Recommender Systems论文翻译&解读

Wide & Deep Learning for Recommender Systems

推荐系统中的Wide & Deep Learning

摘要

Generalized linear models with nonlinear feature transformations are widely used for large-scale regression and classification problems with sparse inputs. Memorization of feature interactions through a wide set of cross-product feature transformations are effective and interpretable, while generalization requires more feature engineering effort. With less feature engineering, deep neural networks can generalize better to unseen feature combinations through low-dimensional dense embeddings learned for the sparse features. However, deep neural networks with embeddings can over-generalize and recommend less relevant items when the user-item inter- actions are sparse and high-rank. In this paper, we present Wide & Deep learning—jointly trained wide linear models and deep neural networks—to combine the benefits of memorization and generalization for recommender systems. We productionized and evaluated the system on Google Play, a commercial mobile app store with over one billion active users and over one million apps. Online experiment results show that Wide & Deep significantly increased app acquisitions compared with wide-only and deep-only models. We have also open-sourced our implementation in TensorFlow.

译文：具有非线形特征变换的广义线性模型被广泛用于大规模回归和稀疏输入的分类问题。通过一系列跨产品特征变换来记忆特征交互是有效且可解释的，而泛化则需要更多的特征工程工作。利用较少的特征工程，深度神经网络可以通过稀疏特征学习到的低维稠密向量生成更好的未知特征组合。然而，当用户-商品交互行为比较稀疏且排名较高时，有向量的深度神经网络会过拟合并且推荐不太相关的东西。在本文中，我们提出wide & deep学习 —— 同时训练线形模型和深度神经网络，为推荐系统结合记忆和泛化的优势。我们在Google Play上制作并评估了该系统，Google Play是一个商业移动应用商店，拥有超过10亿活跃用户和超过100万个应用。在线实验结果表明，与仅限广泛和仅限深度的模型相比，Wide＆Deep明显增加了应用下载量。我们还在TensorFlow中开源了我们的实现。

解读：这里有两个词很重要，在后面也会反复出现：memorization 和 generalization，译文中翻译成记忆和泛化并不是特别好（但也想不到什么更合理的）。memorization是指学习已知的特征变换和特征组合对结果的影响，generalization是指学习未知的特征变换和特征组合对结果的影响。以论文中用到的Google Play预测举例，用线性模型学习用户的年龄、工作，应用的下载量、类型等对用户是否会下载应用的影响是memorization，用深度模型学习未知的特征组合（不是很恰当的例子：用户的年龄*工作/应用的下载量+类型）对用户是否会下载应用的影响是generalization

1. 引言

A recommender system can be viewed as a search ranking system, where the input query is a set of user and contextual information, and the output is a ranked list of items. Given a query, the recommendation task is to find the relevant items in a database and then rank the items based on certain objectives, such as clicks or purchases.
One challenge in recommender systems, similar to the general search ranking problem, is to achieve both memorization and generalization. Memorization can be loosely defined as learning the frequent co-occurrence of items or features and exploiting the correlation available in the historical data. Generalization, on the other hand, is based on transitivity of correlation and explores new feature combinations that have never or rarely occurred in the past. Recommendations based on memorization are usually more topical and directly relevant to the items on which users have already performed actions. Compared with memorization, generalization tends to improve the diversity of the recommended items. In this paper, we focus on the apps recommendation problem for the Google Play store, but the approach should apply to generic recommender systems.
For massive-scale online recommendation and ranking systems in an industrial setting, generalized linear models such as logistic regression are widely used because they are simple, scalable and interpretable. The models are often trained on binarized sparse features with one-hot encoding. E.g., the binary feature “user_installed_app=netflix” has value 1 if the user installed Netflix. Memorization can be achieved effectively using cross-product transformations over sparse features, such as AND(user_installed_app=netflix, impression_app=pandora”), whose value is 1 if the user installed Netflix and then is later shown Pandora. This explains how the co-occurrence of a feature pair correlates with the target label. Generalization can be added by using features that are less granular, such as AND(user_installed_category=video, impression_category=music), but manual feature engineer- ing is often required. One limitation of cross-product trans- formations is that they do not generalize to query-item feature pairs that have not appeared in the training data.
Embedding-based models, such as factorization machines [5] or deep neural networks, can generalize to previously un- seen query-item feature pairs by learning a low-dimensional dense embedding vector for each query and item feature, with less burden of feature engineering. However, it is difficult to learn effective low-dimensional representations for queries and items when the underlying query-item matrix is sparse and high-rank, such as users with specific preferences or niche items with a narrow appeal. In such cases, there should be no interactions between most query-item pairs, but dense embeddings will lead to nonzero predictions for all query-item pairs, and thus can over-generalize and make less relevant recommendations. On the other hand, linear mod- els with cross-product feature transformations can memorize these “exception rules” with much fewer parameters.
In this paper, we present the Wide & Deep learning frame- work to achieve both memorization and generalization in one model, by jointly training a linear model component and a neural network component as shown in Figure 1.
The main contributions of the paper include:
• The Wide & Deep learning framework for jointly train- ing feed-forward neural networks with embeddings and linear model with feature transformations for generic recommender systems with sparse inputs.
• The implementation and evaluation of the Wide & Deep recommender system productionized on Google Play, a mobile app store with over one billion active users and over one million apps.
• We have open-sourced our implementation along with a high-level API in TensorFlow1.
While the idea is simple, we show that the Wide & Deep framework significantly improves the app acquisition rate on the mobile app store, while satisfying the training and serving speed requirements.

译文：推荐系统可以看作一个搜索排序系统，其中输入语句是一组用户和上下文信息，输出是一个排了序的商品列表。给定一个查询语句，推荐任务是在数据库中查询相关的商品，然后基于某些目标（例如点击或者购买）对商品排名。
与一般搜索排名问题类似，推荐系统中的一个挑战是实现记忆和泛化。记忆可以宽松定义为学习商品或者特征的共同出现频繁程度和利用历史数据中可用的相关性。
另一方面，泛化是基于相关性的传递性，探索从未出现或者极少出现过的新的特征组合。基于记忆的推荐系统通常更加直接地和与用户交互过的商品相关。和基于记忆的推荐系统相比，基于泛化的推荐系统倾向于提升推荐商品的多样性。本文中，我们关注的是Google Play商店的应用推荐问题，但该方法应适用于通用推荐系统。
在工业环境中的大规模在线推荐和排名系统中，广义线性模型（如逻辑回归）被广泛使用，因为它们简单，可扩展且可解释。模型通常使用one-hot编码的二值化稀疏特征训练。例如，如果用户安装了Netflix，则二进制功能“user_installed_app = netflix”的值为1。在稀疏特征上使用跨产品特征变换可以有效的实现记忆，例如AND（user_installed_app = netflix，impression_app = pandora“），如果用户安装了Netflix且出现在Pandora则其值为1。这解释了特征对的共现如何与目标标签相关联。可以使用不太精细的特征（例如AND（user_installed_category = video，impression_category = music））添加泛化，但通常需要人工特征工程。跨产品变换的一个局限性是不能产生没有在训练集中出现过的查询语句-商品特征对。
基于嵌入的模型，例如分解机或者深度神经网络，通过学习每个query和item的低维稠密embedding向量，可以泛化从未出现过的查询语句-商品特征对，同时减少特征工程的负担。然而，由于基础的query-item矩阵是稀疏和高排序的，例如具有特定偏好的用户或者小众商品，学习query和item的低维表征是困难的。在这种情况下，大部分的query-item对之间没有交互，但是稠密embedding会导致对所有quert-item对的非零预测，因此可能过拟合和使用不太相关的推荐。另一方面，有着跨产品交叉特征变换的线性模型可以用更少的参数记忆这些“异常规则”。
在本文中，我们提出wide & deep模型，模型通过同时训练一个线形模型和一个神经网络（图1）来同时实现记忆和泛化。
本论文的主要贡献包括：
（1）通用于具有稀疏输入的推荐系统的wide&deep框架，同时训练带有嵌入的前馈神经网络和带有特征变换的线形模型。
（2）在Google Play上实施的Wide＆Deep推荐系统的实施和评估，Google Play是一个拥有超过10亿活跃用户和超过100万个应用的移动应用商店。
（3）我们开源了基于Tensorflow1的高级API的实现。
虽然这个想法很简单，但是实践表明wide&deep框架显著提高了移动app score 的app下载率，同时满足了训练和服务的速度要求。

2. 推荐系统概述

An overview of the app recommender system is shown in Figure 2. A query, which can include various user and contextual features, is generated when a user visits the app store. The recommender system returns a list of apps (also referred to as impressions) on which users can perform certain actions such as clicks or purchases. These user actions, along with the queries and impressions, are recorded in the logs as the training data for the learner.
Since there are over a million apps in the database, it is intractable to exhaustively score every app for every query within the serving latency requirements (often O(10) milliseconds). Therefore, the first step upon receiving a query is retrieval. The retrieval system returns a short list of items that best match the query using various signals, usually a combination of machine-learned models and human-defined rules. After reducing the candidate pool, the ranking system ranks all items by their scores. The scores are usually P(y|x), the probability of a user action label y given the features x, including user features (e.g., country, language, demographics), contextual features (e.g., device, hour of the day, day of the week), and impression features (e.g., app age, historical statistics of an app). In this paper, we focus on the ranking model using the Wide & Deep learning framework.

译文：app推荐系统的框架如图2所示。当用户访问app store的时候，会生成一个包含了丰富的用户和上下文信息的query。推荐系统会返回一个应用列表（也称为印象），用户可以在上面执行某些操作，例如点击或购买。这些用户行为以及查询和印象，会作为模型的训练数据。
数据库中有超过一百万个应用程序，因此在服务延迟要求（通常为o（10）毫秒）内为每个查询语句全面的对每个app评分是不现实的。因此，接收到查询语句的第一步是检索。检索系统通过机器学习模型和人工定义规则筛选返回与查询最匹配的item的简短列表。减少候选池中app数量后，排名系统通过分数对这些app进行排序。分数通常是根据用户特征（国家、语言、人口统计）、上下文特征（设备、时间、星期）、印象特征（应用年龄、应用历史数据）x预测的用户行为标签y=1的概率p（y|x）。在本文中，我们重点关注wide&deep学习框架在排名模型上的应用。

解读：这里的impressions翻译成印象可能不便于理解，应该是指（a list of apps）应用的列表，论及特征（impression features）的时候，指应用的特征

3. wide&deep模型

3.1 wide部分

The wide component is a generalized linear model of the form $y = w^Tx + b$ , as illustrated in Figure 1 (left). y is the prediction, $x=[x_1,x_2,...,x_d]$ is a vector of d features, $w=[w_1,w_2,...,w_d]$ are the model parameters and b is the bias. The feature set includes raw input features and transformed features. One of the most important transformations is the cross-product transformation, which is defined as:
$\theta_k(x)=\prod^d_{i=1}x_i^{c_{ki}}, c_{ki}\in\{0,1\}$ ,where $c_{ki}$ is a boolean variable that is 1 if the i-th feature is part of the k-th transformation φk, and 0 otherwise. For binary features, a cross-product transformation (e.g., “AND(gender=female, language=en)”) is 1 if and only if the constituent features (“gender=female” and “language=en”) are all 1, and 0 otherwise. This captures the interactions between the binary features, and adds nonlinearity to the generalized linear model.

译文：wide部分是 $y = w^Tx + b$ ,形式的广义线性模型，如图1左边部分所示。y是预测值， $x=[x_1,x_2,...,x_d]$ 是特征向量， $w=[w_1,w_2,...,w_d]$ 是模型参数，b是偏置常量。特征包括原始输入特征和变换特征。最重要的变换特征是交叉产品变换，定义如下： $\theta_k(x)=\prod^d_{i=1}x_i^{c_{ki}}, c_{ki}\in\{0,1\}$ , $c_{ki}$ 是一个布尔变量，如果第i个特征是第k个变换的一部分则为1，反之为0.对于二值特征，一个组合特征当原特征都为0的时候才会0（例如“性别=女”且“语言=英语”时，AND（性别=女，语言=英语）=1，其他情况均为0）。这捕获了二元特征之间的相互作用，并为广义线性模型增加了非线性。

解读：这里的 $\theta_k(x)=\prod^d_{i=1}x_i^{c_{ki}}, c_{ki}\in\{0,1\}$ 公式非常数学抽象化，其实就是特征组合。如性别和语言的组合特征，性别:{男，女}，语言:{中文，英语}，组合特征:{男且中文，男且英语，女且中文，女且英语}，某样本性别=女，语言=英语，则组合特征女且英语=1，其他为0

3.2 deep部分

The deep component is a feed-forward neural network, as shown in Figure 1 (right). For categorical features, the original inputs are feature strings (e.g., “language=en”). Each of these sparse, high-dimensional categorical features are first converted into a low-dimensional and dense real-valued vector, often referred to as an embedding vector. The dimensionality of the embeddings are usually on the order of O(10) to O(100). The embedding vectors are initialized ran- domly and then the values are trained to minimize the final loss function during model training. These low-dimensional dense embedding vectors are then fed into the hidden layers of a neural network in the forward pass. Specifically, each hidden layer performs the following computation:
$a^{(l+1)}=f(W^{(l)}a^{(l)}+b^{(l)})$
where l is the layer number and f is the activation function, often rectified linear units (ReLUs). $a^{(l)},b^{(l)},W^{(l)}$ are the activations, bias, and model weights at l-th layer.

译文：deep部分是前馈神经网络，如图1（右）所示。对于类别型特征，原始输入是特征字符串（例如，“语言=英语”）。这些稀疏的高维类别特征会先转换成低维稠密的实数向量，通常被称为嵌入向量。嵌入向量的维度通常通常在o（10）到o（100）的量级。随机初始化嵌入向量，然后在模型训练中最小化最终损失函数。这些低维稠密向量馈送到前向传递中的神经网络的隐藏层中。具体来说，每个隐藏层执行以下计算： $a^{(l+1)}=f(W^{(l)}a^{(l)}+b^{(l)})$ ,l是层数，f是激活函数，通常使用RELU单元。 $a^{(l)},b^{(l)},W^{(l)}$ 是第l层的激活、偏置和模型权重。

3.3 wide模型和deep的结合

The wide component and deep component are combined using a weighted sum of their output log odds as the prediction, which is then fed to one common logistic loss function for joint training. Note that there is a distinction be- tween joint training and ensemble. In an ensemble, individual models are trained separately without knowing each other, and their predictions are combined only at inference time but not at training time. In contrast, joint training optimizes all parameters simultaneously by taking both the wide and deep part as well as the weights of their sum into account at training time. There are implications on model size too: For an ensemble, since the training is disjoint, each individual model size usually needs to be larger (e.g., with more features and transformations) to achieve reasonable accuracy for an ensemble to work. In comparison, for joint training the wide part only needs to complement the weak- nesses of the deep part with a small number of cross-product feature transformations, rather than a full-size wide model.
Joint training of a Wide & Deep Model is done by back- propagating the gradients from the output to both the wide and deep part of the model simultaneously using mini-batch stochastic optimization. In the experiments, we used Follow- the-regularized-leader (FTRL) algorithm [3] with L1 regularization as the optimizer for the wide part of the model, and AdaGrad [1] for the deep part.The combined model is illustrated in Figure 1 (center). For a logistic regression problem, the model’s prediction is: $P(Y=1|x)=\sigma(w_{wide}^T[x,\varphi(x)]+w_{deep}^Ta^{(lf)}+b)$
where Y is the binary class label, σ(·) is the sigmoid func- tion, φ(x) are the cross product transformations of the orig- inal features x, and b is the bias term. $w_{wide}$ is the vector of all wide model weights, and $w_{deep}$ are the weights applied on the final activations $a^{(lf)}$ .

译文：wide的部分和deep的部分使用其输出对数几率的加权和作为预测，然后将其输入到联合训练的一个共同的逻辑损失函数。注意到这里的联合训练和集成学习是有区别的。集成学习中，每个模型是独立训练的，而且他们的预测是在推理时合并而不是在训练时合并。相比之下，联合训练在训练时同时考虑wide和deep模型以及加权和来优化所有参数。这对模型大小也有影响：对于集成学习而言，由于训练是独立的，因此每个模型的大小通常会更大（例如：更多特征和交叉特征）来实现一个集成模型合理的精确度。相比之下，在联合训练中，wide部分只需要通过少量的跨产品特征变换来补充深度模型的不足，而且不是全量的模型。
wide和deep模型的联合训练是通过使用小批量随机优化同时将输出的梯度反向传播到模型的wide和deep部分来完成的。在实验中，我们使用带L1正则的FTRL算法作为wide部分的优化器，AdaGrad作为deep部分的优化器。
这个联合模型如图1（中）所示。对于逻辑回归问题，模型的预测是：
$P(Y=1|x)=\sigma(w_{wide}^T[x,\theta(x)]+w_{deep}^Ta^{(lf)}+b)$ 其中，Y是二值分类标签， $\sigma$ 是sigmoid函数， $\varphi(x)$ 是跨产品特征变换，b是偏置项， $w_{wide}$ 是wide模型的权重， $w_{deep}$ 是用于最终激活函数 $a^{(lf)}$ 的权重。

4. 系统实现

The implementation of the apps recommendation pipeline consists of three stages: data generation, model training, and model serving as shown in Figure 3.

译文：如图3所示，app推荐系统管道的实现包括了三个阶段：数据生成，模型训练和模型服务。

4.1 数据生成

In this stage, user and app impression data within a period of time are used to generate training data. Each example corresponds to one impression. The label is app acquisition: 1 if the impressed app was installed, and 0 otherwise.
Vocabularies, which are tables mapping categorical feature strings to integer IDs, are also generated in this stage. The system computes the ID space for all the string features that occurred more than a minimum number of times. Continuous real-valued features are normalized to [0, 1] by map- ping a feature value x to its cumulative distribution function P (X ≤ x), divided into $n_q$ quantiles. The normalized value
is $\frac{i-1}{n_q-1}$ for values in the i-th quantiles. Quantile boundaries are computed during data generation.

译文：在此阶段，一段时间内的用户和应用程序展示数据用于生成训练数据。每个样本对应一次展示。标签是应用程序下载：如果下载了展示的应用程序，则为1，否则为0。
这个阶段还会生成存储分类特征字符串和对应ID的映射表。系统计算出现次数超过最少次数要求的特征字符串的ID。通过将特征值x映射到其累积分布函数 $\le x$ ），将连续值特征标准化为[0,1]，将其分成 $n_q$ 份。标准化值中第i份的值就是 $\frac{i-1}{n_q-1}$ 。在数据生成阶段计算了分位数边界。

4.2 模型训练

The model structure we used in the experiment is shown in Figure 4. During training, our input layer takes in training data and vocabularies and generate sparse and dense features together with a label. The wide component consists of the cross-product transformation of user installed apps and impression apps. For the deep part of the model, A 32- dimensional embedding vector is learned for each categorical feature. We concatenate all the embeddings together with the dense features, resulting in a dense vector of approximately 1200 dimensions. The concatenated vector is then fed into 3 ReLU layers, and finally the logistic output unit.
The Wide & Deep models are trained on over 500 billion examples. Every time a new set of training data arrives, the model needs to be re-trained. However, retraining from scratch every time is computationally expensive and delays the time from data arrival to serving an updated model. To tackle this challenge, we implemented a warm-starting system which initializes a new model with the embeddings and the linear model weights from the previous model.
Before loading the models into the model servers, a dry run of the model is done to make sure that it does not cause problems in serving live traffic. We empirically validate the model quality against the previous model as a sanity check.

译文：实验中我们使用的模型框架如图4所示。训练过程中，输入层接收训练数据和词汇表，同时生成带label的稀疏和稠密的特征。wide部分包括用户安装的app和展示的app的跨产品特征变换。deep部分，为每个分类特征学习学习32维的嵌入向量。我们将所有向量和稠密特征连接成一个约1200维的稠密向量。然后将连接的矢量输入3个ReLU层，最后输入逻辑输出单元。
wide&deep模型在超过5000亿个样本的数据集上训练。当加入一组新的数据时，需要重新训练模型。然而，每次从头开始重新训练是非常耗费计算资源的，并且延迟了从数据到达到服务更新的时间。为了应对这一挑战，我们实施了一个热启动系统，该系统使用先前模型中的嵌入和线性模型权重初始化。在将模型加载到模型服务器之前，先完成模型的干运行，以确保它不会在提供实时流量时出现问题。我们根据先前的模型验证模型质量作为健全性检查。

4.3 模型服务

Once the model is trained and verified, we load it into the model servers. For each request, the servers receive a set of app candidates from the app retrieval system and user features to score each app. Then, the apps are ranked from the highest scores to the lowest, and we show the apps to the users in this order. The scores are calculated by running a forward inference pass over the Wide & Deep model.
In order to serve each request on the order of 10 ms, we optimized the performance using multithreading parallelism by running smaller batches in parallel, instead of scoring all candidate apps in a single batch inference step.

译文：模型经过训练和验证后，我们将其加载到模型服务器中。对于每个请求，服务器从app检索系统中接收一组app，并给每个app通过用户特征打分。然后，应用程序从高到低排分并展示给用户。通过wide&deep模型运行一个前向推理传递计算得分。
为了在10ms内相应请求，我们通过并行运行较小批量使用多线程并行性来优化性能，而不是在单个批量推理步骤中对所有候选应用程序进行评分。

5. 实验结果

略

6. 相关工作

The idea of combining wide linear models with cross- product feature transformations and deep neural networks with dense embeddings is inspired by previous work, such as factorization machines [5] which add generalization to linear models by factorizing the interactions between two variables as a dot product between two low-dimensional embedding vectors. In this paper, we expanded the model capacity by learning highly nonlinear interactions between embeddings via neural networks instead of dot products.
In language models, joint training of recurrent neural net- works (RNNs) and maximum entropy models with n-gram features has been proposed to significantly reduce the RNN complexity (e.g., hidden layer sizes) by learning direct weights between inputs and outputs [4]. In computer vision, deep residual learning [2] has been used to reduce the difficulty of training deeper models and improve accuracy with shortcut connections which skip one or more layers. Joint training of neural networks with graphical models has also been applied to human pose estimation from images [6]. In this work we explored the joint training of feed-forward neural networks and linear models, with direct connections between sparse features and the output unit, for generic recommendation and ranking problems with sparse input data.
In the recommender systems literature, collaborative deep learning has been explored by coupling deep learning for content information and collaborative filtering (CF) for the ratings matrix [7]. There has also been previous work on mobile app recommender systems, such as AppJoy which used CF on users’ app usage records [8]. Different from the CF-based or content-based approaches in the previous work, we jointly train Wide & Deep models on user and impression data for app recommender systems.

译文：把交叉特征变换的wide模型和使用稠密嵌入向量的deep模型结合起来的思想受到了之前工作的启发。例如分解机，它通过将两个变量之间的相互作用分解为点积来增加线性模型的推广。在两个低维嵌入向量之间。在本文中，我们通过神经网络而不是点积来学习嵌入之间的高度非线性相互作用来扩展模型容量。在语言模型中，已经提出联合训练递归神经网络（RNN）和具有n-gram特征的最大熵模型，通过学习输入和输出之间的直接权重来显着降低RNN复杂度（例如，隐藏层大小）[4] ]。在计算机视觉中，深度残差学习[2]已被用于减少训练更深层模型的难度，并通过跳过一个或多个层的快捷连接来提高准确性。神经网络与图形模型的联合训练也已应用于图像中的人体姿态估计[6]。在这项工作中，我们探索了前馈神经网络和线性模型的联合训练，稀疏特征和输出单元之间的直接连接，用于稀疏输入数据的通用推荐和排序问题。
在推荐系统文献中，通过将内容信息的深度学习与评级矩阵的协同过滤（CF）相结合，探索了协作深度学习[7]。此前还有一些关于移动应用程序推荐系统的工作，例如AppJoy，它在用户的应用程序使用记录中使用了CF [8]。与之前工作中基于CF或基于内容的方法不同，我们联合培训针对应用推荐系统的用户和印象数据的Wide＆Deep模型。

7. 结论

Memorization and generalization are both important for recommender systems. Wide linear models can effectively memorize sparse feature interactions using cross-product feature transformations, while deep neural networks can generalize to previously unseen feature interactions through low- dimensional embeddings. We presented the Wide & Deep learning framework to combine the strengths of both types of model. We productionized and evaluated the framework on the recommender system of Google Play, a massive-scale commercial app store. Online experiment results showed that the Wide & Deep model led to significant improvement on app acquisitions over wide-only and deep-only models.

译文：记忆和概括对于推荐系统都很重要。宽线性模型可以使用跨产品特征转换有效地记忆稀疏特征交互，而深度神经网络可以通过低维嵌入来生成以前看不见的特征交互。我们介绍了Wide＆Deep学习框架，以结合两种模型的优势。我们在Google Play的推荐系统上制作并评估了该框架，Google Play是一个大规模的商业应用商店。在线实验结果表明，Wide＆Deep模型在广泛和仅深度模型上的应用程序获取方面取得了显着改进。

ps：目前简单的翻译了论文，如有错误，还请指正，谢谢！接下来会对开源代码深入学习实践，如果对论文有更深的理解将会不断更新，欢迎交流～～

你可能感兴趣的:(数据挖掘实战)

数据挖掘实战-基于决策树算法构建北京市空气质量预测模型艾派森数据挖掘机器学习人工智能数据挖掘 python 决策树
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.项目简介2.1项目说明2.2数据说明2.3技术工具3.算法原理4.项目实施步骤4.1理解数据4.2数据预处理4.3探索性数据分析4.4特征工程4.5模型构建4.6模型评估5.实验总结源代码1.项目背景随着城市化进程的加速，空气质量问题日
python数据挖掘实战项目开源git_强烈推荐：8个顶级git/github项目数据分析工具 weixin_39619635
任何重要的决定都应基于数据，对于信息项目和软件开发亦是如此。如果你不仔细查看描述项目演进的数据就无法了解项目的健康状况，并给出合理的改进措施。为了分析和挖掘这些信息，我们可以从Git存储库和项目所在的代码托管平台(例如GitHub，Gitlab)获取一些有意义的数据。然而从Git/GitHub轻松获取数据实际也不是一件简单的事情。本文虫虫就给大家介绍一些Git/GitHub开源分析工具供大家学习参
数据挖掘实战-基于机器学习的电商文本分类模型艾派森数据挖掘 python 数据挖掘人工智能
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具4.实验步骤4.1数据探索4.2数据预处理4.3文本归一化4.4特征工程4.5训练模型1.项目背景随着电子商务的蓬勃发展，电商平台上产生了海量的文本数据，包括商品描述、用户评价、客服对话等。这些文本数据包含了丰富的
Python商业数据挖掘实战——爬取网页并将其转为Markdown 雪碧有白泡泡粉丝福利活动 python 数据挖掘开发语言
前言「作者主页」：雪碧有白泡泡「个人网站」：雪碧的个人网站ChatGPT体验地址文章目录前言前言正则表达式进行转换送书活动前言在信息爆炸的时代，互联网上的海量文字信息如同无尽的沙滩。然而，其中真正有价值的信息往往埋在各种网页中，需要经过筛选和整理才能被有效利用。幸运的是，Python这个强大的编程语言可以帮助我们完成这项任务。本文将介绍如何使用Python将网页文字转换为Markdown格式，这将
数据挖掘实战1：泰坦尼克号数据 bb8886 数据挖掘数据挖掘 python 人工智能
一、数据挖掘流程1.数据读取-读取数据-统计指标-数据规模2.数据探索（特征理解）-单特征的分析，诸个变量分析对结果y的影响（x,y的相关性）-多变量分析（x,y之间的相关性）-统计绘图3.数据清洗和预处理-缺失值填充-标准化、归一化-特征工程（筛选有价值的特征）-分析特征之间的相关性4.建模-特征数据的准备和标签-数据集的切分-多种模型对比：交叉验证、调参（学习曲线，网格搜索）-集成算法（提升算
企业级实战项目：基于 pycaret 自动化预测公司是否破产 Python数据挖掘机器学习数据分析及可视化数据挖掘数据分析算法 python
本文系数据挖掘实战系列文章，我跟大家分享一个数据挖掘实战，与以往的数据实战不同的是，用自动机器学习方法完成模型构建与调优部分工作，深入理解由此带来的便利与效果。1.Introduction本文是一篇数据挖掘实战案例，详细探索了从台湾经济杂志收集的1999年到2009年的数据，看看在数据探索过程中，可以洞察出哪些有用的信息，判断哪一个模型能够最准确地预测公司是否破产。公司破产的定义是根据台湾证券交易
数据挖掘实战-基于word2vec的短文本情感分析艾派森数据分析文本分析 python 数据挖掘 word2vec 自然语言处理机器学习
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录一、实验背景二、相关算法2.1Word2vec2.2支持向量机2.3随机森林三、实验数据3.1数据说明3.2评价标准四、实验步骤五、实验结果与分析5.1SVM模型评估结果5.2随机森林模型评估结果六、实验总结文末推荐与福利源代码一、实验背景当前，随着社
125在线民宿 UGC 数据挖掘实战--民宿地理位置可视化分析 Jachin111
民宿地理位置可视化分析数据准备本实验采集了民宿店家共400家，利用抽样分析的方法，将评论数高于民宿评价平均数为200条的民宿挑选出来，总共挑选出来了89家民宿作为样本。image.png使用Pandas加载抽样后的在线数据表格，并查看数据维度和第一行数据。importpandasaspddata=pd.read_csv('https://labfile.oss.aliyuncs.com/cours
数据挖掘实战：基于 Python 的个人信贷违约预测 Python数据挖掘 python 机器学习数据分析及可视化数据挖掘 python 数据分析机器学习人工智能
本次分享我们Python觅圈的一个练手实战项目：个人信贷违约预测，此项目对于想要学习信贷风控模型的同学非常有帮助。技术交流技术要学会交流、分享，不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。好的文章离不开粉丝的分享、推荐，资料干货、资料分享、数据、技术交流提升，均可加交流群获取，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友。方式①、添加微信号：dk
一个企业级数据挖掘实战项目｜客户细分模型（上） weixin_38754337 聚类 python 机器学习数据分析大数据
导读：今天给大家带来了一个Python业务分析实战项目——客户细分模型的应用案例上篇，本文阐述比较详细，包括代码演示、可视化图形展示、以及文字详细分析。分析较浅，希望能够给大家带来些许帮助，欢迎交流学习！文章较长，建议收藏～本文来源：数据STUDIO作者：云朵君客户细分模型是将整体会员划分为不同的细分群体或类别，然后基于细分群体做管理、营销和关怀。客户细分模型常用于整体会员的宏观性分析以及探索性分
41丨数据挖掘实战（3）：如何对比特币走势进行预测？张九日zx
数据挖掘算法有一种叫时间序列分析的算法，时间序列分析模型建立了观察结果与时间变化的关系，能帮我们预测未来一段时间内的结果变化情况。时间序列分析和回归分析的区别：-结果与变量的关系。回归分析训练得到的是目标变量y与自变量x（一个或多个）的相关性，然后通过新的自变量x来预测目标变量y。而时间序列分析得到的是目标变量y与时间的相关性。-回归分析擅长的是多变量与目标结果之间的分析，即便是单一变量，也往往与
数据挖掘实战（七）--使用朴素贝叶斯进行社会媒体挖掘 bb8886 数据挖掘数据挖掘媒体 python 数据分析
一、朴素贝叶斯分类算法贝叶斯定理公式如下：表示“在A发生的情况下，B发生的概率”。在数据挖掘中，A通常是观察样本个体（也就是物特征），B为被测个体所属的类别。那么上述公式如下：我们可以用上述公式进行分类。但是一个物体包含多个特征。对于公式我们先假设特征1,特征2,特征3...相互独立，那么，有以下结论：所以有以下公式：因此，朴素贝叶斯公式如下：因为在所有的类别取值相同，所以贝叶斯的判定标准为：我们
深度学习简述秋无之地数据分析深度学习人工智能
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者：秋无之地简介：CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作，主要擅长领域有：爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注，关注必回关上一篇文章已经跟大家介绍过《数据挖掘实战（3）：如何对比特币走势进行预测？》，相信大家对数据挖掘实战（3）都有一个基本的认识。下面我讲
数据挖掘实战（2）：信用卡诈骗分析秋无之地数据分析数据挖掘人工智能数据分析
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者：秋无之地简介：CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作，主要擅长领域有：爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注，关注必回关上一篇文章已经跟大家介绍过《数据挖掘实战（1）：信用卡违约率分析》，相信大家对数据挖掘实战（1）都有一个基本的认识。下面我讲一下：数据
数据挖掘实战（3）：如何对比特币走势进行预测？秋无之地数据分析数据挖掘人工智能
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者：秋无之地简介：CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作，主要擅长领域有：爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注，关注必回关上一篇文章已经跟大家介绍过《数据挖掘实战（2）：信用卡诈骗分析》，相信大家对数据挖掘实战（2）都有一个基本的认识。下面我讲一下：数据挖
128在线民宿 UGC 数据挖掘实战--基于 LDA 模型的评论主题挖掘 Jachin111
基于LDA模型的评论主题挖掘数据准备本次实验使用基于LDA主题聚类和主题分布可视化的方式研究顾客评论中的主题分布情况，并参考《旅游民宿基本要求与评价》标准中的评级指标辅助定义用户评价主题，具体的评价参考指标如下图所示。image.png使用Pandas加载在线数据表格，并查看数据维度和第一行数据。importpandasaspddata=pd.read_csv('https://labfile.o
python数据挖掘实战现实里的童话xklss
以下有数据挖掘实战的项目，请各位阅读链接：https://pan.baidu.com/s/1rB_7m6xVeg2PHDwgeXZHug密码：erl6如果还想要一些python相关资料，请联系QQ：1538444890谢谢
数据挖掘实战—餐饮行业的数据挖掘之数据探索(EDA) 哎呦-_-不错 #数据挖掘项目实战 EDA 数据挖掘餐饮行业
文章目录引言一、前期准备1.目标定义与任务理解二、数据采集与抽样三、数据探索1.数据质量分析1.1缺失值分析1.1.1缺失值可视化1.1.2描述性统计1.1.3统计缺失数与缺失率1.2异常值分析1.2.13σ原则1.2.2箱型图分析1.3一致性分析1.4重复数据处理2.数据特征分析2.1分布分析2.1.1定量数据的分布分析2.1.1定性数据的分布分析2.2对比分析2.2.1绝对数比较2.2.2相对
机器学习及其matlab实现竞争神经网络与SOM神经网络进阶与提高视频教程平蝶与波澜
机器学习及其matlab实现竞争神经网络与SOM神经网络进阶与提高视频教程大数据，云计算，架构，数据分析师，Hadoop，Spark，Storm，Docker，Mapreduce，Kafka，Flume，OpenStack，Hive，HDFS，YARN，人工智能，机器学习，深度学习，高等数学，自然语言处理等项目实战大数据和人工智能技术包含：大数据，云计算，架构，数据挖掘实战，实时推荐系统实战，电视
123在线民宿 UGC 数据挖掘实战--快速实现民宿整体的意见挖掘 Jachin111
快速实现民宿整体的意见挖掘数据准备对于采集后的在线评论，本次实验采用的主要的处理步骤包含：数据转换、数据清洗、数据划分、数据建模和数据可视化，在线源数据如下所示。image.png使用Pandas加载在线数据表格，并查看数据维度和第一行数据。importpandasaspddata=pd.read_csv('https://labfile.oss.aliyuncs.com/courses/2628
130在线民宿 UGC 数据挖掘实战--集成模型在情感分析中的应用 Jachin111
集成模型在情感分析中的应用数据准备本次实验将加载两个数据，一个是已经标注好的用户评论数据，另外一个是用户评价主题句，通过标注过的用户评论数据进行基于集成模型的情感极性模型训练，然后利用模型对主题句进行情感极性推理，最后通过数据聚合可视化得出主题情感极性。使用Pandas加载在线数据表格，并查看数据维度和前5行数据。importpandasaspddata=pd.read_csv('https://
数据挖掘实战：基于KMeans算法对超市客户进行聚类分群（文末送书）艾派森数据分析机器学习机器学习算法 python 数据挖掘聚类
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录一、研究背景二、算法原理三、实验步骤3.1加载数据集3.2数据预处理3.3确定聚类参数k3.4kmeans聚类3.5聚类结果四、总结完整代码文末推荐文末福利一、研究背景超市作为零售业的主要形式之一，在现代都市生活中扮演着重要角色。随着社会经济的发展和消
人工智能学习路线自律阳阳
学好人工智能并非易事，需要循序渐进，阶段性的学习，先入门后进阶，一步一脚印，那么怎样的学习路线适合初级者，下面简单分享：分为五个阶段：第一阶段：数学包括三科，也都是考研的三科：高等数学／线性代数／概率论；第二阶段：编程python工具库实战／python网络爬虫；第三阶段：机器学习也就是基础知识，机器学习导论，机器学习入门／机器学习提升；第四阶段：数据挖掘实战，只有掌握了数据挖掘处理，才能知道机器
基于大数据技术推荐系统算法案例实战视频教程平蝶与波澜
基于大数据技术推荐系统算法案例实战视频教程大数据，云计算，架构，数据分析师，Hadoop，Spark，Storm，Docker，Mapreduce，Kafka，Flume，OpenStack，Hive，HDFS，YARN，人工智能，机器学习，深度学习，高等数学，自然语言处理等项目实战大数据和人工智能技术包含：大数据，云计算，架构，数据挖掘实战，实时推荐系统实战，电视收视率项目实战，实时流统计项目实
127在线民宿 UGC 数据挖掘实战--基于词向量的主题聚类挖掘 Jachin111
基于词向量的主题聚类挖掘数据准备参考《旅游民宿基本要求与评价》标准中的评级指标辅助定义用户评价主题，本次实验将使用基于Word2Vec和KMeans主题词聚类的方式研究顾客评论中的主题分布情况。image.png使用Pandas加载在线数据表格，并查看数据维度和第一行数据。importpandasaspddata=pd.read_csv('https://labfile.oss.aliyuncs.
【数据挖掘实战】——科大讯飞：跨境广告ROI预测 Lingxw_w 数据挖掘数据挖掘人工智能回归
‍♂️个人主页：@Lingxw_w的个人主页✍作者简介：计算机科学与技术研究生在读希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录一、赛题背景二、赛事任务三、赛题数据四、评价指标五、Baseline解题思路1、读取数据2、数据预处理3、LGBMRegressor4、可视化一、赛题背景跨境电商广告ROI（收入/广告消耗）预测一直以来都是效果类广告领域的重要挑战。在
129在线民宿 UGC 数据挖掘实战--文本自动化标注和数据采样 Jachin111
文本自动化标注和数据采样数据准备首先使用Pandas加载在线数据表格，并查看数据维度和第一行数据。importpandasaspddata=pd.read_csv('https://labfile.oss.aliyuncs.com/courses/2628/1-2.csv')print(data.shape)data.head(1)image.png数据清洗针对用户打分出现的问题进行处理，首先打印
【数据挖掘实战】——舆情分析：对微博文本进行情绪分类 Lingxw_w 数据挖掘数据挖掘机器学习人工智能 nlp 自然语言处理
‍♂️个人主页：@Lingxw_w的个人主页✍作者简介：计算机科学与技术研究生在读希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录一、背景介绍二、比赛任务三、评审规则1.数据说明2.评估指标3.评测及排行四、作品提交要求五、解题思路1、读取数据和预处理2、TFIDF和逻辑回归3、transformersbert模型一、背景介绍疫情发生对人们生活生产的方方面面产生
40丨数据挖掘实战（2）：用逻辑回归分析信用卡诈骗张九日zx
构建逻辑回归分类器逻辑回归是分类方法，主要解决二分类问题。在逻辑回归中使用了Logistic函数，也称为Sigmoid函数。为什么逻辑回归算法是基于Sigmoid函数实现的呢？你可以这样理解：我们要实现一个二分类任务，0即为不发生，1即为发生。我们给定一些历史数据X和y。其中X代表样本的n个特征，y代表正例和负例，也就是0或1的取值。通过历史样本的学习，我们可以得到一个模型，当给定新的X的时候，可
qiuzitao机器学习（七）：桑坦德银行客户交易预测项目 qiuzitao 机器学习系列 python 机器学习数据挖掘数据分析
数据挖掘实战–桑坦德银行客户交易预测项目一、项目介绍：这是2019年Kaggle的比赛：kaggle官网：https://www.kaggle.com/c/santander-customer-transaction-prediction/leaderboard百度云数据集：https://pan.baidu.com/s/1Ph655Ha07eVjCmJoloybsg赛题介绍：桑坦德银行客户交易预
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep