dby_freedom

CTR预估论文精读(九)--Deep & Cross Network for Ad Click Predictions

文章目录

摘要
1. DCN(Deep & Cross Network) 介绍
2. 相关工作
3. DCN特点
4. DCN

4.1 Embedding and Stacking Layer
4.2 Cross Network
4.3 Deep Network
4.4 Combination Layer

总结
参考文献

摘要

Feature engineering has been the key to the success of many prediction models. However, the process is nontrivial and often requires manual feature engineering or exhaustive searching. DNNs are able to automatically learn feature interactions; however, they generate all the interactions implicitly, and are not necessarily efficient in learning all types of cross features. In this paper, we propose the Deep & Cross Network (DCN) which keeps the benefits of a DNN model, and beyond that, it introduces a novel cross network that is more efficient in learning certain bounded-degree feature interactions. In particular, DCN explicitly applies feature crossing at each layer, requires no manual feature engineering, and adds negligible extra complexity to the DNN model. Our experimental results have demonstrated its superiority over the state-of-art algorithms on the CTR prediction dataset and dense classification dataset, in terms of both model accuracy and memory usage.

1. DCN(Deep & Cross Network) 介绍

CTR 预估全称是Click Through Rate，就是展示给用户的广告或者商品，估计用户点击的概率。公司规模较大的时候，CTR 直接影响的价值在数十亿美元的级别。广告支付一个非常流行的模型就是 CPC(cost-per-click)，就是按照用户的点击来付钱。那么准确的进行 CTR 预估，展现给用户他们最可能点击的广告就非常重要了。

传统的CTR预估模型需要大量的特征工程，耗时耗力；引入 DNN 之后，依靠神经网络强大的学习能力，可以一定程度上实现自动学习特征组合。但是 DNN 的缺点在于隐式的学习特征组合带来的不可解释性，以及低效率的学习(并不是所有的特征组合都是有用的)。

DCN 全称 Deep & Cross Network，是谷歌和斯坦福大学在2017年提出的用于 Ad Click Prediction 的模型。DCN(Deep Cross Network) 在学习特定阶数组合特征的时候效率非常高，而且同样不需要特征工程，引入的额外的复杂度也是微乎其微的。

2. 相关工作

最开始 FM 使用隐向量的内积来建模组合特征；FFM 在此基础上引入 field 的概念，针对不同的 field 上使用不同隐向量。但是，这两者都是针对低阶的特征组合进行建模的。
随着 DNN 在计算机视觉、自然语言处理、语音识别等领域取得重要进展，DNN 几乎无限的表达能力被广泛的研究。同样也尝试被用来解决web产品中输入高维高稀疏的问题。DNN 可以对高维组合特征进行建模，但是DNN是否就是针对此类问题最高效的建模方式那？直到现在，业界也没有一个准确的答案。
在 Kaggle 上的很多比赛中，大部分的获胜方案都是使用的人工特征工程，构造低阶的组合特征，这些特征意义明确且高效。而 DNN 学习到的特征都是高度非线性的高阶组合特征，含义非常难以解释。那么是否能设计一种 DNN 的特定网络结构来改善 DNN，使得其学习起来更加高效那？

业内进行了很多探索，DCN 就是其中一个。

3. DCN特点

DCN 特点如下：

使用 cross network，在每一层都应用 feature crossing。高效的学习了 bounded degree 组合特征。不需要人工特征工程。
网络结构简单且高效。多项式复杂度由 layer depth 决定。
相比于 DNN，DCN 的 logloss 更低，而且参数的数量将近少了一个数量级。

4. DCN

DCN 的全称是 Deep & Cross Network，网络架构如下：

CTR预估论文精读(九)--Deep & Cross Network for Ad Click Predictions_第1张图片

DCN架构图如上图所示：最开始是 Embedding and stacking layer，然后是并行的 Cross Network 和 Deep Network，最后是 Combination Layer 把 Cross Network 和 Deep Network 的结果组合得到 Output。

4.1 Embedding and Stacking Layer

这一层说起来其实非常的简单，就两个功能Embed和Stack。

Embedding：

在网络规模推荐系统的 CTR 预测任务中，输入主要是分类特征，通常的处理办法就是 one-hot，但是 one-hot 之后输入特征维度非常高非常系数，如 “country=usa”。这些特征通常是编码为独热向量如 [0,1,0]；然而，这通常会产生超高维度的特征空间。
所以有了 Embedding 来大大的降低输入的维度，就是把这些 binary features 转换成 dense vectors with real values（通常称为嵌入向量）：
$x_{embed,i} =W_{embed,i}x_i$
其中 $x_{embed,i}$ 是embedding vector， $x_i$ 是第 $i$ 个 category 的二元输入， $W_{embed,i} \in R^{n_e \times n_v}$ 是对应的 embedding matrix，会与网络中的其它参数一起进行优化， $n_e$ , $n_v$ 分别是embedding size和vocabulary size。

Embedding 操作其实就是用一个矩阵和 one-hot 之后的输入相乘，也可以看成是一次查询（lookup）。这个 Embedding 矩阵跟网络中的其他参数是一样的，是需要随着网络一起学习的。

Stacking
处理完了类别型特征，还有连续型特征没有处理那。所以我们把连续型特征规范化之后，和嵌入向量 stacking 到一起，就得到了原始的输入：
$x_0 = [ x_{embed,1}^T, ..., X_{embed,k}^T, X_{dense}^T]。$
这一部分在tensorflow中，使用tf.feature_columnAPI可以很容易实现，大致代码结构如下：

embed0 = tf.feature_column.embedding_column(...)
...
dense0 = tf.feature_column.indicator_column(...)
dense1 = tf.feature_column.numeric_column(...)
...
columns = [embed0, ..., dense0, dense1, ...]
x0 = tf.feature_column.input_layer(features, feature_columns)

4.2 Cross Network

交叉网络的核心思想是以有效的方式应用显式特征交叉。交叉网络由交叉层组成，每个层具有以下公式：
$x_{l+1} = x_0 x_l^T w_l + b_l + x_l = f(x_l, w_l, b_l) + x_l$
其中:

$x_l,x_{l+1}$ 是列向量（column vectors），分别表示来自第 $l$ 层和第 $(l + 1)$ 层cross layers的输出；
$w_l, b_l \in R^d$ 是第 $l$ 层 layer 的 weight 和 bias 参数。

在完成一个特征交叉 f 后，每个 cross layer 会将它的输入加回去，对应的mapping function $f：R^d \rightarrow R^d$ ，刚好等于残差 $x_{l+1} - x_l$ ，这里借鉴了残差网络的思想。

CTR预估论文精读(九)--Deep & Cross Network for Ad Click Predictions_第2张图片

特征的高阶交叉（high-degree interaction）：

cross network的独特结构使得交叉特征的阶（the degress of cross features）随着layer的深度而增长。对于第 $l$ 层 layer，它的最高多项式阶（在输入 $x_0$ 上）是 $l + 1$ 。实际上，cross network由这些交叉项 $x_1^{\alpha_1} x_2^{\alpha_2} … x_d^{\alpha_d}$ 组成，对应的阶从 1 到 $l + 1$ 。

复杂度分析：

假设 $L_c$ 表示 cross layers 的数目， $d$ 表示输入 $x_0$ 的维度。那么，在该cross network中涉及的参数数目为：
$\times L_c \times 2$
因为每一层的W和b都是d维度的。从上式可以发现，复杂度是输入维度d的线性函数。所以相比于deep network，cross network引入的复杂度微不足道。这样就保证了DCN的复杂度和DNN是一个级别的。论文中表示，Cross Network之所以能够高效的学习组合特征，就是因为x0 * xT的秩为1( rank-one 特性(两个向量的叉积))，使得我们不用计算并存储整个的矩阵就可以得到所有的cross terms。

主流的实现cross layer的方法，代码如下:

def cross_layer(x0, x, name):
  with tf.variable_scope(name):
    input_dim = x0.get_shape().as_list()[1]
    w = tf.get_variable("weight", [input_dim], initializer=tf.truncated_normal_initializer(stddev=0.01))
    b = tf.get_variable("bias", [input_dim], initializer=tf.truncated_normal_initializer(stddev=0.01))
    xx0 = tf.expand_dims(x0, -1)  # shape 
    xx = tf.expand_dims(x, -1)  # shape 
    mat = tf.matmul(xx0, xx, transpose_b=True)  # shape 
    return tf.tensordot(mat, w, 1) + b + x  # shape

这种方法在逻辑上没有什么问题，但实际上却是非常消耗计算和存储资源的，原因在于显式地计算 $x_0 x_l^T$ 需要非常大的内存空间来存储临时计算结果。
我们来计算一下，一个 cross layer 仅仅是计算 $x_0 x_l^T$ ，这一个操作就需要消耗 $batch\_size \times d \times d \times 4$ 字节的内存（一个浮点数占4个字节）。在企业级的模型中， $d$ 通常是几千甚至几万的量级，假设 $d = 1 k$ ，则需要 $batch\_size \times 4M$ 的存储空间，这通常情况下已经是 G 级别的大小了，何况我们仅仅计算了一个 Layer，别忘了我们总共有 $L_c$ 个 cross layer。另外，该操作的结果（一个矩阵）再和 $w$ 向量相乘时也是非常消耗计算资源的。即使你在离线训练时通过减少 cross layer 的个数，减小 batch_size 等手段完成了模型的训练，在模型部署中线上之后，线性的打分系统依然要面临 Out of Memory 的风险，因为线上预测我们总是希望一次请求尽可能返回多条记录的预测分数，否则要么是影响全局的效果，要么是需要更多的请求次数，从而面临巨大的性能压力。

正确的实现方式不是先计算 $x_0 x_l^T$ ，而是先计算 $x_l^T w$ ，因为 $x_l^T w$ 的计算结果是一个标量，几乎不占用存储空间。这两种方法的计算结果是一致的，因为矩阵乘法是满足结合律的： (AB)C=A(BC)。高效的实现代码如下：

def cross_layer2(x0, x, name):
  with tf.variable_scope(name):
    input_dim = x0.get_shape().as_list()[1]
    w = tf.get_variable("weight", [input_dim], initializer=tf.truncated_normal_initializer(stddev=0.01))
    b = tf.get_variable("bias", [input_dim], initializer=tf.truncated_normal_initializer(stddev=0.01))
    xb = tf.tensordot(tf.reshape(x, [-1, 1, input_dim]), w, 1)
    return x0 * xb + b + x

在上面的实现中，我们使用了 tf.reshape 操作实现了 $x_l$ 的转置，因为 $x_l$ 实际上是一个向量，并不是一个矩阵，因此这种方法是可行的。下面给出构建整个交叉网络的tensorflow代码：

def build_cross_layers(x0, params):
  num_layers = params['num_cross_layers']
  x = x0
  for i in range(num_layers):
    x = cross_layer2(x0, x, 'cross_{}'.format(i))
  return x

泛化FM

跟FM一样，DCN同样也是基于参数共享机制的，参数共享不仅仅使得模型更加高效而且使得模型可以泛化到之前没有出现过的特征组合，并且对噪声的抵抗性更加强。
在FM模型中，特征 $x_i$ 和权重向量 $v_i$ 相关联，交叉项 $x_i x_j$ 的权重由 $v_i, v_j>$ 在DCN模型中， $x_i$ 和标量 ${w_k^{(i)}\}_{k=1}^l$ 相关联，并且 $w_i x_j$ 的权重从集合 ${w_k^{(i)}\}_{k=1}^l$ 和 ${w_k^{(j)}\}_{k=1}^l$ 中计算而来。两种模型的每个特征学习独立于其他特征的参数，交叉项的权重是对应参数的特定组合。
参数共享不仅使模型更有效,但也使模型可以泛化出不可见的特征组合，使得模型更健壮。例如,以具有稀疏特征的数据集，如果两个二进制特征 $x_i$ 和 $x_j$ 在训练数据集中很少或从不共现，如 $x_i \ne 0 \cap x_j \ne 0$ ，然后 $x_i x_j$ 学到的权重对于预测也没什么意义。

FM是一个非常浅的结构，并且限制在表达二阶组合特征上，DeepCrossNetwork(DCN)把这种参数共享的思想从一层扩展到多层，并且可以学习高阶的特征组合 $x_1^{\alpha_1}x_2^{\alpha_2} \cdots x_d^{\alpha_d}$ 。但是和FM的高阶版本的变体不同，DCN的参数随着输入维度的增长是线性增长的。

有效映射

对于cross layer可以换一种理解方式。假设 $\tilde{x} \in R^d$ 是一个cross layer的输入，cross layer首先构建 $d^2$ 个关于 $x_i \tilde{x}_j$ 的 pairwise 交叉，接着以一种内存高效的方式将它们投影到维度 $d $ 上。如果采用全连接 Layer 那样直接投影的方式会带来3次方的开销。Cross layer提供了一种有效的解决方式，将开销减小到维度 $d $ 的量级上：考虑到 $x_p = x_0 \tilde{x}^T w$ 等价于：
$x_p^T = [x_1\tilde{x}_1 ... x_1\tilde{x}_d ... x_d\tilde{x}_1 ... x_d\tilde{x}_d] \left[ \begin{array}{ccc} w&0&...&0\\ 0&w&...&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&...&w \end{array} \right]$
其中，行向量包含了所有 $d^2$ 个关于 $x_i \tilde{x}_j$ 的 pairwise 交叉，投影矩阵具有一个块对角化结构，其中 $\in R^d$ 是一个列向量。

值得注意的是，正是因为cross network的参数比较少导致它的表达能力受限，为了能够学习高度非线性的组合特征，DCN并行的引入了Deep Network。

4.3 Deep Network

交叉网络的参数数目少，从而限制了模型的能力（capacity）。为了捕获高阶非线性交叉，我们平行引入了一个深度网络。

深度网络就是一个全连接的前馈神经网络，每个深度层具有如下公式：
$h_{l+1} = f(W_l h_l + b_l)$
其中：

$h_l \in R^{n_l}, h_{l+1} \in R^{n_{l+1}}$ 分别是第 l 层和第 (l+1) 层hidden layer；
$W_l \in R^{n_{l+1} \times n_l}, b_l \in R^{n_{l+1}}$ 第 l 层 deep layer 的参数；
$f (\cdot)$ 是ReLU function。

复杂度分析：出于简洁性，我们假设所有的deep layers具有相同的size。假设LdLd表示deep layers的数目，m表示deep layer的size。那么，在该deep network中的参数的数目为：
$d×m+m+(m^2+m)×(L_d−1)$
其中 $\times m + m$ 是第一层参数，而第二层至最后一层参数为： $\times m + m)×(L_d−1)$ ，因为到了第二层，输入已经转变成了 $m$ 维。

def build_deep_layers(x0, params):
  # Build the hidden layers, sized according to the 'hidden_units' param.
  net = x0
  for units in params['hidden_units']:
    net = tf.layers.dense(net, units=units, activation=tf.nn.relu)
  return net

4.4 Combination Layer

Combination Layer 把 Cross Network 和 Deep Network 的输出拼接起来，然后经过一个加权求和后得到 logits，然后经过 sigmoid 函数得到最终的预测概率。形式化如下：
$\sigma ( [x_{L_1}^T, h_{L_2}^T] w_{logits})$
$p$ 是最终的预测概率； $X_{L1}$ 是 d 维的，表示 Cross Network 的最终输出； $h_{L2}$ 是 m 维的，表示 Deep Network 的最终输出； $W_{logits}$ 是 Combination Layer 的权重；最后经过 sigmoid 函数，得到最终预测概率。

损失函数使用带正则项的 log loss，形式化如下：
$-\frac{1}{N} \sum_{i=1}^{N} y_i log(p_i) + (1-y_i)log(1-p_i) + \lambda \sum_{l} ||w||^2$
另外，针对Cross Network和Deep Network，DCN是一起训练的，这样网络可以知道另外一个网络的存在。

类似于WDL模型，我们对两个network进行jointly train，在训练期间，每个独立的network会察觉到另一个。下面给出整个模型的实现代码：

def dcn_model_fn(features, labels, mode, params):
  x0 = tf.feature_column.input_layer(features, params['feature_columns'])
  last_deep_layer = build_deep_layers(x0, params)
  last_cross_layer = build_cross_layers(x0, params)
  last_layer = tf.concat([last_cross_layer, last_deep_layer], 1)
  my_head = tf.contrib.estimator.binary_classification_head(thresholds=[0.5])
  logits = tf.layers.dense(last_layer, units=my_head.logits_dimension)
  optimizer = tf.train.AdagradOptimizer(learning_rate=params['learning_rate'])
  return my_head.create_estimator_spec(
    features=features,
    mode=mode,
    labels=labels,
    logits=logits,
    train_op_fn=lambda loss: optimizer.minimize(loss, global_step=tf.train.get_global_step())
  )

总结

DCN主要有以下几点贡献：

提出一种新型的交叉网络结构，可以用来提取交叉组合特征，并不需要人为设计的特征工程；
这种网络结构足够简单同时也很有效，可以获得随网络层数增加而增加的多项式阶（polynomial degree）交叉特征；
十分节约内存（依赖于正确地实现），并且易于使用；
实验结果表明，DCN相比于其他模型有更出色的效果，与DNN模型相比，较少的参数却取得了较好的效果。

参考文献

[1] Deep & Cross Network for Ad Click Prediction

[2] Deep&Cross Network模型理论和实践

[3] 谷歌DCN模型理论与实践

[4] 距离玩转企业级DCN(Deep & Cross Network)模型，你只差一步

网络爬虫进阶 rooney2024 爬虫
目录一、进阶爬虫的核心挑战二、关键技术与最佳实践三、实战案例：爬取动态电商价格（伪代码示例）四、持续学习路径结语一、进阶爬虫的核心挑战动态渲染页面(JavaScript/AJAX)问题：数据由JavaScript动态加载生成，初始HTML中不存在。解决方案：浏览器自动化工具：Selenium,Playwright,Puppeteer。模拟真实浏览器行为，等待JS执行并渲染出完整DOM后再解析。无头
陈若许凯张琳《重生后，我打脸恶毒狗男女》全文免费_陈若许凯张琳全文阅读_笔趣阁好书慢看
陈若许凯张琳《重生后，我打脸恶毒狗男女》全文免费_陈若许凯张琳全文阅读_笔趣阁主角配角：陈若许凯张琳小说别名：重生后，我打脸恶毒狗男女简介：中秋那天，我递了辞职信，远离医院那个是非之地。回乡下度假的那天，手机却被打爆了。男友的青梅疯狂发信息过来，质问我SCI医学论文怎么不写了。我感受着乡村的风和日丽，毅然关机图个清净。可是没等我找她，我的医院工作群已经炸开了，全是讨论着同一件事。张琳一早又发了新动
项目管理流程体系建设：从碎片化到系统化的进阶路径玩转数据库管理工具FOR DBLENS 项目管理大数据数据库数据库开发后端
项目管理流程体系是企业实现战略落地的“操作系统”，也是项目经理从被动救火转向主动掌控的核心工具。据统计，拥有成熟流程体系的企业，项目成功率比无体系企业高出42%（PMI《全球项目管理现状报告》）。然而，许多组织的流程建设仍停留在“表单堆砌”阶段，缺乏系统性设计。本文将从架构设计、核心模块、支持系统、进化机制四个维度，构建完整的项目管理流程体系框架。一、流程体系架构设计：打造适配业务的“骨架系统”1
拆解爆款文章发现，原来写作是有方法和步骤 1bdcc660f394
文：轻腾创者文字功底很深厚的文章常推不到爆款，很多爆款文章都是很朴实的文字语言。写作，一种是写自己想写的，另一种则是写别人想看的。当然，前者是写前的前期，自嗨模式；后者是写作的进阶，有一定的积累和自己的文字表达。以前是为日更而写，现在发现，写作用于记录自己真实的一些思想碰撞点还是非常不错。最近我比较喜欢看销售文，可以从中学到一些技术为自己所用，同时还可以学到背后的逻辑。万事万物都具有规律性，找到规
【CVPR 2025】低光增强RT-X Net（红外辅助结构引导）--part2代码讲解 BOB_BOB_BOB_ 低光增强LLIE transformer 深度学习人工智能神经网络计算机视觉
【CVPR2025】本文参考论文RT-XNET:RGB-THERMALCROSSATTENTIONNETWORKFORLOW-LIGHTIMAGEENHANCEMENTTransformerDesign下面对方法论部分进行详细分析论文提出网络类似Retinexformer/SG-LLIE，感兴趣的可以在我的主页进一步学习论文地址：arxiv代码地址：github文章目录**代码段1:导入与辅助函数
浅析Vue3(vue3笔记之进阶篇) 唆键盘的小前端 Javascript 前端 vue 笔记 vue.js 前端前端框架 javascript windows
本文是结合实践中和学习技术文章总结出来的笔记(个人使用),如有雷同纯属正常((✿◠‿◠))喜欢的话点个赞,谢谢!有问题欢迎指正!!前面已经讲了基本的Vue生命周期和入门知识,本篇重点介绍Vue3的一些进阶知识1.vue-router路由Vue的路由对比React真是舒服太多了,路由守卫不需要自己配置,还可以方便自己添加一些自定义逻辑,比如在beforeEach加载进度条之类的,这里以Hash路由为
Python练习（7）Python模块与方法：20道核心实战练习题（含答案与深度解析）（上）
目录引言基础篇（5题）练习1：模块导入方式对比练习2：模块别名应用练习3：条件导入模块练习4：模块搜索路径管理练习5：包结构初始化进阶篇（5题）练习6：模块重载机制练习7：类方法与静态方法区分练习8：魔术方法应用练习9：模块级变量作用域练习10：装饰器实现方法注册高级技巧篇（5题）练习11：动态模块导入练习12：命名空间包练习13：模块卸载陷阱练习14：元类方法控制练习15：上下文管理器方法实战案
2023-11-15 自然科学学术论文=记叙文+说明文+议论文写作不停的追梦人
一篇自然科学的实验性的原创论文，包含了前言、材料方法、结果、讨论结论，这四块主要内容。而前言部分，就是记叙文，介绍所有研究问题的由来；而材料方法和结果部分，就是说明文部分，介绍材料方法具体过程和结果部分，主要描述结果的情况详细具体情况；而讨论结论，就是议论文部分，以实验结果为论据，来证明你的分论点，而结论就是你的一篇文章总论点。
Python 进阶（一）：多线程
目录1.相关概念1.1解释器1.2GIL2.threading2.1方法属性2.2线程对象2.3锁对象2.4条件对象2.5信号量对象2.6事件对象1.相关概念1.1解释器Python解释器的主要作用是将我们在.py文件中写好的代码交给机器去执行，比较常见的解释器包括如下几种：CPython：官方解释器，我们从官网下载安装后获得的就是这个解释器，它使用C语言开发，是使用范围最广泛的Python解释器
word python 域操作_Python进阶：关于 Word 基本操作铃木大宝 word python 域操作
1.概述Word是一个十分常用的文字处理工具，通常我们都是手动来操作它，本节我们来看一下如何通过Python来操作。Python提供了python-docx库，该库就是为Word文档量身定制的，安装使用pipinstallpython-docx命令即可。2.写入首先，我们使用Python来创建一个Word文档并向其中写入一些内容。2.1标题我们先来创建Word文档并向其中添加标题，完整实现代码如下
鸿蒙开发进阶（HarmonyOS ）应用启动框架AppStartup应用实践案例你我皆是牛马星人鸿蒙开发 HarmonyOS OpenHarmony 1024程序员节 harmonyos 华为鸿蒙前端 android 鸿蒙系统
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）启动框架应用场景大型应用在启动过程中会加载大量的模块或SDK，各个模块或SD
2023听讲座（6）听郝晓东老师教师专业写作的进阶之路相信未来_3257
窗外，雨声淅淅沥沥。被近半个月的雨声折磨得我迟迟静不下心，于是，打开手机，找到收藏夹里的讲座听起来。近年，主要关注的就是教育写作。于是，我打开了郝晓东老师《教师专业写作进阶之路》这个讲座听起来。郝老师这个讲座间隔时间比较长了，讲座是2020年的，但是，我听起来，却依旧干货满满。郝老师从重新认识写作和修改文章的五方面谈起教育写作，让我对教育写作有了更深的了解，也明晰了后期努力的方向。郝老师在讲座中谈
Kubernetes服务发布进阶 YUNYINGXIA k8s
目录一、Ingress基础概念与工作原理1.1Kubernetes服务暴露方式概述1.2Ingress核心组成1.2.1Ingress对象1.2.2IngressController1.3Ingress工作流程1.4Ingress工作原理图解二、IngressNginxController安装2.1准备工作2.1.1安装Helm2.1.2配置镜像源2.1.3关键参数配置2.2部署IngressNg
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
数据结构进阶：使用链表实现栈和队列详解与示例（C, C#, C++）
文章目录1、栈与队列简介栈（Stack）队列（Queue）2、使用链表实现栈C语言实现C#语言实现C++语言实现3、使用链表实现队列C语言实现C#语言实现C++语言实现4、链表实现栈和队列的性能分析时间复杂度空间复杂度性能特点与其他实现的比较总结在软件开发中，数据结构是不可或缺的一部分。本文将详细介绍如何使用链表来实现栈和队列这两种基本的数据结构，并提供C、C#和C++三种语言的示例代码。1、栈与
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
前后端分离项目进阶1---后端屋外雨大，惊蛰出没 java 开发语言
前端链接：前端解析一.项目目录二.关键代码分析1)Admin.javapackageimprov1.improv1.entity;publicclassAdmin{privateStringaccount;privateStringpassword;privateStringname;//构造方法、getter和setterpublicAdmin(){}publicAdmin(Stringacco
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
股票模拟交易训练日志(427) 黄鸿昊
目标:100万1.12883.1650000股2.93>2.962.9988203300股110>1143.11867.3630000股5.42>5.444.16680.75200000股0.64>0.625.3904.1297000股4.73>4.8剩下:26250今天港股开半天，但已买进两只股票。因为本身就持有相同的，但仍看之后的走势。现在还是集中精力在写毕业论文上，股票的话，希望也能更进一步
C# 上位机开发进阶：利用 WinForms 与 WPF 创建智能化工业控制系统威哥说编程 c#wpf 开发语言
随着工业自动化和智能制造的不断发展，上位机系统作为人与机器之间的重要桥梁，已成为工业控制系统中不可或缺的一部分。在上位机系统开发中，C#提供了强大的开发框架，尤其是WinForms和WPF，两者在创建高效、智能化的工业控制系统中扮演着重要角色。本文将深入探讨如何利用C#中的WinForms和WPF构建智能化的工业控制系统，从界面设计、实时数据处理、设备通信协议到性能优化的全面技术方案，助力开发者提
c语言进阶字符函数和字符串函数 91刘仁德 c语言 c语言
字符函数和字符串函数字符函数和字符串函数1.strlenstrlen函数详解模拟实现1.计数器方式2.不能创建临时变量计数器（递归）3.指针-指针的方式2.strcpystrcpy函数详解模拟实现3.strcatstrcat函数详解模拟实现4.strcmpstrcmp函数详解模拟实现5.strncpystrncpy函数详解模拟实现6.strncatstrncat函数详解模拟实现7.strncmps
JavaScript进阶：探索模块化、ES6+与前端框架 WayneYalejk javascript es6 前端框架
随着Web技术的快速发展，JavaScript也在不断演进。ES6（ECMAScript2015）及更高版本的发布为JavaScript带来了许多新特性和改进，使得JavaScript更加强大和易用。同时，模块化编程和前端框架的兴起也极大地推动了前端开发的现代化进程。本文将带您深入探索JavaScript的进阶话题，包括模块化、ES6+新特性以及前端框架的应用。1.模块化编程模块化的重要性：解释模
LiteCoT：难度感知的推理链压缩与高效蒸馏框架大千AI助手人工智能 #Prompt #OTHER 深度学习人工智能机器学习自然语言处理提示词 LiteCoT 思维链
“以智能裁剪对抗冗余，让推理效率与精度兼得”LiteCoT是由香港科技大学（广州）联合独立研究者团队提出的创新方法，旨在解决大模型知识蒸馏中推理链过度冗长和缺乏难度适应性的核心问题。该方法通过难度感知提示（DAP）动态生成精简的推理链，显著提升小模型推理效率与准确性。相关论文发表于arXiv预印本平台（2025年），为当前大模型轻量化部署的前沿方案。本文由「大千AI助手」原创发布，专注用真话讲AI
人工智能学习指南：从菜鸟到大神的进击之路橡晟人工智能深度学习计算机视觉算法学习 python
人工智能学习指南：从菜鸟到大神的进击之路前言：别慌，AI没那么可怕嘿！想学人工智能？恭喜你，你已经比90%的人更有眼光了！很多人一听到"人工智能"就开始头疼，仿佛这是什么高深莫测的巫术。其实不然，AI就像学做饭一样——刚开始可能会糊锅，但掌握了方法，你也能做出一桌好菜！目录第一章：认清现实，别被忽悠第二章：建立知识地图第三章：实战为王第四章：自检清单——你真的学会了吗？第五章：进阶之路结语：成为A
如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！炒青椒不放辣 Web爬虫进阶实战 python cloudflare 爬虫 5秒盾逆向
大家好！我是爱摸鱼的小鸿，关注我，收看每期的编程干货。逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解cloudflare（5秒盾）以及如何绕过使用cloudflare服务的网站从而抓取数据特别声明：本篇文章仅供学习与研究使用，不用做任何非法用途，相关URL和API等均已做脱敏处理，若有侵权请联系作
python请求有关ja3指纹问题王太歌 python 爬虫开发语言
遇见一个网站采集，无论怎样都返回空数据(实际上是有数据的)，但是抓包下来又确实是那样的，请教了一些人推测是指纹验证，拜读了网上其他大佬的博客文章后实验了一下，发现确实是这个问题！第一次知道tcp还有这个东西，让我大受震撼，值此搬运一下。参考链接及来源：Python爬虫进阶必备|JA3指纹在爬虫中的应用与定向突破python爬虫requests、httpx、aiohttp、scrapy突破ja3指纹
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
【三维感知目标检测论文阅读】《Point RCNN: An Angle-Free Framework for Rotated Object Detection》
今天给大家带来的论文是2019年的《PointRCNN:AnAngle-FreeFrameworkforRotatedObjectDetection》。尽管这是一篇较早的纯点云检测论文，但我把它放在了最后来讲。因为在了解了各类主流方法后，再回过头来阅读它会有更深的理解。PointRCNN采用自底向上的方式直接从点云生成高质量的3D候选框，其对于旋转框的无角度（Angle-Free）处理方式，对于理
【AI论文】EmbRACE-3K: 复杂环境中的具身推理与行为研究
摘要：近期先进的视觉语言模型（Vision-LanguageModels，VLMs）在被动、离线的图像和视频理解任务中展现出了卓越的性能。然而，在具身场景中，这些模型的有效性仍较为有限。具身场景要求在线交互和主动的场景理解，在此类场景中，智能体以第一人称视角感知环境，且每一次动作都会动态地影响后续的观察结果。即便是像GPT-4o、Claude3.5Sonnet和Gemini2.5Pro这样的先进模
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

CTR预估 论文精读(九)--Deep & Cross Network for Ad Click Predictions