march_on

Practical Lessons from Predicting Clicks on Ads at Facebook

ABSTRACT

文中提出的模型融合了决策树和逻辑回归，比单个方法效果好3%。并探索了多个基础参数对效果的影响。最重要的事情是使用正确的特征：即那些捕捉到用户或者广告历史信息的特征比其他类型的特征更有优势。一旦有了正确的特征和模型（决策树和逻辑回归），其他因素发挥的作用很小（即使是微小的提升在大规模下也会是很重要的）。更新数据、设置学习率和采样数据时选择最优的方法，也能稍微提升模型效果，虽然远比不上增加一个优质的特征或者选择一个合适的模型。

INTRODUCTION

用户访问facebook的时候都会触发广告请求，而每次请求的候选广告特别多，所以facebook构建了一组计算成本逐级升高的级联分类器。本文专注于最后一个阶段的点击率预估模型

EXPERIMENTAL SETUP

选择2013第四季度的某一个星期的数据作为训练数据。然后将这些数据分为训练集和测试集，用来模拟线上训练和预测的流式数据。文中所有实验都使用相同的训练集和测试集。

Evaluation metrics

使用Normalized Entropy (NE) and calibration 作为主要的评估指标。

NE 更准确一点是Normalized CrossEntropy，等同与 the average log loss per impression divided by what the average log loss per impression would
be if a model predicted the background click through rate (CTR) for every impression
换句话说，即预估对数损失使用 background CTR 的熵进行归一化。background CTR 是训练集的经验平均CTR值。将指标记为Normalized Logarithmic
Loss. 可能更能说明问题。值越低，模型的预测越好。归一化的原因是 background CTR 离0或1 越近，越容易取得更低的对数损失。除以background CTR的熵可以令NE 对background CTR不那么敏感。假设训练数据包含N个样本，标签 $y_i \in \{-1, +1\}$ ,预估概率 $p_i, i=1,2,...,N$ ,平均经验CTR记为p

NE 实际上是计算Relative Information Gain (RIG)的一个组成部分，有如下关系：

$R I G = 1 - N E$

Calibration是平均预估ctr和经验ctr的比值。换句话说，就是期望的点击数和实际观测到的点击数的比值。
Calibration 是一个很重要的指标，因为准确的CTR预估和校准对线上出价和拍卖的成功至关重要。校准和1的差距越小，模型越好。只在校准值比较显著的时候才报告校准值。

AUC 也是衡量排序质量（没有校准）的良好指标。在实际环境中，我们期望预估是准确的，而不仅仅是为了得到最优的排序，避免潜在的underdelivery or overdelivery。NE 衡量预估的质量，隐式地反应校准。比如，如果模型预估值都是实际值的两倍，我们乘以一个系数0.5 来校准，对应的NE 会提升，但是AUC仍然保持不变。 Predictive model performance: Offline and online evaluations 对这些指标的分析比较深入。

PREDICTION MODEL STRUCTURE

模型结构如下：

在本节描述一个混合模型结构，梯度提升树和线性模型的连接。如图1所示。3.1节说明决策树强大的特征转换能力，可以显著提高线性模型的准确度。3.2 说明如何更新数据使得预估更准确。这两点激发了使用在线学习方法去训练分类器。3.3 对两类概率线性模型比较一系列在线学习变种。

文中的在线学习基于SGD进行优化，特征转换转换，一个广告展现表示成一个向量 $x=(e_{i_1},...,e_{i_n})$ , $e_i$ 是第i个单位向量， $i_1,...,i_n$ 是n个离散输入特征的取值。在训练阶段，假设label $y\in{+1, -1}$ 表示点击和未点击。

给定一个标注的广告展现(x,y),权重的线性组合如下：

w是线性点击分数的权重向量

在Bayesian online learning scheme for probit regression (BOPR) 中，似然和先验分别如下：

是标准正态分布的累积分布函数，N(t)是标准正态分布的概率密度函数。
在线训练是通过** expectation propagation with moment matching. ** 实现的。
结果模型包含权重向量w的近似后验分布的均值和方差。 BOPR 算法的推断是计算p(w|y,x), 并将之映射回p(w)最近的高斯近似。所以更新算法可以只通过x的非零维度的均值和方差的更新公式来表示。

v和w分别是和
推理可以看做对均值和方差向量应用SGD。
作者将BOPR和似然函数的SGD进行比较。

结果算法即逻辑回归。推理则是计算似然函数的梯度，然后在梯度方向走一个维度相关的步长（6）

g是非零维度的对数似然梯度。

（3）可以看做对均值向量 $\mu$ 进行per-coordinate 梯度下降，步长通过belief uncertainty $\sigma$ 自动控制。基于SGD 的LR 和BOPR在应用到训练数据时都是流式学习的。

3.1 Decision tree feature transforms

有两种方式可以转换线性分类器的特征，对于连续特征，学习非线性变换的一个简单的trick就是进行分桶，并将桶编码作为离散特征（bin the feature and treat the bin in- dex as a categorical feature）。线性分类器为特征学习每个bin的权重。学习bin的边界很重要。

第二个简单且有效的变换是构建元组输入特征。对于离散特征，暴力方式是计算笛卡尔积。不是所有组合都有效，没有用的可以去掉。如果输入特征是连续特征，那么可以使用k-d树来做联合分桶。（没太懂）

我们发现梯度提升树是一种非常强大而方便的完成刚才说的第二种特征转换的方法。
我们将每颗单独的树作为离散特征，它把一个样本最终落到的叶子节点的下标作为特征值。** the index of the leaf an instance ends up falling in.** 这种特征我们使用one-hot编码。比如，考虑图1中包含2颗子树的决策树，第一棵有3个叶子，第2棵有2个叶子。如果一个样本在第一棵子树中分到了叶子2，第二棵树分到了叶子1，那么线性分类器的输入就变成了[0,1,0,1,0] ,其中前3个元素对应第一棵树的叶子，剩下两个对应第二棵树的叶子。提升树我们使用GBM，具体使用L2-TreeBoost算法。每次迭代中产生一个新树，对前面的树的残差进行建模。我们可以将基于基于提升树的特征变换看做一种有监督的特征编码，将实数特征向量转换成二值特征向量。从根节点到叶子节点的遍历代码某些特征的规则。在这个结果向量上拟合线性分类器可以学习到这些规则集合的权重。提升树进行批训练。

我们通过实验来证明这种特征作为线性模型的输入的效果。实验中我们比较了两种LR模型，一个是使用树特征变换，一种是使用原始二者。同时，使用一个提升树模型作为对比。结果如下：

与不使用树变换的模型相比基于树的特征变换可以将NE 降低3.4%。这个提示非常大。作为参考，常见的特征工程实验只能提升几个千分点。

同时可以看到，LR和树模型单独使用时预测准确度差不多，LR稍好，但是他们的结合却提升了很多。

Data freshness

点击预估系统中数据分布时刻在变，作者研究了训练数据的更新对预测效果的影响。具体做法是在某天训练一个模型并在以后每天用它来预测。我们分别使用GBM和GBM+LR来进行。

实验中，我们使用一天的数据进行训练，然后在接下来的6天上进行评估，计算每天的NE。结论入下图：

随着训练集和测试集之间的时间差越多，两个模型的预测精度都有明显下降。对两个模型都可以观察到，将训练从周级别改为天级别时 NE 可以下降约1%。

这些发现表明需要天级别训练。一种选择是天级别的任务重新训练模型，重新训练提升树的时间和很多因素有关，比如样本量，树的数目，叶子的数目，cpu，内存等。使用一个单核cpu 从上亿样本中训练一个包含上百棵树的提升树模型可能会超过24小时。在实践中，训练可以在一个多核且内存足以放下整个训练集的机器上通过足够并发在数小时内完成。下一部分我们考虑一种替代方案。提升树可以每天或每几天训练，但是线性模型使用一些在线学习的方式实现接近实时的训练。

3.3 Online linear classifier

为了最大化数据新鲜度，一种选择是在线训练线性模型，即标注广告展现生成的时候就训练。在第4部分会描述生成实时训练数据的框架，本节评估基于SGD 的LR 在线学习中设置学习率的几种方式。然后比较BOPR 模型的在线学习的最好的几个变种。
基于6，探索了如下几种学习率：
1.每个维度不同的学习率：
第t次迭代特征i的学习率如下：

$\alpha, \beta$ 是可调参数
这是在Ad click prediction: a view from the trenches. 中提出的方法

2.Per-weight square root learning rate:

$n+{t,i }$ 是第t次迭代有第i个特征的所有样本数。

3.Per-weight learning rate

4.Global learning rate:

5.Constant learning rate

前3种每个特征学习一个学习率，最后两个所有特征使用相同的学习率。所有超参数通过网格搜索进行调优。结果如表2：

我们每次将lr 调低0.00001 。用上面的学习率方法在相同的数据集上训练和测试LR模型。实验结果如下

可以看出per-coordinate 方法预测最准，比效果最差的per weight 学习率的NE 低了5%.这和Ad click prediction: a view from the trenches. 的结论是一致的。
使用per-weight 平方根方法和常数学习率效果差不多，NE 略差一些。 Global 方法失败的主要原因是每个特征下面的训练样本数不均衡因为每个训练样本包含的特征数目不同，一些常见的特征的样本数更多。在这种全局lr机制下，数量更少的特征的学习率下降太快，阻止收敛到最优参数。虽然 per-weight 方法解决了这个问题，但是因为他把所有特征的学习率下降太快了所以仍然失败。训练结束太快，此时模型只能收敛到次优点。这也解释了这种机制表现最差的原因。

有意思的是，（3）中BOPR更新均值的公式和LR 的SGD 的per-coordinate 方法非常像。 **The effective learning rate for BOPR is specific to each coordinate, and depends on the posterior variance of the weight associated to each individual coordinate, as well as the “surprise” of label given what the model would have predicted **

我们将per-coordinate 方法和BOPR 对比，我们使用相同的数据训练LR和BOPR模型，并在下一天的数据上进行测试。结果如下：

大家也许会猜测，考虑到更新公式这么像， BOPR 和使用per-coordinate 学习率进行SGD更新的LR 的NE 和校准可能会很相近。

LR相比BOPR的一个优势是模型大小是后者的一半，考虑到每个稀疏特征只有一个权重，而不是一个均值和方差。根据事先，模型越小 cache 越好， cache的查询越快。从预测阶段的计算开销来说， LR 只需要一个特征向量和权重向量的内积，而BOPR 需要方差向量、均值向量和特征向量都做内积。
BOPR 相比LR的优势之一是在贝叶斯体系下提供了点击概率的预测分布，可以用来计算预测分布的分位点，可以用来做explore/exploit learning schemes 。

4. ONLINE DATA JOINER

本节介绍生成实时训练数据的实现系统，这些数据用来通过在线学习训练线性模型。

我们称之为online joiner，因为最重要的操作是将标签和输入（曝光）以在线的方法连接在一起。相似的架构比如google 广告系统用来做流式学习。 online joiner 将实时训练数据输出给Scribe 。由于负例不好定义，所以，如果用户在看到广告后的一个固定且足够长的时间段内没有点击，则认为该次曝光是没有点击的。等待的时间窗口需要仔细调整。太长则耽误实时日志生成，增加了在等待点击标签过程中缓存曝光需要的内存，太短则会丢失一些点击，因为对应的曝光可能已经流失了起被标记为未点击。则会影响点击覆盖率，即点击和曝光成功join在一起的比例。所以， online joiner 需要在实时和覆盖率做权衡。

点击覆盖率没有达到100% 意味着实时训练集是有偏的，经验ctr 比实际情况要低。因为一部分被标注为未点击的曝光其实是应该标记为点击的。在实践中发现只要等待窗口让内存在可控的范围内我们很容易将bias 降低到千分位。另外，这个bias 可以测量和修正。更多窗口大小和效果可以参考Processing sliding window multi-joins in continuous queries over data streams。 The online joiner is designed to perform a distributed stream-to-stream join on ad impressions and ad clicks uti- lizing a request ID as the primary component of the join predicate 请求id 在用户每完成一个刷新内容的动作时生成。 online joiner 接下来的在线学习的数据和模型流如图所示：

最开始用户访问facebook 时数据流产生，生成向ranker 请求广告的请求。广告返回给用户设备，同时每个广告和对应的在这次排序中使用的特征都被加到曝光流中。如果用户点击广告，那么这个点击加入到点击流中。为了实现流之间的join，系统利用包含FIFO 队列的HashQueue作为缓存窗口，同时使用一个hash map 来快速标注一个展现。 HashQueue 对kv 对有三种操作： enqueue， dequeue， lookup。比如，进队列时，我们将item 加入到队列的前面，并在hash map中生成一个key， value 指向 item 在queue中的位置。只有在窗口期满后标注的曝光才会释放给训练数据流。如果没有点击，则被作为一个未点击的样本。

在实验设置中，trainer 不停从训练流中学习，并定期将新模型推送给Ranker，最终形成一个闭环，特征分布变化后，模型可以捕捉，学习并在很短的时间内进行修正。

在使用实时训练数据进行实验时一个重要的考虑是需要对异常情况建立保护机制。
一条
比如，点击流因为基础架构问题变得陈旧了，online joiner 可能会生成经验ctr 非常低的训练数据，结果就是实时trainer 的预估值很低，甚至接近0. 最终可能会导致广告曝光减少。异常检测机制可能会有所帮助。比如实时训练数据的分布发生剧变的时候，系统自动和online trainer 断开。

CONTAINING MEMORY AND LATENCY

Number of Boosting Trees

树越多模型预估时间越长。树的数目对预估效果的影响。

树的数目从1到2000 ，在一天的数据上进行训练，使用接下来的一天数据进行测试。限制每个树不能超过12个叶子。和之前的实验一样，使用NE作为评估指标。结果如下：

可以看到，提高树的数目可以降低NE。但是增加树的数目的收益会逐渐消失。几乎所有的NE 降低都来自于前500颗树，最后的1000棵树仅把NE降低了0.1%。另外，子模型2 在1000棵树之后效果开始变差。 原因是过拟合 因为模型2的训练数据是0和1的1/4.

Boosting feature importance

特征数目是另外一个影响模型效果和计算开销的指标。为了更好的理解特征数目的影响作者给每个特征赋予一个重要性。
为了测量特征的重要性，使用statistic Boosting Feature Importance。它可以捕捉由该特征带来的累积损失下降。每个树节点在构建时，都会选一个最好的特征来最大化地降低平方损失。因为一个特征在多个树中都被用到，每个特征的Boosting Feature Importance 就是将所有树中该特征减少的平方损失的总和。

通常，一小部分特征共享了大部分的可解释性，剩余的特征共享其余的部分。我们在特征数目和他们的累积特征重要性的关系图中有可以看到这一点。

从上述结果可以看到最高的10个特征贡献了大约一半的特征重要性，最后300 个特征总共贡献不到1%。基于此，我们只保留最高的10、20、50、100和200个特征进行实验。评估对效果的影响。结果如下：

从图中可以看出，随着特征越来越多，NE 也有类似的下降消失的现象。

杰西莱，我们研究历史和上下文特征的作用。我们不能透露我们实际使用的特征细节。一些上下文特征包括当地时间， day of week 等。历史特征包含广告上的累积点击数等。

Historical features

提升树中使用的特征可以分为两类，上下文特征和历史特征。上下文特征的值只依赖于最近广告展现的上下文相关的信息，比如用户使用的设备或者用户所在的页面。相反，历史特征依赖于广告或者用户的历史交互，比如上周该广告的点击率或者用户的平均点击率。

该部分我们研究这两类特征如何影响系统性能。首先我们检查两类特征的相对重要性。我们把所有特征按重要性排序，然后计算前k个重要特征中历史特征的比例。结果如下：

可以看出，历史特征比上下文特征提供了更多的解释性。前10个特征都是历史特征，前20个特征只有两个上下文特征，虽然历史特征共占总特征的75%。To better understand the comparative value of the features from each type in aggregate we train two Boost- ing models with only contextual features and only historical features, 结果如下：

从表中可以验证总得来说，历史特征比上下文特征作用更大。没有任何上下文特征时，我们的loss 下降了4.5%。相反，没有上下文特征，我们的预测精度只下降了1%。（没看到！！）

上下文特征对处理冷启动问题很重要。对于新的模型和用户，上下文特征对于合理的ctr预估来说是不可缺少。
在下一步，我们对只使用历史特征或者上下文特征训练得到的模型进行连续一周的测试，检查特征对数据新鲜度的依赖。结果如下：

从图中可以看出，带有上下文的特征比历史特征更依赖数据新鲜程度。和直觉一致，因为历史特征可以描述用户长期积累的行为，比上下文特征更稳定。

6. COPING WITH MASSIVE TRAINING DATA

facebook 一天的训练数据太多，常见的控制训练成本的方法是降低训练数据大小。本节评估两种降采样的方法， uniform subsampling and negative down sampling。每种方法我们训练一系列包含600个树的树模型，使用calibration 和NE 来评估模型。

Uniform subsampling

该方法易于实现，且模型在采样过的训练数据和没采过样的测试数据上的用法都是一样的。这里，我们评估一系列指数增长的降采样率。每个采样率我们使用训练一个模型。采样率分别是{0.001, 0.01, 0.1, 0.5, 1 }
结果如下：

和我们的直觉一致，数据越多效果越好。另外，从预测准确度来讲，数据量大小也有收益逐渐消失的现象。只使用10%的数据， NE 只比使用全部训练集下降1%。 calibration 在这个采样率下没有下降。

Negative down sampling

类别不平衡对模型效果影响很大。这里我们研究负采样率来解决这个问题。我们尝试了不同的负采样率，包括{0.1, 0.01, 0.001, 0.0001 } , 结果如下：

可以看出负采样率对效果的巨大影响。效果最好的负采样率是0.025.

6.3 Model Re-Calibration

负降采样可以提高训练速度和模型效果，但是如果训练时使用负降采样的话，预测时需要校准预估值。比如，采样前ctr均值为0.1%，我们进行0.01 负降采样，经验ctr值变成大约10%。线上流量我们需要重新校准，得到0.1% 左右的预估值。

p 是降采样之后的预估值，w是降采样率。

7.Discussion

1.Data freshness matters.
天级别retrain 是值得的，我们讨论了不同的在线学习方法。同时论述了生成实时训练数据的架构。
2.使用决策树对实数值特征 进行转换可以大幅度提高线性模型的预估准确度。

3.最好的在线学习方法：LR 使用per-coordinate学习率，效果和BOPR差不多。

Class imbalance has been studied by many researchers and has been shown to have significant impact on the perfor- mance of the learned model. In this part, we investigate the use of negative down sampling to solve the class imbalance problem. We empirically experiment with different negative down sampling rate to test the prediction accuracy of the learned model. We vary the rate in {0.1, 0.01, 0.001, 0.0001}. The experiment result is shown in Figure 11.
From the result, we can see that the negative down sam- pling rate has significant effect on the performance of the trained model. The best performance is achieved with neg- ative down sampling rate set to 0.025.

more data leads to better per- formance. Moreover, the data volume demonstrates dimin- ishing return in terms of prediction accuracy. By using only 10% of the data, the normalized entropy is only a 1% reduc- tion in performance relative to the entire training data set. The calibration at this sampling rate shows no performance reduction.

参考：
1.http://blog.crackcell.com/posts/2018/03/18/paper_note_facebook_gbdt_lr.html
2.http://d0evi1.com/facebook-ad/

你可能感兴趣的:(machine,learning)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
FISCO BCOS（十七）——— go SDK的使用林中有神君 #FISCO BCOS 2.8.0 golang 服务器 linux fisco bcos 区块链
1、创建一个工作目录root@wyg-virtual-machine:~/fisco#mkdirgoWorkSpace2、下载go-sdkroot@wyg-virtual-machine:~/fisco/
Git报错（一）fatal: Could not read from remote repository. librarycode
解决方案来自CSDN：https://blog.csdn.net/cxwtsh123/article/details/79194263?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.control&dist_request_id=&depth_1-utm_source=distr
VOC数据集转换为CoCo数据集（亲测有效）情书学长人工智能学习笔记图像处理
#VOC数据集格式VOC格式的数据集分为3部分，Annotations、ImageSets、JPEGImages。（一）Annotations：存放数据标注的xml文件，格式如下：CUMID_train0001.pngC:\Users\86182\Desktop\CUMID_train\0001.pngUnknown2040136830MachineUnspecified0011933491451
【Vesta发号器源码】PropertyMachineIdsProvider DeanChangDM
Vesta发号器源码解析——PropertyMachineIdsProvider属性配置文件持有Id的模式,没啥东西，比单个的多了一个获取下一个的方法封装实现上略有一点点区别privatelong[]machineIds;privateintcurrentIndex;publiclonggetNextMachineId(){returngetMachineId();}publiclonggetMa
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
【ShuQiHere】探索人工智能核心：机器学习的奥秘 ShuQiHere 人工智能机器学习
【ShuQiHere】什么是机器学习？机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）中最关键的组成部分之一。它使得计算机不仅能够处理数据，还能从数据中学习，从而做出预测和决策。无论是语音识别、自动驾驶还是推荐系统，背后都依赖于机器学习模型。机器学习与传统的编程不同，它不再依赖于人类编写的固定规则，而是通过数据自我改进模型，从而更灵活
综述论文“A Survey of Zero-Shot Learning: Settings, Methods, and Applications” 硅谷秋水机器学习机器学习神经网络深度学习
该零样本学习综述，发表于ACMTrans.Intell.Syst.Technol.10,2,Article13(January2019)摘要：大多数机器学习方法着重于对已经在训练中看到其类别的实例进行分类。实际上，许多应用程序需要对实例进行分类，而这些实例的类以前没有见过。零样本学习（Zero-ShotLearning）是一种强大而有前途的学习范例，其中训练实例涵盖的类别与想分类的类别是不相交的。
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
梯度提升机 (Gradient Boosting Machines, GBM) ALGORITHM LOL boosting 集成学习机器学习
梯度提升机(GradientBoostingMachines,GBM)通俗易懂算法梯度提升机（GradientBoostingMachines，GBM）是一种集成学习算法，主要用于回归和分类问题。GBM本质上是通过训练一系列简单的模型（通常是决策树），然后将这些模型组合起来，从而提高整体预测性能。基本步骤初始模型：首先，我们用一个简单的模型（如一个常数值）作为预测模型，记为F0(x)F_0(x)F
机器学习 VS 表示学习 VS 深度学习 Efred.D 人工智能机器学习深度学习人工智能
文章目录前言一、机器学习是什么?二、表示学习三、深度学习总结前言本文主要阐述机器学习,表示学习和深度学习的原理和区别.一、机器学习是什么?机器学习(machinelearning),是从有限的数据集中学习到一定的规律,再把学到的规律应用到一些相似的样本集中做预测.机器学习的历史可以追溯到20世纪40年代McCulloch提出的人工神经元网络,目前学界大致把机器学习分为传统机器学习和机器学习两个类别
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
JVM 架构 : 运行时数据区 & 内存结构光剑书架上的书
JVM:JavaVirtualMachine架构JVMArchitectureRuntimeDataArea/MemoryStructureClassloaderClassloaderisasubsysteminJVM,whichisprimarilyresponasibleforloadingthejavaclasses,thereare3differentclassloaders:Bootst
Lt-8 Multithreading yanlingyun0210 java
IntendedLearningOutcomesTounderstandtheconceptofconcurrency.Tounderstandthedifferenceofaprocessandathread.TodefineathreadusingtheThreadclassandRunnableinterface.TocontrolthreadswithvariousThreadmethod
如何使用Pytorch-Metric-Learning？鱼儿也有烦恼 PyTorch pytorch
文章目录如何使用Pytorch-Metric-Learning？1.Pytorch-Metric-Learning库9个模块的功能1.1Sampler模块1.2Miner模块1.3Loss模块1.4Reducer模块1.5Distance模块1.6Regularizer模块1.7Trainer模块1.8Tester模块1.9Utils模块2.如何使用PyTorchMetricLearning库中的
risc-v特权模式狮子座硅农（Leo ICer） risc-v
risc-v架构定义了3种工作模式，又称为特权模式（privilegedmode）。机器模式（machinemode），简称M模式；监督模式（supervisormode），简称S模式；用户模式（usermode），简称U模式。risc-v架构定义机器模式为必选模式，另外两种模式为可选模式，通过不同的模式组合可以实现不同的系统。risc-v架构支持几种不同的存储器地址管理机制，包括对物理地址和虚拟
推荐开源项目：PyTorch-Metric-Learning 潘惟妍
推荐开源项目：PyTorch-Metric-Learningpytorch-metric-learningTheeasiestwaytousedeepmetriclearninginyourapplication.Modular,flexible,andextensible.WritteninPyTorch.项目地址:https://gitcode.com/gh_mirrors/py/pytorc
推荐：FastAPI驱动的稳定扩散LLMs演示项目褚知茉Jade
推荐：FastAPI驱动的稳定扩散LLMs演示项目FastAPI-for-Machine-Learning-Live-DemoThisrepositorycontainsthefilestobuildyourveryownAIimagegenerationwebapplication!OutlinedarethecorecomponentsoftheFastAPIwebframework,anda
【python】【Ray的概述】资源存储库 python 开发语言
Overview概述Rayisanopen-sourceunifiedframeworkforscalingAIandPythonapplicationslikemachinelearning.Itprovidesthecomputelayerforparallelprocessingsothatyoudon’tneedtobeadistributedsystemsexpert.Rayminimi
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分