Robert Wang

一文梳理论文《AIBox: CTR Prediction Model Training on a Single Node》

论文链接：https://dl.acm.org/doi/pdf/10.1145/3357384.3358045

背景介绍：百度搜索中一个很重要的工作室点击率预估（CTR），CTR预估计算代价很大，往往在线的数据非常的大，之前采用的方式是MPI上训练集群，但是这种方式不但耗时而且通信代价也很大；点击率预测起着关键作用确定最佳广告空间分配，因为它会直接影响用户体验和广告盈利能力。本文设计了一个通过SSD（固态硬盘）和GPU的点击率集中式系统，叫做AIBOX，将CTR模型划分为两部分：第一部分适用于CPU，另一个适用于GPU。使用SSD上的二级缓存管理系统来存储10TB参数，同时提供低延迟访问；广泛的经验指导生产数据显示新系统的有效性。AIBox具有大型MPI训练能力，而只需要集群成本的一小部分。传统的采用参数服务器进行分布式训练，但是也曾遭受节点故障和网络故障，更糟糕的是，在参数服务器上的同步会阻碍训练的执行，并导致巨大的网络通信开销，而异步训练框架会因为每个工作节点上的过时模型而导致模型收敛问题。

分析：现有大规模CTR预测模型训练系统面临的问题

大数据和大模型问题：训练数据和模型规模达到PB级别
巨大的特征空间规模：特征空间规模达到 $2^{64}$
数据稀疏性问题: 每个特征向量中只有几百个非零条目

解决思路:

压缩模型规模：流行的模型压缩技术，如下采样和散列，对于训练具有超高维（例如，数千亿个特征）和极稀疏（例如，每个特征中只有几百个非零项）的训练数据的商业CTR模型来说，效果较差。研究报告中常见的论据，如“只需0分就能将培训成本降低一半”。3%的精度损失“，不再在这个行业工作。另一方面，DNN-CTR模型的训练在百度是一项日常工作，工程师和数据科学家必须对许多不同的模型/特性/策略/参数进行实验，并且必须非常频繁地训练andre-train-CTR模型。硬件（如MPI集群）的成本和能耗可能非常高。
设计高效的训练系统（本文方法）：AIBox使用新兴的硬件SSD（固态驱动器和GPU），以存储大量参数并加速神经网络训练的繁重计算。作为集中式系统，AIBox直接消除了分布式系统中由网络通信引起的那些弊端。与大型计算集群中的数千个节点相比，单节点AIBox的硬件故障数量要少几个数量级。此外，由于仅需要内存锁和GPU片上通信，因此可以显着降低单个节点中的同步成本。与分布式环境相比，没有通过网络传输数据。

但是模型压缩会损失一部分精度，但是即使精度损失了0.1%，也会造成巨大的商业损失，所以百度的这篇论文主要是从设计一个高效的训练系统的方式上进行的。

AIBOX设计过程中的挑战： AIBox的设计仍面临两个主要挑战。第一个挑战是将10TB规模的模型参数存储在单个节点上。当容量超过1 TB时，内存价格将上涨。当模型将来变得更大时，它是不可伸缩的。由于成本高昂，我们无法将整个10TB参数存储在主存储器中。 PCIe总线上新兴的非易失性内存Express（NVMe）SSD的延迟比硬盘驱动器低50倍以上。我们利用SSD作为辅助存储来保存参数。但是，SSD有两个缺点。首先，就延迟而言，SSD仍比主内存慢两个数量级，从而导致训练过程中的参数访问和更新速度较慢。 SSD的另一个缺点是，SSD中的存储单元只能持续数千个写周期。因此，我们必须维护有效的内存缓存以隐藏SSD延迟并减少磁盘写入SSD的时间。第二个挑战是在单个上使用多个GPU节点加快训练计算。最近，单Nvidia Tesla V100具有32 GB高带宽内存（HBM）达到15.7 TFLOPS，是47倍比高端服务器CPU节点（Intel Xeon系列）更快学习推理。这提供了独特的机会签署具有可比计算能力的多GPU计算节点集群性能。但是，当前的现成GPU确实可以没有TB规模的HBM。我们无法保留整个点击率预测GPU HBM中的神经网络。在这项工作中，我们提出了一本小说方法（第2节）将神经网络分为两部分。第一部分是占用大量内存并在CPU上进行过训练的。另一个网络的一部分是计算密集型的，而输入功能的迭代次数。我们在GPU上训练它。训练数据模型参数在主存储器之间传输以及多GPU的HBM。但是，主内存和GPU HBM受PCIe总线限制带宽。较高的GPU数值计算性能为当通信带宽成为瓶颈时，阻塞-颈部。新兴的NVLink 和NVSwitch 技术在不涉及PCIe的情况下实现直接GPU到GPU的通信公共汽车。我们使用NVLink并设计了一个内置HBM参数服务器减少GPU数据传输

设计的CTR预测神经网络模型的概述。

Embedding 学习的输入层上的节点表示高维稀疏性。在联合学习的连接层上没有传入箭头的节点是密集的个性化输入特征（除了Embedding之外）。第一个模块高维稀疏地关注嵌入学习功能，第二个模块用于密集学习功能来自第一个模块。嵌入学习在CPU上处理，通过学习到的Embedding从CPU转移到GPU，同时利用SSD储存模型参数。

Embedding Learning on CPU（嵌入学习）：SSD和CPU之间访问迅速，通过SSD储存模型参数，然后学习到Embedding输入到下一层。

Joint Learning on GPU（联合学习）：联合学习的投入包括密集的个性化功能和学习的嵌入。个性化功能通常来自包括标题创意文本，用户个性化的行为，以及与广告相关的各种元数据。如果我们直接串联这些要素和馈送的神经网络，重要信息个性化功能可能无法得到充分的探索，从而点击率预测结果不准确。因此，我们设计了几个深度神经网络，共同学习有意义的表示最终的CTR预测。如图1所示，联合学习该模块包含几个（图中两个）深度神经网络。每个网络都将学习的嵌入和一种个性化信息一起作为输入层。然后几个应用完全连接的层以帮助捕获交互以自动方式设置功能。这些的最后隐藏层网络组合在一起用于softmax层和输出层点击率预测。

AIBOX系统设计：

SPARSE TABLE

将稀疏表存储到SSD的参数有效。它利用内存作为SSD的快速缓存，同时减少了SSD I / O，并提供低延迟的SSD访问。它包含两个主要组件，密钥哈希索引和二级缓存管理。

Key Hash Index
- 为了通过功能键访问SSD上的参数文件，我们必须为 $10^{12}$ 个参数存储 $10^{12}$ 个密钥到文件的映射在点击率预测模型中将每个密钥到文件的映射存储为内存中的64位值对需要1.6 TB =（8字节密钥+ 8字节的SSD偏移量）× $10^{12}$ ，超过了1 TB的内存预算。我们必须仔细设计关键哈希索引和SSD上的文件结构，以减少内存占用量。我们引入了分组功能，该功能将密钥映射到组ID这样每个组都包含m个关键点，即group（key）→{0，1，···， $10^{12}$ / m − 1}。在这里10个12键被划分为 $10^{12}$ / m组。将密钥分组后，我们可以保留内存中的组到文件映射作为内存消耗仅是原始密钥到文件映射的1 / m。由于键是从1到10 12连续，可以很容易地观察通过均匀地划分键空间来获得，例如group（key）→密钥mod $10^{12}$ / m。我们设置m =⌊BLOCK/（8 + sizeof（value））⌋，其中BLOCK是SSD的I / O单元，由SSD决定块大小（通常为4096），8表示密钥占用的字节，以及sizeof（value）是值（模型参数）的大小（以字节为单位），它是在我们的点击率预测模型中大约有50个字节。 m永远不会设置为小于⌊BLOCK/（8 + sizeof（value））⌋的值，因为SSD访问必须从磁盘获取块字节。 m太小是次优的。另一方面，我们选择的m越大，则密钥哈希索引的内存占用空间就越小。但是，大m会导致一个大组，因为我们必须从SSD读取多个页面才能得到一个组。因此，当组到文件的映射在内存中占据可接受的空间时，我们设置的m值是最佳的。当块大小远大于值的大小时，这是正确的。作为内存占用量的折衷，分组策略的缺点是即使从当前的迷你批处理中未引用磁盘，也要从磁盘获取同一组中的值，这会浪费I / O带宽。一种可能的优化是将具有较高共现性的特征分组在一起，例如，预训练学习的哈希函数以最大化特征共现性。这属于垂直划分的另一个研究领域，不在本文的讨论范围之内。此外，通过缓存管理组件可以减少此缺点，在缓存组件中，我们跳过了从磁盘读取缓存密钥的组。
Bi-level Cache Management
Sparse Table Operators
File Management

原文翻译：

摘要：

翻译：作为世界上主要的搜索引擎之一，百度的赞助商搜索早已采用深度神经网络（DNN）广告点击率（CTR）预测模型2013。百度在线广告系统使用的输入期货（又称“凤凰巢”）具有很高的维度（例如，甚至数千亿个功能），而且还非常疏。百度产品使用的点击率模型的大小系统可以超过10TB。这带来了巨大的挑战用于培训，更新和在生产中使用此类模型。对于百度的广告系统，保持模型培训过程非常高效，因此工程师（以及搜索者）能够快速优化和测试他们的新模型，或者新的功能。而且，数十亿的用户广告点击历史记录条目每天都有货，必须迅速对模型进行重新训练因为点击率预测是一项非常耗时的任务。百度的当前的点击率模型是在MPI（消息传递接口）上训练的集群，需要较高的容错能力和同步性这会导致昂贵的通信和计算成本。当然，集群的维护成本也很大。本文介绍AIBox，这是一个用于培训点击率的集中式系统通过使用solid-状态驱动器（SSD）和GPU。由于内存限制GPU，我们将点击率模型仔细划分为两部分：第一部分适用于CPU，另一个适用于GPU。我们进一步介绍固态硬盘上的二级缓存管理系统来存储10TB参数，同时提供低延迟访问。广泛的经验指导生产数据显示新系统的有效性。AIBox具有大型MPI训练能力，而只需要集群成本的一小部分。

介绍：

百度是全球领先的搜索引擎提供商之一搜索系统（又称“凤凰巢”）预先针对广告的点击率（CTR）的神经网络（DNN）模型，最早于2013年做出决定。点击率预测起着关键作用确定最佳广告空间分配，因为它会直接影响用户体验和广告盈利能力。通常，点击率预测需要多种资源作为输入，例如，查询广告相关性，广告功能和用户画像。它可以确定用户点击的概率在给定的广告上。最近，深度学习在以下方面取得了巨大的成功计算机视觉和自然语言处理。启发据此，提出了用于CTR预测的学习方法任务。与常用逻辑回归比较，深度学习模型可以大大改善准确性，大大增加了培训成本。

在百度搜索广告的当前生产系统中，我们模型的训练过程既耗费资源又耗时消耗。通过参数服务器训练模型在具有数百个MPI（消息传递接口）的群集中成千上万的CPU节点数。生产中使用的主要模型是尺寸超过10TB，并在特殊硬件上存储/管理。的参数服务器解决方案遭受节点故障和网络的困扰太多节点环境中的故障。更糟糕的是，参数服务器中的同步会阻止训练计算机并导致大量的网络通信开销，而异步训练框架具有模型收敛的可能性每个工作程序节点上的模型过时导致的障碍。

这里有令人着迷的机会和挑战来改善赞助搜索的生产系统，在许多不同的方面位置。积极研究人员的一个领域可以提高“召回”的质量（广告）调用CTR模型之前。例如，百度向社区分享了这样的技术论文，建立在快速的近邻搜索算法之上和最大的内部产品搜索技术。

在本文中，我们将介绍百度的另一项重大并举改善在线广告系统，即从MPI集群到GPU的CTR模型训练。而使用用于机器学习和科学计算的GPU已成为惯例，使用GPU训练商业点击率模型会议：目前仍然带来许多重大挑战。最著名的挑战原因是训练数据大小为PB（PeteByte）大小，并且经过训练的模型的大小超过10TB。训练数例子可能多达数千亿的功能可能达到数千亿（我们通常使用2 64作为功能空间大小的便捷替代。）数据馈送到该模型也非常稀疏，只有几百个每个特征向量的非零项。

作为一个商业赞助的搜索系统，任何模型压缩技术都不应影响预测性能（收益）。事实上，即使是很小的（例如0。1%的预测准确度下降将导致不可接受的收入损失。事实上，整个系统已经进行了高度优化，几乎没有冗余（例如，参数已经被小心地量化为整数），这种方式似乎没有多少改进的余地。流行的模型压缩技术，如下采样和散列，对于训练具有超高维（例如，数千亿个特征）和极稀疏（例如，每个特征中只有几百个非零项）的训练数据的商业CTR模型来说，效果较差。研究报告中常见的论据，如“只需0分就能将培训成本降低一半”。3%的精度损失“，不再在这个行业工作。另一方面，DNN-CTR模型的训练在百度是一项日常工作，工程师和数据科学家必须对许多不同的模型/特性/策略/参数进行实验，并且必须非常频繁地训练andre-train-CTR模型。硬件（如MPI集群）的成本和能耗可能非常高。为了应对这些挑战，我们展示了AIBox，这是一种新颖的集中式系统在单个节点上训练这种巨大的机器学习模型。 AIBox使用新兴的硬件SSD（固态驱动器和GPU），以存储大量参数并加速神经网络训练的繁重计算。作为集中式系统，AIBox直接消除了分布式系统中由网络通信引起的那些弊端。此外，与大型计算集群中的数千个节点相比，单节点AIBox的硬件故障数量要少几个数量级。此外，由于仅需要内存锁和GPU片上通信，因此可以显着降低单个节点中的同步成本。与分布式环境相比，没有通过网络传输数据。尽管如此，AIBox的设计仍面临两个主要挑战。

第一个挑战是将10TB规模的模型参数存储在单个节点上。当容量超过1 TB时，内存价格将上涨。当模型将来变得更大时，它是不可伸缩的，并且在现实世界中的大规模生产中不可行。由于成本高昂，我们无法将整个10TB参数存储在主存储器中。 PCIe总线上新兴的非易失性内存Express（NVMe）SSD的延迟比硬盘驱动器低50倍以上。我们利用SSD作为辅助存储来保存参数。但是，SSD有两个缺点。首先，就延迟而言，SSD仍比主内存慢两个数量级，从而导致训练过程中的参数访问和更新速度较慢。 SSD的另一个缺点是，SSD中的存储单元只能持续数千个写周期。因此，我们必须维护有效的内存缓存以隐藏SSD延迟并减少磁盘写入SSD的时间。第二个挑战是在单个上使用多个GPU节点加快训练计算。最近，单Nvidia Tesla V100具有32 GB高带宽内存（HBM）达到15.7 TFLOPS，是47倍比高端服务器CPU节点（Intel Xeon系列）更快学习推理。这提供了独特的机会签署具有可比计算能力的多GPU计算节点集群性能。但是，当前的现成GPU确实可以没有TB规模的HBM。我们无法保留整个点击率预测GPU HBM中的神经网络。在这项工作中，我们提出了一本小说方法（第2节）将神经网络分为两部分。第一部分是占用大量内存并在CPU上进行过训练的。另一个网络的一部分是计算密集型的，而输入功能的迭代次数。我们在GPU上训练它。训练数据模型参数在主存储器之间传输以及多GPU的HBM。但是，主内存和GPU HBM受PCIe总线限制带宽。较高的GPU数值计算性能为当通信带宽成为瓶颈时，阻塞-颈部。新兴的NVLink 和NVSwitch 技术在不涉及PCIe的情况下实现直接GPU到GPU的通信公共汽车。我们使用NVLink并设计了一个内置HBM参数服务器减少GPU数据传输

总结工作如下：

我们引入AIBox（受SSD和GPU加速的单个节点）来训练具有10TB参数的CTR预测模型。单节点设计范例消除了昂贵的网络通信和分布式系统的同步成本。据我们所知，AIBox是第一个为实际机器学习而设计的集中式系统如此大规模的应用
我们展示了一种将大型CTR预测模型分为两部分的新颖方法。分区之后，我们能够将内存密集型训练部分保留在CPU上，而将内存受限的GPU用于计算密集型部分来加速训练。
我们建议使用稀疏表，通过在SSD上存储模型参数并利用内存作为快速缓存来减少SSD I / O延迟。此外，我们实现了一个3级流水线，该流水线与网络，稀疏表和CPU-GPU学习阶段的执行重叠。
我们通过将其与包含10个PB示例的真实CTR预测数据上的75个节点的分布式集群解决方案进行比较，进行了广泛的实验，以评估该提议的系统。它显示了AIBox的有效性-AIBox具有与群集解决方案相当的培训性能，而只需要我们为群集支付的费用的不到1/10。

点击率预估神经网络

工业大规模网络经过大规模的设计和培训，缩放数据示例以帮助预测广告的点击率准确，快速和可靠。百度点击率预测中的功能模型通常是极其稀疏的特征（例如，数百个或甚至数千亿个功能），只有很少的数量-每个向量ber（例如几百个）非零值。这个巨大存储后，DNN模型的参数大小超过10TB仅对非零参数进行仔细量化。因为GPU的HBM容量有限，因此保持GPU的HBM中整个模型的10TB参数。

在本文中，我们介绍了训练的两模块架构，在CPU + GPU上使用庞大的DNN CTR模型。第一个模块高维稀疏地关注嵌入学习功能，第二个模块用于密集学习功能来自第一个模块。嵌入学习在CPU上处理，以帮助学习低维密集嵌入-丁表示。由于10TB的内存密集型问题参数使得无法维持整个模型在训练过程中存储内存，我们利用SSD来存储模型参数。可以从SSD到CPU快速访问参数。通过将学习到的嵌入向量从CPU转移到GPU，计算密集型联合学习模块可以充分利用用于CTR预测的功能强大的GPU。在联合学习模式中例如，通过以下方法对几个完全连接的神经网络进行建模嵌入作为输入。这些神经网络的最后一层连接在一起以进行最终的点击率预测。图1显示了设计的CTR神经网络模型的概述。我们将在以下小节中介绍该模型的详细信息。

Embedding Learning on CPUs: 嵌入学习模块旨在映射高维将稀疏向量（例如10 12个维度）稀疏成低维密集表示形式。如图1所示，嵌入学习该模块包括高维稀疏特征的输入层和输出嵌入层。 ReLU用作激活功能。自10 12开始，此模块主要占用大量内存功能导致10TB规模的模型参数，这是不可行的将所有参数加载到主存储器中。为了学习嵌入时，我们将10TB参数存储到SSD中。由于SSD和CPU之间的有效访问速度，我们可以轻松地从SSD加载参数并学习CPU上的嵌入。
Joint Learning on GPUs：计算高维CPU上的嵌入后稀疏功能，我们将嵌入从CPU转移到GPU，以实现点击率预测过程。联合学习的投入包括密集的个性化功能和学习的嵌入。个性化功能通常来自各种来源，包括标题创意文本，用户个性化的行为，以及与广告相关的各种元数据。如果我们直接串联这些要素和馈送的神经网络，重要信息个性化功能可能无法得到充分的探索，从而点击率预测结果不准确。因此，我们设计了几个深度神经网络，共同学习有意义的表示最终的CTR预测。如图1所示，联合学习该模块包含几个（图中两个）深度神经网络。每个网络都将学习的嵌入和一种个性化信息一起作为输入层。然后几个应用完全连接的层以帮助捕获交互以自动方式设置功能。这些的最后隐藏层网络组合在一起用于softmax层和输出层点击率预测

为了有效地学习以前的神经网络，表示是从第一个和最后一个隐藏的对象中提取的层，然后与当前输入层连接联合学习的神经网络。具体来说，第一个隐藏层表示低级特征学习并提取最相关的来自输入层的信息。最后一个隐藏层显示高级特征学习，并为最终CTR预测检测最抽象但最有用的信息。我们结合了先前网络中最有意义的低层和最强大的高层信息，以获更准确的点击率预测结果。

AIBOX SYSTEM OVERVIEW

SPARSE TABLE

Key Hash Index
- 为了通过功能键访问SSD上的参数文件，我们必须为 $10^{12}$ 个参数存储 $10^{12}$ 个密钥到文件的映射在点击率预测模型中将每个密钥到文件的映射存储为内存中的64位值对需要1.6 TB =（8字节密钥+ 8字节的SSD偏移量）× $10^{12}$ ，超过了1 TB的内存预算。我们必须仔细设计关键哈希索引和SSD上的文件结构，以减少内存占用量。我们引入了分组功能，该功能将密钥映射到组ID这样每个组都包含m个关键点，即group（key）→{0，1，···， $10^{12}$ / m − 1}。在这里10个12键被划分为 $10^{12}$ / m组。将密钥分组后，我们可以保留内存中的组到文件映射作为内存消耗仅是原始密钥到文件映射的1 / m。由于键是从1到10 12连续，可以很容易地观察通过均匀地划分键空间来获得，例如group（key）→密钥mod $10^{12}$ / m。我们设置m =⌊BLOCK/（8 + sizeof（value））⌋，其中BLOCK是SSD的I / O单元，由SSD决定块大小（通常为4096），8表示密钥占用的字节，以及sizeof（value）是值（模型参数）的大小（以字节为单位），它是在我们的点击率预测模型中大约有50个字节。 m永远不会设置为小于⌊BLOCK/（8 + sizeof（value））⌋的值，因为SSD访问必须从磁盘获取块字节。 m太小是次优的。另一方面，我们选择的m越大，则密钥哈希索引的内存占用空间就越小。但是，大m会导致一个大组，因为我们必须从SSD读取多个页面才能得到一个组。因此，当组到文件的映射在内存中占据可接受的空间时，我们设置的m值是最佳的。当块大小远大于值的大小时，这是正确的。作为内存占用量的折衷，分组策略的缺点是即使从当前的迷你批处理中未引用磁盘，也要从磁盘获取同一组中的值，这会浪费I / O带宽。一种可能的优化是将具有较高共现性的特征分组在一起，例如，预训练学习的哈希函数以最大化特征共现性。这属于垂直划分的另一个研究领域，不在本文的讨论范围之内。此外，通过缓存管理组件可以减少此缺点，在缓存组件中，我们跳过了从磁盘读取缓存密钥的组。
Bi-level Cache Management
- 高速缓存管理设计受到以下两个挑战的指导：SSD的访问性能和寿命。
  - 首先，内存访问延迟约为纳秒级而SSD需要几微秒的时间来查看数据，因为SSD比内存慢大约1000倍，但是，参数点击率中的数据稀疏和偏斜，导致不到1％的参数迷你批处理中引用了一个。它为我们提供了建立内存缓存系统的机会在有限的内存预算中经常使用的“热参数”。
  - 第二个挑战是仅SSD的物理属性允许对每个存储单元进行数千次写入。参数是在培训的每次迭代中更新。它将大大如果及时更新参数，则可以缩短SSD的使用寿命。高速缓存管理还充当参数缓冲区。缓冲的在不涉及SSD I / O的情况下在内存中更新参数。当缓冲区到达缓冲区时，它们会延迟地存储到SSD容量和缓存替换策略将其交换出缓存
Sparse Table Operators
File Management

后续更新

Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Zellij 详细教程：一个比 tmux 更友好、强大的终端复用工具 vortex5 工具命令 zellij tmux linux
在终端环境中，终端复用器（TerminalMultiplexer）是一种不可或缺的工具。它能够将单一的终端会话分割为多个独立的工作区域，不仅实现“一心多用”，还便于会话管理，确保任务不会因误关闭终端窗口或SSH连接中断而丢失。这种特性对于开发者、系统管理员以及命令行爱好者来说尤为重要。提到终端复用器，许多人首先想到的是经典的tmux，其名称正是“terminalmultiplexer”的缩写。凭借
(LeetCode 面试经典 150 题 ) 238. 除自身以外数组的乘积 (前缀和) 岁忧 LeetCode 面试经典 150 题 LeetCode C++JAVA Go版本 leetcode 面试算法 c++go java
题目：238.除自身以外数组的乘积思路：前缀和，时间复杂度0(n)。先用前缀和预处理出前n的乘计和，然后第二次遍历时，从后往前，同时维护右边的乘计和即可。C++版本：classSolution{public:vectorproductExceptSelf(vector&nums){intn=nums.size();vectorpre(n,1);pre[0]=nums[0];for(inti=1;i
规划将 IaaS 资源从经典部署模型迁移到 Azure Resource Manager zangdalei Market
尽管Azure资源管理器提供了许多精彩功能，但请务必计划迁移，以确保一切顺利进行。花时间进行规划可确保执行迁移活动时不会遇到问题。Note以下指导的主要参与者为Azure客户顾问团队，以及与客户合作迁移大型环境的云解决方案架构师。此文档随着出现新的成功模式而持续更新，因此，请不时地回来查看，了解是否有新的推荐内容。迁移之旅包括四个常规阶段：计划技术注意事项和权衡根据技术要求大小、地理区域和操作方案
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解汀、人工智能 LLM工业级落地实践人工智能 LLM 自然语言处理 NL2SQL 大模型应用 Text2SQL gpt
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理1.MindSQL(库)MindSQL是一
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
亚马逊云科技助力全球电子发票合规化进程 taibaili2023 AWS
亚马逊云科技助力全球电子发票合规化进程关键字:[亚马逊云科技，Peppol，电子发票合规化，全球电子发票，税务合规，发票管理，增值税申报]导读在这场演讲中，演讲者分享了亚马逊云科技如何助力全球电子发票合规化进程。他解释了电子发票的重要性，以及各国政府为何推行电子发票系统。他介绍了电子发票的发展趋势，包括监管模式、持续交易控制模式、标准化格式等。他还分享了亚马逊云科技与经典发票员的合作，利用云服务提
推荐几本创业者需要掌握的财务管理类书籍 AI布道师阿彬单独的博客资料创业者财务管理书籍推荐创业
作为创业者，需要建立一个坚实的财务和管理知识体系。这不仅仅是“看书”，而是通过阅读经典来构建商业思维框架。以下是精心挑选的一系列书籍，并按照从**“入门认知”到“高手进阶”**的逻辑进行分类，每本书都附上了推荐理由，确保它们能精准地解决创业者在创业不同阶段可能遇到的问题。第一部分：财务思维篇(让您看懂钱、管好钱、用好钱)对于技术出身的创始人来说，财务知识不是为了让您成为会计，而是为了让您拥有**“
C# 与串口通信：解决常见问题的调试技巧与实用建议威哥说编程 c#单片机 stm32
串口通信作为一种经典的通信方式，在很多领域中仍然广泛应用，尤其是在嵌入式系统、工业自动化、测控系统等场景中。通过串口接口，可以实现设备间的短距离、低速数据传输。C#提供了强大的System.IO.Ports.SerialPort类来支持串口通信的开发，但在实际开发中，开发者常常遇到一些问题，比如数据丢失、串口冲突、波特率不匹配等。本文将深入探讨如何使用C#进行串口通信，结合调试技巧和实用建议，帮助
《AI颠覆编码：GPT-4在编译器层面的奇幻漂流》的深度技术解析踢足球的，程序猿人工智能 python c语言
一、传统编译器的黄昏：LLVM面临的AI降维打击1.1经典优化器的性能天花板//LLVM循环优化Pass传统实现（LoopUnroll.cpp）voidLoopUnrollPass::runOnLoop(Loop*L){unsignedTripCount=SE->getSmallConstantTripCount(L);if(!TripCount||TripCount>UnrollThreshol
用 Python 开发文字冒险游戏：从零开始的教程晓天天天向上 python microsoft 开发语言
文字冒险游戏(Text-basedAdventureGame)是一种经典的游戏类型，玩家通过输入文字指令与游戏世界互动。这种游戏不依赖复杂的图形界面，非常适合初学者学习编程逻辑和用户交互。在本篇博客中，我们将用Python开发一个简单的文字冒险游戏，体验游戏开发的乐趣。1.游戏设计思路游戏背景玩家醒来发现自己身处一个神秘的地下城，需要探索房间、收集物品、战胜敌人并找到出口。核心机制房间导航：玩家可
Java中多态的一些见解
更多内容请看我的个人网站多态初识调用成员的特点成员变量：编译看左边，运行看左边成员方法：编译看左边，运行看右边多态在调用成员变量时为什么是父类的，但是方法是子类的?一句话解释：在编译时（静态绑定），成员变量是根据引用类型（也就是声明的类型）来决定的；在运行时（动态绑定），方法是根据对象的实际类型（也就是new出来的类型）来决定的。举个经典例子classParent{publicStringname
卷积神经网络（Convolutional Neural Network, CNN）不想秃头的程序神经网络语音识别人工智能深度学习网络卷积神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专门用于处理图像、视频等网格数据的深度学习模型。它通过卷积层自动提取数据的特征，并利用空间共享权重和池化层减少参数量和计算复杂度，成为计算机视觉领域的核心技术。以下是CNN的详细介绍：一、核心思想CNN的核心目标是从图像中自动学习层次化特征，并通过空间共享权重和平移不变性减少参数量和计算成本。其关键组件包括：卷积层（
ResNet（Residual Network）不想秃头的程序神经网络语音识别人工智能深度学习网络残差网络神经网络
ResNet（ResidualNetwork）是深度学习中一种经典的卷积神经网络（CNN）架构，由微软研究院的KaimingHe等人在2015年提出。它通过引入残差连接（SkipConnection）解决了深度神经网络中的梯度消失问题，使得网络可以训练极深的模型（如上百层），并在图像分类、目标检测、语义分割等任务中取得了突破性成果。以下是ResNet的详细介绍：一、核心思想ResNet的核心创新是
P25：LSTM实现糖尿病探索与预测 ?Agony lstm 人工智能 rnn
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、相关技术1.LSTM基本概念LSTM（长短期记忆网络）是RNN（循环神经网络）的一种变体，它通过引入特殊的结构来解决传统RNN中的梯度消失和梯度爆炸问题，特别适合处理序列数据。结构组成：遗忘门：决定丢弃哪些信息，通过sigmoid函数输出0-1之间的值，表示保留或遗忘的程度。输入门：决定更新哪些信息，同样通过sigmoid函数控制更新
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
人脸识别算法赋能园区无人超市安防升级智驱力人工智能算法人工智能边缘计算人脸识别智慧园区智慧工地智慧煤矿
人脸识别算法赋能园区无人超市安防升级正文在园区无人超市的运营管理中，传统安防手段依赖人工巡检或基础监控设备，存在响应滞后、误报率高、环境适应性差等问题。本文从技术背景、实现路径、功能优势及应用场景四个维度，阐述如何通过人脸识别检测、人员入侵算法及疲劳检测算法的协同应用，构建高效、精准的智能安防体系。一、技术背景：视觉分析算法的核心支撑人脸识别算法基于深度学习的卷积神经网络（CNN）模型，通过提取面
Linux ps 指令 halugin Linux指令 linux 运维
Linuxps指令ps（ProcessStatus）是Linux系统中用于查看进程状态的核心命令行工具。它提供系统当前运行进程的快照，显示进程ID、CPU和内存使用情况、运行状态等信息。作为系统管理员或开发人员，ps是监控系统资源、排查性能问题和管理系统进程的必备工具。其灵活的选项和输出格式使其适用于从简单查询到复杂分析的各种场景。什么是ps指令？概述ps是一个经典的Linux/Unix命令，用于
Linux netstat 指令 halugin Linux指令 linux 运维
Linuxnetstat指令netstat（NetworkStatistics）是Linux系统中用于查看网络状态、连接、路由表和接口统计信息的经典命令行工具。它为系统管理员和开发人员提供了强大的网络诊断功能，帮助分析网络连接、监控流量以及排查网络问题。尽管在现代Linux系统中，netstat正在被更新的工具（如ss）部分取代，但其简单性和广泛适用性使其仍然是许多场景下的首选工具。什么是nets
【Python深度学习】零基础掌握Pytorch Pooling layers nn.MaxPool方法 Mr数据杨 Python 深度学习 python 深度学习 pytorch
在深度学习的世界中，MaxPooling是一种关键的操作，用于降低数据的维度并保留重要特征。这就像是从一堆照片中挑选出最能代表某个场景的那张。PyTorch提供了多种MaxPooling层，包括nn.MaxPool1d、nn.MaxPool2d和nn.MaxPool3d，它们分别适用于不同维度的数据处理。如果处理的是声音信号（一维数据），就会用到nn.MaxPool1d。而处理图像（二维数据）时，
Redis网络通信模块深度解析：单线程Reactor到多线程IO的架构演进
一、核心架构：单线程Reactor模型Redis网络模块采用经典Reactor模式，核心流程如下：voidaeMain(aeEventLoop*eventLoop){while(!eventLoop->stop){//前置钩子（集群心跳/数据持久化）if(eventLoop->beforesleep)eventLoop->beforesleep(eventLoop);//事件分派：I/O复用+定时
阅读笔记(2) 单层网络:回归 a2507283885 笔记
阅读笔记(2)单层网络:回归该笔记是DataWhale组队学习计划（共度AI新圣经：深度学习基础与概念）的Task02以下内容为个人理解，可能存在不准确或疏漏之处，请以教材为主。1.从泛函视角来看线性回归还记得线性代数里学过的“基”这个概念吗？一组基向量是一组线性无关的向量，它们通过线性组合可以张成一个向量空间。也就是说，这个空间里的任意一个向量，都可以表示成这组基的线性组合。函数其实也可以看作是
HarmonyOS高效数据检索方案全解析：从原理到实战代码 harmonyos
摘要在开发鸿蒙（HarmonyOS）应用的过程中，数据检索是一个绕不开的重要环节。无论是小型本地存储的数据，还是大型缓存数据，检索的效率直接影响到用户体验。本文将介绍两种经典的数据检索方法——哈希表和二分查找，结合实际场景进行分析，并提供可以直接运行的示例代码。引言随着鸿蒙系统的发展，越来越多的开发者投身于原生应用开发。但在处理数据尤其是大量数据时，如何高效地定位目标值就显得非常关键。特别是在智能
60天python训练计划----day55
DAY55序列预测任务介绍知识点回顾序列预测介绍单步预测多步预测的2种方式序列数据的处理：滑动窗口多输入多输出任务的思路经典机器学习在序列任务上的劣势；以随机森林为例一、序列预测任务介绍1.1序列预测是什么？我们之前接触到的结构化数据，它本身不具备顺序，我们认为每个样本之间独立无关，样本之间即使调换顺序，仍然不影响模型的训练。但是日常中很多数据是存在先后关系的，而他们对应的任务是预测下一步的值，我
【设计模式】单例模式之双检锁（Double-Checked Locking）浩瀚之水_csdn #软件模式设计模式单例模式
双检锁（Double-CheckedLocking）是一种在多线程环境下高效实现单例模式的技术，它结合了延迟初始化和线程安全的优点，避免了不必要的同步开销。核心思想双检锁的核心思想是：第一重检查（无锁）：快速检查实例是否已创建加锁保护：确保只有一个线程进入创建流程第二重检查（有锁）：再次检查实例是否已创建创建实例：如果仍未创建，则创建实例经典实现（C++11之前）#includeclassSing
【深度学习解惑】如果用RNN实现情感分析或文本分类，你会如何设计数据输入？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 分类人工智能机器学习神经网络
以下是用RNN实现情感分析/文本分类时数据输入设计的完整技术方案：1.引言与背景介绍情感分析/文本分类是NLP的核心任务，目标是将文本映射到预定义类别（如正面/负面情感）。RNN因其处理序列数据的天然优势成为主流方案。核心挑战在于如何将非结构化的文本数据转换为适合RNN处理的数值化序列输入。2.原理解释文本到向量的转换流程：原始文本分词建立词汇表词索引映射词嵌入层序列向量关键数学表示：词嵌入表示：
C#推箱子游戏源代码解析与实践指南 Boa波雅
本文还有配套的精品资源，点击获取简介：C#推箱子游戏是一个经典的益智游戏，适合编程初学者学习C#语言和游戏开发的基础知识。本篇文章将深入探讨使用C#语言开发推箱子游戏的源代码，涉及面向对象编程、图形用户界面(GUI)、事件驱动编程、数据结构与算法、状态管理、错误检查与边界条件、游戏逻辑以及调试技巧。通过学习本课程，初学者将能够掌握C#编程的基础和游戏逻辑的实现，并能够创建用户友好的界面。1.面向对
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

一文梳理论文《AIBox: CTR Prediction Model Training on a Single Node》

论文链接：https://dl.acm.org/doi/pdf/10.1145/3357384.3358045

SPARSE TABLE

原文翻译：

摘要：

介绍：

点击率预估神经网络

AIBOX SYSTEM OVERVIEW

SPARSE TABLE

你可能感兴趣的:(经典论文解读,深度学习)