DataFunTalk

点击率预测模型Embedding层的学习和训练

导读： 本文将简要介绍推荐模型的发展历史，现状，和下一步的研究趋势。并重点介绍针对embedding数据的模型训练及优化。主要包含以下几大部分内容：

CTR预测模型（CTR Models）
连续值处理（Continuous Feature）
交叉特征建模（Interaction Modelling）
大Embedding模型训练（Distributed Training）
总结和展望

01 CTR预测模型（CTR Models）

1. 推荐模型的发展

首先简要介绍下推荐模型的发展。以06年为起点，在06年时，更多的是以协同过滤（Collaborative Filtering）的方法来做推荐，还包括最近邻方法（Nearest neighbor），矩阵分解（Matrix factorization - MF）的方法，以及主题模型（Topic models）的方法。

10年以后，很多公司开始在业务中引入使用广义线性模型（Generalized Linear Model）这一系列的模型，包括逻辑回归（Logistic regression）、低秩模型如因子分解机FM（Factorization Machines）、基于域信息的因子分解机FFM (Field-aware Factorization Machine)，以及一些learning to rank 的方法，如BPR， RankSVM，lambda Rank等。

15年以后，CNN在视觉任务取得了一些突破性的进展，深度学习模型在业界得到了很大的关注，很多模型被提出。例如大家熟知的FNN、PNN、DIN、谷歌提出的wide&deep，以及华为的deepFM等等。

18年以后，研究开始倾向于向强化学习这一类推荐模型发展。18年之前已经有像多臂老虎机这种方法在使用，但是AlphaGo击败围棋世界冠军这次事件引起了业界极大关注，推荐任务的研究也开始转向基于强化学习的推荐模型

整体的发展趋势就是模型逐渐从人工经验向自动化，深度模型的归一化，越来越聚焦到某一类模型，期望引入自适应模型来解决业务问题。

2. 推荐系统中的核心问题

点击率预测模型是推荐系统中的核心问题。举个例子，如上图所示是一个网页，网页上有一些内容，也有一些位置留给广告，广告对于一个网站是比较大的收入来源。展示什么广告给用户，就需要预测用户在特定页面点击广告的概率，点击率预测就是执行这样一个任务。预测的准确与否决定了整个推荐系统或者说广告系统的收益以及用户体验。

在2021年IJCAI上面有这样一篇Survey论文，是上海交通大学张伟楠老师和华为诺亚实验实的联合工作，将深度学习时代的点击率预测模型分为了三类：

第一类就是基于组合特征挖掘的模型；
第二类针对用户行为的模型；
第三类是自动架构搜索的模型。

① 用户行为挖掘

这块从论文来看做的比较早的是阿里的一些工作，包括阿里妈妈团队在2017-2018做的基于dnn的Deep interest network-DIN，是用dnn里面的pooling，将用户的历史行为做了一些建模。这样可以把用户的历史兴趣体现在模型中，从而得到更好的预测效果。2019年，阿里妈妈团队又在DIN的基础上增加了一个RNN模块，推出DIEN模型。DIN只是把用户行为做pooling，把过去历史行为都等同来看，而没有去关注行为之间过去历史之间的序列关系。所以DIEN 模型在user modeling加了一个RNN模型，从而可以拟合序列关系。同年，阿里另一个团队推出了BST模型，将transformer用在了用户行为 modeling模块里面，目前有很多公司也在用，包括去年快手发布的万亿参数模型，也是用到了transformer来拟合用户的长期行为。

② 组合特征挖掘

另一类是组合特征挖掘类模型。我个人认为可以分为三类，第一类就是像wide&deep模型，谷歌最先提出，他们在模型里面加入了显示的交叉，也就是特征之间笛卡尔相乘之后构建出来新特征，加入到线性部分，这样模型会记住这些特征，当下次组合特征出现的时候，会直接把它的权重取出来做预测。第二类模型是DeepFM这类的模型，可以称为双塔模型、双塔结构，像DCN，xDeepFM以及后边的很多模型，都属于这类模型，这类模型是在dnn之外以及线性之外，加了基于分解的模块，用来建模两个特征之间的组合关系。两个特征的组合关系，是用一个向量的乘法或者是一些复杂的结构来拟合的，建模完这个关系之后，会直接把输出喂到最终输出中，而不会去神经网络。与之相反的是第三类如PNN这种网络，也会利用分解模式构建特征之间的组合关系，但是它构建完组合关系之后，会再把输出喂入到模型MLP中，让MLP来再度拟和这些特征之间的关系。

3. 结构创新带来的收益越来越小，如何突破？

如上图中展示的一些实验结果，是华为诺亚实验室20-21年的一个工作成果，已经公开发表（FuxiCTR: An Open Bench mark for Click-Through Rate Prediction[J]. arXiv preprint arXiv: 2009.05794, 2020.）。论文对15年至今比较有代表性的深度学习点击率预测模型进行复现，在几个公开数据集上进行调参、再调优。实验结果显示，模型创新，结构创新带来的收益越来越小。比如图中DeepFM和AFN+，公开数据集结果显示结果差距不大。当然并不是说这些年模型没有发展，业界使用模型做实验时，很多时候都是用自己私有的数据集，数据集会有不同的特点，模型在这样的私有数据集会有收益，并且会针对数据集专门改造模型。还有就是比如17年的时候很多模型调参的trick没有发现，现在将这些trick带入到17年的模型进行训练，补足了以前模型的短板，所以看不到大的差异。相对于模型创新，如何结合数据设计模型以及如何找到一些针对推荐搜索等场景比较通用的调参策略，是一个不错的突破点。

4. 如何更高效的利用数据？

在此基于组合特征建模和用户行为建模提供两个方向。这几个工作也是近两年发表在KDD和SIGIR上的一些工作。

首先是组合特征建模方向，很多深度模型建模的时候，使用显示特征作为输入，这样一是会带来人工的特征工程，二是因为特征的稀疏，直接使用可能学习不好。而像阿里的CAN模型，并没有使用显示的特征，而是将显示的交互特征（组合特征）喂入模型，带来的提升也是很明显的。怎么设计特征或者说怎么选择哪些特征做显示的喂入，哪些做隐式的交叉也是一个研究方向。另外，很多这种基于交叉基于分解的建模方式都是将所有的特征中间都去做交叉建模，但并不是所有特征都适合这种交叉。哪些可以交叉，哪些交叉后会带来负向的效果，这需要模型去自动选择或者人工去不断尝试。

上图展示了华为诺亚方舟实验室在2020年发表的AutoFIS模型，该模型针对交叉特征加了一组参数，用来自动去学哪些特征重要，哪些特征不重要。通过第一阶段的搜索，筛选出重要特征，把不重要的去掉，再重新输入到模型，这样做效果有明显提升。

第二个方向是用户行为建模。怎么更高效利用数据呢，其实很多工作也提到了，那就是用更长周期的行为数据；但是利用更长周期的行为数据，会带来两个问题，第一个问题就是数据序列会很长，建模时它的参数量会很大，而且不容易训练，另一个问题是可能只是一小部分的用户行为序列很长，其他大多数用户行为序列很稀疏，从而造成模型训练困难。

针对这些问题，阿里以及上海交通大学张伟楠老师分别发表了类似的工作：SIM和UBR。这两个工作想法类似：在行为数据中加入检索模块。如上图所示，用户的行为进来之后，通过一个行为建模的模块，比如RNN或者是transformer，就会得到一个用户的embedding，再和其他的特征一起注入到模型去做预测。这里的检索基于一个target，即预测目标，去对用户的行为做了一个筛选或者加权。基于这样的操作，模型会有很明显的提升。此外，针对如何更高效利用数据，本报告会介绍华为诺亚方舟实验室最近两个工作，如何去处理连续特征和更好的建模组合特征。

5. 如何处理大Embedding?

推荐模型的研究，还有一个方向就是怎样去处理大embedding。分两个方面来看，一方面就是怎样把embedding变小，也就是将embedding压缩；另一方面就是怎么用更新的分布式架构去更高效更低成本的去训练大embedding。

压缩方法的话也有几个分类，这里简单提几个比较有趣的工作，第一个就是twitter在Recsys 2021发表的Double hash的方法。这种方法首先把特征分成了高频和低频，因为高频特征相对比例比较小，给每一个高频特征分配一个独立的embedding，它所占的空间也不是很大。对于低频特征，使用Double hash方法进行压缩，该hash方法是为了尽可能地减少冲突。第二个工作是百度在SIGMOD2021发表的一篇基于int16训练Embedding参数。直接基于低比特参数进行训练模型十分挑战。第三个工作比较偏探索，是Google发表在KDD2021上的DHE模型，去掉了Embedding Table。

如上图所示，这个模型里面左侧是传统的embedding的处理方法，对一个特征进行编码，得到一个ID，然后用ID去一个大的Embedding table里面查表，得到它对应的Embedding。这种做法需要存一个大的Embedding，假设特征是亿级别的，那这个table可能是数百GB，维护这样一个Embedding table和训练模型是比较困难的。谷歌的DHE基于原始输入，用了1024个hash函数对数据做了一个硬编码，但函数怎么设计，没有提到，只是给了一个简要的指导，基于它硬编码之后的1024维输出，会再通过一个多层的网络去恢复出来一个Embedding，也就是说他认为1024维的hash函数进行编码加上多层神经网络即可恢复出Embedding table的参数。其在矩阵分解的一些模型上做了实验，实验效果显示精度没有损失太多。

另外一个方向的就是新的大Embedding分布式训练架构。这里的话我们最熟知的，用的最多的可能就是基于GPU这种Horovod去数据同步。腾讯发表于SIGIR2020的DES通过模型结合硬件设计了一个分布式的方案。英伟达提出基于cude直接写了一个HugeCTR，当然还有很多其他工作，后面的第四部分会介绍华为诺亚方舟实验室的ScaleFreeCTR模型，简单介绍一下这几种训练方式的一些不同。

02 连续值处理（Continuous Feature）

下面介绍华为的AutoDis，这个工作已经在KDD2021发表。熟悉深度模型的同学可能很清楚，我们的模型基本是服从Embedding+MLP。已有工作更多的是聚焦在怎么去设计网络的架构，在特征组合部分去设计架构，目的是为了更好的去捕捉显式或者隐式的交叉，但是特征的embedding，尤其是针对连续特征的embedding的研究是比较少的。下面对现有的相关工作做了一些总结。

如上图是一种对离散特征的处理方法，它就是做了one-hot的编码，然后去做Embedding lookup。对于连续特征的处理方法，调研发现主要分为三类，第一类就是不使用Embedding，把原始值做一些变化，或者是归一化后输入到模型。第二类是Field Embedding，是给每个域一个Embedding。第三类是把连续特征离散化，之后把它当成离散特征来处理。

第一种方法，No Embedding。这里介绍几个模型的用法，第一个是wide&Deep，在它的介绍里面，使用的是原始值，另外一个是谷歌的YouTubeNet，它会对原始值做平方开根号这些变换。另一个是facebook DLRM模型，对连续值的处理方式是把所有的连续值输入到一个神经网络，然后通过神经网络把它压缩到一个embedding维度大小的一个向量上，然后将Embedding和其他离散特征Embedding Concat起来，再做后面根据它的模型去做不同的计算。京东的DMT模型，他们的网络是使用了归一化的输出，这种方法表示能力比较弱，因为它这里其实没有对原始的延续特征做一个很好的表示。

第二种处理连续值的方法是Field Embedding，每个域有一个Embedding。某个域的Embedding是该域的一个连续值，乘上它的域的Embedding。这类方法的问题是表示能力比较弱，然后不同值之间是一个线性的关系。

第三类的方法就是离散化。离散化可以有很多方法，比方说等频、等距和取log，或者基于树的模型去做一个预训练。但这类方法有两个问题：首先，就是它是两阶段的，离散化的过程不能端到端优化；另外，有一些边界的问题，如下图所示的例子，一个年龄特征，假设我们按40，41来分，40以下的我们称之为青年，41以上的成为中年，其实40和41，它们是很接近的年龄，但是因为我们的离散化的方法，把它分到两个不同的桶里面，可能学到的Embedding是差异比较大的Embedding。

针对这些问题，华为提出了一个连续值Embedding的方法AutoDis，它分为三个模块，第一个模块是Meta-embedding，就是假设有若干个桶，每个桶有个Field Embedding，这个embedding是可以去学习的，还有一个模块叫做Automatic Discretization，这个模块就是将原始值映射到一个H维的向量上。这里函数是去学习连续值分配到H个桶上的概率，然后基于分配概率和Meta-embedding，就会得到最终的连续值的embedding。

为了验证这个模型是不是有效，这里在两个公开数据集以及一个私有的数据集上做了实验，比较了像前面提到的几种不同的embedding方法，可以看到当使用这种离散化的方法时，它的效果相对于这种没有embedding或者Field Embedding，会有比较明显的提升。

AutoDis方法相对于离散化的方法，会有进一步的提升，这篇文章也在不同的模型尝试加入AutoDis模块，看看AutoDis对普通模型是否有效果，这里可以看到（上图右边部分）它其实都有一些提升。文中还尝试了将该模型在华为内部一个业务上去落地上线。基线组的连续特征被专门做了精细化的设计，通过很多的调参去选择出来一个离散化的策略，实验组使用的是原始的连续值，然后在模型里面加入了一个AutoDis，看线上效果，在点击率及eCPM这两个指标上都是有一个百分位的提升。

03 交叉特征建模（Interaction Modelling）

这一部分介绍华为诺亚方舟实验室的第二个工作 - 交叉特征建模。这个工作目前还没有发表，但是我们已经放在了Arxiv上。

如上图所示，这里将组合特征建模方法分为了三类，即Naive、Memorized和Factorized。

第一类像FNN模型，即不建模，每个特征有一个embedding，所有的特征embedding后concat拼接输入网络，后面网络自己去学，想学到什么就是什么。

第二类像wide&deep模型，这里统称为基于记忆的方法，就是去显示的构造组合特征，特征做交叉做笛卡尔积，然后把新构造的特征输入模型。模型就会记住这个特征，这个信号就比较强。

第三类方法就是基于分解的方法，例如IPNN模型，对不同的域之间的交叉关系，通过乘法的方式去做建模，得到的乘法结果会和原始embedding一起喂入到后面的MLP，然后来再次去做一个组合。不同的特征之间是不是都应该组合，或者说怎么去组合，如果我们去试的话，需要去做很多实验，能不能自动判断特征是不是要组合，以及它们之间应该用哪种组合这种关系去学到呢，这个就是我们这个工作的一个动机。

基于这个目标，我们提出Optlnter。如上左图，最上面有一个分类器，然后中间是一个Feature Interaction层，再下面是一个embedding层，这一层一方面会为每个特征用原始方法去构建出来它的embedding输出（Origin Embedding table），还有一个的话就是通过一个Cross-product transformation模块，将交叉特征的embedding学到。Cross-product transformation模快的细节展开如上右图所示，可以看到这个图里面蓝色的模块是一个选择模块，通过选择模块，最终输出这两个域的一个交叉的embedding。选择模块的输入有三个：第一个是使用分解方式去构建的一个embedding，基于这两个特征的一个embedding做一个乘法，然后得到的一个输出；然后第二个输入的话就是拿小白的方法 - 根据业务选择的特征直接输入，不做特征交叉，即我们认为两个特征之间关系不强，不去构建它，用了一个空的embedding。然后第三个输入，是通过交叉或者笛卡尔去构建出来特征，为这个特征分配一个独立的embedding。有这样三个输入，进入选择模块，选择模块会最终选出来一个embedding。选择模块是一个类似于softmax函数（如上图右图中公式），这个函数里面有一些参数是可以去学习的，最终会学出来一个结构的参数。基于这个框架，训练也是分为两个阶段，第一个阶段就是搜索，第二个阶段是Retrain。搜索的话，这块具体细节不进行展开了，其实是要学一个⍺参数。这个参数，是一个结构的参数，针对每个特征，它们之间是使用小白的、记忆的，还是使用基于分解的方式去建模，通过训练会得到一个最优的⍺参数，然后到了retrain阶段的话，我们会根据最优的⍺参数去重构我们的网络，然后基于重构的网络的，将模型重新训练。

对于以上方法，在多个数据集进行了实验，包括三个公开的数据集，这三个数据集是CTR预测比较常用的数据集，并且在私有的数据集进行了实验；如上图所示，是几个数据集的实验结果。这里分别比较了LR这种不去构建任何特征交叉的方法、分解的方法以及记忆的方法。

04 大Embedding模型训练（Distributed Training）

第四部分也是介绍华为的一个工作 - 大Embedding模型的分布式训练，这个工作发表于SIGIR2021。

如上图所示，推荐模型一般都包含两部分，一部分是参数embedding，一部分是MLP。两部分在数据和存储上有不同的特点。embedding参数量很大，计算量相对比较少。一般GPU的显存是明显不够去存embedding的，像上文提到的模型有几百个G，一张显卡如V100有32个G，还会去存很多运行态参数等数据，用它存embedding显然是不切实际的。第二部分MLP，它的参数量相对来说比较少，但计算量会相对比较大。训练MLP的话，使用CPU它的效率相对于GPU来说是低很多的。这里简单介绍了下推荐模型的一个训练的特点。

这里再简要提一下，为什么Embedding会大。这是因为推荐里面有很多的高维稀疏输入，什么是高纬稀疏呢，比如上图的例子，样本有三个域的特征，星期、性别和城市，因为它是离散的特征，所以它这里面只有某个位置会有值。这个例子中特征的维度都是比较低的，其实像用户或者是一些交叉特征，它的维度是会很高的，特征的量也是很大的，在推荐里面因为用了embedding，就是将高维稀疏的输入映射到了一个低维稠密的一个向量上，当我们稀疏的特征变得很大，大到几十亿甚至是几百亿上千亿规模之后，它的embedding的table也会变得很大。如上图右下部分，是快手去年发布的一个模型，比谷歌的一个超大模型还要大，这是因为它这里面embedding table里面有很多的特征，每个特征都有个embedding，导致规模会很大。

简要介绍下已有的几种并行训练的方法：

第一类是数据并行，例如基于all-reduce的Horovod，这种方式在每个GPU卡中存一份完整的模型副本，需要把模型都能存得下，我们模型如果变得大，GPU显存不足以存下完整模型，即使模型可以存得下，比方说有十几G几十G，基于这样一个大小的模型，它在做通信的时候，它的通信的时延很可能比它计算带来的时间的减少还要来得多，也就是说你增加节点不一定带来性能的一个提升。

第二类是NVIDIA提出的，之前他们的方案还是一个多卡切分的方案，但现在已经支持了一个CPU的embedding的一个存储，他们这个方法把embedding切成多份，然后在每个卡的显存里面存一部分，MLP在每个节点都存一个完整的模型。embeding通过一个all to all的通信， MLP通过all-reduce通信，这个方案有一个问题就是当它的模型很大时需要的GPU卡很多，从而它的成本也会很高。

第三类方法是使用CPU的内存来存embedding，然后用GPU来存MLP。CPU负责存储，MLP来负责前项以及反向的梯度的计算。对于这种方法，如果我们采用同步训练的话，它有一个问题就是因为embedding是存在CPU侧的，需要从CPU去传输到GPU，梯度需要从GPU回传到CPU，他们之间通信的时延是很高的。

针对这些问题华为就提出了自己的一个分布式训练的框架，叫做ScalefreeCTR，这个框架分成三个部分，第一个部分是有一个Host manager，它是用来负责embedding单元以及缓存的一个维护，另一个模块的话是dataloader，负责将数据从硬盘读到内存，以及做一些去重之类的操作，第三个部分是GPU worker，它负责从缓存里面去把对应的embedding取到，然后去做一个前向计算以及反向的训练，然后再将梯度更新到缓存的embedding中。这里由host-manager来负责embedding参数的下发，GPU缓存的维护，以及embedding参数的更新，因为有了缓存，所以我们可以做到数据读取，参数下发以及模型训练的三阶段的流水，尽可能的提升了资源的利用效率，从而提升了最终的吞吐。

如上所示是比较细节的图，这里可以看到embedding完整的存在了CPU侧。如果有多个节点的话，每个节点负责一部分embedding的存储，然后换Host-manager，它就负责绿色的缓存和embedding之间的交互，host-manager会根据当前的数据去做下一批的数据提前的下发，也就是说当下面的GPUworker完成了上一个batch训练之后，可以直接从缓存里面取到它下一个batch需要用到的参数，因而GPU相对来说利用率是比较高的，GPU之间的通信使用all-reduce的MLP的通信。

05 总结和展望

最后做个简单的总结，从做算法以及训练方法的角度有以下三个比较有意思的方向：

怎样去结合数据设计更好的模型，让模型更有针对性。如何进一步提升训练效率，包括怎样去利用更多的数据，以及增快模型迭代效率。怎样去增强数据处理、选择、模型调优的自动化的程度，从而解放业务或者算法同学，让他们更多地去关注模型数据、算法和策略。

今天的分享就到这里，谢谢大家。

本文首发于微信公众号“DataFunTalk”，欢迎转载分享，转载请留言或评论。

从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
ORACLE 11g 使用ROWNUM完美解决ORA-00600 内部错误代码有点智慧
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！1，ORA-00600：内部错误代码Oracle从11.2.0.1升级到11.2.0.4，开发人员报告说一个job运行失败，调试有报错信息，ORA-00600:内部错误代码，参数：[rwoirw:checkret
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
践行乡村支教，助力乡村振兴 bc1bd9748b57
在大数据时代，大量农村青年进城寻求机遇，在工资待遇环境各个方面追求改善，导致大批留守儿童与孤寡老人，教育环境差，师资力量薄弱，这些孩子的教育问题受到大众关注。同时，大学毕业生在求职时也更加倾向于留在大城市，发展较快的地方寻求更大的发展机遇。当然也不乏大学生回乡为新一代的成长奉献自己，通过支教或者直接就业的形式，为乡村孩子的成长奉献自己的力量。有一些有才华的人放弃自己在大城市继续深造的机会，专心于这
时序数据库：数据库领域的未来之星数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库时序数据库 ai
时序数据库：数据库领域的未来之星关键词：时序数据库、时间序列数据、物联网、大数据分析、数据库优化、TSDB、实时数据处理摘要：本文深入探讨了时序数据库(TimeSeriesDatabase,TSDB)这一新兴数据库技术。我们将从基本概念入手，分析时序数据库的核心原理和架构设计，详细讲解其特有的数据模型和存储机制。通过实际代码示例展示如何使用主流时序数据库处理时间序列数据，并探讨其在物联网、金融科技
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
关于线上技术学习的一点学习心得 GuangHui
我是**五期学员,和你分享一下我的学习心得,希望能够帮助到你.这是自己对于学习的思考和想法,因为我还在不断的学习和调整中,所以并不能说自己的所想都是正确的.我想即使我实现了成功的转行,也并不代表我说的我所选择的方式都是适合所有人的.每个人还需结合自己的实际情况,找到适合自己的最佳方法.我们一起努力.一.目标篇因为大数据需要学习的内容很多,所以学习过程中,一定要对进行定位,要做到有所取舍.针对自己的
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
贝融助手是什么？贝融助手是专业的大数据信用查询平台无忧达人
贝融助手是一个可以快速了解自己信用的工具，是一个生活中非常实用的小助手，信用是现在最重要的一个生活场景，人人都想有一个好的信用，贝融助手就是帮助我们查询自己信用的平台。贝融助手是一个非常专业的平台，贝融助手18年就上线了，到现在已经有很多年的历史了，在信用行业一直都是行业前三的平台，用户量也是非常的大，身边朋友都在用的平台。贝融助手查询入口放在文末了，划到文章结尾就可以看到查询入口贝融助手大数据信
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
从AWS MySQL数据库下载备份到S3的完整解决方案 AWS官方合作商数据库 aws mysql
本文将介绍两种主流方法将AWSRDSMySQL数据库备份下载到S3，适用于生产环境需求。方法一：通过RDS快照导出（AWS原生方案）适用场景：全量备份、大数据量、无需额外计算资源流程：创建数据库快照进入AWSRDS控制台→选择目标MySQL实例→点击"操作"→"拍摄快照"输入快照名称（如my-db-snapshot-2024）配置S3导出任务在RDS控制台左侧菜单选择快照→选择刚创建的快照点击"操
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
骗子太猖獗了，打着摩根士丹利何晓斌名义带股民进入虚假宝丰能源节能减排碳交易市场，大量股民被骗真相曝光墨守成法
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！这些新平台打着“低风险”、“高收益”、“慈善公益投票”等噱头先让投资人尝到甜头再通过恶意操作将投资人
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
碳中和碳交易骗局揭晓！第七届内部操盘群伍戈被骗黑幕曝光!血泪事迹令人惊心! 昌龙律法
如今大家生活好了，手里或多或少有点闲钱了。就开始想着怎么赚更多的钱！这也使得各种投资市场很火爆，无孔不入的骗子们又暗戳戳上线了，利用人们对赚钱的渴望，打着网络投资的旗号实施诈骗。随着“互联网+”的发展，万物皆可“数字经济”的“数字大数据”投资项目走入现实生活中。但是有不法分子就利用了这一“商机”，将数字投资变为新型找形式，并且利用洗脑话术，核心骗术仍然是高额返利，让人不知不觉掉进提前布局的“陷阱”
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
9.20其二道左无人
做一家服务公司，为下面的公司提供一些事务性的管理、财务管理、风险管理的服务，粘住一个大圈子的HR，通过下面的公司做掉项目，为HR提供一个稳定的资源变现的渠道；做一家科技公司，提供线上的平台运营，大数据采集，以及基于这个基础上的卖货、信贷等服务做一家连锁企业，每一家门店都是独立的企业，提供招聘、引流以及终端服务所以外部通过众筹绑定大批量的HR，就会有稳定的订单，通过服务公司提供服务，通过终端门店保证
黄仁勋链博会演讲实录：脱掉皮衣，穿上唐装，中文开场
黄仁勋一度尝试用中文开场，他说，“我在美国长大，学到了很多汉语。”他表示，像DeepSeek、阿里巴巴、MiniMax、百度，他们开发的产品都是世界级的，推动了全球人工智能的发展。中国的开源AI是全球进步的催化剂，以至于全世界各个行业都有机会加入到AI革命当中。7月16日，黄仁勋身着唐装出席了第三届链博会，在此之前，他身着标志性皮衣出席多个场合活动。在此之前，英伟达官宣获得H20芯片对华的出口许可
只靠可视化大屏，做不了数字化，数据总监总结3点，你做到了几个大数据的那些事
企业数字化是很多企业热衷的话题。本文的数字化指各行业头的头部企业的端到端数字化解决方案，常见部署于华为专有云、阿里私有云、亚马逊云，项目金额一般百万起步，上不封顶。很多企业投人、投钱数字化，都希望有个酷炫的数据大脑，政府、合作伙伴来参观时，用酷炫的数据大脑让来宾们啧啧称赞。热闹散去后，企业内部的各部门，天天围着数据挖宝，大数据快告诉我，下个月能卖多少，哪几个渠道卖得不好，哪条生产线有问题，哪些货压
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
【人工智能之深度学习】6. 卷积核工作原理：从边缘检测到特征抽象的逐层演进（附可视化工具与行业实战代码） AI_DL_CODE 人工智能深度学习卷积核特征提取卷积神经网络边缘检测特征可视化
摘要：卷积核是卷积神经网络（CNN）的核心组件，其通过局部感受野与参数共享机制实现高效特征提取。本文从数学本质出发，揭示卷积操作的空域-频域对偶性：空域卷积等价于频域乘积（F{f∗g}=F{f}⋅F{g}F\{f*g\}=F\{f\}⋅F\{g\}F{f∗g}=F{f}⋅F{g}），解释边缘检测核（Sobel、Laplacian）的频域响应特性。通过特征可视化实验表明，CNN特征呈现逐层抽象规律：
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
【大模型】结构化提示词：让AI高效完成复杂任务的“编程语言” JosieBook AI/大数据/云计算人工智能
文章目录前言：提示词一、不同提示词写作方法对比进阶技巧对比表实战组合策略二、三板斧：精准撰写提示词的黄金法则角色设定：为AI精准定位任务描述：明确行动指南输出要求：规范成果呈现三、魔法棒：零基础也能用的“AI需求翻译机”四、结构化：把提示词写成“可插拔的乐高”五、分治法：把“庞然大物”拆成可并行的小任务前言：提示词在人工智能时代，提示词（Prompt）已成为连接人类意图与AI能力的核心媒介。优质的
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam