坚持669

盘点前深度学习时代阿里、谷歌、Facebook的CTR预估模型

\u003cblockquote\u003e\n\u003cp\u003e本文是王喆在 AI 前线开设的原创技术专栏“深度学习 CTR 预估模型实践”的第三篇文章（以下“深度学习 CTR 预估模型实践”简称“深度 CTR 模型”）。回顾王喆老师过往精彩文章：\u003ca href=\"https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==\u0026amp;mid=2247494669\u0026amp;idx=2\u0026amp;sn=b1ca666f647373b0de4be5da388e53bc\u0026amp;chksm=fbea55c2cc9ddcd4f909dd2ea65102d9e0637857dac813d35f71229d0c897a435077c987418f\u0026amp;scene=21#wechat_redirect\"\u003e《重读 Youtube 深度学习推荐系统论文，字字珠玑，惊为神文》\u003c/a\u003e、\u003ca href=\"https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==\u0026amp;mid=2247494791\u0026amp;idx=2\u0026amp;sn=643df72a5116807136e07a82db83b9cd\u0026amp;chksm=fbea5548cc9ddc5e07baffe20d23003227371c9a8f2dd515e60345a9f1775d079082bcbf2976\u0026amp;scene=21#wechat_redirect\"\u003e《YouTube 深度学习推荐系统的十大工程问题》\u003c/a\u003e。\u003c/p\u003e\n\u003c/blockquote\u003e\n\u003cp\u003e在上篇专栏文章\u003ca href=\"https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==\u0026amp;mid=2247495766\u0026amp;idx=2\u0026amp;sn=edc5f01d009b8bdbd7de9d9023a7c7d6\u0026amp;chksm=fbea4999cc9dc08fd342fd313cc703cc822e244d713db4aa11532e26d5c2d92f54f572e9b705\u0026amp;token=67592734\u0026amp;lang=zh_CN#rd\"\u003e《前深度学习时代CTR预估模型的演化之路——从LR到FFM》\u003c/a\u003e中，我们沿着特征交叉这条发展路线，回顾了从LR到POLY2，FM，再到FFM的CTR模型演化过程。但任何问题的观察角度都不是唯一的，CTR模型更是如此，本文将继续探索前深度学习时代的CTR模型，从特征工程模型化的角度回顾Facebook的CTR模型——GBDT+LR，从时效性的角度学习Google是如何使用FTRL解决模型online learning问题的，最后从样本聚类的动机出发介绍阿里的LS-PLM CTR模型。\u003c/p\u003e\n\u003cp\u003e在介绍细节之前，我们再次回到前深度学习时代的CTR模型关系图，熟悉各个模型在演化过程中的位置，其中黄色的部分是上篇专栏文章介绍的模型，蓝色部分将是这篇文章的主要内容。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1d84883.png\" alt=\"image\" title=\"传统CTR模型演化关系图\" /\u003e\u003c/p\u003e\n\u003ccenter\u003e传统CTR模型演化关系图\u003c/center\u003e\n\u003ch3\u003eGBDT+LR——特征工程模型化的开端\u003c/h3\u003e\n\u003cp\u003e上篇文章介绍的FFM模型采用引入特征域的方式增强了模型的表达能力，但无论如何，FFM只能够做二阶的特征交叉，如果要继续提高特征交叉的维度，不可避免的会发生组合爆炸和计算复杂度过高的情况。那么有没有其他的方法可以有效的处理高维特征组合和筛选的问题？2014年，Facebook提出了基于GBDT+LR组合模型的解决方案。\u003c/p\u003e\n\u003cp\u003e简而言之，Facebook提出了一种利用GBDT自动进行特征筛选和组合，进而生成新的离散特征向量，再把该特征向量当作LR模型输入，预估CTR的模型结构。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1a43eff.png\" alt=\"image\" title=\"GBDT+LR的模型结构\" /\u003e\u003c/p\u003e\n\u003ccenter\u003eGBDT+LR的模型结构\u003c/center\u003e\n\u003cp\u003e需要强调的是，用GBDT构建特征工程，和利用LR预估CTR两步是独立训练的。所以自然不存在如何将LR的梯度回传到GBDT这类复杂的问题，而利用LR预估CTR的过程在上篇文章中已经有所介绍，在此不再赘述，下面着重讲解如何利用GBDT构建新的特征向量。\u003c/p\u003e\n\u003cp\u003e大家知道，GBDT是由多棵回归树组成的树林，后一棵树利用前面树林的结果与真实结果的残差做为拟合目标。每棵树生成的过程是一棵标准的回归树生成过程，因此每个节点的分裂是一个自然的特征选择的过程，而多层节点的结构自然进行了有效的特征组合，也就非常高效的解决了过去非常棘手的特征选择和特征组合的问题。\u003c/p\u003e\n\u003cp\u003e利用训练集训练好GBDT模型之后，就可以利用该模型完成从原始特征向量到新的离散型特征向量的转化。具体过程是这样的，一个训练样本在输入GBDT的某一子树后，会根据每个节点的规则最终落入某一叶子节点，那么我们把该叶子节点置为1，其他叶子节点置为0，所有叶子节点组成的向量即形成了该棵树的特征向量，把GBDT所有子树的特征向量连接起来，即形成了后续LR输入的特征向量。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1ad4ceb.png\" alt=\"image\" title=\"GBDT生成特征向量的过程\" /\u003e\u003c/p\u003e\n\u003ccenter\u003eGBDT生成特征向量的过程\u003c/center\u003e\n\u003cp\u003e举例来说，如上图所示，GBDT由三颗子树构成，每个子树有4个叶子节点，一个训练样本进来后，先后落入“子树1”的第3个叶节点中，那么特征向量就是[0,0,1,0]，“子树2”的第1个叶节点，特征向量为[1,0,0,0]，“子树3”的第4个叶节点，特征向量为[0,0,0,1]，最后连接所有特征向量，形成最终的特征向量[0,0,1,0,1,0,0,0,0,0,0,1]。\u003c/p\u003e\n\u003cp\u003e由于决策树的结构特点，事实上，决策树的深度就决定了特征交叉的维度。如果决策树的深度为4，通过三次节点分裂，最终的叶节点实际上是进行了3阶特征组合后的结果，如此强的特征组合能力显然是FM系的模型不具备的。但由于GBDT容易产生过拟合，以及GBDT这种特征转换方式实际上丢失了大量特征的数值信息，因此我们不能简单说GBDT由于特征交叉的能力更强，效果就比FFM好，在模型的选择和调试上，永远都是多种因素综合作用的结果。\u003c/p\u003e\n\u003cp\u003eGBDT+LR比FM重要的意义在于，它大大推进了特征工程模型化这一重要趋势，某种意义上来说，之后深度学习的各类网络结构，以及embedding技术的应用，都是这一趋势的延续。\u003c/p\u003e\n\u003cp\u003e在之前所有的模型演化过程中，实际上是从特征工程这一角度来推演的。接下来，我们从时效性这个角度出发，看一看模型的更新频率是如何影响模型效果的。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1b78e4b.png\" alt=\"image\" title=\"模型实效性实验\" /\u003e\u003c/p\u003e\n\u003ccenter\u003e模型实效性实验\u003c/center\u003e\n\u003cp\u003e在模型更新这个问题上，我们的直觉是模型的训练时间和serving时间之间的间隔越短，模型的效果越好，为了证明这一点，facebook的工程师还是做了一组实效性的实验（如上图），在结束模型的训练之后，观察了其后6天的模型loss（这里采用normalized entropy作为loss）。可以看出，模型的loss在第0天之后就有所上升，特别是第2天过后显著上升。因此daily update的模型相比weekly update的模型效果肯定是有大幅提升的。\u003c/p\u003e\n\u003cp\u003e如果说日更新的模型比周更新的模型的效果提升显著，我们有没有方法实时引入模型的效果反馈数据，做到模型的实时更新从而进一步提升CTR模型的效果呢？Google 2013年应用的FTRL给了我们答案。\u003c/p\u003e\n\u003ch3\u003eFTRL——天下武功，唯快不破\u003c/h3\u003e\n\u003cp\u003eFTRL的全称是Follow-the-regularized-Leader，是一种在线实时训练模型的方法，Google在2010年提出了FTRL的思路，2013年实现了FTRL的工程化，之后快速成为online learning的主流方法。与模型演化图中的其他模型不同，FTRL本质上是模型的训练方法。虽然Google的工程化方案是针对LR模型的，但理论上FTRL可以应用在FM，NN等任何通过梯度下降训练的模型上。\u003c/p\u003e\n\u003cp\u003e为了更清楚的认识FTRL，这里对梯度下降方法做一个简要的介绍。从训练样本的规模角度来说，梯度下降可以分为：batch，mini-batch，SGD（随机梯度下降）三种，batch方法每次都使用全量训练样本计算本次迭代的梯度方向，mini-batch使用一小部分样本进行迭代，而SGD每次只利用一个样本计算梯度。对于online learning来说，为了进行实时得将最新产生的样本反馈到模型中，SGD无疑是最合适的训练方式。\u003c/p\u003e\n\u003cp\u003e但SGD对于互利网广告和推荐的场景来说，有比较大的缺陷，就是难以产生稀疏解。为什么稀疏解对于CTR模型如此重要呢？\u003c/p\u003e\n\u003cp\u003e之前我们已经多次强调，由于one hot等id类特征处理方法导致广告和推荐场景下的样本特征向量极度稀疏，维度极高，动辄达到百万、千万量级。为了不割裂特征选择和模型训练两个步骤，如果能够在保证精度的前提下尽可能多的让模型的参数权重为0，那么我们就可以自动过滤掉这些权重为0的特征，生成一个“轻量级”的模型。“轻量级”的模型不仅会使样本部署的成本大大降低，而且可以极大降低模型inference的计算延迟。这就是模型稀疏性的重要之处。\u003c/p\u003e\n\u003cp\u003e而SGD由于每次迭代只选取一个样本，梯度下降的方向虽然总体朝向全局最优解，但微观上的运动的过程呈现布朗运动的形式，这就导致SGD会使几乎所有特征的权重非零。即使加入L1正则化项，由于CPU浮点运算的结果很难精确的得到0的结果，也不会完全解决SGD稀疏性差的问题。就是在这样的前提下，FTRL几乎完美地解决了模型精度和模型稀疏性兼顾的训练问题。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1e19718.png\" alt=\"image\" title=\"FTRL的发展过程\" /\u003e\u003c/p\u003e\n\u003ccenter\u003eFTRL的发展过程\u003c/center\u003e\n\u003cp\u003e但FTRL的提出也并不是一蹴而就的。如上图所示，FTRL的提出经历了下面几个关键的过程：\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003e\n\u003cp\u003e从最近简单的SGD到OGD（online gradient descent），OGD通过引入L1正则化简单解决稀疏性问题；\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e从OGD到截断梯度法，通过暴力截断小数值梯度的方法保证模型的稀疏性，但损失了梯度下降的效率和精度；\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003eFOBOS（Forward-Backward Splitting），google和伯克利对OGD做进一步改进，09年提出了保证精度并兼顾稀疏性的FOBOS方法；\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003eRDA：微软抛弃了梯度下降这条路，独辟蹊径提出了正则对偶平均来进行online learning的方法，其特点是稀疏性极佳，但损失了部分精度。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003eGoogle综合FOBOS在精度上的优势和RDA在稀疏性上的优势，将二者的形式进行了进一步统一，提出并应用FTRL，使FOBOS和RDA均成为了FTRL在特定条件下的特殊形式。\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003eFTRL的算法细节对于初学者来说仍然是晦涩的，建议非专业的同学仅了解其特点和应用场景即可。对算法的数学形式和实现细节感兴趣的同学，我强烈推荐微博冯扬写的“在线最优化求解”一文，希望能够帮助大家进一步熟悉FTRL的技术细节。\u003c/p\u003e\n\u003ch3\u003eLS-PLM——阿里曾经的主流CTR模型\u003c/h3\u003e\n\u003cp\u003e本文的第三个模型，我们从样本pattern本身来入手，介绍阿里的的LS-PLM（Large Scale Piece-wise Linear Model），它的另一个更广为人知的名字是MLR（Mixed Logistic Regression）。MLR模型虽然在2017年才公之于众，但其早在2012年就是阿里主流的CTR模型，并且在深度学习模型提出之前长时间应用于阿里的各类广告场景。\u003c/p\u003e\n\u003cp\u003e本质上，MLR可以看做是对LR的自然推广，它在LR的基础上采用分而治之的思路，先对样本进行分片，再在样本分片中应用LR进行CTR预估。在LR的基础上加入聚类的思想，其动机其实来源于对计算广告领域样本特点的观察。\u003c/p\u003e\n\u003cp\u003e举例来说，如果CTR模型要预估的是女性受众点击女装广告的CTR，显然我们并不希望把男性用户点击数码类产品的样本数据也考虑进来，因为这样的样本不仅对于女性购买女装这样的广告场景毫无相关性，甚至会在模型训练过程中扰乱相关特征的权重。为了让CTR模型对不同用户群体，不用用户场景更有针对性，其实理想的方法是先对全量样本进行聚类，再对每个分类施以LR模型进行CTR预估。MLR的实现思路就是由该动机产生的。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d20d5530.png\" alt=\"image\" /\u003e\u003c/p\u003e\n\u003cp\u003eMLR目标函数的数学形式如上式，首先用聚类函数π对样本进行分类（这里的π采用了softmax函数，对样本进行多分类），再用LR模型计算样本在分片中具体的CTR，然后将二者进行相乘后加和。\u003c/p\u003e\n\u003cp\u003e其中超参数分片数m可以较好地平衡模型的拟合与推广能力。当m=1时MLR就退化为普通的LR，m越大模型的拟合能力越强，但是模型参数规模随m线性增长，相应所需的训练样本也随之增长。在实践中，阿里给出了m的经验值为12。\u003c/p\u003e\n\u003cp\u003e下图中MLR模型用4个分片可以完美地拟合出数据中的菱形分类面。\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c9f8d1c44bba.png\" alt=\"image\" /\u003e\u003c/p\u003e\n\u003cp\u003eMLR算法适合于工业级的广告、推荐等大规模稀疏数据场景问题。主要是由于表达能力强、稀疏性高等两个优势：\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003e\n\u003cp\u003e端到端的非线性学习：从模型端自动挖掘数据中蕴藏的非线性模式，省去了大量的人工特征设计，这使得MLR算法可以端到端地完成训练，在不同场景中的迁移和应用非常轻松。\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e稀疏性：MLR在建模时引入了L1和L2,1范数，可以使得最终训练出来的模型具有较高的稀疏度，模型的学习和在线预测性能更好。\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003cp\u003e如果我们用深度学习的眼光来看待MLR这个模型，其在结构上已经很接近由输入层、单隐层、输出层组成的神经网络。所以某种意义上说，MLR也在用自己的方式逐渐逼近深度学习的大门了。\u003c/p\u003e\n\u003ch3\u003e深度学习CTR模型的前夜\u003c/h3\u003e\n\u003cp\u003e2010年FM被提出，特征交叉的概念被引入CTR模型；2012年MLR在阿里大规模应用，其结构十分接近三层神经网络；2014年Facebook用GBDT处理特征，揭开了特征工程模型化的篇章。这些概念都将在深度学习CTR模型中继续应用，持续发光。\u003c/p\u003e\n\u003cp\u003e另一边，Alex Krizhevsky 2012年提出了引爆整个深度学习浪潮的AlexNet，深度学习的大幕正式拉开，其应用逐渐从图像扩展到语音，再到NLP领域，推荐和广告也必然会紧随其后，投入深度学习的大潮之中。\u003c/p\u003e\n\u003cp\u003e2016年，随着FNN、Deep\u0026amp;Wide、Deep crossing等一大批优秀的CTR模型框架的提出，深度学习CTR模型逐渐席卷了推荐和广告领域，成为新一代CTR模型当之无愧的主流。下一篇文章，我们将继续探讨深度学习CTR模型，从模型演化的角度揭开所有主流深度学习CTR模型之间的关系和每个模型的特点，期待继续与你一同学习讨论。\u003c/p\u003e\n\u003cp\u003e\u003cstrong\u003e《深度学习 CTR 预估模型实践》专栏内容回顾：\u003c/strong\u003e\u003c/p\u003e\n\u003col\u003e\n\u003cli\u003e\n\u003cp\u003e\u003ca href=\"https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==\u0026amp;mid=2247495560\u0026amp;idx=2\u0026amp;sn=094e3a79085898ce881f64e6232fcdd6\u0026amp;chksm=fbea5647cc9ddf5180be52c2e26f08a4c3f7d5ca0f45f0e72bfbe80db69b73853b8c737ea187\u0026amp;token=1198573375\u0026amp;lang=zh_CN\u0026amp;scene=21#wechat_redirect\"\u003e深度学习 CTR 预估模型凭什么成为互联网增长的关键？\u003c/a\u003e\u003c/p\u003e\n\u003c/li\u003e\n\u003cli\u003e\n\u003cp\u003e\u003ca href=\"https://mp.weixin.qq.com/s?__biz=MzU1NDA4NjU2MA==\u0026amp;mid=2247495766\u0026amp;idx=2\u0026amp;sn=edc5f01d009b8bdbd7de9d9023a7c7d6\u0026amp;chksm=fbea4999cc9dc08fd342fd313cc703cc822e244d713db4aa11532e26d5c2d92f54f572e9b705\u0026amp;token=67592734\u0026amp;lang=zh_CN#rd\"\u003e前深度学习时代CTR预估模型的演化之路——从LR到FFM\u003c/a\u003e\u003c/p\u003e\n\u003c/li\u003e\n\u003c/ol\u003e\n\u003ch2\u003e作者介绍\u003c/h2\u003e\n\u003cp\u003e王喆，毕业于清华大学计算机系，现在美国最大的smartTV公司Roku任 senior machine learning engineer，曾任hulu senior research SDE，7年计算广告、推荐系统领域业界经验，相关专利3项，论文7篇，《机器学习实践指南》、《百面机器学习》作者之一。知乎专栏/微信公众号：王喆的机器学习笔记。\u003c/p\u003e\n\u003cp\u003e更多内容，请关注AI前线\u003c/p\u003e\n\u003cp\u003e\u003cimg src=\"https://static.geekbang.org/infoq/5c6947ecc1649.png\" alt=\"image\" /\u003e\u003c/p\u003e\n

Xcode26新特性与iOS26适配指南 BianHuanShiZhe ios mac
Xcode26新特性在WWDC25上Apple推出了Xcode26，相比较Xcode16，它有如下的变化。项目安装包更小，其他组件与工具链只有在需要时才会下载。设置界面重新设计，菜单从顶部挪到了左侧，其中Accounts改名为AppleAccounts，TextEditing改名为Editing，KeyBindings改名为Shortcuts，同时增加了菜单Notifications。模拟器运行时
浅谈qt界面开发 xzdjsnb qt 开发语言
一，首先理解什么mainwindow与widget区别。下面根据百度大家自己看看`QMainWindow`和`QWidget`是Qt中常用的两个类，它们之间有一些重要的区别和关系：1.**区别**：-**QMainWindow**：-`QMainWindow`是用于创建应用程序主窗口的类，通常包含菜单栏、工具栏、状态栏和中央部件。-用于创建具有多个子窗口或文档视图的应用程序，负责应用程序的整体框架
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
PettingZoo:多智能体强化学习的标准API 资源存储库多智能体强化学习人工智能深度学习
PettingZoo:AStandardAPIforMulti-AgentReinforcementLearningPettingZoo:多智能体强化学习的标准API目录Abstract摘要1Introduction1介绍2BackgroundandRelatedWorks2背景及相关工作2.1PartiallyObservableStochasticGamesandRLlib2.1部分可观察随机
浅谈Qt和C++的关系 Terrarily qt5 qt c++
Qt和C++Qt是QML和JavaScript的C++扩展功能工具包，并且Qt是由C++开发的，所以C++贯穿了整个Qt的项目。我会着重从c++的角度来介绍Qt。从C++的角度分析Qt，然后你会发现Qt通过内省数据的机制实现了许多现代语言的特性。这个是通过Qt的基础类QObject来实现的。Qt使用源对象信息实现了信号和槽的回调绑定。每个信号都能绑定任意数量的槽函数或者其他的信号。当一个信号弄一个
构建LangChain应用程序的示例代码：63、如何使用Petting Zoo库定义和运行多智能体模拟环境 Hugo_Hoo langchain 人工智能 AI编程
多智能体模拟环境:PettingZoo在这个例子中，我们展示如何使用模拟环境定义多智能体模拟。与我们的单智能体Gymnasium示例类似，我们创建了一个具有外部定义环境的智能体-环境循环。主要区别在于我们现在使用多个智能体实现这种交互循环。我们将使用PettingZoo库，它是Gymnasium的多智能体对应版本。安装pettingzoo和其他依赖!pipinstallpettingzoopyga
Qt设置窗口置顶（避免窗口隐藏）空名Noname qt
转自个人博客方法一说在前面：本方法比较通用，但经过我的使用，发现其存在问题，而下面方法二正常使用存在问题：在窗口置顶后，会自动隐藏，即便在设置窗口置顶后手动对窗口使用show()或setVisible(true)等方法显示出来，也会出现窗口闪烁的现象，极不自然。对你的主窗口QMainWindow或者主控件QWidget使用以下方法，都是Qt自带的。窗口置顶也是一个标志，先获取窗口已有的所有标志，再
C++使用大小括号初始化变量空名Noname c++开发语言
转自个人博客本文对普通变量、普通类对象在初始化时使用()和{}的情况进行区分说明，以免混淆不清。一般使用()是使用构造函数初始化，使用{}是使用列表初始化，如下。1.基本初始化（略过）这里大概对基本初始化方式做一个归纳1.1默认初始化即只声明，让其调用默认构造函数。对于基本变量类型（如int、double…），只声明就不会定义具体的初始值。对于类对象，就会调用可以不用填参数的默认构造函数，如果没有
从入门到精通：进程信号每天进步亿丢丢 Linux学习服务器网络 linux c++
引言在操作系统的世界里，信号是一种用于进程间通信和控制的重要机制。信号能够在不同的进程之间传递异步事件，通知进程发生了某种情况。在Linux系统中，信号的使用是非常普遍且重要的，尤其是在处理进程控制、异常处理和进程间通信时。本文将带你深入了解Linux系统中的信号机制，从基本概念到高级应用，全面覆盖信号的生成、阻塞、捕捉和处理。通过对信号的深入理解和实际操作，你将能够更好地控制和管理进程，提高程序
操作系统基本概念与进程管理：从入门到精通阿贾克斯的黎明软考软考
目录操作系统基本概念与进程管理：从入门到精通一、常见操作系统与计算机系统层次结构二、操作系统的概念、功能与特征三、操作系统的发展与分类四、进程管理（一）进程的状态与状态转换（二）前驱图（三）进程同步与互斥机制（四）信号量机制与PV操作（五）PV操作实现前驱关系（六）死锁（七）银行家算法在计算机的世界里，操作系统就像是一位幕后的“大管家”，默默管理着计算机的各种资源，协调着各种程序的运行。今天，咱们
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
Java-Matcher类 Lowjin_ Java 开发语言 java
Matcher类是Java正则表达式API的核心组件之一（位于java.util.regex包），用于执行复杂的字符串匹配操作。它与Pattern类配合使用，提供查找、替换、分组提取等功能。1.Matcher类的作用对输入字符串执行匹配操作（查找、替换等）支持分组提取（通过()捕获的子表达式）提供位置信息（匹配的起始和结束索引）支持多次匹配和重置2.创建Matcher对象Matcher对象必须通过
Java-Scanner类 Lowjin_ Java 开发语言 java
Scanner是Java中一个实用的文本扫描工具类（位于java.util包），主要用于从输入流（如键盘、文件或字符串）中解析基本数据类型和字符串。它通过正则表达式将输入分解为标记（tokens），并提供了多种方法来读取和转换这些标记。1.Scanner的核心功能功能说明读取输入从键盘、文件、字符串等来源读取数据。按类型解析自动将输入的文本转换为int、double、String等类型。分隔符控制
【HarmonyOS next】ArkUI-X休闲娱乐搞笑日历【基础】 harmonyos-next
引言在跨平台应用开发中，网络图片在不同设备上的适配展示是常见挑战。本文将基于HarmonyOSnext的ArkUI-X框架，通过一个休闲娱乐日历应用，展示如何实现网络图片在华为和iOS设备上的完美适配。应用每日通过API获取搞笑日历图片，并在不同设备上智能适配显示。开发环境操作系统：macOS开发工具：DevEcoStudio5.0.4测试设备：华为Nova12Ultra、iPhone13Pro开
【HarmonyOS next】ArkUI-X休闲益智记忆翻牌【进阶】 harmonyos-next
本文通过记忆翻牌游戏实现，揭秘网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于ArkUI-X的Web组件技术，我们实现了一套代码双端运行的混合架构。一、跨平台实现架构//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:web_webvie
【HarmonyOS Next】ArkUI-X休闲益智接水果【进阶】 harmonyos-next
本文通过ArkUI-X实现跨平台接水果游戏，深入探究网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于WebView的混合架构，我们实现了单代码库双端适配的高效开发模式。一、跨平台架构设计//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:
C++学习笔记.2 Lowjin_ C++c++学习笔记
类和对象封装语法：class关键字{访问权限属性行为}#includeusingnamespacestd;constdoublepi=3.14;//设计一个圆类classcircle{//访问权限//公共权限public://属性intr;//行为doublec(){return2*pi*r;}};intmain(){//通过圆类创建具体的圆（对象）circlec1;c1.r=10;cout#in
unity如何让一个物体拥有按钮功能 Lowjin_ unity unity 游戏引擎
在Unity中，要让一个物体（例如一个3D模型、UI元素或其他对象）变成一个按钮，你需要为它添加交互功能。这通常意味着让物体能够响应点击事件，像UI按钮那样触发某些行为。对于3D物体，可以通过射线检测（Raycast）来处理点击交互，而对于UI元素，则直接使用Unity的UIButton组件。这里提供几种常见的方式来让物体变成按钮：方法1：让一个3D物体（例如模型）变成按钮如果你有一个3D物体，并
如何判断同一以太网交换机下的主机能否互相访问 Lowjin_ 网络计算机网络
1.同一广播域以太网交换机是工作在数据链路层（Layer2）的设备，它根据MAC地址转发数据帧。当两台主机连接到同一台交换机时，它们通常处于同一个广播域。在同一广播域内，主机之间可以直接通过MAC地址进行通信，交换机会将数据帧转发到目标主机的端口。判断标准：物理连接：如果两台主机连接到同一台交换机的端口，并且这些端口没有进行VLAN划分或被隔离，它们就位于同一个广播域。广播通信：在同一广播域内，广
Java-内部类 Lowjin_ java 开发语言
一、内部类的基本概念1.什么是内部类内部类（InnerClass）是定义在另一个类内部的类。它可以访问外部类的所有成员，包括私有成员。2.内部类的分类成员内部类（MemberInnerClass）静态内部类（StaticNestedClass）局部内部类（LocalInnerClass）匿名内部类（AnonymousInnerClass）二、成员内部类1.定义方式classOuter{privat
假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢？ Lowjin_ leetCode算法练习算法 c++学习笔记
示例1：输入：n=2输出：2解释：有两种方法可以爬到楼顶。1.1阶+1阶2.2阶示例2：输入：n=3输出：3解释：有三种方法可以爬到楼顶。1.1阶+1阶+1阶2.1阶+2阶3.2阶+1阶提示：1<=n<=45本题大家如果没有接触过的话，会感觉比较难，多举几个例子，就可以发现其规律。爬到第一层楼梯有一种方法，爬到二层楼梯有两种方法。那么第一层楼梯再跨两步就到第三层，第二层楼梯再跨一步就到第三层。所以
【SQL学习笔记4】case when 和if的用法你一定能成为你想要成为的人 SQL学习笔记 mysql sql 数据库
1.case用法--用法一：casewhen条件1then字段取值1when条件2then字段取值2when条件3then字段取值3else字段取值4--如果上述全部不满足，则执行end--用法二：case字段名when取值1then字段取值1when取值2then字段取值2when取值3then字段取值3else字段取值4--如果上述全部不满足，则执行end2.if用法if(条件,取值1,取值2
【HarmonyOS next】ArkUI-X休闲益智儿童拼图【进阶】 harmonyos-next
【HarmonyOSnext】ArkUI-X休闲益智儿童拼图【进阶】一、前言：当拼图遇上跨端开发最近在开发一款跨平台的儿童拼图游戏时，我深刻体会到了ArkUI-X框架的威力——同一套代码竟能同时在华为Mate60Pro和iPhone15上流畅运行！这不仅节省了开发成本，更重要的是确保了多端用户体验的一致性。今天我们就来聊聊这个项目的核心技术点，特别是拖动坐标计算和图片剪影生成这两个让人"又爱又恨"
【鸿蒙开发】响应式设计 harmonyos-next
前言响应式设计（ResponsiveWebDesign，简称RWD）在Web网站设计领域是一种网页设计方法论，旨在让网站在不同设备和屏幕尺寸上都能提供良好的阅读和交互体验，而无需为每一个新设备或屏幕尺寸创建单独的版本。这种设计方法的核心在于页面布局和内容可以根据用户所使用的设备特性（如屏幕尺寸、分辨率、方向等）进行灵活调整。实现断点响应式布局中最常使用的特征是窗口宽度及窗口高宽比，可以将窗口宽度及
鸿蒙关系型数据库实战：高效数据存储与管理数据库harmonyos
在鸿蒙应用开发中，关系型数据库（RDB）是结构化数据存储的核心方案。通过深度实践，其基于SQLite的轻量级实现不仅性能出色，更提供了强大的事务支持和类型安全。以下是关键经验总结：三大核心优势：SQL兼容：完整支持SQL92标准语法线程安全：内置多线程读写锁机制加密存储：支持AES-256加密敏感数据关系型数据库实战封装及使用：在Utils目录下新建一个RdbUtils文件//./src/main
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查
HarmonyOSNext应用无响应全解析：从机制到实战的卡死问题排查\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。喂喂喂！应用卡成PPT了？点啥都没反应？别慌！这是你的应用无响应急救指南！系统检测到应用卡死后会生成appfreeze日志，本文手把手教你从日志里挖出元凶！先划重点！本文使用范围//仅适用于Stage模型！看日志前请确
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！
HarmonyOSNext华为账号一键登录：3秒完成登录的黑科技！\##HarmonyOSNext##ArkTs##教育本文适用于教育科普行业进行学习，有错误之处请指出我会修改。你以为登录只能输手机号+验证码？NO！华为账号一键登录直接让你「点击即登录」，彻底告别手动输入！基于OAuth2.0和OpenIDConnect协议构建，它让开发者秒级获取用户的身份标识UnionID+真实手机号，快速搭建
docker网络_docker之间的网络协议 2401_89224733 网络 docker 网络协议
一、docker网络模式docker0网络docker容器的虚拟网关loopback:回环网卡、TCP/IP网卡virtualbridge:linux自身继承了一个虚拟化功能(kvm架构)，是原生架构的一个虚拟化平台，安装了一个虚拟化平台之后就会系统就会自动安装虚拟网卡。安装workstation(虚拟化平台)之后，会在网络适配器中会多出VMnet1VMnet8VMnet0)docker0:容器的
反射&枚举&以及lambda表达式观音山保我别报错 java 开发语言
反射,Java代码中,让一个对象,认识到自己,也叫做"自省"自己清楚的认识自己谁是最认识对象的??程序员程序员是非常清楚,某个对象是属于哪个类的这个对象里面有哪些属性(属性的名字,类型,private/public,其他的修饰符注解之类的)这个对象里有哪些方法(方法的名字,参数列表,private/public)这个类的父类是谁这个类实现了接口有哪些这些东西程序员只需要看看代码,就知道这些事情了程
浅拷贝 ... 的作用徐福记c 开发脚手架 python
浅拷贝在编程和软件开发中有重要的意义，尤其是在处理数据和对象时。以下是浅拷贝的主要意义：1.数据安全和隔离浅拷贝可以创建一个新对象，这个新对象包含原对象属性值的副本。对于基本数据类型（如数字、字符串等），浅拷贝会直接复制其值，而对于引用数据类型（如对象、数组等），它会复制引用地址。在修改新对象时，不会直接修改原对象的值（对于基本数据类型），从而保证了原数据的安全性。例如：在表格编辑场景中，通过浅拷
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

盘点前深度学习时代阿里、谷歌、Facebook的CTR预估模型

你可能感兴趣的:(盘点前深度学习时代阿里、谷歌、Facebook的CTR预估模型)