智源社区

智源青年科学家袁洋：机器学习可靠性与算法优化的方法探索

2020年2月11日，在“智源论坛Live | 青年科学家线上报告会”上，智源青年科学家、清华大学助理教授袁洋作了题为《机器学习可靠性与算法优化》的演讲。袁洋，2018 年获得康奈尔大学计算机专业博士学位，在机器学习理论与算法设计方面取得了突出成果。他参与合作的关于SGD 逃离鞍点的论文是机器学习理论顶级会议COLT 最近5 年来被引用次数最多的论文，并独立证明了第一个满足严格鞍点性质的函数，即张量分解问题；此外，袁洋还与他人合作给出了第一篇SGD 在非线性网络的收敛性分析。

本次讲座，袁洋主要从三大研究方向:机器学习理论、机器学习可靠性、机器学习与算法优化为大家做了精彩的阐述。在机器学习理论方向，袁洋和大家分享了随机梯度下降法（SGD）的理论分析和神经网络收敛性分析的一些结果；在机器学习可靠性方向，袁洋主要的工作和本次的分享主要集中在对抗样本和鲁棒性的研究；对于机器学习与算法优化方向，他认为虽然这其实是两个方向的结合，但是二者是互相帮助的，我们可以用算法、用理论的方式，来解决机器学习的一些问题，同时也可以用机器学习的技术来改进已有的传统算法获得更好的效果。

整理：钱小鹅

编辑：王炜强

机器学习理论

机器学习理论的基础分为三个方面，表达能力理论（Representation）、优化理论（Optimization）、泛化理论（Generalization），这三个方向目前都有很多很有意义的研究，袁洋的主要方向是优化理论，也会涉及一点泛化理论的内容。本次讲座，我们主要介绍给大家SGD方法的一些性质，重点是SGD逃离鞍点的工作，也会谈及SGD逃离局部最优点分析、两层神经网络收敛性分析以及对未来的研究构想，下面我们从这四个方向分别为大家整理说明。

SGD逃离鞍点[Ge, Jin, Huang, Yuan, COLT’15]

深度学习从某种角度看，可分成两个步骤：第一步，针对具体一个问题来设计好的网络结构，使得这个网络结构能对应解决我们要解决的问题；第二步，考虑使用随机梯度下降法（SGD）或者其变体进行优化。例如：在机器视觉领域，包括图像分类、风格迁移等，我们首先设计好的卷积网络结构，接着使用SGD去做数值优化；Alphago围棋对决，也是使用强化学习、卷积网络以及蒙特卡洛树搜索后使用SGD做优化；同样自然语言处理中一般是Transformer网络和SGD的组合算法。因此，袁洋认为机器学习如同一列很长的列车，卷积网络、强化学习等各种不同的算法可以看成是一节节不同的车厢，而SGD优化方法，如同整个火车的引擎，最终拖着不同的算法达到最后目的地，因此深刻理解SGD是非常重要的。

图1：SGD在机器学习中如同引擎

首先，我们介绍SGD的“祖师爷”-GD，也就是所谓的梯度下降法。在机器学习中，梯度下降的目标是优化一个损失函数L，数学表达式即为：

优化方法是简单的迭代：

图2: 梯度下降法

如图2所示，迭代函数是个二维函数，从随机点做梯度下降的话，如果每一步都选择函数的严格梯度，逐步迭代后最终会找到函数的全局最优点。虽然GD算法的理论知识非常简单，图示也很直观，但是却有两个局限性：

1.（从应用角度来看）计算

非常慢：需要扫遍所有数据；如果数据很多，就会很慢。

2.（从理论角度来看）可能会卡在稳定点（导数为0的点）上，如图3中我们不难看出，有三个点是导数为0的点。虽然这三个点导数都是0，但是只有中间的点是全局最优点，而左边是鞍点，右边是局部最优点。有理论工作指出，当使用GD算法的话，有可能需要指数时间才能逃离鞍点[Du,Jin, Lee, Jordan, Poczos, Singh, NeurIPS’17]。

图3: L(w)函数图

鉴于GD算法的局限性，我们在实际应用中通常更偏向使用SGD。SGD与GD算法两者是非常相似的，唯一的区别在于迭代过程中，导数的选择具有随机性，其数学表达式如下：

也就是说随机梯度Gt的期望等于严格精确导数即可，而随机梯度本身并不需要严格等于导数。它允许包含一些噪声。如图4中，蓝色收敛路径为SGD的收敛路径，红色收敛路径为GD路径。不难看出，蓝色收敛路径比红色长很多而且杂乱很多，因为每次走的是它的随机梯度，它的方向有噪声，但最后也可以慢慢收敛到全局最优点。很多读者会问，既然它走的这么杂乱而且路径比GD这个算法要长，为何在实际中更常用呢？一开始是因为人们发现随机导数要比准确导数算的快，因为如果只需要一个期望正确的随机导数的话，我们只需要在数据里采几百个点算一算就可以，而不是把每个点都过一遍，现在我们发现，从理论角度SGD还有别的优点，比如可以逃离鞍点[Ge, Jin, Huang, Yuan, COLT’15]，逃离比较陡的局部最优点[Kleinberg, Li, Yuan,ICML’18]，这也是袁洋最近的一些工作，而且其他的科研人员发现SGD可以在实际中找到一些泛化性能更好的解[Keskar, Mudigere, Nocedal, Smelyanskiy, Tang, ICLR’17] ，所以与GD相比，SGD不仅是个更快的算法，而且是个实际效果更好的算法。

下面我们详细介绍袁洋在机器学习理论中的两个研究工作：

图4: 梯度下降法与随机梯度下降法图示

研究方向一：逃离鞍点

如图5所示，浅色箭头所指的点为鞍点。为何是个鞍点呢，首先导数是0，其次从某些方向来看它的函数不断上升，从某些方向来看它的函数不断下降，所以不是个局部最小或者最大值，因此它是个鞍点。要观察到的是，途中鞍点并不稳定，也就是说在图里加一个很小的扰动，我们就可以顺着梯度方向滑下去，所以这是个典型的容易处理的鞍点，就是说存在一个方向，有可能是能滑下去的，SGD因为梯度里有一些噪声，加上这个噪声之后，就像滑梯一样沿着这个方向滑下去了。更准确直观的说明，我们不妨给出它的数学定义：

与此同时，我们给出严格鞍点函数的非正式定义，不妨说：

L是一个严格鞍点函数，如果L定义域中不包含任何平坦鞍点。

图5: 鞍点示意图

逃离鞍点的理论结果证明了，如果函数是严格鞍点的，那么SGD可以逃离所有鞍点，收敛到某一个局部最小值（注：这也是第一篇SGD逃离鞍点的严格理论证明）。该证明的意义深远：第一，如果L是严格鞍点的，则（根据该定理）SGD会收敛到局部最小值；第二，如果同时L的局部最小值一样好，则SGD收敛到的是全局最小值。因此，当严格鞍点函数和局部最小值一样好这两个条件同时存在时，使用SGD算法将可以完美优化L这个函数。

当然，很多读者又会思考，“严格鞍点函数和局部最小值一样好”这两个条件很强，在使用中如何满足呢？后来人们发现，在机器学习领域中，有大量问题函数都天然满足这两个条件，包括Community Detection [Huang, Niranjan, Hakeem,Anandkumar, JMLR'14]、Topic models [Zou, Hsu, Parkes, Adams, NeurIPS'13]、Shallow/linear networks [Kawaguchi, NeurIPS'16]、Matrix completion [Ge, Lee, Ma, NeurIPS'16]、Phase Retrieval [Sun, Qu, Wright, ISIT'16]、Matrix Sensing [Bhojanapalli, Neyshabur, Srebro,NeurIPS'16]等等。同时，科研人员也据此提出了很多新的算法，例如：GD with random initialization [Lee, Simchowitz, Jordan, Recht, COLT'16]、Normalized GD [Levy'16]、Perturbed GD [Jin, Ge, Netrapalli, Kakade,Jordan, ICML'17]、Accelerated GD [Jin, Netrapalli, Jordan, COLT'18]等。通常情况下，理论和实际之间是有一定差别的，但是严格鞍点函数在优化理论和实际应用中却起到了很好的桥梁作用。如果一个函数是严格鞍点的，从理论角度可以设计各式各样有理论保证的算法，来解决严格鞍点的问题；而从实际角度看，我们发现实际中有各式各样的机器学习的问题，它们的损失函数满足严格鞍点的性质，因此又促使我们从理论设计新的方法来解决这些问题。

图6: 严格鞍点函数是一个很好的桥梁

SGD逃离局部最优点[Kleinberg, Li, Yuan, ICML’18]

在机器学习理论的第二部分，袁洋为我们分享了他及其合作伙伴关于SGD逃离最优点的研究成果。在此之前，有读者可能认为，SGD逃离最优点这件事本身就很荒诞：如图7所示，局部最优点是个“坑”，如果用SGD这样的迭代方法走进这个“坑”中，应该很难跳出来才对，但实际中如果遇到的“坑”特别陡，如图7中靠左边的蓝色局部最小点，我们看到即是收敛路径一开始已经陷入局部最小值中，如果加一些噪声扰动（SGD扰动较大的情况下）的话同样有可能从局部最优中逃离出来。袁洋在讲座中生动的分析到：“SGD可以看做是把原来的函数变得更平的一个算法，它可以抹去一些小坑”。

图7: SGD逃离最优点

两层神经网络的收敛性分析[Li, Yuan, NeurIPS’17]

第三部分，袁洋为我们带来了两层神经网络收敛性分析的成果展示(如图8)。论文主要介绍了：

1.对两层带跳跃连接的神经网络，SGD在多项式时间内分两个阶段收敛。第一阶段：逐渐远离最后的解，第二阶段：逐渐逼近最后的解，相关的理论也得到了实验证实[Orhan, Pitkow, ICLR’18]；

2.是第一个关于SGD在非线性网络的收敛分析；

不过，这个属于神经网络理论的早期工作。目前使用超宽网络拟合理论可以得到更好的理论分析结果。

图8: 两层神经网络收敛性

未来研究设想

袁洋对未来主要有三方面的构想：

第一，可以用优化理论的这些工具更好地刻画神经网络的收敛规律；

第二，超宽网络拟合理论，虽然上文中提到的超宽网络拟合理论[Du et al ICML’19, Allen-Zhu, Li,Song, ICML’19, Zou et al MJL’19]优美地回答了神经网络的优化问题，但并不是说没有任何缺点，比如：超宽网络拟合理论使用的神经切线核在优化过程中几乎不会发生任何变化，但在实际中如果看神经网络具体的优化过程，会发现其实变化量还是很大的，目前看这个理论和实际发生的现象不太一样，所以在想能否找到和实际发生的现象更加吻合的收敛分析；

第三，泛化理论，很多文章都声称目前的神经网络有比较强的泛化性，那从理论角度能不能对这个现象理解的更好呢？最近的一篇论文[ [Nagarajan, Kolter, NeurIPS’19]提到，目前常用的泛化理论都是基于Uniform convergence框架，而这个收敛框架是具有一定局限性的，在这个框架下我们很难做出真正的有意义的泛化理论结果，因此，能否设计一些写的理论框架，来针对这个局限性解决泛化的理论问题。

机器学习可靠性

目前，机器学习可靠性是非常有意义和热门的方向，所谓机器学习可靠性，是指除了算法的预测准确率之外，为了能够真正落地使用，需要解决的一系列其他问题，包括：对抗样本与鲁棒性、可解释性、数据安全与隐私性、决策因果性、逻辑性、公平性、无偏见。虽然这些问题不涉及到最终的算法精度问题，但是如果这些问题不解决的话，在很多落地的场景中，如医疗场景、法律场景等很多算法将无法真正落地使用。本此讲座，袁洋主要从三方面为我们介绍他的研究。

带鲁棒性保证的算法设计[Lee, Yuan, Chang, Jaakkola, NeurIPS’19] [Teng, Lee, Yuan, in submission]

首先，请各位读者仔细观察图9，这是个非常有名的熊猫图，相信大部分同学都看到过，其大概意思说，如果把图9中左边的熊猫图作为神经网络的输入，网络认为有57.7%的置信度认为图中是熊猫。接着，我们根据网络结构精心设计一些噪声，并将其加入到原始的图片中后，得到了右边的熊猫图。新的图片人们用肉眼仍然可以分辨出一只熊猫，但是输入与左图相同的神经网络，结果网络认为类人猿的置信度为99.3%，这是一个非常典型的实验，证明该网络的鲁棒性不是非常好。

图9: 神经网络的低鲁棒性表现

当然，并不是某一个网络才会出现低鲁棒性的问题。虽然很多论文中声称自己的模型具有较好的鲁棒性，但是很多都是“虚假”鲁棒性模型。在2018年ICML最佳论文中[Athalye,Carlini, Wagner, ICML’18]，作者调研了八篇顶级会议中被录用的鲁棒性模型文章，结果显示，虽然这些论文都被录用，并且被同行审议通过，文章均声称解决了上述图9中的“熊猫噪声问题”，但是其实模型均没有描述的那么有效，我们可以采取一些简单的攻击方法就能把模型的准确度降的很低甚至降为0，据图参数见图10。

图10: 虚假鲁棒性模型实验数据

这是一个非常典型的“现代版矛与盾”的故事：甲提出了鲁棒模型A，乙提出了攻击算法B可以干掉A，丙提出了鲁棒模型C可以抵御B，丁提出了攻击算法D可以干掉C。我们发现，之所以现在的深度学习算法中有这样的问题，主要原因是因为没有很好的理论支持，我们没有办法从理论角度说明鲁棒性。因此最近一两年，人们开始从理论角度设计带有鲁棒性保证的算法。人们提出了各种巧妙的想法，目前最流行的方法是随机光滑化法[Cohen,Rosenfeld, Kolter, ICML’19]。

我们简单介绍什么是随机光滑化。如图11，图中左侧正方形为预测空间，正方形中的每一个点都是一个输入，每种颜色对应函数对输入的不同分类，比如：我们不妨假设蓝色区域中的每个点表示猩猩，绿色区域中的点表示熊猫，红色区域中的点表示随机。这是一个函数的分类区间，如果我们将输入函数投影到一个非常高维的空间中，那么我们很容易找到某个方向，沿着该方向可以穿过该色而抵达另外一个颜色区域中，这也就是所谓的对抗样本高维空间的解释。所谓随机光滑化，是用统计的方法来解决这个问题。我们不妨以x为中心画一个球，在这个球内统计每种颜色面积大小，根据每种颜色在球内的面积大小排序，颜色最高一类就是用随机光滑化方法得到的对x分类的判定。例如，图11中以x为中心画球，我们看到球内蓝色区域是面积最大的，所以判定该点的分类也是蓝色。随机光滑化法是比较稳定的一种分类方法，从图中我们也不难看出这个结论。例如，如果我们把x区往绿色区域移动一小点并以此点为圆心画的球，各种颜色统计后蓝色面积仍然是最大的。

图11: 随机光滑化方法，投影高维空间

当然，这个方法并非完全不能攻击。如图12中我们看到，如果中心点往绿色区域走的足够远，那么球中面积最大的颜色很可能变成了绿色，这时攻击就成功了。

图12: 更稳定不代表不能够进行攻击

那么问题来了，我们能否从理论角度证明，到底走多远攻击能够成功呢？Cohen等人[Cohen, Rosenfeld, Kolter, ICML’19]在2019年所做的工作中指出：在l2利用高斯分布的对称性得到任何攻击方向都是等价的，并且给出了该范数空间下鲁棒性的界。袁洋在此基础上得出了范数取l0和l1时鲁棒性的界，如图13。感兴趣的读者可以阅读相关的文献继续研究。

图13: l0和l1时该问题的界

数据安全与隐私保护[Huet. al. in submission] [Wu, Du, Yuan, in submission]

在机器学习可靠性方向，袁洋团队所做的第二类工作为数据安全与隐私保护，他在讲座中为我们分享了两类问题。第一类是：是否能够找到一种数据加密方法，使得当我们分享数据时，人类可以使用但是机器无法使用？例如图14中，原始图加密后所得的图输入机器学习的模型后计算结果失效，但是肉眼看起来二者差别并不是很大。

图14: 图片加密问题

袁洋团队是基于已有对抗样本相关的技术实现上述目标，见Madry教授团队的工作[Ilyaset al, NeurIPS’19]，感兴趣的读者可以阅读论文了解算法详情。我们在这里为大家举一个较为通俗易懂的例子。首先我们解释两个名词：鲁棒性特征和非鲁棒性特征。所谓鲁棒性特征我们可以理解为人类可以察觉的特征，比如：狗的整体形态、两只眼睛、嘴巴的形状等等；所谓非鲁棒性特征即我们人类不易察觉但是机器学习可以提取的特征。在图15中，袁洋团队将原始图片中狗的非鲁棒性特征更换为猫的非鲁棒性特征，所得到的图片进行训练，结果显示模型对图片中带有狗的鲁棒性特征及猫的非鲁棒性特征的图片预测良好，对狗的原始图片预测能力较差。当然，我们可以做更为复杂的图片加密。（该研究工作仍在进行中）

图15: 数据安全实例

另外一类问题是，是否能够找到一种数据加密方法，使得当我们分享数据时，机器可以使用但是人类无法使用？例如我们作为数据的提供商，想要把数据交给某个人工智能公司训练模型，但是对方极有可能会将数据/模型卖给第三方，此刻我们该如何保护自己的数据？目前这方面的工作，袁洋团队仍在继续探索，主要的思路是：将图片通过流模型转换到抽象的特征空间，在特征空间中进行加密后再将其通过流模型转换为图片，从而得到加密后的图片。由于整个转换在特征空间中进行，因此图片虽然看起来不甚相同，但是仍然保留了很多相通的语义信息。如果同时能确保特征转换绝对私密，那么该过程将不会被破解。

图16: 数据在特征空间中进行加密

未来研究设想

袁洋对于机器学习可靠性的未来设想主要有：

第一：探索各类新的问题；

第二：探索各类可靠性问题间的相互关系，包括鲁棒性和可解释性 [Tsipras et al, 18]、因果推断，与贝叶斯网络结合、数据共享与数据安全、算法设计，理论保证等,最终目标是让机器学习技术更饱满。

机器学习与算法优化

袁洋认为，机器学习与算法优化之间应该形成正向反馈作用：我们设计更好的算法解决机器学习问题，从理论方面推动机器学习的发展；同时，我们使用机器学习技术设计更好的算法，从数据方面推动算法的发展。在这一研究方向中，袁洋主要介绍了两方面的内容。

自动调参数法[Hazan, Klivans, Yuan, ICLR’2018]

自动调参数法是目前机器学习中非常热门的方向，包括：调整网络结构、网络层数、网络部件、Mini-batch大小以及训练算法、优化算法步长等。袁洋团队目前在这方面的研究表示：如果参数对应的函数可以被大小s的决策树近似，那么我们可以采用布尔泛函分析及压缩感知技术来学习决策树，并且极大的优化了采样复杂度，只有，并且非常适合并行，实验证明得到比手调更好的解。

加速矩阵低秩分解算法[Indyk, Vakilian, Yuan, NeurIPS’19]

正如上文中所说，我们第二类工作的核心思想是使用数据来帮助算法设计。袁洋为我们介绍了低秩分解的一些优化想法。我们知道，经典的低秩分解方法为Sketching方法，即：

选择一个随机矩阵，其中m很小，计算（很小），最后对SA计算SVD。该算法理论证明可以应用到任何场景，但是如果某些特定的场景中，袁洋表示，可以使用优化方法学习更好的S，使得S不再是一个任意的随机矩阵。可以使用导数方法不断优化S来适应特定的问题。

未来研究设想：

袁洋对未来主要有三方面的构想：

第一，针对各种传统算法进行改进，使得其在实际应用中能够得到更好的效果。例如：各种传统数据结构（搜索树）、各种嵌入算法（例如树分解算法）。

第二，针对已有算法进行理论分析，包括：找出传统算法与机器学习技术结合的共性，提出分析方案、应用于新的问题。

第三，使用机器学习技术处理NP-难问题，包括：找到某一类NP-难问题的应用场景、在给定数据分布下找到更快算法。

【python】Python中常见的KeyError报错分析景天科技苑 python 开发语言 python报错 KeyError
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，linux，shell脚本等实操
fastapi+angular实现菜鸟驿站系统勘察加熊人 typescript fastapi angular.js 前端
说明：我计划用fastapi+angular实现菜鸟驿站系统userid和stationid暂时先写死全部写成1也就是用户1驿站1这样就可以简化流程1.新增包裹入库增加一个添加入库的按钮然后填写信息然后入库2.新增包裹取件按钮post请求，弹窗填写取件码，取件成功需要刷新包裹状态3.获取超时列表比如有些包裹严重超时我需要查看超时包裹的信息和位置4.还需要取件记录表用弹窗每次用户取件都必须有一条取件
手机零部件三维光学测量解决方案 yy229382036 人工智能 3d 光学成像算法
在移动互联网时代，智能终端深受市场追捧，而智能手机占据了第一大移动智能终端的地位。市场的火热造就了手机厂商白热化的竞争，继CPU、屏幕、摄像头等硬件配置大战之后，以外观、设计、质量为切入点的设计及功能竞争，也日趋激烈。在手机设计、质量检测中，无论是手机中框还是屏幕，利用三维光学测量技术，有助于优化从原型和模具构建、首件检验报告到装配分析等环节的质量控制，并有效节省检测时间，快速推进新产品上市。另外
Python 常用函数全解析，轻松提升编码效率 yang789022 python 开发语言 windows
Python常用函数全解析，轻松提升编码效率Python常用函数全解析，轻松提升编码效率1.基础内置函数1.1`print()`与`input()`1.2`len()`、`type()`与`isinstance()`2.数学与数值处理函数2.1`abs()`、`round()`与`pow()`2.2`divmod()`与`max()/min()`3.序列与迭代相关函数3.1`range()`与`e
C++内存管理秘籍：深入解析与实战代码示例萱萱199504 c++java 开发语言
C++内存管理秘籍：深入解析与实战代码示例一、内存管理的基本概念二、内存泄漏与野指针三、智能指针：现代C++的内存管理利器四、实战代码示例示例1：传统动态内存管理示例2：使用`std::unique_ptr`示例3：使用`std::shared_ptr`五、总结在C++编程的世界里，内存管理是一项既基础又核心的技能。它直接关系到程序的性能、稳定性和可维护性。不同于一些高级语言自动管理内存的特性，C
全自动文章生成发布构建 PyAIGCMaster 我的学习笔记 python
单机版、定时生成文章和分平台发布，以下是优化后的解决方案及代码示例：---###**推荐方案：APScheduler+内置调度逻辑**选择**APScheduler**是最佳方案，原因：1.**轻量级**：纯Python实现，无需额外服务（如Redis/CeleryWorker）。2.**精准调度**：支持Cron式定时任务（如每天3点生成、8点发布）。3.**单机友好**：直接嵌入代码中，适合打
Ubuntu 显卡NVIDIA-smi提示错误 DoubleImage 深度学习 ubuntu
Ubuntu长时间正常工作，但是重启后显卡工作异常执行NVIDIA-SMI提示如下问题：NVIDIA-SMIhasfailedbecauseitcouldn'tcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriverisinstalledandrunning.一、问题原因主要是由于系统自动更新了内核，新内核的版本与显卡驱动不匹
Ubuntu系统中NVIDIA-SMI 报错：NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver. QuietNightThought Linux linux python
文章目录一、介绍二、解决办法一：安装必要的内核头文件三、解决办法二：使用DKMS重新安装内核的NVIDIA驱动程序(我用这个方法解决了问题)四：解决办法三：安装NVIDIA驱动程序一、介绍当服务器未安装NVIDIA驱动程序，或驱动程序版本与显卡不匹配时，或者安装了某些系统软件或系统更新了内核时，服务器重启后可能无法连接到NVIDIA驱动程序。错误消息如下：$nvidia-smiNVIDIA-SMI
CSS3：深度解析与实战应用 my1121716951 css3 css 前端
CSS3：深度解析与实战应用详解1.选择器增强2.盒模型扩展3.渐变和背景4.转换和动画总结CSS3是CSS（层叠样式表）的最新版本，它引入了许多新的特性和功能，使得网页的样式设计更加灵活、丰富和具有动态效果。在本文中，我们将深入解析CSS3的一些关键特性和实战应用，并通过代码样例展示其强大之处。1.选择器增强CSS3增加了许多新的选择器，如属性选择器、伪类选择器等，使得我们能够更精确地选择页面元
Vue 3 事件总线详解：构建组件间高效通信的桥梁 love729234ming vue.js 前端 javascript
Vue3事件总线详解：构建组件间高效通信的桥梁为什么需要事件总线？使用mitt实现事件总线1.安装mitt2.创建事件总线3.在组件中使用事件总线发送端组件（例如ComponentA.vue）接收端组件（例如ComponentB.vue）自定义实现事件总线总结在复杂的前端应用中，组件之间的通信往往需要一种灵活且解耦的方式。传统的Vue2中，我们常使用全局事件总线来实现这种通信，但在Vue3中，由于
Java常用集合与映射的线程安全问题深度解析 jiajia651304 java 安全开发语言
Java常用集合与映射的线程安全问题深度解析一、线程安全基础认知在并发编程环境下，当多个线程同时操作同一集合对象时，若未采取同步措施，可能导致以下典型问题：数据竞争：多个线程同时修改数据导致结果不可预测状态不一致：部分线程看到集合的中间状态内存可见性：线程本地缓存与主内存数据不同步死循环风险：特定操作引发无限循环（如JDK7的HashMap扩容）二、典型非线程安全集合问题分析1.ArrayList
Spring Boot中@Valid 与 @Validated 注解的详解 jiajia651304 spring boot 后端 java
SpringBoot中@Valid与@Validated注解的详解引言@Valid注解功能介绍使用场景代码样例@Validated注解功能介绍使用场景代码样例@Valid与@Validated的区别结论引言在SpringBoot应用中，参数校验是确保数据完整性和一致性的重要手段。@Valid和@Validated注解是SpringBoot中用于参数校验的两个核心注解。本文将详细介绍这两个注解的用法
手机租赁平台开发技术方案解析红点聊租赁其他
内容概要想造个手机租赁平台？这事儿可比租共享充电宝复杂多了——毕竟用户可能抱着价值万元的折叠屏手机连夜跑路（别笑，真有案例）。不过别慌，咱们的"技术武器库"里藏着三件法宝：区块链账本、AI风控雷达和支付宝生态对接器。先说区块链架构，它就像个永远撕不坏的记账本。每次租赁订单生成时，系统会自动在链上刻下"电子纹身"，把设备序列号、租赁协议、用户身份信息打包成加密积木块。就算有人想偷偷给手机刷机，区块链
全面解析手机租赁平台开发的关键要素与实施策略红点聊租赁其他
内容概要在手机租赁平台开发的过程中，市场调研是至关重要的一步。只有深入了解用户需求和行业趋势，才能确保平台的成功。首先要考虑潜在用户，他们究竟对手机租赁有什么期望？是希望租金更便宜，还是更看重手机的款式和新旧程度？通过问卷、访谈等方式收集相关数据，可以帮助确定目标市场的特征。接下来，我们需要关注行业趋势。近年来，随着环保意识的增强和消费习惯的改变，越来越多的人开始倾向于租赁而非购买。这一趋势不仅改
金融租赁系统的创新发展与市场竞争力提升探讨红点租赁系统开发其他
内容概要随着经济的快速发展，金融租赁系统逐渐成为金融市场中不可或缺的一环。它不仅提供了灵活的资金解决方案，还促进了企业的资本结构优化与资源配置效率。因此，了解该系统的市场背景与发展现状至关重要。在现今环境下，新兴技术如人工智能、大数据和区块链等正加速推动金融租赁的创新。通过这些技术，不仅可以优化业务流程，提升运营效率，还可以增强风险管理能力。例如，利用数据分析可以实时监测租赁资产的风险，从而采取相
手机租赁系统开发核心技术解析红点租赁系统开发其他
内容概要如果把手机租赁系统比作一台精密运转的智能管家，那它的骨架可不是用代码随便搭的乐高积木。这玩意儿得同时搞定三件事：让用户像刷短视频一样流畅下单，让风控系统比小区门禁还难糊弄，还得让物流信息比外卖小哥的定位更透明。想象一下，当你在APP里滑动挑选最新款折叠屏手机时，后台其实正在上演三重加密的信用评分大战——你的芝麻信用分、电商平台消费记录甚至社交账号活跃度，都被塞进算法熔炉里炼成租赁权限的通行
Ubuntu20.04 RTX4060 AI环境搭建 stxinu 人工智能人工智能
下面记录在Ubuntu20.04环境下，使用ASUSATS-RTX4060-O8G-V2显卡，搭建NvidiaTensorRT开发环境。1.安装步骤0）准备工作使用如下命令创建我们的工作目录：mkdir~/nvidia再使用如下命令进入到上面的目录（接下来的步骤，如无特殊说明，均在该目录下进行）：cd~/nvidia1）安装CUDA下载并安装NVIDIACUDAToolkit：wgethttps:
手机租赁系统开发全面解析与实现指南红点租赁系统开发其他
内容概要手机租赁系统的设计理念是为了满足用户对便捷、灵活的手机使用需求。想象一下，谁还愿意花大价钱买一部手机呢？尤其是当新款手机频繁推出时，租赁似乎成了更受欢迎的选择。这个系统旨在让用户可以随时随地选择租用不同型号的手机，极大提升了用户体验。接下来，我们将深入探讨这个系统的技术架构。它通常包含前端界面、后端处理和数据库管理三个核心部分。前端负责与用户交互，后端则处理数据逻辑，而数据库则是存储所有租
SassScript：Sass中的编程特性详解算法探险家 sass 前端 css
Sass（SyntacticallyAwesomeStylesheets）是一种强大的CSS预处理器，它允许开发者使用类似于编程语言的语法来编写CSS，然后通过编译生成标准的CSS代码。SassScript是Sass中的编程特性集合，它包含了变量、嵌套规则、混合、函数以及控制指令等，极大地提高了CSS的开发效率和可维护性。1.变量SassScript中的变量允许开发者在样式表中存储和重复使用值。变
Spring Boot实战：MySQL与Redis数据一致性深度解析与代码实战算法探险家 spring boot mysql redis
SpringBoot实战：MySQL与Redis数据一致性深度解析与代码实战一、数据一致性问题概述二、常见解决方案三、选择合适的解决方案四、总结在SpringBoot开发中，MySQL作为关系型数据库，提供了强大的数据存储和查询能力；而Redis作为内存数据库，以其高速读写性能成为缓存层的首选。然而，当这两者共同服务于一个系统时，如何确保它们之间的数据一致性，成为了一个不可忽视的问题。本文将深入探
【AI大模型-提示词中的###和“““】 NeVeRMoRE_2024 AI大语言模型-ChatGPT 人工智能
提示词中活用###和"""（或其他特殊字符或格式）的原因主要基于以下几点：1.结构化与清晰性在编写提示词时，使用特殊字符如###和"""可以帮助将复杂的指令或上下文信息结构化，使其更加清晰易懂。这对于大型语言模型（LLMs）尤为重要，因为它们需要处理大量的输入信息，并据此生成输出。结构化的提示词有助于模型更好地理解用户的意图，减少误解的可能性。例如，使用###作为分隔符，可以将提示词中的不同部分（
Vue 3 事件总线详解：构建组件间高效通信的桥梁 QQ828929QQ vue.js 前端 javascript
Vue3事件总线详解：构建组件间高效通信的桥梁为什么需要事件总线？使用mitt实现事件总线1.安装mitt2.创建事件总线3.在组件中使用事件总线发送端组件（例如ComponentA.vue）接收端组件（例如ComponentB.vue）自定义实现事件总线总结在复杂的前端应用中，组件之间的通信往往需要一种灵活且解耦的方式。传统的Vue2中，我们常使用全局事件总线来实现这种通信，但在Vue3中，由于
Vue Markdown 编辑器全攻略：轻松集成 MD 编辑器到前端项目软件工匠师前端 vue.js 编辑器
VueMarkdown编辑器全攻略：轻松集成MD编辑器到前端项目1.为什么选择Markdown编辑器？2.安装v-md-editor3.全局配置与集成4.在组件中使用Markdown编辑器5.高级配置与自定义功能6.总结在现代前端开发中，Markdown编辑器被广泛应用于博客、内容管理系统、在线文档等场景。本文将以Vue3为例，详细介绍如何使用v-md-editor库在项目中集成Markdown编
MySQL常用函数详解及SQL代码示例星河浪人 mysql sql android
MySQL常用函数详解及SQL代码示例引言当前日期和时间函数字符串函数数学函数聚合函数结论引言MySQL作为一种广泛使用的关系型数据库管理系统，提供了丰富的内置函数来简化数据查询、处理和转换。掌握这些函数可以大大提高数据库操作的效率和准确性。本文将详细介绍MySQL中一些常用的函数，并配以SQL代码示例，帮助读者更好地理解和应用这些函数。当前日期和时间函数在当前时间（中国北京时间2025年03月1
深入理解Java集合框架：构建高效、灵活的数据管理方案漏洞猎人001 java 开发语言
深入理解Java集合框架：构建高效、灵活的数据管理方案引言Java集合框架（JavaCollectionsFramework,JCF）是Java语言提供的一套用于表示和操作集合的统一架构。它包含了一系列的接口和类，用于存储和操作对象集合，如列表（List）、集合（Set）、映射（Map）和队列（Queue）等。集合框架的设计初衷是为了提供一套灵活、可重用且类型安全的集合数据结构，帮助开发者以统一和
OmniParser V2 安装与使用教程 Leaton Lee OmniParser V2 人工智能 deepseek
1.环境准备操作系统：支持Windows/macOS/Linux。Python版本：确保已安装Python3.7或更高版本。包管理工具：使用pip（Python自带）。安装环境：condacreate-n"omni"python==3.12condaactivateomnipipinstall-rrequirements.txt确保您已将V2权重下载到weights文件夹中（确保标题权重文件夹名为
Linux基础指令详解：掌握Linux系统的必备技能智能编织者 linux 服务器运维
Linux基础指令详解：掌握Linux系统的必备技能一、Linux基础指令概述二、基础指令详解1.**ls**2.**cd**3.**pwd**4.**mkdir**5.**rmdir**6.**rm**7.**cp**8.**mv**9.**cat**10.**more**和**less**11.**chmod**12.**chown**13.**df**14.**du**15.**ps**16
AGI大模型（5）：提示词工程不死鸟.亚历山大.狼崽子 AGI大模型 agi
1什么是提示词工程（Prompt）所谓的提示词其实指的就是提供给模型的⼀个⽂本⽚段，⽤于指导模型⽣成特定的输出或回答。提示词的⽬的是为模型提供⼀个任务的上下⽂，以便模型能够更准确地理解⽤户的意图，并⽣成相关的回应。2什么是提示⼯程(PromptEngineering)所谓的提示⼯程也可以被称为「指令⼯程」，提示⼯程的核⼼思想是，通过精⼼设计的提示，可以显著提⾼模型的性能和输出质量。貌似简单，但其实
微软开源神器OmniParser V2.0 介绍魔王阿卡纳兹开源项目观察大模型知识札记 microsoft OmniParser 开源项目
微软开源的OmniParserV2.0是一款基于纯视觉技术的GUI智能体解析工具，旨在将用户界面（UI）截图转换为结构化数据，从而实现对计算机屏幕上的可交互元素的高效识别和操控。这一工具通过结合先进的视觉解析技术和大型语言模型（LLM），显著提升了AI智能体在复杂环境下的识别能力和操作效率。核心功能与特点高精度识别：OmniParserV2.0在检测小尺寸可交互UI元素时的准确率显著提升，达到了3
设计模式六大原则（3）：依赖倒置原则岸似达春绿设计模式设计模式设计模式 string class 编程 setter interface
定义：高层模块不应该依赖低层模块，二者都应该依赖其抽象；抽象不应该依赖细节；细节应该依赖抽象。问题由来：类A直接依赖类B，假如要将类A改为依赖类C，则必须通过修改类A的代码来达成。这种场景下，类A一般是高层模块，负责复杂的业务逻辑；类B和类C是低层模块，负责基本的原子操作；假如修改类A，会给程序带来不必要的风险。解决方案：将类A修改为依赖接口I，类B和类C各自实现接口I，类A通过接口I间接与类B或
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

智源青年科学家袁洋：机器学习可靠性与算法优化的方法探索

你可能感兴趣的:(智源青年科学家袁洋：机器学习可靠性与算法优化的方法探索)