baihuang2797

深度学习常见问题

原文链接： http://www.cnblogs.com/rise0111/p/11568730.html

忘了数据规范化
What?

在使用神经网络的过程中，非常重要的一点是要考虑好怎样规范化（normalize）你的数据。这一步不能马虎，不正确、仔细完成规范化的话，你的网络将会不能正常工作。因为规范化数据这个重要的步骤在深度学习圈中早已被大家熟知，所以论文中很少提到，因此常会成为初学者的阻碍。

How?

大体上说，规范化是指从数据中减去平均值，然后再除以标准差的操作。通常这个操作对每个输入和输出特征是分别完成的，但你可能会想同时对一整组的特征进行规范化，再挑出其中一些特殊处理。

Why?

我们需要规范化数据的主要原因是，在神经网络中几乎所有的数据传输途径中，都是假设输入和输出的数据结构满足标准差接近于1，平均值几乎为0。这个假设在深度学习中的每个地方都会出现，从权重因子的初始化，到活化函数，再到训练网络的优化算法。

And?

一个未训练的神经网络通常输出的结果范围从-1到1。如果你希望它的输出值在其它的范围，比如说RGB图片表示颜色的值域就是0到255，你将会遇到麻烦。

当期望的输出值是255，神经网络开始训练时情况会极不稳定，因为实际产生的值为-1或者1，对大多数用来训练神经网络的优化算法来说，这和255相比都有巨大的误差。这将会产生巨大的梯度，你的训练误差很可能会爆表。

就算碰巧在你训练的起始阶段，误差没有爆表，这个过程仍然是没有意义的，因为神经网络在向错误的方向学习和发展。

如果你先将你的数据规范化（在这个例子中你可以将RGB值除以128然后减去1），那么这些情况就都不会发生。

总体来说，神经网络中各种特征的值域决定了他们的重要性。

如果输出中的一项特征的值域很大，那么意味着与其他特征相比，它将会产生更大的误差。同样地，输入中值域大的特征也会支配着网络，在下游中引起更大的变化。

因此，仅仅依靠许多神经网络库中的自动规范化，盲目地减去平均值后再除以方差，并不总是合适的做法。可能有这样一个输入特征，取值范围通常在0到0.001之间，它的值域这么小是因为这个特征不重要，还是因为它与其他特征相比有着更小的单位呢？这决定了你要不要将它规范化。

类似地，还要谨慎对待那些值域较小的特征，因为它们的标准差可能很小，接近或者严格等于0。如果你对它们进行规范化，可能会产生NaN(Not a Number)的错误。

这种情况需要谨慎地对待，要仔细琢磨你的这些特征真正代表着什么，以及考虑规范化的过程是为了将所有输入的特征等价。

这是少数几个我认为在深度学习中需要人类完成的任务。

没有检查结果
What?

当你训练网络经过了几个epoch之后，误差（error）开始下降了——成功！

但这是否意味着你完成了训练呢？很不幸，答案是否定的。

你的代码中，基本上还肯定还存在一些错误。这个bug可能存在于数据预处理，或者训练网络甚至是最后给出推断结果的过程中。

只是误差开始下降，并不意味着你的网络学到了“真功夫”。

How?

毋庸置疑，在数据传输过程中的每个阶段检查数据正确性都很重要，通常这意味着要通过一些方法来对结果进行可视化。

如果你的数据是图像，那么情况就很简单，相应的动画数据很好生成。但如果你的数据比较奇葩，也要找出一种合适的方法，能够在预处理、网络训练和数据传递的每个阶段来检查数据的正确性，将其与原始的真实数据比较。

Why?

跟传统的编程过程不同，机器学习系统失败时都不出声。

在传统编程中，我们习惯了当遭遇状况时计算机报错，随后我们可以结合报错内容来debug。不幸的是，这个过程并不适用于机器学习应用。

所以，我们需要极其小心地在每个阶段检查我们的过程是否有问题，从而能够察觉到bug的产生，以及在需要回头仔细检查代码的时候及时发现。

And?

有许多种方法来检查你的网络是否有效。其中之一是要明确训练误差的意义。将在训练集上运行的神经网络的输出结果进行可视化——输出结果跟实际情况相比怎样？

你可能看到在训练过程中误差从100下降到1，但最终结果仍然是不可用的，因为在实际场景中误差为1仍然是不可接受的结果。如果网络在训练集上有效，那么再在验证集上测试——它是否同样适用于之前没有见过的数据呢？

我的建议是从一开始就可视化所有过程，不要等网络不奏效时再开始做，在你开始尝试不同的神经网络结构之前，你要确保整个流程没有一丝差错。这是你能够正确评估不同网络模型的唯一方式。

忘了数据预处理
What？

绝大部分数据都很tricky。我们认为非常相似的事物，从数据上看可能拥有完全不同的数值表达形式。

就拿视频中的人物动作来说，如果我们数据是在一个特定地点或是特点方向上，记录人物的关节相对于录像中心的3D位置，那么换一个方向或地点，可能同一套动作会拥有完全不同的数字表达形式。

因此，我们需要用新的方式来表达我们的数据，比如说放到一些本地参考系中（诸如跟人物的质心相关的一些），让相似的动作有相似的数值表达。

How？

思考你的特征具体代表着什么——你是否可以在它们上面做一些简单的变换，来确保用来代表相似事物的数据点通常具有相似的数值表达？是否存在一个本地坐标系，能以一种不同的形式更自然地表达你的数据？比如说一个更好的色彩空间？

Why？

神经网络只对输入的数据做一些最基本的假设，但是这些假设中有一条，是认为这些数据分布的空间是连续的，即对于空间中的大部分，两个数据点间的点类似这两个数据点的“混合”，相邻的数据点在某种意义上代表着相似的事情。

当数据空间中存在较大的不连续时，亦或者一大组分开的数据均代表着同一件事情时，将会使得学习任务的难度大大增加。

And？

理解数据预处理（preprocess）的另一种方式，是把它作为减少由排列组合导致的数据激增的一种尝试。

举例来说，如果一个基于人物动作训练过的神经网络需要学习在该人物在各个地点、各个方向上的同一组动作，那么将会耗费大量的资源，学习的过程将会是冗余的。

忘了正则化
What?

正则化（regularization）方式是训练神经网络时另一个不可或缺的方面，通常以Dropout层、小噪声或某种形式的随机过程等方式应用到网络中。

即使在你看来当前数据规模远大于参数规模，或是在某些情况下，不会出现过拟合效应，或者就算出现也不影响效果，你仍然应该加入Dropout层或一些其他形式的小噪声。

How?

向神经网络添加正则化的一种最基本方法，是在网络中的每个线性层（如卷积层或稠密层）前加入Dropout层。

在开始设置Dropout值时，可定义中等值到较低值，如0.25或0.1。你可根据网络的各项指标，来判断过拟合程度并进行调整，若仍觉得不可能出现过拟合效应，可以将Dropout值设置到非常小，如0.01。

Why?

正则化方式不仅仅是用来控制过拟合效应，它在训练过程中引入了一些随机过程，在某种意义上“平滑”了代价格局。这种方式可加快训练进程，有助于处理数据中的异常值，并防止网络中出现极端权重结构。

And?

跟Dropout层一样，数据增强或者其他类型的噪声也可作为正则化方式。

虽然Dropout层通常被认为是一种将许多随机子网络的预测结果结合起来的技巧，但它也可看作是一种通过在训练时产生多种输入数据的相似变体来动态扩展训练集大小的方法。

而且要知道，防止过拟合并提高网络准确性的最佳方法是向神经网络输入大量且不重复的训练数据。

设置了过大的批次大小
What?

设置了过大的批次（batch）大小，可能会对训练时网络的准确性产生负面影响，因为它降低了梯度下降的随机性。

How?

要在可接受的训练时间内，确定最小的批次大小。一个能合理利用GPU并行性能的批次大小可能不会达到最佳的准确率，因为在有些时候，较大的批次大小可能需要训练更多迭代周期才能达到相同的正确率。

在开始时，要大胆地尝试很小的批次大小，如16、8，甚至是1。

Why?

较小的批次大小能带来有更多起伏、更随机的权重更新。这有两个积极的作用，一是能帮助训练“跳出”之前可能卡住它的局部最小值，二是能让训练在“平坦”的最小值结束，着通常会带来更好的泛化性能。

And?

数据中其他的一些要素有时也能起到批次大小的作用。

例如，以两倍大小的先前分辨率来处理图像，得到的效果与用四倍批次大小相似。

做个直观的解释，考虑在CNN网络中，每个滤波器的权重更新值将根据输入图像的所有像素点和批次中的每张图像来进行平均，将图像分辨率提高两倍，会产生一种四倍像素量同样的平均效果，与将批次大小提高四倍的做法相似。

总体来说，最重要的是要考虑到，在每次迭代中有多少决定性的梯度更新值被平均，并确保平衡好这种不利影响与充分利用GPU并行性能的需求之间的关系。

使用了不适当的学习率
What?

学习率对网络的训练效果有着巨大的影响。如果你刚入门，使用了常用深度学习框架中给出的各种默认参数，那几乎可以肯定，你的设置不对。

How?

关闭梯度裁剪，找出学习率的最大值，也就是在训练过程中不会让误差爆表的上限值。把学习率设置为比这小一点的值，很可能就非常接近最佳学习率了。

Why?

大多数深度学习框架会默认启用梯度裁剪方式。这种方式通过限制在每个步骤中可以调整权重的数量，来防止训练过程中优化策略出现崩溃。

当你的数据中包含许多异常值，会造成大幅度的梯度和权重更新，这种限制特别有用。但是在默认情况下，这种方式也会使用户很难手动找到最佳学习率。

我发现，大多数深度学习新手会设置过高的学习率，并且通过梯度裁剪来缓解此问题，使得全局训练过程变慢，并且改变学习率后的网络效果不可预测。

And?

如果你好好清洗了数据，删除了大多数异常值，并设置了合理的学习率，实际上并不需要梯度裁剪方式。如果关闭了梯度裁剪之后里，你发现网络偶尔会发生训练错误，那就再打开它。

但是要记住，发生训练错误通常表明你的数据还存在一些问题，梯度裁剪只是一个暂时的解决方法。

在最后一层使用了错误的激活函数
What?

在最后一层中，不合理的激活函数有时会导致你的网络无法输出所需值的全部范围。最常见的错误是，在最后一层使用ReLU函数，导致网络只能产生正值输出。

How?

如果要实现回归任务，那么在最后一层通常不需要使用任何激活函数，除非你详细地知道你想输出哪一类值。

Why?

再次确认下你输入数据的实际意义，以及归一化后的具体范围。

很可能出现的情况是，网络的输出区间是从负无穷大到正无穷大，在这种情况下，你不该在最后一层使用激活函数。

如果网络输出只在某个区间内有意义，则需使用一些特殊的激活函数。比如，某网络输出为[0, 1]区间的概率值，根据这种情况可使用S形激活函数。

And?

在选择最后一层的激活函数时，有许多玄学。

在神经网络产生输出后，你也许会将其裁剪到[-1, 1]的区间。那将这个裁剪过程当作最后一层的激活函数，这似乎是有意义的，因为这将确保网络中的误差函数不会对不在[-1, 1]区间外的值进行惩罚。但是没有误差意味着区间外的这些值没有对应梯度，这在某些情况下无法进行网络训练。

或者，你也可以在最后一层使用tanh函数，因为这个激活函数的输出范围是[-1, 1]。但是这也可能出现问题，因为这个函数在1或-1附近时斜率变得很大，可能会使权重大幅增加，最终只产生-1或1的输出。

一般来说，最好的选择通常是采用求稳策略，在最后一层不使用任何激活函数，而不是试图使用一些机灵的技巧，可能会适得其反。

网络含有不良梯度
What?

使用ReLU激活函数的深度神经网络通常可能遭受由不良梯度引起的所谓“死神经元”。这可能会对网络的性能产生负面影响，或者在某些情况下导致完全无法训练。

How?

如果发现在epoch到epoch之间，你的训练误差不会变化，就可能是由于ReLU激活函数导致了所有的神经元已经死亡。

换一个激活函数试试，比如leaky ReLU或ELU，看看是不是还会发生同样的情况。

Why?

ReLU激活函数的梯度对于正值为1，对于负值为0。这是因为对于小于0的输入来说，输入的很小变化不会影响输出。

这可能看起来不是一个问题，因为正值的梯度很大。但是很多层叠在一起，而负权重可以将具有强梯度的大正值变为0梯度的负值。

你可能经常发现，无论输入什么，部分甚至全部隐藏单元对成本函数都是0梯度，这就是所谓的网络“已死”，所有权重都无法更新。

And?

很多运算都具有0梯度，比如裁剪，舍入，或取最大/最小值，如果用它们来计算成本函数相对于权重的导数，都会产生不良梯度。

如果它们出现在你的符号图的任何地方，要非常小心，因为它们常常会导致意想不到的困难。

没有正确地初始化网络权重
What?

如果你没有正确地初始化神经网络权重，那么神经网络很可能根本就无法训练。

神经网络中有许多其他组件，会假设你的权重初始化是正确的，或者标准的，它们会将权重设置为0，或者使用你自定义的随机初始化权重，于是将不会起作用。

How?

“he”、“lecun”或“xavier”权重初始化都是受欢迎的选择，在几乎任何情况下都应该很好地工作。只要选一个（我最喜欢的是“lecun”）就行了。

但是一旦神经网络开始训练了，你就可以自由的实验，寻找最适合你任务的权重了。

Why?

你可能听说过，可以使用“小随机数”初始化神经网络权重，但并不那么简单。

所有上述初始化方法都是靠复杂、细致的数学发现的，这也说明了为什么它们是最佳的。

更重要的是，很多其他神经网络组件都是围绕这些初始化构建的，并根据经验使用它们进行测试，自己进行初始化可能会导致难以复现其他研究者的成果。

And?

其他层可能也需要仔细地初始化。网络偏移被初始化为零，而其他更复杂的层（如参数激活函数）可能会带有自己的初始化，这与正确的同样重要。

神经网络太深了
What?

网络越深越好？不一定。

当你对网络进行基准测试，试着在一些任务上提高1%的准确度时，更深的网络通常会表现得更好。

但是如果你设计的浅层（3到5层）网络没有学习任何特征，那么可以保证，你设计的超深（如100层）网络也会没有效果，甚至更加糟糕。

How?

刚开始时，先试试浅层神经网络的效果，通常是3到8层。只有当你的网络有一定效果，要开始着手提高准确率时，再去研究更深层网络的结构。

Why?

看起来似乎是当有人决定堆一个几百层的神经网络时，神经网络模型忽然得到了突破性的结果，但事实并非如此。

在过去十年中，神经网络中所有改良技术所取得的微小进步，对浅层和深层网络都同样适用。如果你的网络不起作用，这很可能不是深度问题，是其他方面出错了。

And?

从小型网络开始训练，也意味着能更快地训练网络、更快地完成模型推理及更快地完成不同结构和参数配置的迭代过程。首先，与仅堆叠更多网络层相比，上面提到的所有方面将对模型准确率产生更大的影响。

隐藏unit的数量不对
What?

某些情况下，隐藏单元太多或者太少，都会导致网络难以训练。

隐藏单元太少，可能会没有能力表达所需的任务；太多单元又会导致网络缓慢、难以训练，残留噪声难以消除。

How?

开始时的隐藏单元数量，最好在256到1024个之间。

然后，看一下研究类似应用的研究人员使用了多少个隐藏单元，找找灵感。如果你的同行所用的数量和上面给出的数字相差很远，可能会有一些特殊的原因，这可能对你来说很重要。

Why?

当决定隐藏单元的数量时，关键在于考虑要表达你想通过网络传递的信息，所需的最小真实值是多少。

然后，考虑到dropout、网络使用冗余的表示、以及为你的估计留一点余地，可以将这个数字放大一点。

如果你正在做分类，可以使用类别数目的5到10倍，作为隐藏单元的数量；如果做回归，可以使用输入或输出变量数目的2到3倍。

当然，所有这些都高度依赖于环境，没有简单的自动解决方案，决定隐藏单元数量时，最重要的依然是直觉。

And?

实际上，与其他因素相比，隐藏单元的数量通常对神经网络性能影响很小，而在许多情况下，高估所需隐藏单位的数量除了拖慢训练速度之外，也不会有什么负面影响。

一旦网络开始正常工作，如果你还是担心，可以尝试各种不同数量的隐藏单元，并测量网络精度，直到找到最合适的设置。

转载于:https://www.cnblogs.com/rise0111/p/11568730.html

【go从入门到精通】探秘struct结构体转json为什么需要首字母大写？前网易架构师-高司机 golang从入门到精通 golang json go 结构体首字母大写 golang从入门到精通 go从入门到精通
目录作者简介：问题抛出分析结论作者简介：高科，先后在IBMPlatformComputing从事网格计算，淘米网，网易从事游戏服务器开发，拥有丰富的C++，go等语言开发经验，mysql，mongo，redis等数据库，设计模式和网络库开发经验，对战棋类，回合制，moba类页游，手游有丰富的架构设计和开发经验。并且深耕深度学习和数据集训练，提供商业化的视觉人工智能检测和预警系统（煤矿，工厂，制造业
【动手学深度学习】#1PyTorch基础操作 -一杯为品- 机器学习深度学习人工智能
主要参考学习资料：《动手学深度学习》阿斯顿·张等著【动手学深度学习PyTorch版】哔哩哔哩@跟李牧学AI目录1.1数据操作1.1.1入门1.1.2运算符1.1.3广播机制1.1.4索引和切片1.1.5节省内存1.1.6转换为其他Python对象1.2数据预处理1.2.1读取数据集1.2.2处理缺失值1.2.3转换为张量格式1.3线性代数1.3.1标量1.3.2向量1.3.3矩阵1.3.4张量1.
学习SpringBoot过程中常见问题汇总及多工程项目使用 IntelliJ IDEA 打开 KunQian_smile springBoot
一：SpringBoot:redisClientine.test.serviceImpl.RedisServiceImplrequiredabeanoftype‘com.examp1:没有自动注入导致。service类上面没有@service注解或者mapper上没有@Repository注解，但是这种情况比较少见，一般不会忘记。2:配置了mybatis，但没有指定扫描的包。（1）直接在生成出来的
AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践 pythonyaml
摘要在现代软件开发中，跨团队协作的挑战主要体现在需求变更、测试环境不匹配、沟通不畅，这些问题往往导致交付延迟。本文将探讨如何通过DevOps、Scrum以及协作文档来提升跨团队协作效率，并提供可运行的Demo代码模块，帮助读者落地最佳实践。引言在企业软件开发中，产品、开发、测试、运维、设计团队之间的交付摩擦是常见问题。造成这些摩擦的核心原因包括：需求变更频繁：需求文档未同步，开发与产品理解偏差。测
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
PHP与数据库连接常见问题及解决办法奥顺互联_老张 php教程 php 数据库
PHP与数据库连接常见问题及解决办法在现代Web开发中，PHP与数据库的连接是不可或缺的一部分。无论是构建动态网站、内容管理系统（CMS）还是电子商务平台，PHP与数据库的交互都是核心功能之一。然而，在实际开发过程中，开发者常常会遇到各种与数据库连接相关的问题。本文将探讨PHP与数据库连接中的常见问题，并提供相应的解决办法。1.数据库连接失败问题描述在PHP中，连接数据库时最常见的错误是无法连接到
从0到1构建AI深度学习视频分析系统--基于YOLO 目标检测的动作序列检查系统：（2）消息队列与消息中间件 shiter 人工智能系统解决方案与技术架构人工智能深度学习音视频
文章大纲原始视频队列Python内存视频缓存优化方案（4GB以内）一、核心参数设计二、内存管理实现三、性能优化策略四、内存占用验证五、高级优化技巧六、部署建议检测结果队列YOLO检测结果队列技术方案一、技术选型矩阵二、核心实现代码三、性能优化策略四、可视化方案对比五、部署建议逻辑判定队列时间片图论时间序列大模型引入参考文献原始视频队列想要在单机内存中缓存1-5分钟的视频片段，python技术栈的话
从零开始大模型开发与微调：PyCharm的下载与安装 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyCharm的下载与安装1.背景介绍随着人工智能和深度学习技术的不断发展,大型语言模型(LargeLanguageModels,LLMs)已经成为当前最引人注目的研究热点之一。LLMs能够在各种自然语言处理任务上展现出惊人的性能,例如机器翻译、文本生成、问答系统等。PyTorch和TensorFlow等深度学习框架为训练和微调大型语言模型提供了强大的支持。PyCharm
【从零开始学习计算机科学】软件工程（二）软件工程方法学贫苦游商学习软件工程 hadoop 面向过程面向对象软件开发敏捷开发
【从零开始学习计算机科学】软件工程（二）软件工程方法学软件工程方法学结构化/面向过程结构化编程结构化设计结构化分析结构化方法的常见问题面向对象软件工程方法学我们通常把在软件生命周期全过程中使用的一整套技术方法的集合称为方法学(methodology)，也称为范型(paradigm)。软件工程中有许多方法：结构化/面向过程对于结构化方法，其又被称为传统方法学，也称为生命周期方法学或结构化范型。它采用
遗传算法与深度学习实战（2）——生命模拟及其应用盼小辉丶遗传算法与深度学习实战深度学习人工智能遗传算法
遗传算法与深度学习实战（2）——生命模拟及其应用0.前言1.康威生命游戏1.1康威生命游戏的规则1.2实现康威生命游戏1.3空间生命和智能体模拟2.实现生命模拟3.生命模拟应用小结系列链接0.前言生命模拟是进化计算的一个特定子集，模拟了自然界中所观察到的自然过程，例如粒子或鸟群的聚集方式。生命模拟只是用来探索和优化问题的模拟形式之一，还有很多其他形式的模拟，可以更好地建模各种过程，但它们都源于康威
PyTorch从入门到精通：探索深度学习新境界 lmtealily 深度学习 pytorch 人工智能
引言PyTorch作为当前最受欢迎的深度学习框架之一，凭借其动态计算图的独特设计和与Python生态的无缝集成，正重塑着人工智能开发的新范式1。从NVIDIA的研究实践到Meta的产业应用，PyTorch的价值已渗透至学术研究、工业部署的每个角落。本文将带领您从张量操作基础开始，逐步探索GPU加速、动态图机制、框架生态集成等高级主题，最终实现理论与实战的双重突破。一、PyTorch核心基础构建1.
【Python】已解决：pip安装第三方模块（库）与PyCharm中不同步的问题（PyCharm添加本地python解释器）屿小夏 python pip pycharm
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
【Vue3+Vite指南】全局引入SCSS文件后出现Undefined mixin？一招解决命名空间陷阱！积水成江前端 scss 前端 html5 vue.js
【Vue3+Vite全局引入SCSS指南】解决Undefinedmixin错误的完整方案本文目录前置准备：安装SCSS环境问题现象与错误分析根本原因：Sass模块化的命名空间三大解决方案详解方案1:显式命名空间调用方案2:全局暴露命名空间方案3:主文件聚合导出操作验证步骤扩展：@use与@import对比最佳实践与避坑指南常见问题FAQ️前置准备：安装SCSS环境{#-前置准备}步骤1：安装Sas
Windows 下 MySQL 命令行操作全指南：端口修改、服务管理与实用技巧 mysql后端命令行
引言MySQL作为最流行的关系型数据库之一，在Windows环境下的配置与管理是开发者必备技能。本文将以命令行操作为核心，详解如何通过命令修改MySQL端口号、启停服务、自定义服务名等实用操作，并结合常见问题解决方案，帮助用户快速掌握MySQL在Windows中的高效管理方法。一、MySQL服务启停1.通过命令行启停启动MySQL服务：netstartmysql8#根据实际服务名调整（如mysql
C++设计模式-原型模式：从基本介绍，内部原理、应用场景、使用方法，常见问题和解决方案进行深度解析牵牛老人 C++专栏 c++设计模式原型模式
一、基本介绍：理解"克隆"的设计哲学1.1什么是原型模式原型模式（PrototypePattern）是一种创建型设计模式，其核心思想是通过复制现有对象来创建新对象，而非传统的新建实例方式。如同生物学的细胞分裂机制，原型对象作为"母体"，通过自我复制产生完全相同的新个体。该模式在C++中通常借助拷贝构造函数或克隆接口实现，特别适用于以下场景：对象初始化成本高昂（如需要读取大文件）；系统需要动态生成多
YOLOv5+UI界面在车辆检测中的应用与实现深度学习&目标检测实战项目 YOLOv5实战项目 YOLO ui 分类数据挖掘目标跟踪人工智能
1.引言随着智能交通系统（ITS）的快速发展，车辆检测已成为计算机视觉领域的重要研究方向。车辆检测技术广泛应用于交通流量监控、车辆违章抓拍、无人驾驶等场景中。近年来，深度学习技术的突破，特别是卷积神经网络（CNN）的崛起，使得目标检测技术取得了显著进展。其中，YOLO（YouOnlyLookOnce）系列模型以其高效的实时检测能力和出色的性能成为车辆检测领域的首选方法之一。在本文中，我们将基于YO
DeepSeek：技术教育领域的AI变革者——从理论到实践的全面解析量子纠缠BUG DeepSeek DeepSeek部署 AI 人工智能 python
一、技术教育为何需要DeepSeek？在数字化转型的浪潮下，技术教育面临着知识更新快、实践门槛高、个性化需求强三大核心挑战。传统的教学模式难以满足开发者快速掌握前沿技术、构建复杂系统能力的需求。DeepSeek作为国产开源大模型的代表，凭借其推理能力、多模态支持与低成本部署的特性，正在为技术教育带来突破性解决方案。二、DeepSeek赋能技术教育的核心技术优势1.推理能力驱动深度学习思维链（CoT
【人工智能基础2】机器学习、深度学习总结 roman_日积跬步-终至千里人工智能习题人工智能机器学习深度学习
文章目录一、人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数：四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络训练方法一、人工智能关键技术领域基础原理与逻辑机器学习机器学习基于数据，研究从观测数据出发寻找规律，利用这些规律对未来数据进行预测。基于学习模式，机器学习可以分为监督、无监督、强化学习
一文搞懂 AI Agent 与 AI 大模型的区别 a小胡哦人工智能 Manus Ai agent
在人工智能蓬勃发展的当下，新术语和新技术层出不穷。AIAgent和AI大模型便是其中的“明星”，但不少人对它们的区别感到困惑。今天，我们就以Manus这类AIAgent为例，深入剖析AIAgent与一般AI大模型的不同之处。Manus：Manus定义与核心能力AI大模型AI大模型是基于深度学习架构，通过海量数据训练得到的复杂模型，像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力，
清华大学《DeepSeek赋能家庭教育》深度解析：AI如何重塑现代家庭教育模式硅基打工人 AI 人工智能经验分享大数据开源语言模型
引言：家庭教育的困境与AI的破局在数字化与智能化浪潮下，家庭教育面临多重挑战：家长教育能力不足、教育资源分配不均、亲子沟通效率低下、个性化需求难以满足等。清华大学发布的《DeepSeek赋能家庭教育》系列报告（共56页）提出了一种基于人工智能的解决方案，通过深度学习平台DeepSeek，为家庭教育注入科技动能。本文将从技术原理、核心功能、应用场景、伦理安全及未来展望等多维度展开分析。一、DeepS
第5篇：从入门到精通：深入详解Python模块与包管理的应用猿享天开 python 开发语言
第5篇：模块与包管理目录模块概述什么是模块导入模块标准库简介创建与使用自定义模块创建模块导入自定义模块模块搜索路径包（Packages）什么是包创建包导入包中的模块常用内置模块介绍math模块datetime模块os模块sys模块模块与包的最佳实践命名规范组织结构避免循环导入示例代码常见问题及解决方法总结模块概述什么是模块模块是Python中组织代码的一种方式。一个模块就是一个包含Python定义
Java对接DeepSeek全攻略：从0到1小白无忧古龙飞扬 java 开发语言 ai
本文将带你从零开始，详细讲解如何在Java中对接DeepSeekAPI，适合小白用户。我们将从环境搭建、API调用、数据处理等方面逐步展开，并提供完整的代码示例。目录准备工作获取DeepSeekAPI密钥创建Java项目添加依赖使用Maven引入HTTP和JSON库编写代码创建请求和响应类发送HTTP请求处理API响应完整代码示例运行与测试常见问题与解决方案1.准备工作1.1获取DeepSeekA
IntelliJ IDEA 快捷键系列：重命名快捷键详解进一步有进一步的欢喜 intellij-idea java IDEA
目录引言一、默认重命名快捷键1.Windows系统‌2.Mac系统‌二、操作步骤与技巧1.精准选择重命名范围‌2.智能过滤无关内容‌三、总结引言在代码重构中，‌重命名变量、类、方法‌是最常用的操作之一。正确使用快捷键可以极大提升开发效率。本文针对‌Mac‌和‌Windows‌用户，详细讲解IntelliJIDEA中的重命名功能，并附上操作技巧和常见问题解决。一、默认重命名快捷键1.Windows系
Spring深度学习 — 关于 Spring 搬运Gong Spring spring
前言作为一名Java程序猿，相信对Spring都不陌生，那么我们经常使用的Spring的发展史大家都了解过吗？它是如何来的？又是如何一步一步成长到了现在这种不可替代的重要地位？下面将对Spring进行一个整体认知和学习，对后面的深度学习起到铺垫作用。本文意在对知识点的温顾，如文中有写的不对的地方，还望不吝指教。一、Spring的发展史相信经历过不使用框架开发Web项目的70后、80后都会高如此感触
Alipay SDK for Python 常见问题解决方案丁璟耀Optimistic
AlipaySDKforPython常见问题解决方案alipay-sdk-python-all支付宝开放平台AlipaySDKforPython项目地址:https://gitcode.com/gh_mirrors/al/alipay-sdk-python-all1.项目基础介绍和主要编程语言AlipaySDKforPython是支付宝官方提供的Python语言版本的SDK，用于帮助开发者快速接入
Android手机中各类安全相关知识总结数据知道 2025年爬虫和逆向教程 android 智能手机安全
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.Android安全威胁2.Android安全防护措施3.Android安全建议和最佳实践4.Android安全工具推荐5.Android安全常见问题5.1如何检测设备是否感染恶意软件？5.2如何防止应用滥用权限？5.3如何保护设备免受网络攻击？5.4设备丢失后如何保护数据？6.学习资源7.总结Android手机作为全球使用最广泛的移动操作系统
Android Studio运行错误分析与解决：Caused by: org.codehaus.groovy.control.MultipleCompilationErrorsException: s LuXi_foryou android studio android ide
AndroidStudio运行错误分析与解决：常见问题汇总作为一名Android开发者，在使用AndroidStudio时，难免会遇到各种运行错误。今天，我将分享一些常见的错误及其解决方法，帮助大家快速定位问题并修复代码。错误1：org.codehaus.groovy.control.MultipleCompilationErrorsException:startupfailed错误描述在运行或构
Ansible、Ansible Tower：操作Pan-OS与常见问题 2huxy Ansible Ansible Tower 运维 linux 运维
Ansible、AnsibleTower：操作Pan-OS一、安装1、控制节点中pip安装依赖：Ansible可以直接pipinstallpan-pyhtonpydevicexmltodictAnsibleTower涉及到虚拟环境的问题，应该把相应的虚拟PIP库装进对应模板的虚拟环境中sudo/var/lib/awx/venv/ansible/bin/pipinstallpan-pyhton2、A
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

深度学习常见问题

你可能感兴趣的:(深度学习常见问题)