ShannonPaul

吴恩达深度学习学习笔记

吴恩达教授的课可以在
1.Coursera（可以申请旁听免费）
2.DeepLearning AI（中国）
3.B站
4.网易云课堂（官方）
几个平台上面观看。
由于看视频后面可能会忘，可以翻看笔记快速回忆，免去来回看视频找知识点的痛楚。
笔记链接

配套练习：
github: https://github.com/robbertliu/deeplearning.ai-andrewNG
gitee: https://gitee.com/Mei_HW/deeplearning.ai-andrew-ng
kesci线上版目录：https://zhuanlan.zhihu.com/p/95510114

这是吴恩达deep learning的编程作业（含quiz）和黄博士写的配套课本（笔记）
链接：https://pan.baidu.com/s/1loWZxPn9wJGiZ0FIvZn8rw
提取码：bfft
编程作业的答案
B站评论区

2.9？学习了dvar的意思da，dw就是对应的导数
2.15 Python中的广播：axis的作用
2.16 关于向量的说明：提醒使用（5,1）这种形式，不要用（5,）这种形式，经常会出bug
2.18 从数学角度分析了logistic函数的损失函数为啥是那个
3.1 圆括号表示的是单个样本，方括号表示的是层
3.3 说了层的数字标号在哪里写
3.6 说了常见的几个激活函数
3.10 没看
3.11 随机初始化的时候不能初始化的一样的

4.1 介绍了一些符号，说符号定义会贴在课程里面https://blog.csdn.net/weixin_44917390/article/details/119676571
4.3 介绍了他自己用维数来查错的方法
第二课时
1.2 说了variance与bias，具体解释可看文章
1.4 正则化其实就是让神经网络变简单，防止把一些样本特有的特征也给拟合了，导致variance高，泛化性不强
1.6 dropout正则化：随机失活，随机消除
1.9 当输入特征X1,X2相差太大，比如X1属于[1,2]，X2属于[1,1000],要归一化输入特征
1.11 神经网络的权重初始化：w可以设为1/n，n为输入的特征数量
2.1 mini batch：batch使用花括号，比如X{1}，Y{1}，
2.2 mini batch = 1即为随机梯度下降法，mini batch=m，相对噪声低些，幅度也大些（学习率），mini batch=1，相对噪声大，并且失去了向量化带来的计算速度的提高，小样本（<2000）直接batch。mini batch 考虑到电脑计算，一般设置为2的次方
2.8 融合momentum和RMSprop算法就是这种Adam算法形式
其中V是momentum算法里面的，下面更号是RMSprop算法里面的，加了一个西格玛（很小），防止出现分母为0的情况

几个超参数，不过一般只会调整阿尔法
3.1 调试处理：怎么去选择超参数。画方格（但是这样会连续取五个相同的值），可以随机取值，然后呢找到较好的区域进行放大
3.2 超参数搜索的时候标尺不要用均匀标尺，用对数标尺，让落到不同数量级的概率一样
3.3 超参数调试的两种模式：熊猫模式（一步一步调试一个超参数模型）与鱼子酱模式（同时运行多个超参数模型，看哪一个好）。自己悟到了一点cost function的波动意义（波动就是因为学习率设置的比较大，设置较大的学习率可能会快速达到最优解附近，但是会震荡，设置小一点可能会下降慢，但是最后在很小范围内波动，但是刚才拿飞桨里面房价预测的问题跑了一下，好像不是这样。。。学习率）刚才思考了一下又有一些感悟，那张碗状图每一步并不是对一个训练数据来说的，而是对完成一个epoch（遍历一次训练集）来说的，每过一轮学习到一些特征，学习多了或者神经元多了会过拟合？分成batch既可以运用到向量化的好处，又可以学习更细？是哪个地方开始不能设置为0来着？又忘记了。
看一下飞桨那个房价预测（已经fork了）的代码顺序，每遍历一次训练集，就会保存一次model，下一个epoch拿出来作为基础继续训练（在上一轮中学习到了一些特征，下一轮继续学习）
3.6 解释了batch norm有什么用。mini batch越小，噪声越大（学习到的仅仅是这个mini batch的特征，不是整个训练集），正则化效果越好（泛化性越好）

batch norm公式，就是神经元的两个计算，左边计算出来z之后，经过batch norm，再进入右边算a

3.7说了batch norm中μ和西格玛方一般是粗略估计出来的，用指数加权平均等方法
3.8softmax层是用来输出多标签的，自己在这里回想到了加b（bias）的作用，不加bias最后其实整个网络都可以等同于一层网络。softmax就是把原来的激活函数改掉了，原来sigmoid输入一个real number，softmax输入一个4*1向量
3.9 hardmax是把最大的元素输出1，其它输出为0。还说了softmax的loss function。

1.1 改进策略

训练集(Train Set)
开发集(Dev Set)development set
测试集(Test Set)
顾名思义，训练集主要用来训练机器学习模型的参数。开发集用来对不同的超参数进行选择，而且这一过程是个迭代过程，因为事先不知道哪个参数比较适合当前的问题，需要多次尝试。最后，测试集用来验证最终的机器学习系统的性能。
1.2 正交化就是调节某个方向，不影响其他方向。就像开车方向调节和速度调节互不影响，要是会互相影响就很麻烦
1.3 precision（查准率）和recall（查全率）从目标样本和全体样本两个角度来分析的。F1综合这俩指标
1.4 optimizing metric（优化指标）要追求极致（如accuracy准确度），satisficing metric（满足指标）要满足（如运行时间）
1.8贝叶斯最优误差（不会超过这个，除非过拟合）
1.9 正则化或手机更多训练数据让dev error接近training error。avoidable bias可避免误差。avoidable bias可以通过增大网络，延长训练时间来实现

2.2 深度学习对于随机误差（不小心标注错误）的鲁棒性比较好。dev set的作用是在两个模型中选出更好的。对dev test修正那对test set也要修正，保证同分布。修正错误标签之后，要对原来正确的数据也要检查。防止出现模型改变后原来对的变成错的了。train set一般不用改，因为上面说的深度学习对于随机误差鲁棒性比较好
2.4 数据来自不同分布，怎么分配train set，dev set，test set。
2.5
加入training-dev set后怎么评价指标
2.6 误差分析找到dev set和training set的不同之处。人工合成训练集可能会导致对这一小部分过拟合。
2.7transfer learning迁移学习： pre-training预训练和 fine tuning微调（把图像识别的模型挪到放射识别，把最后一层网络重新训练，或者数据够多把全网络训练）使用情景：一个方向数据不多，另一个方向多，比如另一个已经学习到了图像的一些低级特征。
2.8 multi-task learning ：
2.9端到端深度学习：中间不再需要手工组件。直接喂入数据集，就能得到输出，但是有时候分成几步会更好，分开后会有更多数据集

1.2：kernel（核）=filter（过滤器）
1.4 卷积后大小为(n-f+1*(n-f+1)。padding就是在图像周围填充，一般填充0，好处是可以防止图像在一步步卷积操作中逐渐缩小，还可以防止丢失边缘信息。两种卷积方式，一种valid（不填充p=0），一种same（填充后卷积后大小不变）
1.5 stride步长加入步长后维度的公式为：((n+2p-f)/s)+1 * ((n+2p-f)/s)+1
1.6 RGB的filter也是三维的，最后卷积结果是一维的。文献里面chanel = depth
1.7 10个333的filter，无论图片多大，也只有280个parameters（参数），参数很少，避免了过拟合。

CNN的一些符号
1.8 讲了卷积神经网络的流程，为什么会越变越细长
1.9 说了池化层。pooling的两个超参数，f（filter size）和s（stride），若f=2，s=2.则相当于高度和宽度缩减一半。有最大池化和平均池化。padding一般不动，为0. 若有几个channel，就一层一层来。池化过程没有要学习的参数

2.2 说了三种经典论文里面的网络
2.3 说了残差网络
2.5 池化可以缩小长度和宽度。11卷积可以缩小通道数。
2.6 不知道使用33,55等等尺寸问题，可以使用inception网络，把它们全都堆叠在一起。 11卷积在inception网络中构建瓶颈层。可以减小计算成本
2.8 简单教了怎么用GitHub
2.9 迁移学习（transfer learning）：你的数据集比较小，你可以把别人训练好的参数也拿过来，然后前面冻结，只训练最后的softmax层。数据集多的话就冻结的少一点。
2.10 数据增强（data augmentation）：翻转，随机裁剪，调节RGB值（比方有的时候阳光会强一点就会发黄）。然后说了并行的线程thread实现。
2.11 ensembling和multi-crop（那个笔记里面还是有点解释的，这部分视频里面有点机翻的，literature文献翻译成文学，那个笔记里面改过来了）

3.1 目标定位：说了标签Y的的值分别代表什么。
3.2 关键点检测
3.3 滑动窗口检测
3.4 说了全连接层FC怎么改成卷积层。滑动窗口的实现不用依靠连续的卷积操作来实现，直接输入一整张图片，后面可以一次性获得所有值。滑动窗口的缺点是无法获得精确的框框柱目标
3.5 说了YOLO算法，找目标中心，分给对应的格子，所以不会出现一个目标分到两个格子里面。再给这个格子的label标签里面标上坐标信息。拿这个label去训练。这个卷积共享了很多运算，没有每一个格子都跑一边算法。可以做到实时检测。 bx，by要小于1（因为中点要位于方框内）。bw，bh可以大于1（因为汽车可能边缘部分超过方框）
3.6 intersession over union（IoT）交并比判断结果好坏
3.7 Non-max suppression（非最大值抑制）保证不会好几个框框柱同一个。把和最准确框有很高占IoT的其它框删掉。多类别检测的话每个独立进行非最大值抑制。
3.8 之前每个格子只能输出一个标签，但是会有多个物体中心都在一个格子里面的情况，这个时候可以使用anchor box，两个label上下叠一起。这些应该都是dataset里面标签用的。两个anchor box选择与你打好标签里面占并比更高的。
3.9 介绍了YOLO算法全流程。

设定了两个anchor box，所以每个grid cell都会有两个框。然后再用非最大值抑制
3.10 介绍了带区域的cnn:RCNN，先用图像分割算法选出候选区域

4.2 one-shot learning问题，可以用similarity function，而不是之前的那些softmax function，这个函数输入两张图片对比相似度
4.3 Siamese network 比较两个图片输出范数平方
4.4 介绍了损失函数：triplet三元组
4.5 介绍了面部识别的二分类，可以提前把一个人脸的embedding存起来，减少运算量。
4.7 说了卷积网络的几层都在检测些什么东西。感觉这一块是偏感性的东西
4.8 说了风格迁移要定义两个损失函数，一个是内容，一个是风格。

4.9 说了内容损失函数
4.10 这里矩阵用G因为在线性代数里面这种矩阵叫做Gram矩阵。其他没咋听懂。
4.11 说了三维和一维，一维就是序列模型了。

1.2 下标表示你要算出来的是啥，比如Wy意思是这个矩阵等下算出来的是y
1.7 模型模拟了任意单词序列出现的概率。基于词汇和基于字符的两种形式。
1.9 GRU擅长捕捉长距离的依赖。a是激活值action，b是bias。
1.10 GRU和LSTM没咋听懂。。。
1.11 RNN和BRNN是两种传递方式。这两种传递方式的框有GRU和LSTM这几种。

2.1 one hot表示变成embedding。featurized representation
2.2 人脸识别的encoding和词的embedding其实一样，最后都是一个向量，包含了它的特征。
2.3 cosine similarity 用来计算两个向量之间的相似度。 s-SNE的为了将其在二维展示使用了非线性映射，所以看不出来那种非线性关系
2.4 嵌入矩阵*one hot = 这个词的嵌入向量，实践中一般不乘，直接提取
2.5 自己在想：要想训练网络那肯定要有标签，然后反向传播。
2.6 介绍了skip-gram model。 hierarchyical classifier分级softmax分类器，构造树，常用的词在上面。不过还会一般用负采样。Word2Vec的softmax操作很昂贵
2.8 实际上词嵌入的轴并不是理想化的某个属性，比如性别等，而是很多混在一起。
2.9 普通的情感分析把所有词嵌入加在一起平均，但是没有考虑到词序，可能很多good前面有一个not。可以使用RNN解决。
2.10 词嵌入除偏见。

3.1 seq2seq 和 image to sequence
3.2 相比之前随机输出翻译，机器翻译模型会找最有可能的英语句子翻译
3.3 beam search 来实现输出最有可能的英语句子翻译。bean width为3，就是每次保存最有可能的三个单词，若是贪心算法的话就只能保持一个了。每次都会选择前三种可能的，所以不会一直增大
3.4 取那个概率的最大值，因为项都小于1，所以可能最后数字太小不利于电脑浮点数存储，可以取log，这样小于1的数相乘就变成小于1的项相加了。因为每个项都小于1，为了防止倾向与输出短句子，可以使用归一化，就是除以单词个数，还可以进一步在除的个数上加个指数阿尔法，为1就是除以个数，为0就是不除。阿尔法也是一个超参数
3.5 束搜索算法是一种近似搜索算法（an approximate search algorithm），也被称作启发式搜索算法（a heuristic search algorithm）句子翻译效果不好，通过这一节教的误差分析可以分析出来是是RNN没做好（正则化或者加入更多数据，或者换一个网络结构）还是beam search没做好（增大集束宽度）
3.6 一句话有很多正确的翻译，不是唯一答案，怎么判断句子翻译的好不好呢，可以用Bleu：有一元组，二元组等等，算法是把翻译中的n个连续的词组在reference中出现的次数除以样本总词组数（描述不太清楚自己看去），最后除以一个用了几个元组。防止倾向输出短句子，加上一个BP简短惩罚自己对深度学习的理解刚刚一下子悟道了：给机器训练集，标签，接下来等它自己总结规律就行了，确实非常玄学，算力飞升过拟合，但是只要训练集够完美，算力提升就完事了
3.9 语音识别的CTC模型，解决了多输出的问题。可能有10秒*100HZ = 1000的输入，但是输出只有10个字母，可以把相邻相同的合并。

景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
深入探讨盘古大模型的高精度多尺度能力 Hardess-god WRF 人工智能算法
随着人工智能技术的快速发展，大模型的研究逐渐进入新的阶段。其中，盘古大模型以其卓越的高精度和多尺度处理能力成为研究热点。本文将详细分析盘古模型在高精度多尺度问题上的技术特征、优势和应用潜力，并探讨其深入研究的方向。一、盘古模型概述盘古模型是华为推出的中文预训练大模型系列，拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础，通过海量文本数据进行训练，表现出优异的自然语言理解和生成能
AI巨浪中的安全之舵：天空卫士助力人工智能落地远航天空卫士人工智能安全数据安全网络安全大数据
"AI时代的安全战场，不在云端在本地；数据治理的胜负手，不在防御在认知。"近期，众多企业纷纷接入DeepSeek大模型，迅速推动了大型模型应用的广泛铺开。无论是在制造业、金融业，还是在医疗、教育等领域，DeepSeek大模型的应用都如火如荼，遍地开花，展现出了其广泛的应用前景和巨大的商业价值。顺势而来的是DeepSeek一体机以"低成本、高算力、私有化部署"的优势席卷企业市场。因为DeepSeek
DeepSeek重塑软件行业：研发工程师的机遇与挑战 LiuSid7 人工智能 llama 语言模型 ai
人工智能技术的浪潮正以前所未有的速度重塑软件行业，而DeepSeek作为其中的代表性技术，已成为研发工程师日常工作中不可忽视的变革力量。从代码生成到架构优化，从效率提升到职业生态重构，DeepSeek正在重新定义工程师的工作范式。以下从技术革新、职业发展、行业趋势三个维度，分析其对研发工程师的核心影响。一、技术革新：从“重复劳动”到“创造力释放”代码生产的效率革命DeepSeek通过自然语言指令生
机器学习结合伏羲模型高精度多尺度气象分析与降尺度实现 Hardess-god WRF 算法人工智能
随着人工智能的发展，机器学习技术在气象预报领域展现出巨大潜力。本文详细探讨如何结合机器学习（ML）和伏羲模型进行高精度多尺度气象模拟分析，并提供详细的实现步骤和相关代码。1.研究目标与技术路线目标：结合机器学习模型与伏羲气象模式，实现区域和局地高精度降尺度。技术路线：伏羲模型提供大尺度气象数据和预报使用机器学习模型（如CNN、LSTM、XGBoost）进行降尺度2.数据准备与处理2.1气象数据获取
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南 m0_57781768 python langchain 搜索引擎
使用Python和LangChain构建检索增强生成（RAG）应用的详细指南引言在人工智能和自然语言处理领域，利用大语言模型（LLM）构建复杂的问答（Q&A）系统是一个重要应用。检索增强生成（RetrievalAugmentedGeneration，RAG）是一种技术，通过将模型知识与额外数据结合来增强LLM的能力，使其能够回答关于特定源信息的问题。这些应用不仅限于公开数据，还可以处理私有数据和模
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

吴恩达深度学习学习笔记

你可能感兴趣的:(人工智能,深度学习)