丶Karl

第一课神经网络与深度学习第二周神经网络基础（已完结（虽然有坑））

视频地址

二分分类

怎么说，第一段话就颠覆了我的想象，遍历m个样本不需要用for循环

这里是介绍了图片的预处理，将图片切分为rgb三个颜色空间（这个我熟），然后将所有的分别将三幅单通道图片的所有像素排列为一个列向量，这样得到三个列向量

这里讲的是一些变量名称的约定

我们的训练样本为x，其经过神经网络处理后输出的结果为y，y的取值为0或1

一个数据规模为m的数据集，可以用ppt中第二行那样的形式表示

在实际使用中，我们常将特征向量作为列向量堆叠到数据集矩阵中（老师说这样有好处），将输出的y变成一个1×m的行向量（那这个中间的这个计算的矩阵是怎么操作的？？？）

logistic回归

这是一个学习算法，用在监督学习问题中，输出y的标签是0或者1时

需要一个算法，能够给出一个预测值（一个概率），当输入特征x满足条件时，y就是1

~~然后就开始讲一些我听不懂的东西了~~

老师首先说，对于logistic回归，我们给其中输入训练数据集x和系数w,b

一种可能的计算方法是线性的计算

但是这种计算的弊端很明显，我们算出来的y尖的值可能为负数或者大于1，这对于概率来说是没有任何意义的

然后引入了一个sigmiod函数（？？？），使计算式变为

这个应该是sigmoid函数的图像，他能够将x轴上的实数平滑的投影到0-1的区间内，解决了线性计算式概率会不符合规定的问题

这里是sigmoid函数的表达式

所以我们的任务就是得到较好的w和b

这里是另外的符号定义，老师说不会用

logistic回归损失函数

上一个视频介绍的是logistic回归的模型，为了训练这个模型，得到参数w和b，我们需要定义一个成本函数

老师首先讲上个视频的函数

为了让模型通过学习调整参数，要给一个m个样本的数据集

我们希望得到的w和b能够使预测值（模型算出，通过sigmoid函数作用于线性计算式得到的）与实际值（人手动标记的）接近

其中每个样本x都有其对应的y尖

接下来给出了一个损失函数（误差函数），其可以衡量算法的运行情况

其中一种可能的损失函数是

在学习这些参数的时候，会发现之后讨论的优化问题，会变成非凸的（听不懂），最后会得到很多个局部最优解，对于梯度下降法，可能得不到全局最优解

~~所以大家都不用，所以我们看下一种~~

我们通过定义这个损失函数，来衡量你的预测输出值y尖和y的实际值有多接近

由于上一种不好用，老师定义了另外一个损失函数，并同时解释了这个损失函数为什么行

老师举了两个极限的例子，分别是实际y=0时和实际y=1时的情况

y=1时，损失函数变为

我们的目的是让损失函数尽可能小，即y尖尽可能大，所以y尖会接近1，接近我们实际的y=1

y=0时，损失函数变为

损失函数尽可能小时，1-y尖要尽可能大，那么y尖会接近0，接近我们实际的y=0

当y与y尖接近时，损失函数很小，那么我们说这个损失函数是好的，这就是我们为什么用上面那个损失函数

下面才是我们所需要的成本函数

他衡量的是在全体训练样本上的表现（所以就是将损失函数求和）

梯度下降法

我们在上个视频中知道了logistic回归函数中有两个重要的参数：w和b，但是我们并没有说明如何得到这两个参数

所以这节课，我们将用梯度下降法来逼近这两个参数的最优取值

这里老师将成本函数的图像画了出来，根据这个图像，我们很直观的能够看到，对于这个成本函数而言，在数次迭代后，是一定有一组(w,b)，使得J(w,b)取到最小值，也就是我们需要的参数w和b的值

然后关于如何取w和b的初值，老师说对于logistic回归而言，任意的初始化方式都有效，一般我们初始化为0，当然随机数初始化也是可行的，但是不推荐

这里相当于变相的解释了，对于logistic回归，我们为什么要使用这个特定的成本函数

接下来解释梯度下降得到最优解的原理

老师为了简化解释过程，画了一个二维的图像

这个图像的最小值，相当于三维图像的最低点，这里的横轴是w，为了找到这个w，我们需要进行迭代，迭代的方式老师直接给出了，w=w-α×J的导数（α是学习率，老师在后面会进行解释），同时也进行了解释

假设我们的w此时在最小值的右边，我们需要往左移动，显然，这里函数的导数为正，那么经过迭代之后，w会减小，朝着我们目标方向前进

w在最小值的左边时也是同理

在最后，老师给出了我们在进行梯度下降时实际进行的操作，就是上面两个迭代的过程，关于这个符号，老师在这里没有使用偏导的符号，而是直接使用了一元函数求导的d，但是这无关紧要

导数

~~看这个标题，是数学课了~~

~~但是老师说听不懂也没关系哈哈哈哈哈哈~~

~~这是到目前为止唯一一集不用脑子就能听懂的课~~

老师说了斜率的定义，然后讲导数就是斜率，然后说了几个导数的表示方式

计算图（computation graph）

~~（？这集在讲什么）~~

老师说一个神经网络的计算都是按照前向或者反向传播过程来实现的，我们首先计算出神经网络的输出，紧接着进行一个反向传输操作，用反向传出的计算对应的梯度，导数，然后就直接是例子

这个例子中，老师讲了从输入计算出成本函数的过程，下一个视频要讲如何利用这个输出来计算我们所需要的导数（为什么可以计算出来？）

计算图的导数计算

这我看完，不就是链式求导？高数下警告！

散了吧散了吧，就是链式求导

但是求导可以让我们知道如何最快的下降到我们需要的最优解，这对于缩短训练时间有重要意义

logistic回归中的梯度下降法

这集主要介绍如何计算偏导数来实现logistic回归的梯度下降法

这里需要做一个解释（感谢弹幕）

这里的这个z的表达式，实际上w和x都是一个矩阵，这才会有后面z=(w1x1)+(w2x2)+b的这个式子

这里也需要作说明，这个损失函数L对a求偏导后（默认log的底数是e自然对数），就是

然后到了这张ppt，我认为也需要解释

dz=dL/dz=(dL/da)×(da/dz)

然后σ函数的表达式我们是已知的（自己翻前面的内容），求导之后直接等于a(1-a)（自己算！）

这是我们最后的ppt，计算出dw1，dw2，db（动笔算算吧）后，我们就可以更新我们的w1，w1和b（当然学习率还不知道是啥，慢慢来吧）

m个样本的梯度下降

这个视频讲的是如何将上个视频提到的方法应用到m个样本的训练集中

成本函数是损失函数的值的平均值，然后对于导数，可以是分开的求导之后再求和

根据上一个视频的推导，我们如果要完成一步梯度下降，对于一个二维向量，我们需要对于全局成本函数计算两个导数，分别对这两个特征进行求导（当然还有db），即求出下面三个值，然后带入给出的公式中，进行一步梯度下降

接下来需要逐行解释ppt，因为说实话有点听不懂

第一行是初始化，之前说对于logistic回归，我们可以任意初始化（随机初始化也可以，但不支持），所以这里所有值初始化为0

对于一个m个样本的训练集，我们需要遍历所有的样本（这里用的还是显式遍历，隐式遍历会在后面讲到），然后依次计算z，a，J，dz，dw1，dw2，db（假设一个样本只有两个特征）

然后计算平均值

之后进行更新，更新w1，w2，b的值

做一个说明，老师说我们在深度学习算法中若显式的使用for循环，会使算法很低效，我们需要完全不用显式for循环，对应的，有一门向量化技术，可以解决掉这些显式的for循环

这节课和上节课之间千万不能休息啊！（不然就会重新学一遍上一集的）

向量化

~~好耶第一个内容就是讲解什么是向量化~~

看完好像觉得，向量化就是调用了python里的一个库函数然后实现了，多线程实现了加速计算

这里是写了实际的代码来作为解释

然后老师说，只要能不用显式for循环，那就不要用

向量化的更多例子

这里还是朴素方法和库函数计算方法的比较

左边是朴素的向量v中每一个分量的指数运算，右边是直接一行代码就能解决问题，然后老师还举了几个numpy中的多个库函数，log，abs，maximum，平方（v**2）等

原本ppt上是标准的计算logistic回归导数的程序，然后板书是经过numpy优化后的版本

第一行初始化的时候，我们可以直接将dw初始化为一个全为0的向量，然后下面的两步优化可以直接用矩阵的计算来进行

向量化logistic回归

这节课将如何向量化实现logistic回归，然后首先讲如何使用向量来计算z=wT×x+b

我们让w为一个n×1的矩阵，x为一个n×m的矩阵（将每一个样本的特征值按照列进行排列，并排放到一起），b为一个实数，我们需要的z也是一个1×m的矩阵，这样当w的转置×X矩阵时，我们最后的结果就是一个1×m矩阵，就是我们需要的结果

最后在python中，这些操作合成了一句话，就是Z=np.dot(w.T,X)+b

最后的一步是计算a=σ(Z)，也可以直接用向量的方法计算

向量化logistic回归的梯度输出

看完只觉得大无语，说是不用for循环，只不过是把循环封装到了矩阵的运算之中，将我们大量的数据注入矩阵，利用矩阵的运算一次性算出我们的所有值

反正经过矩阵的构造，我们可以一次性计算我们需要的很多值

这里说的就是将之前用for循环的代码如何修改为不需要for的代码，但是需要注意的是，我们这里只做了一次迭代，如果需要多次的迭代，我们还是需要for循环，而且这种for循环是无法避免的

python中的广播

如题，这个视频主要讲的是python中的广播，类似于自动扩展作用范围（？）

老师首先抛出了一个例子，这是对于四种不同食物的一个卡路里来源表，问我们能不能不用for循环来计算出四种食物中的碳水化合物提供的卡路里的占比

~~md看到一半不禁感叹python真tm是一门神奇的语言~~

下面是实现上述描述的代码~~就两行，很快啊，不讲武德~~，然后老师说要讲另外的例子

比如说这个

~~离谱啊真离谱~~

我个人认为是不用记的，到时候要用的时候直接试一下就好了

这又是另外的例子，也基本上是最终的运算规律

关于python_numpy向量的说明

这里主要是讲一些注意事项，我到目前为止还没有接触过python，所以对老师说的这些东西还不是很有感触

有一点，在初始化时，一定要将向量初始化为1×5或者5×1这种，图片中的下面两种初始化方法是推荐的

Jupyter ipython笔记本的快速指南

啊，啥也没讲，就讲了一下他的这个ipython笔记本，没了

（选修）logistic损失函数的解释

我们在之前的视频中，并没有解释为什么要使用这个损失函数，所以这个视频就解释了，为什么要使用这样的损失函数

我们在之前的定义中，y尖是一个概率，由z经σ函数运算后，映射到0-1之间作为概率（后面写了σ函数的式子）

约定说y尖，是在给定的x的条件下，y=1的概率

所以

y=1时，P(y|x)=y尖

y=0时，P(x|x)=1-y尖

这里最上面两个式子是之前的条件概率的式子，然后第一个手写的式子是将这两个式子合并的结果（gay率论警告），下面绿色和紫色的式子是对这个合并的解释，然后对于这个log运算的解释，我的理解是

log在大于0范围内严格递增，那么我们只要得到了损失函数取对数之后的最大值，我们就能知道其还原之后的值，然后我们的损失函数是该log值的相反数，这样我们就能通过求原log值最大时，求得最小的损失函数

投降投降，这一张ppt是完全不懂的，全部是概率论的知识，给自己留个坑吧

视频地址在这里

写在后面

首先感谢你看到这里，这个博客我前前后后写了将近一个多星期的时间，中间有概率论，有电路，有大物等等科目的阻碍，还莫名其妙的当上了部长（没人认识我，我根本不保密哈哈哈哈哈哈），学了这么久也才学了一个星期的内容，但是我相信我可以坚持下去的！

怎么说，这是我第一次接触深度学习，原来也就是将计算的过程看做一个函数，然后得到我们需要的结果，但是这其中有大量的关于概率论，微积分和线性代数相关的知识，如果你看到了这里并且没有系统性的学习过这三大数学（虽然我概率论也没学），抓紧机会好好学一下，学习是一个快乐的过程，isn’t it?

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
《从依赖纠缠到接口协作：ASP.NET Core注入式开发指南》后端
在C#的ASP.NETCore开发中，依赖注入绝非简单的技术技巧，而是重构代码关系的底层逻辑。它像一套隐形的神经网络，让程序模块摆脱硬编码的束缚，在运行时实现动态连接，从而为系统注入可测试、可进化的核心生命力。理解其深层价值，需要穿透"服务注册与获取"的表层操作，触及它对软件设计哲学的重塑。依赖注入的本质，是对"依赖关系"的去中心化治理。传统开发中，模块间的依赖如同藤蔓缠绕的树木，一个组件直接创建
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

第一课神经网络与深度学习第二周神经网络基础（已完结（虽然有坑））

二分分类

logistic回归

logistic回归损失函数

梯度下降法

导数

更多导数的例子

计算图（computation graph）

计算图的导数计算

logistic回归中的梯度下降法

m个样本的梯度下降

向量化

向量化的更多例子

向量化logistic回归

向量化logistic回归的梯度输出

python中的广播

关于python_numpy向量的说明

Jupyter ipython笔记本的快速指南

（选修）logistic损失函数的解释

写在后面

你可能感兴趣的:(吴恩达深度学习课程,神经网络,深度学习,机器学习)

第一课 神经网络与深度学习 第二周 神经网络基础（已完结（虽然有坑））

二分分类

logistic回归

logistic回归损失函数

梯度下降法

导数

更多导数的例子

计算图（computation graph）

计算图的导数计算

logistic回归中的梯度下降法

m个样本的梯度下降

向量化

向量化的更多例子

向量化logistic回归

向量化logistic回归的梯度输出

python中的广播

关于python_numpy向量的说明

Jupyter ipython笔记本的快速指南

（选修）logistic损失函数的解释

写在后面

你可能感兴趣的:(吴恩达深度学习课程,神经网络,深度学习,机器学习)

第一课神经网络与深度学习第二周神经网络基础（已完结（虽然有坑））