魏宝航

【吴恩达课后编程作业】深度学习和神经网络第二周作业 Logistic回归

【吴恩达课后编程作业】Course 1 - 神经网络和深度学习 - 第二周作业 - 具有神经网络思维的Logistic回归

上一篇：【课程1 - 第二周测验】 ✌✌✌✌ 【目录】 ✌✌✌✌ 下一篇：【课程1 - 第三周测验】

首先说明一下，大学生一枚，最近在学习神经网络，写这篇文章只是记录自己的学习历程，起总结复习的作用，别无它意，本文参考了zsffuture的博客、布衣先生real的博客、孔小爽的博客、何宽的博客以及Github上fengdu78老师的文章进行学习

✌ 我们要实现一个能够识别猫的图片的简单神经网络

numpy：
matplotlib：python的画图工具
h5py：读取h5格式文件的工具
lr_utils：用于加载训练及测试数据

import numpy as np
import matplotlib.pyplot as plt
import h5py
from lr_utils import load_dataset

✌ 加载训练测试数据集

x_train：训练集数据
x_test：测试集数据
y_train：训练集标签
y_test：测试集标签

x_train,x_test,y_train,y_test,classes=load_dataset()

✌ 查看测试集的维度

这里的数据维度应为4维，例 [ 20 , 32 , 32 , 3]
第一维表示有多少张图片，2维和3维表示图片的宽和高，而第4维的3代表像素，RGB红绿蓝
这里就是有20张图片，每张的图片为的32*32的彩色图片，如果是1则为黑白照片

print(x_test.shape)

✌ 打印数据集的详细数据

print('训练集的数量：',x_train.shape[0])
print('测试集的数量：',x_test.shape[0])
print('训练集的数据维度：',x_train.shape)
print('测试集的数据维度：',x_test.shape)
print('训练集的标签维度：',y_train.shape)
print('测试集的标签维度：',y_test.shape)
print('图片的维度：',x_train[0].shape)

查看输出结果：

训练集的数量： 209
测试集的数量： 50
训练集的数据维度： (209, 64, 64, 3)
测试集的数据维度： (50, 64, 64, 3)
训练集的标签维度： (1, 209)
测试集的标签维度： (1, 50)
图片的维度： (64, 64, 3)

✌ 将图片数据向量化

上面说到测试集的图片维度为 (50, 64, 64, 3)，我们要将每个像素点提取出来作为1个特征，说白了就是将图片拉长，变成50行，64643列的矩阵
那么为什么要将其转置呢，正常来说不是行数代表样本量，列数代表特征数吗？
这是因为后面构建神经网络时，涉及到矩阵的运算，转置后计算会更方便一些，看到后面你就会get到这个点

x_train=x_train.reshape(x_train.shape[0],-1).T
x_test=x_test.reshape(x_test.shape[0],-1).T

✌ 打印向量化后的数据维度

print(x_train.shape)
print(x_test.shape)

查看输出结果：

(12288, 209)
(12288, 50)

✌ 向量归一化

在传统机器学习中，我们在将数据导入模型训练之前首先要将数据归一化，转化到0~1之间，为了消除量纲的影响和有利于模型的计算
而在图片也需要这点，但图片的处理方式会更容易一些，因为图片的每个像素是0~255之间的数字组成，所以我们只需要将该图片矩阵除255即可，就会将矩阵缩放到0-1之间

x_train=x_train/255
x_test=x_test/255
x_train[0,0:10]

查看第一张图片的前10个特征：

array([2.61437908e-04, 3.01422530e-03, 1.26105344e-03, 1.53787005e-05,
       1.38408304e-04, 1.29181084e-03, 8.61207228e-04, 2.92195309e-04,
       9.68858131e-04, 3.53710111e-04])

✌ 神经网络介绍

现在我们的准备工作已经做好了，接下来就是搭建神经网络
$z = w . T * X + b$
$y = a = s i g m o i d (z)$
单一样本的损失：
$L （ y ， a ） = - (y * l o g (a) + (1 - y) * l o g (1 - a))$
计算所有样本的平均损失值：
$J=1/m\sum_{i=0}^mL（y，a）$
搭建神经网络的主要步骤是：

定义模型结构（例如输入特征的数量）
初始化模型的参数
不断迭代（调整参数）：

3.1 计算当前损失（正向传播）

3.2 计算当前梯度（反向传播）

3.3 更新参数（梯度下降）

✌ 定义sigmoid函数

$a = s i g m o i d (z)$
$sigmoid=1/(1+e^-x)$
因为我们要做的是二分类问题，所以到最后要将其转化为概率，所以可以利用sigmoid函数的性质将其转化为0~1之间

def sigmoid(z):
	"""
	功能：激活函数，计算sigmoid的值
	
    参数：
        z  -  任何维度的矩阵
        
    返回：
        s  -  sigmoid（z）
    """
    s=1/(1+np.exp(-z))
    return s

✌ 定义初始化w、b的函数

在进行梯度下降之前，要初始化w和b的值，我们为了简单都将其初始化为0
w的维度应为（特征数，1）
这里就验证了之前说到的特征转置
$z = w . T * X + b$
可以看到刚好对应矩阵的维度
b为一常数

def init_w_b(dim):
	"""
	功能：初始化w，b的维度和值
	
    参数：
        dim  -  w要初始化的行维度，就是特征数
        
    返回：
        w    -  初始化好的（dim，1）维矩阵
        b    -  常数0
    """
    
    # 将w初始化为列矩阵
    w=np.zeros((dim,1))
    b=0
    
    return w,b

✌ 定义传播函数

神经网络分为正向传播和反向传播
正向传播计算求出损失函数，然后反向计算各个梯度
然后进行梯度下降，更新参数

def propagate(w,b,X,Y):
    """
    功能：正向传播和反向传播
    	 计算损失函数，以及各权重w，偏置b的梯度
    	 
    参数：
        w  - 初始化好的权重矩阵（特征数，1）维
    	b  - 偏置b
    	X  - 训练数据 （特征数，样本数）维
    	Y  - 训练标签 （1,样本数）维
    	
    返回：
        grads  -  各权重和偏置的梯度
        loss   -  损失值
    """
    # m:为样本数
    m=X.shape[1]
    
    # 正向传播计算损失
    a=sigmoid(np.dot(w.T,X)+b)
    loss=(-1/m)*np.sum(Y*np.log(a)+(1-Y)*np.log(1-a))
    
    # 反向传播计算梯度
    dw=(1/m)*np.dot(X,(a-Y).T)
    db=(1/m)*np.sum(a-Y)
    
    grads={
     'dw':dw,'db':db}
    
    return grads,loss

✌ 定义优化器函数

目标是通过最小化损失函数 J来学习 w 和 b 。对于参数 λ，更新规则是 $w = w - λ * d J / d w$ $b = b - λ * d J / d b$ ，其中 λ 是学习率。
num_iter代表梯度下降时的迭代次数，就是w的改变次数，求取损失函数的最小值，即全局最优解，这里可能会产生局部最优解，会影响模型结果，这里不与阐述，可以选择其他较好的优化器
大多数优化器都是基于梯度下降这种方法，只不过具体的数学计算有些不同

def optimizer(w,b,X,Y,num_iter,lr,print_loss=False):
	"""
    功能：优化函数，进行梯度下降，不断更新权重值，求取最优解
    	 
    参数：
        w  - 初始化好的权重矩阵（特征数，1）维
    	b  - 偏置b
    	X  - 训练数据 （特征数，样本数）维
    	Y  - 训练标签 （1,样本数）维
    	num_iter  - 梯度下降时的迭代次数
    	lr  - 学习率  w=w-lr*dw
    	print_loss  - 是否每100次迭代打印一次缺失值
    	
    返回：
    	params -   训练好后的w和b值
        grads  -   各权重和偏置的梯度
        loss   -   各迭代次数下的损失值
    """
    # 不同迭代次数下的损失值
    losses=[]
    
    # 进行迭代
    for i in range(num_iter):
        
        # 开始传播，计算梯度
        grads,loss=propagate(w,b,X,Y)
        
        dw=grads['dw']
        db=grads['db']
        
        # 更新参数，梯度下降
        w=w-lr*dw
        b=b-lr*db
        
        if i%100==0:
            losses.append(loss)
        
        if print_loss and i%100==0:
            print('迭代次数：%d，误差值：%f'%(i+1,loss))
        
    params={
     'w':w,'b':b}
    
    grads={
     'dw':dw,'db':db}
    
    return params,grads,losses

✌ 定义预测函数

上面optimizer函数会输出已经训练好的w、b参数，我们可以利用它们进行预测新的样本集
进行预测两个步骤：

$y = a = s i g m o i d (w . T * X + b)$
利用概率将其转化为0-1类别
将结果存储到y_pred中

def predict(w,b,X):
	"""
    功能：利用优化好的w和b值进行预测
    	 
    参数：
        w  - 初始化好的权重矩阵（特征数，1）维
    	b  - 偏置b
    	X  - 训练数据 （特征数，样本数）维
    	
    返回：
    	y_pred -  预测值（1,样本数）维
    """
    # 样本数
    m=X.shape[1]
    
    # 将y_pred变成和标签同维度的举证
    y_pred=np.zeros((1,m))
    
    # 激活
    a=sigmoid(np.dot(w.T,X)+b)
    
    # 根据概率进行二分类判断
    for i in range(m):
        y_pred[0,i]=1 if a[0,i]>0.5 else 0
    
    return y_pred

✌ 定义模型函数

我们已经将所需要的所有函数已经封装好了，现在需要一个训练函数调用它们，完成模型的训练，model的作用就是如此

def model(x_train,x_test,y_train,y_test,num_iter,lr,print_loss=False):
	"""
    功能：利用前面封装好的函数进行训练
    	 
    参数：
        x_train  - 训练数据（特征数，样本数）
    	x_test  - 初始化好的权重矩阵（特征数，样本数）
    	y_train  - 初始化好的权重矩阵（1，样本数）
    	y_test  - 初始化好的权重矩阵（1，样本数）
    	num_iter  - 梯度下降的迭代次数
    	lr  - 学习率
    	print_loss  - 是否每100次打印loss值
    	
    返回：
    	d - 预测结果以w，b等数据
    """
    # 初始化参数w、b
    w,b=init_w_b(x_train.shape[0])

	# 开始梯度下降
    params,grads,losses=optimizer(w,b,x_train,y_train,num_iter,lr,print_loss)
    
    w,b=params['w'],params['b']
    
    # 预测训练集和测试集
    y_pred_train=predict(w,b,x_train)
    y_pred_test=predict(w,b,x_test)
    
    # 计算准确率
    print('训练集的准确性：%.3f'%((y_pred_train==y_train).sum()/y_train.shape[1]*100),'%')
    print('测试集的准确性：%.3f'%((y_pred_test==y_test).sum()/y_test.shape[1]*100),'%')
    
    d = {
     
            "losses" : losses,
            "y_pred_train" : y_pred_train,
            "y_pred_test" : y_pred_test,
            "w" : w,
            "b" : b,
            "learning_rate" :lr,
            "num_iter" : num_iter }
    return d

✌ 进行测试

我们将我们处理好的训练测试集传入，测试下模型的效果，并每迭代100次打印下损失函数的值，观察模型效果是否得到了优化

print("====================测试model====================")     
d = model(x_train,x_test,y_train,y_test,2000,0.003,True)

查看输出结果：

====================测试model====================
迭代次数：1，误差值：0.693147
迭代次数：101，误差值：0.686231
迭代次数：201，误差值：0.680305
迭代次数：301，误差值：0.675226
迭代次数：401，误差值：0.670873
迭代次数：501，误差值：0.667139
迭代次数：601，误差值：0.663935
迭代次数：701，误差值：0.661184
迭代次数：801，误差值：0.658821
迭代次数：901，误差值：0.656790
迭代次数：1001，误差值：0.655043
迭代次数：1101，误差值：0.653539
迭代次数：1201，误差值：0.652244
迭代次数：1301，误差值：0.651129
迭代次数：1401，误差值：0.650167
迭代次数：1501，误差值：0.649337
迭代次数：1601，误差值：0.648620
迭代次数：1701，误差值：0.648002
迭代次数：1801，误差值：0.647467
迭代次数：1901，误差值：0.647004
训练集的准确性：65.550 %
测试集的准确性：34.000 %

✌ 画学习曲线

这里我们可以看到随着迭代次数的增加，模型的损失函数越来越小，这都是梯度下降所起到的作用，说明我们的w、b等值更新的正确，朝着全局最优解的方向进行

losses=d['losses']
# 横坐标为迭代次数*100 ，纵坐标为损失值
plt.plot(range(1,len(losses)+1),losses)
plt.title('l r=0.003')
plt.xlabel('iters(*100)')
plt.ylabel('losses')
plt.show()

✌ 学习率曲线

上面我们看到当学习率为0.03时模型效果并不是很好，可能是梯度下降时影响了参数的变化速率及值的变化，所以我们可以画学习曲线去观察不同学习率的模型评估效果

lr=[0.01,0.001,0.0001,0.00001]
models={
     }
for i in lr:
    print('learning rate is :',i)
    models[str(i)]=model(x_train,x_test,y_train,y_test,2000,i)
    print('\n'+"----------------------------------------")
    
for i in lr:
    plt.plot(range(1,len(models[str(i)]['losses'])+1),models[str(i)]['losses'],label=str(i))

plt.xlabel('iter(*100)')
plt.ylabel('losses')

plt.legend(loc='upper right')

plt.show()

查看输出结果：

learning rate is : 0.01
训练集的准确性：99.522 %
测试集的准确性：70.000 %

----------------------------------------
learning rate is : 0.001
训练集的准确性：91.388 %
测试集的准确性：68.000 %

----------------------------------------
learning rate is : 0.0001
训练集的准确性：71.292 %
测试集的准确性：40.000 %

----------------------------------------
learning rate is : 1e-05
训练集的准确性：65.550 %
测试集的准确性：34.000 %

----------------------------------------

国外7个最佳大语言模型 (LLM) API推荐程序员后端
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【部署】Ktransformer是什么、如何利用单卡24GB显存部署Deepseek-R1 和 Deepseek-V3 仙人掌_lz 人工智能人工智能 AI 部署自然语言处理
简介KTransformers是一个灵活的、以Python为中心的框架，旨在通过先进的内核优化和放置/并行策略提升HuggingFaceTransformers的使用体验。它具有高度的可扩展性，用户可通过单行代码注入优化模块，获得兼容Transformers的接口、符合OpenAI和Ollama的RESTfulAPI，甚至简化的ChatGPT风格的WebUI。KTransformers的性能优化基
C语言-回调函数的应用 woainizhongguo. C/C++c语言
什么是回调函数回调函数就是一个被作为参数传递的函数。在C语言中，回调函数只能使用函数指针实现，在C++、Python、ECMAScript等更现代的编程语言中还可以使用仿函数或匿名函数。工作机制⑴定义一个回调函数；⑵提供函数实现的一方在初始化的时候，将回调函数的函数指针注册给调用者；⑶当特定的事件或条件发生的时候，调用者使用函数指针调用回调函数对事件进行处理。应用案例（1）应用层：通过调用hal层
Python Union 联合类型注解详解人才程序员杂谈 python 服务器 java linux 后端软件工程开发语言
文章目录PythonUnion联合类型注解详解1.什么是Union联合类型？**语法（Python3.9及之前版本）**：**语法（Python3.10及之后版本）**：2.Union联合类型注解示例**(1)使用Union来表示多个类型的参数****(2)使用`|`来表示联合类型（Python3.10及之后版本）**3.使用Union进行复杂类型注解**(1)使用Union与列表结合****(2
Ubuntu22.4.03服务器版安装及搭建深度学习环境的问题总结蜡笔小祎在线学习问题集合深度学习人工智能
Ubuntu22.4.03服务器版安装流程整个流程已经有很多分享帖了，这里概述一下：下载iso制作启动U盘，按f2进入安装，选择语言，键盘布局english，ubuntuserver安装，DHCP自动配置网络（问题1），代理服务器我们没填，配置阿里云镜源http://mirrors.aliyun.com/ubuntu/，磁盘分区（问题2），设置服务器密码，安装ssh远程工具，重启reboot。可参
OpenAI揭示o3的推理过程，以弥合与DeepSeek-R1的差距 c++服务器开发人工智能 deepseek
生成式人工智能开发商OpenAI公司首席执行官SamAltman最近在RedditAMA问答活动中承认，该公司在开源软件研究方面站在了“历史错误的一边”。尽管OpenAI公司尚未发布其开源模型，但已经迈出了提高透明度的第一步。正如该公司在其X帐号上所宣布的那样，其最新的推理模型o3-mini现在展示了其思维链（CoT）跟踪的更详细版本。此前，OpenAI公司的推理模型仅展示了CoT的高级概述，这使
释放 DeepSeek 的力量：像专家一样本地安装与探索！ guzhoumingyue AI python
要在本地运行DeepSeek，您需要遵循以下步骤。请确保您的计算机上已安装Python和Git，并且满足DeepSeek的依赖项。步骤1:安装依赖项安装Python和pip确保您已安装Python（建议使用Python3.6及以上版本）。您可以通过在终端/命令提示符中输入以下命令来检查Python是否已安装：bash复制代码python--version或者bash复制代码python3--ver
国鑫DeepSeek 671B本地部署方案：以高精度、高性价比重塑AI推理新标杆 Gooxi国鑫人工智能服务器
随着DeepSeek大模型应用火爆全球，官方服务器总是被挤爆。而且基于企业对数据安全、网络、算力的更高需求，模型本地化部署的需求日益增长，如何在有限预算内实现高效、精准的AI推理能力，成为众多企业的核心诉求。国鑫作为深耕AI领域的技术先锋，推出基于4台48GRTX4090或8台24GRTX4090服务器的2套DeepSeek“满血”版本地部署方案，以FP16高精度、高性价比、强扩展性三大优势，为企
嵌入式MCU平台汇总 TENET- 嵌入式单片机嵌入式硬件 mcu
文章目录1.单片机（MCU）2.数字信号处理器（DSP）3.ARMCortex系列4.超低功耗MCU5.物联网MCU（IoTMCU）6.开源架构MCU（RISC-V）7.可编程逻辑器件（FPGA）1.单片机（MCU）概念:单片机（MicrocontrollerUnit，MCU）是集成了中央处理器（CPU）、存储器（RAM、ROM或Flash）、输入输出端口（I/O）以及各种外设（如定时器、串行通信
【Tools/macOS系列】macOS终端配置：zsh+iTerm2+OhMyZsh 飞翔的鲲【实用工具专栏】macOS zsh iTerm2 终端 ohmyzsh
DATE:2021.7.17文章目录1、前言2、参考3、终端和vim配置效果图4、终端配置步骤4.1、安装iTerm24.2、安装oh-my-zsh4.3、主题和颜色4.4、插件4.5、特殊字体Hackherdfont4.6、vim配置4.7、随时唤起4.8、自定义界面壁纸1、前言macOS的终端Terminal界面非常简单，没有Linux下面的颜色设置和自动补齐等功能，用起来非常不方便。本文讲解
ffmpeg-python安装 neverayever 计算机 ffmpeg python linux
centos-ffmpeg-python安装安装ffmpeg一：下载并解压wgethttp://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gztar-zxvfffmpeg-4.2.tar.gz若linux服务器没网，可以在windows上直接访问http://www.ffmpeg.org/releases/ffmpeg-4.2.tar.gz就可下载，然后上传至服
SMT贴片加工中回流焊接机的关键工艺 CIT_PCBA pcb工艺制造
SMT贴片指的是在PCB基础上进行加工的系列工艺流程的简称。PCB(PrintedCircuitBoard)意为印刷电路板。(原文:SMT贴片指的是在PCB基础上进行加工的系列工艺流程的简称PCB(PrintedCircuitBoard))SMT是表面组装技术(表面贴装技术)(SurfaceMountedTechnology的缩写)，是目前电子组装行业里最流行的一种技术和工艺。电子电路表面组装技术
教你本地复现Deep Research：DeepSeek R1+ LangChain+Milvus 大模型入门教程 langchain 人工智能大模型学习大模型 DeepSeek AI大模型大模型教程
金融机构、律所、科研党的福音来了！不久前，OpenAI新推出了一项名叫DeepResearch（深度研究）的功能，迅速风靡全球。我们可以将其理解为大模型+超级搜索+研究助理的三合一。在这项功能里，用户输入查询问题后，只需要选择DeepResearch选项，OpenAIo3就能自动查找分析数百优质在线资源，并对其进行综合整理并加工，为用户生成一份具备专业分析师水准的综合报告。不仅内容生成更加详实，而
“深入浅出”系列之QT：（10）Qt接入Deepseek 我真不会起名字啊 qt 开发语言
项目配置：在.pro文件中添加网络模块：QT+=corenetworkAPI配置：将apiUrl替换为实际的DeepSeekAPI端点将apiKey替换为你的有效API密钥根据API文档调整请求参数（模型名称、温度值等）功能说明：使用QNetworkAccessManager处理HTTP请求自动处理JSON序列化/反序列化支持异步请求处理包含基本的错误处理扩展建议：添加更完善的错误处理（HTTP状
22.4.3.1 IPGlobalProperties类 .Net学习 C#教程 c#网络
版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。IPGlobalProperties类提供有关本地计算机的网络接口和网络连接的配置和统计信息。此类提供的信息与IPHelperAPI函数提供的信息相似。IPGlobalProperties常用属性：DhcpScopeName：动态主机配置协议(DHCP)范围名。DomainName：在其中注册本地
Python的那些事第二十七篇：Python中的“数据魔法师”NumPy 暮雨哀尘 Python的那些事 python numpy 开发语言数据分析算法数组索引
摘要在这篇幽默风趣的论文中，我们将深入探讨NumPy——Python中最强大的数值计算库之一。它不仅提供了高性能的多维数组对象，还让复杂的数学运算变得像吃冰淇淋一样简单。本文将通过生动的代码示例和幽默的比喻，带你领略NumPy的魔法世界，让你在欢笑中掌握这个强大的工具。一、引言：为什么NumPy是程序员的“超级英雄”？1.1NumPy的起源：从“数据苦力”到“数据魔法师”想象一下，你被困在一个全是
第26篇：pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA使用lora微调的模型异构个性化联邦学习还不秃顶的计科生联邦学习深度学习人工智能开发语言
第一部分：解决的问题联邦学习（FederatedLearning,FL）是一种分布式机器学习方法，允许客户端在本地数据上训练模型，同时通过中心服务器共享学习成果。传统FL框架假设客户端使用相同的模型结构（模型同构），但在实际中可能面对：统计异质性：客户端的数据分布不均（non-IID）。资源异质性：客户端硬件资源有限。模型异质性：客户端可能拥有不同的模型结构。模型异构的个性化联邦学习（MHPFL）
零基础学会asp.net做AI大模型网站/小程序十六：专栏总结借雨醉东风 asp.net 小程序后端
本专栏以实战为主，轻理论。如果哪里有不太懂的，可关注博主后加个人微信（平台规定文章中不能贴联系方式，需先关注博主，再加微信），后续一起交流学习。-------------------------------------正文----------------------------------------目录本专栏总结后续方向项目简介项目结构使用方法项目地址关键特点LLaMA机器学习简介使用LLaMA
vue中原生表格的使用今天吃了嘛o table原生 vue
因项目中需要大量的合并，而且表格左右布局，所以采用了原生table。colspan和rowspan分别代表合并多少行多少列。代码如下：线路名称{{item.lineName}}巡检区段{{item.scope}}运维管理单位{{item.operationAndMaintenanceCompany}}运检作业单位{{item.insWorkCompany}}巡检员{{item.droneWorkU
GPT (Generative Pre-trained Transformer) 彬彬侠自然语言处理 gpt transformer 预训练 NLP 自然语言处理
GPT(GenerativePre-trainedTransformer)是由OpenAI提出的一个基于Transformer架构的自回归语言模型。GPT模型通过大规模无监督预训练，使用大量的文本数据进行学习，然后再进行微调（fine-tuning）来适应具体的下游任务。GPT的设计目标是能够理解和生成自然语言文本，并且它以其出色的自然语言生成能力在多个领域取得了显著的成果。GPT的基本原理GPT
Vision Transformer（ViT）：用 Transformer 颠覆图像识别金外飞176 论文精读 transformer 深度学习人工智能
VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。然而，近年来，自然语言处理（NLP）领域中大放异彩的Transformer架构也开始在图像识别中崭露头角。今天，我们将深入探讨一种创新的架构——VisionTransformer（ViT），它将Transformer的强大能力直接应用于图像
mac mini m1芯片 Xcode 15.3 各种报错的问题 OKXLIN macos xcode ide
错误一：/Users/mac/Desktop/Test_project/mobile-ios/Test/Test-Bridging-Header.h:4:9failedtoemitprecompiledheader'/Users/mac/Library/Developer/Xcode/DerivedData/App-apvcgkuclncgfqdlzqcoffyaexos/Build/Interm
若依前后端分离集成CAS详细教程 Roc-xb 单点登录前后端分离 CAS
目录一、后端配置1、添加cas依赖2、修改配置文件3、修改LoginUser.java4、修改Constants.java5、添加CasProperties.java6、添加CasUserDetailsService.java7、添加CasAuthenticationSuccessHandler.java8、修改SecurityConfig9、启动后端二、前端配置1、修改settings.js2、
基于Transformer的YOLOv8检测头架构改进：提升目标检测精度的全新突破（YOLOv8）步入烟尘 transformer YOLO 目标检测
本专栏专为AI视觉领域的爱好者和从业者打造。涵盖分类、检测、分割、追踪等多项技术，带你从入门到精通！后续更有实战项目，助你轻松应对面试挑战！立即订阅，开启你的YOLOv8之旅！专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Transformer的YOLOv8检测头架构改进：提升目标检测精度的全新突破什么是DAtten
vscode保存自动将CRLF 转换成 LF 沐歌丨丶 vue JavaScript 前端 vue 前端
1、下载vscode插件：EditorConfigforVSCode2、在项目根目录新建.editorconfigroot=true[*]charset=utf-8indent_style=spaceindent_size=2end_of_line=lfinsert_final_newline=truetrim_trailing_whitespace=true
Python爬虫TLS dme. Python爬虫零基础入门爬虫 python
TLS指纹校验原理和绕过浏览器可以正常访问，但是用requests发送请求失败。后端是如何监测得呢？为什么浏览器可以返回结果，而requests模块不行呢？https://cn.investing.com/equities/amazon-com-inc-historical-data1.指纹校验案例1.1案例：ascii2dhttps://ascii2d.net/importrequestsres
python爬虫Selenium库详细教程_python爬虫之selenium库的使用详解嘻嘻哈哈学编程程序员 python 爬虫 selenium
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！2.2访问页面2.3查找元素2.3.1单个元素下面
排序算法：冒泡排序（Python）娱乐不打烊丶排序算法算法数据结构
思路：大家一定都喝过汽水吧，汽水中常常有许多小小的气泡，往上飘，这是因为组成小气泡的二氧化碳比水要轻，所以小气泡才会一点一点的向上浮。而冒泡排序之所以叫冒泡排序，正是因为这种排序算法的每一个元素都可以向小气泡一样，根据自身大小，一点一点向着数组的一侧移动。一图解百惑，上图！那么，话不多说，上代码！defbubble_sort(input_list):#冒泡排序：每次循环，锁定一个最值，并朝着最大或
supervisord 命令介绍和使用案例 lisanmengmeng linux 命令工具系统运维 shell编程服务器 linux 运维
supervisord命令介绍和使用案例supervisord是一个用Python编写的进程管理工具，用于监控和管理Linux系统中的进程。它可以将普通的命令行进程转变为后台守护进程（daemon），并监控进程状态，在进程异常退出时自动重启。它通过fork/exec的方式把被管理的进程当作自己的子进程来启动。主要功能:进程管理：能够启动、停止、重启和关闭进程.自动重启：监控进程状态，并在进程崩溃时
ptython setup.py install 设置python包编译时的并行数 leo0308 基础知识 Python python pytorch3d
通过源码编译安装pytorch3d的时候，直接执行pythonsetup.pyinstall时，默认开的并行数很多，有10几个，直接导致机器卡死。通过设置下面的环境变量，可以设置较小的并行数，避免占用过多的资源。exportMAX_JOBS=4设置后，同时只有4个编译的进程。
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

【吴恩达课后编程作业】深度学习和神经网络 第二周作业 Logistic回归

【吴恩达课后编程作业】Course 1 - 神经网络和深度学习 - 第二周作业 - 具有神经网络思维的Logistic回归

✌ 我们要实现一个能够识别猫的图片的简单神经网络

✌ 加载训练测试数据集

✌ 查看测试集的维度

✌ 打印数据集的详细数据

✌ 将图片数据向量化

✌ 打印向量化后的数据维度

✌ 向量归一化

✌ 神经网络介绍

✌ 定义sigmoid函数

✌ 定义初始化w、b的函数

✌ 定义传播函数

✌ 定义优化器函数

✌ 定义预测函数

✌ 定义模型函数

✌ 进行测试

✌ 画学习曲线

✌ 学习率曲线

你可能感兴趣的:(机器学习,找不到女朋友系列,AI,神经网络,python,机器学习,人工智能,深度学习)

【吴恩达课后编程作业】深度学习和神经网络第二周作业 Logistic回归