luputo

第三十五周学习笔记

文章目录

第三十五周学习笔记

SuperPoint复现进度

detector可视化

Encoder架构
Detector Head架构

detector 的 Ground Truth 和 Label的关系
样本不均衡问题
网络debug

使用单张图片放入网络训练

Pytorch MNIST分类

pipline
结果分析

全连接

momentum=0
momentum=0.9
momentum VS no momentum

问题

对MNIST做或不做除以255有什么影响
使用或不使用momentum有什么影响
SGD with momentum的公式是啥
net在什么时候初始化参数？net.train还是什么？
tensor.data和tensor.item有啥区别
输入图片的tensor是uint8还是float有啥区别

论文阅读《Deep Residual Learning for Image Recognition》

概括
文章解决了什么问题
用了什么方法

主要思想
细节
不同层的ResNet

ResNet-50
ResNet101和ResNet152

效果如何

plain Net和ResNet的对比
shortcuts connection和不同层数的ResNet的对比（ImageNet）
CIFAR-10

结论
存在什么不足
其他

术语
训练的细节

Image Net
CIFAR-10

问题

本周小结
下周计划

第三十五周学习笔记

SuperPoint复现进度

code

detector可视化

Encoder架构

为了显示全图，省略了relu操作，relu就是stride为2，kernel_size为2的常规非线性操作，在每层卷积层后都有

Detector Head架构

输出是一个(15,20,65)的tensor，除去最后一维“no interest dustbin”之后，剩余的(15,20,64)的结果可以reshape成原图的大小(120,160)
Detector Head对Encoder得到的feature进行decode，通过增加深度，最后将深度重新reshape到长宽维上实现与原图一样大小的输出，这里之所以不使用upconvolution的原因是add a high amount of computation and can introduce unwanted checkerboard artifacts[18]

detector 的 Ground Truth 和 Label的关系

观察损失函数
$L_p(X,Y)=\dfrac{1}{H_cW_c}\sum_{h=1,w=1}^{H_c,W_c}l_p(\mathbf{x}_{hw};y_{hw})$
其中， $H_c=H/8,W_c=W/8$ ，且
$l_p(\mathbf{x}_{hw};y)=-\log\dfrac{\exp(\mathbf{x}_{hwy})}{\sum_{k=1}^{65}\exp(\mathbf{x}_{hwk})}$
注意到detector的输出是(15,20,65)的，除去最后一个深度维后，剩下(15,20,64)对应着原图（120,160）的15*24个8*8的区域，对每个这样的区域，关键点所在的第几个位置（将8/*8的区域拉成64维向量）即是 $y_{hw}$ 的值，若区域中没有关键点，则 $y_{hw}=65$ ，显然，从上面的损失函数中，默认了每个8*8区域中只有一个关键点，如果某个区域中有多于1个的关键点，则会在其中随机选择一个，虽然网络训练时使用随机的关键点，但是，实际的时候，大于最低置信度的点都会被认为是关键点，在训练过程中，只要多个关键点都多次被选中，可能可以检测出所有关键点。

样本不均衡问题

实际的标签上大多数是64（代表没有兴趣点），并没有特别的解决样本不均衡问题的方法，作者在pretrained model中设置了检测最低置信度为0.015（约为1/65），而tf实现中，检测的最低置信度更是0.001

网络debug

由于实际训练时，用上述的置信度，得出的网络输出的兴趣点都分布在如图的边缘，所以可能需要debug网络

使用单张图片放入网络训练

1.训练出的网络对输入不敏感，且输出的热力图的8*8网格中每个小格子输出一样

几乎差不多的热力图，网络的输出损失也很大，预测结果和全部热力图如下图，这是欠拟合的表现

2.增大训练轮次后输出scale不同
损失小于1e-5，但预测时出现指数溢出，查看输出，发现15*20的每个65维输出的scale不一样，有的是0~80，有的是-40~0，统计结果如下

位于output[1,:,:]的统计结果

位于output[59,:,:]的统计结果

所以求exp的时候会溢出，loss的数值也不稳定，此时对每个15*20的channel求argmax时，得到的结果已经和label完全一致，可能是因为过拟合太多的原因，且在训练过程中，loss瞬间从0.5下降到0.002，可能是momentum在同一张图片上训练更新向量累积模太大，所以去掉momentum，且为防止过拟合，设定最小loss阈值

注意因为此处的输出求argmax后已经与label完全一样，我曾想通过归一化来保证预测时exp的数值稳定，但实际上是不可行的，因为不能做统一的归一化，这样会导致scale相对小的激活值输出的置信度很低，也不能做15*20区域中每个64维向量分别的归一化（？但是softmax的时候实际上是这样做的），这样会导致每个区域都有较大的激活值，问题是softmax在求损失函数的时候为什么数值是稳定的呢？

可能是因为输入没处理好的原因
可能是标签没处理好的原因
可能是输出转化到标签没处理好的原因
可能是loss函数不对的原因，计算了下损失的上界，-log(1/65) = 4.1744，与每次训练开始的误差是一致的
框之间的大小不可比？？？尽管是框中最大的激活值，还没有别的框中的非关键点激活值大？

3.在验证集上训练误差停在0.2左右下不去，且预测结果很差
考虑之后使用可变的学习率来改正

Pytorch MNIST分类

代码在这
本实验主要是使用Pytorch进行MNIST分类，并与pytorch-example的代码进行对比

pipline

下载并载入数据，本次只使用训练集1000，测试集200
浏览数据集
定义网络，全连接和卷积两种
- 全连接网络：28*28->28*28->10，参数共计28*28*28*28+28*28*10=622496个
- CNN：卷积核3*3，padding=1，stride=1，conv(1,8)->relu->pool->conv(8,16)->relu->fc，参数共计(3*3)*8+(3*3*8)*16+7*7*16*10=9064个
写出预测的代码，并用初始化的网络预测几个结果
调参，使用不同的学习率和momentum
训练
测试

结果分析

全连接

momentum=0

可见学习率对训练的影响，太小则太慢，太大则无法收敛

momentum=0.9

在有动量的情况下，加快了小学习率的优化速度，稍大的学习率在无动量情况下表现良好，但此时也会出现震荡

momentum VS no momentum

没有动量的方法稍微好一点，两者表现相差不大，但有动量因为额外的计算需要更长的时间

CNN

所有的参数中，表现好的参数有

lr=0.1，train_loss=0.0533，test_loss=0.1158
lr=0.01，train_loss=0.0978，test_loss=0.0816
lr=0.01，momentum=0.9，train_loss=0.06866，test_loss=0.06981

与之前的结果相似，小的学习率配上动量可以得到较好的结果，在这里大的学习率收敛快，因为没有正则化而出现了过拟合，本例使用的两个模型，在准确率上，CNN和全连接相差不大，但全连接的参数是CNN的68倍多

问题

对MNIST做或不做除以255有什么影响

原数据就是0~1之间的浮点数，不需要再除以255

使用或不使用momentum有什么影响

小学习率和momentum是好的组合

SGD with momentum的公式是啥

原来的公式是

x += learning_rate * gradient

加上momentum公式是

v = momentum * v - learning_rate * gradient
x += v

net在什么时候初始化参数？net.train还是什么？

网络在init方法后会自动初始化参数，net.train与net.eval是对特殊层（如bn、dropout）在训练和测试时切换表现的选项

tensor.data和tensor.item有啥区别

tensor.data虽然可以使用，但是文档中查不到，且返回还是一个tensor，而tensor.item()则返回python类型的数值，要求tensor是一个一维张量

输入图片的tensor是uint8还是float有啥区别

不知道

论文阅读《Deep Residual Learning for Image Recognition》

概括

文章提出了深度残差学习网络，解决了深层网络难以优化的问题，核心思想是以学习残差代替学习直接映射，理论上这降低了网络学习到恒等映射的难度，从而使得更深的网络起码和浅的网络效果一样好

文章解决了什么问题

更深的神经网络更难训练，容易出现梯度爆炸和消失的问题，但初始化的正规化和中间层的正规化很大程度的降低了这一可能（不是本文主要解决的问题）
更深的网络的准确率达到饱和，进而不断下降，增加更多层反而引起更多的误差
这意味着这个系统难以优化（本文主要解决的就是更深的网络的优化问题）

用了什么方法

主要思想

理论上来说，更深的网络至少可以表现地和浅层的网络一样好，只要在一个浅层的网络加后加多层恒等变换层

提出了残差学习网络来降低深层神经网络的学习难度，网络不直接学习输入到输出的映射 $H (x)$ 而学习输出和输入之差 $F (x) = H (x) - x$ ，然后通过 $F (x) + x$ 重建原映射，作者认为，如果恒等映射是最优的，这样的网络学习恒等变换比原来要简单（只要层的所有参数为0即可）

细节

x的传播可以很容易地使用shortcut connections实现

图中给出了ResNet的building block，定义为
$y=F(x,\{W_i\})+x$
其中 $x$ ， $y$ 分别为输入和输出， $F$ 表示待学习的残差映射，比如在上图中，就有 $F=W_2\sigma(W_1x)$ ，其中 $\sigma$ 是ReLU函数，且为了简洁省略了偏置项，且第二个非线性层在 $F (x) + x$ 之后使用

注意到这个shortcut connection没有引入新的参数和多的计算复杂度

注意到 $F$ 和 $x$ 的维度必须相同，如果不相同，可以通过一个投影变换实现
$y=F(x,\{W_i\})+W_sx$
作者也提出可以在维度match的时候在 $x$ 前加一个方阵 $W_s$ ，但实验中表明恒等映射已经足够， $W_s$ 仅仅在维度不匹配时使用
每个building block中的层数大于等于两层（图例中是两层），作者观察到使用1层并不能带来什么好处，可能由于1层本身就是一个线性变换 $y=W_1x+x$

网络结构

作者使用一个plain网络和一个ResNet来做对比，其中

plain Network
- 所有卷积之后输出的大小不变
- 如果特征图长宽小一半，则卷积核的数量加倍（channel加倍）以保证每层计算复杂度一样
Residual Network
- 在plain Network的基础上加shortcut connections
- 维度相同时，之间使用identity shortcuts
- 如果维度增加了（channel），有两个选择：
  - (A) 0 padding
  - (B) 使用投影变换

注意其中的下采样均是由stride为2的卷积网络实现的，而非池化层

不同层的ResNet

层数不同的ResNet的区别如下

bottleneck是权衡之后的building block，更深的网络可以得到更好的结果，但是相比训练时间来说是不值得的

ResNet-50

用3层的block代替ResNet34中的2层block

ResNet101和ResNet152

使用更多的3层block得到

效果如何

plain Net和ResNet的对比

浅层的网络精度相差不多，但ResNet18收敛更快，随着层数增加，plain Net的误差反而上升，而ResNet的误差大大下降

shortcuts connection和不同层数的ResNet的对比（ImageNet）

三种shortcuts

(A)0 padding
(B)只在维度改变时使用投影

CIFAR-10

注意到ResNet1202虽然误差也很好，但是没有ResNet110好，可能是因为过拟合的原因

结论

ResNet更容易优化
更容易使得网络更深以获得更高的准确率
以3.57%的top-5错误率赢得了2015年ILSVRC的冠军，获得了ImageNet detection，ImageNet localization，COCO detection 和COCO segmentation的冠军

存在什么不足

其他

术语

FLOPS 每秒浮点运算次数

训练的细节

Image Net

图片随机将小的那一维resize成[256,480]中的值，然后crop成224*224
使用了standard color augmentation
在卷积之后激活之前使用batch normalization
使用SGD，初始学习率为0.1，当误差停滞的时候，将学习率除以10
weight decay 0.0001，动量0.9
不使用dropout

CIFAR-10

mini batch 128
初始学习率0.1，在32k和48k次迭代时除以10
在64k次迭代时终止

问题

具体地，A、B是怎么实现的？

本周小结

终于完成了拖欠三周的resnet论文的阅读
训练出初始的superpoint模型，卡在bug上未完成
学习opencv到百分之50，快到25%了

下周计划

阅读faster-cnn的论文
训练出MagicPoint
学习opencv上册到50%

linux+docker安装常见中间件+shell学习笔记芦屋花绘 linux docker 中间件
初始设置下载虚拟机软件：选择适合的虚拟机软件（如VirtualBox或VMware）。下载操作系统ISO映像文件：选择并下载你想安装的Linux发行版（例如Ubuntu、CentOS等）的ISO文件。ISO映像文件：是包含了完整光盘内容的文件，包含引导记录、文件系统、数据文件和目录结构。导入ISO文件到虚拟机，并进行相关配置，如分配内存、硬盘空间等。了解基本linuxLinux常见目录及其用途Li
mysql数据库学号数据类型_MySQL数据库学习笔记（二）----MySQL数据类型艾萨里昂之光 mysql数据库学号数据类型
【正文】上一章节中，我们学习了MySQL软件的安装，既然软件都装好了，现在就正式开始MySQL的基础知识的学习吧，即使是零基础，也要一步一个脚印。恩，首先要学习的就是MySQL的数据类型。一、数据类型：1、整型(xxxint)2、浮点型(float和double)3、定点数(decimal)4、字符串(char,varchar,xxxtext)5、二进制数据(xxxBlob)6、日期时间类型二、数
学习笔记——GPU 鹤岗小串 gpu算力分布式信息与通信系统架构硬件架构运维笔记
本文为学习笔记，故只对知识点依据自己的理解作概要总结，方便以后复习激活记忆。注：本文中GPU的讲解以A100型号为例，V100跟A100的架构差别不大也可适用，但是其他架构可能会有所出入。一、GPU硬件结构NVIDIAA100GPU的硬件结构HBM2：显存MemoryController：负责控制HBM2和L2Cache之间的通信High-SpeedHub：GPU总线，将NVLink、PCIE、E
侯捷 C++ 课程学习笔记：深入掌握 C++ 高阶特性 —— 实践与心得分享清水白石008 C++学习笔记课程教程 c++学习笔记
侯捷C++课程学习笔记：深入掌握C++高阶特性——实践与心得分享自从开始接触侯捷C++系列精品课程以来，我对C++语言有了全新的认识与深入理解。这套课程不仅系统地梳理了C++的基础知识，更从实际案例中展示了许多高阶特性和工程实战技巧。作为一名长期从事C++开发的专业人士，我深深感受到侯捷老师讲解中那种由浅入深、逻辑严密的魅力，也正是这种教学风格让我在短时间内掌握了不少难以琢磨的知识点。今天，我将结
达梦数据库学习笔记 lwq979991632 数据库
达梦数据库学习资料一、操作系统安装1、配置信息CPU：4核心内存：4G网络：NAT2.安装包选择选择带GUI的服务器，勾选Java平台、KDE二、安装前准备1.数据库远程访问：关闭防火墙systemctlstopfirewalld（禁用）systemctldisablefirewalld(停止，关闭开机自启动)systemctlstatusfirewalld（查看状态）2.安装gcc包rpm-qa
【Azure 架构师学习笔记】- Azure Networking(1) -- Service Endpoint 和 Private Endpoint 發糞塗牆 Azure 架构师学习笔记 Azure 网络安全 azure Network
本文属于【Azure架构师学习笔记】系列。本文属于【AzureNetworking】系列。前言最近公司的安全部门在审计云环境安全性时经常提到serviceendpoint（SE）和priavateendpoint（PE）的术语，为此做了一些研究储备。云计算的本质就是网络，默认情况下资源间及外部都是通过公网也就是互联网访问。为了安全，Azure引入了SE和PE等服务。云环境网络流动主要有两个：inb
计算机基础：编码02，有符号数编码，原码水饺编程 MFC学习笔记 Win32学习笔记 c++windows mfc c语言
专栏导航本节文章分别属于《Win32学习笔记》和《MFC学习笔记》两个专栏，故划分为两个专栏导航。读者可以自行选择前往哪个专栏。（一）WIn32专栏导航上一篇：计算机基础：编码01，无符号数编码回到目录下一篇：计算机基础：编码03，根据十进制数，求其原码（二）MFC专栏导航上一篇：计算机基础：编码01，无符号数编码回到目录下一篇：计算机基础：编码03，根据十进制数，求其原码本节前言上一节，我是讲解
「Kubernetes Objects」- Service（学习笔记） @20210227 k4nzdroid
Service，服务，用于暴露Pod以供访问。官方文档及手册KubernetesAPIv1.18/Servicev1coreService?Pod会被创建，并且还会消失，这由ReplicaSets控制。每个Pod都有自己的IP地址，但是这些IP地址不能视为可靠的。那么，如果前端的一部分Pod依赖于后端的Pod，那前端的这些Pod如何找出并追踪后端的Pod？ServiceService是一个抽象，定
k8s学习笔记（3）--- kubernetes核心技术概念梦谜 k8s基础知识 k8基本核心概念
kubernetes核心技术概念1.容器（Container）2.API对象3.集群（Cluster）4.Master5.Node6.Pod7.复制控制器（ReplicationController，RC）8.副本集（ReplicaSet，RS）9.部署(Deployment)10.服务（Service）11.任务（Job）12.定时任务（CronJob）13.后台支撑服务集（DaemonSet）
关于Go那些懒得看又不得不知道的东西 Hock2024 golang 开发语言后端
写在前面当开始学习go，亦或是cpp、还是java向go进行转职，这部分内容都是比较重要的。go的编译环境，模块管理以及一些基本的语法我认为还是很有必要去学习的，因此重新学习了这个部分并且写下下面的学习笔记！如果有写错或者不全面的地方，还希望大家及时纠正和指导。连接环境首先，作为一个后端er，能使用linux系统是必备的技能，这里我建议可以使用Xshell连接云服务器的方案来完成。云服务器建议使用
Eagle_Wood-滤波方式学习笔记 OverflowSummer 嵌入式泛用知识学习笔记人工智能算法嵌入式硬件笔记学习
//1.移动平均滤波器（信号处理）#defineWINDOW_SIZE5floatmoving_average(float*buffer,floatnew_sample){ staticfloatsum=0; staticintindex=0; staticfloatsamples[WINDOW_SIZE]={0}; sum-=samples[index]; samples[ind
AWS SAP学习笔记-概念 HainesFreeman AWS aws
1、什么是ETL应用程序，举个例子说明？ETL（Extract,Transform,Load）应用程序是一种用于数据处理和迁移的工具或程序，它主要负责从多个数据源提取数据，对数据进行转换和清洗，然后将处理后的数据加载到目标数据仓库或数据库中。ETL应用程序广泛应用于数据集成、数据仓库构建、数据分析和数据迁移等场景。ETL的三个主要步骤：Extract（提取）：从各种数据源（如数据库、文件、API等
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
Kubernetes学习笔记-移除Nacos迁移至K8s 人生偌只如初见 Kubernetes J2EE kubernetes k8s java
项目服务的配置管理和服务注册发现由原先的Nacos全面迁移到Kubernetes上。一、移除Nacos移除Nacos组件依赖。com.alibaba.cloudspring-cloud-starter-alibaba-nacos-discoverycom.alibaba.cloudspring-cloud-starter-alibaba-nacos-configorg.springframewor
rust学习笔记16-206.反转链表(递归) 水蜜桃one 学习笔记链表
rust函数递归在14中已经提到，接下来我们把206.反转链表，用递归法实现递归函数通常包含两个主要部分：基准条件（BaseCase）：递归终止的条件，避免无限递归。递归步骤（RecursiveStep）：将问题分解为更小的子问题，并调用自身来解决这些子问题。//Definitionforsingly-linkedlist.#[derive(PartialEq,Eq,Clone,Debug)]pu
day11 学习笔记豆豆学习笔记 python
文章目录前言一、类方法二、静态方法三、构造方法四、魔术方法前言通过今天的学习，我掌握了更多Python中有关面向对象编程思想中方法的概念与操作，包括类方法，静态方法，构造方法，魔术方法一、类方法类方法是属于类的行为，一般使用类而非对象进行调用类方法需要使用@classmethod装饰器定义类方法至少有一个形参用于绑定类，约定为cls类和该类的实例都可以调用类方法，但一般不用实例进行调用类方法不能访
使用spring data MongoDB对MongoDB进行简单CURD操作示例其实我就是个萌新 spring mongodb java
本文章为作者个人学习笔记，仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机：localhost]spring.data.mongodb.port=[数据库端口，默认:27017]2.根据数据库文档定义实体类：@RequiredArgs
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
numpy学习笔记3：三维数组 np.ones((2, 3, 4)) 的详细解释宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记3：三维数组np.ones((2,3,4))的详细解释以下是关于三维数组np.ones((2,3,4))的详细解释：1.三维数组的形状形状(2,3,4)表示：最外层维度：2个“层”（或“块”）；中间维度：每个层有3行；最内层维度：每行有4个元素。可以类比为：2本书（外层），每本书有3页（中间层），每页有4行文字（内层）。2.创建全1三维数组代码示例：importnumpyasnp
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
numpy学习笔记2：ones = np.ones((2, 4)) 的详解宁宁可可 #机器学习 #Python基础与进阶 numpy python 开发语言
numpy学习笔记2：ones=np.ones((2,4))的详解np.ones()是NumPy中用于创建全1数组的核心函数，其用法和参数与np.zeros()类似，但生成的数组元素值全部为1。以下是详细解释：1、语法numpy.ones(shape,dtype=float,order='C')作用：生成一个指定形状和数据类型的全1数组。参数：shape：数组的形状，以元组形式传递（如(2,4)表
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
TCP/IP学习笔记(5) --IP选路 ox0080 Linux 网络 linux网络
静态IP选路一个简单的路由表选路是IP层最重要的一个功能之一。前面的部分已经简单的讲过路由器是通过何种规则来根据IP数据包的IP地址来选择路由。这里就不重复了。首先来看看一个简单的系统路由表。命令:routeprint|more对于一个给定的路由器，可以打印出五种不同的flag。U表明该路由可用。G表明该路由是到一个网关。如果没有这个标志，说明和Destination是直连的，而相应的Gatewa
嵌入式C语言学习笔记（2）愿抬头有阳光 c语言学习笔记
1.数组指针数组指针本质上就是一个指针，它里面存放的是数组的首地址。#includevoidshow(int(*p)[4],intn){for(inti=0;i4*4=16;3.命令行传递参数，main函数的标准格式intmain(intargc,constchar*argv[]){return0;}//argc：参数的个数包括./a.out//argv：参数的值列表argv[0]="./a.ou
C++学习笔记：引用 etp_ c++学习笔记
引用是已知变量的别名，通过将引用变量用作参数，函数将使用原始数据而不是其副本。下面将r作为a的别名：inta;int&r=a;就像char*是指向char的指针一样，int&是指向int的引用。（a和r指向相同的值和内存单元)注意：&r表示r引用变量的地址。引用和指针的区别1.必须在声明引用时将其初始化，而不能像指针那样先声明再赋值。2.引用更接近const指针，一旦与某个变量关联起来便有一直效忠
React学习笔记20 充气大锤 React学习笔记学习笔记 javascript 前端算法开发语言 react.js
一、React.forward1.1、作用通过ref暴露子组件的DOM1.2、场景说明1.3、语法实现//子组件constInput=forwardRef((props,ref)=>{return})//父组件functionfather_component(){constinputRef=useRef(null)constfocus=(ref)=>{ref.current.focus()}ret
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

第三十五周学习笔记

文章目录

第三十五周学习笔记

SuperPoint复现进度

detector可视化

Encoder架构

Detector Head架构

detector 的 Ground Truth 和 Label的关系

样本不均衡问题

网络debug

使用单张图片放入网络训练

Pytorch MNIST分类

pipline

结果分析

全连接

momentum=0

momentum=0.9

momentum VS no momentum

CNN

问题

对MNIST做或不做除以255有什么影响

使用或不使用momentum有什么影响

SGD with momentum的公式是啥

net在什么时候初始化参数？net.train还是什么？

tensor.data和tensor.item有啥区别

输入图片的tensor是uint8还是float有啥区别

论文阅读 《Deep Residual Learning for Image Recognition》

概括

文章解决了什么问题

用了什么方法

主要思想

细节

不同层的ResNet

ResNet-50

ResNet101和ResNet152

效果如何

plain Net和ResNet的对比

shortcuts connection和不同层数的ResNet的对比（ImageNet）

CIFAR-10

结论

存在什么不足

其他

术语

训练的细节

Image Net

CIFAR-10

问题

本周小结

下周计划

你可能感兴趣的:(学习笔记)

论文阅读《Deep Residual Learning for Image Recognition》