john_bh

[6DoF Pose] Category Level Object Pose Estimation via Neural Analysis-by-Synthesis

转载请注明作者和出处： http://blog.csdn.net/john_bh/

Arxiv 地址：Category Level Object Pose Estimation via Neural Analysis-by-Synthesis
作者及团队：苏黎世联邦理工学院 & 图宾根大学
会议及时间：ECCV 2020
主页： https://ait.ethz.ch/projects/2020/neural-object-fitting/

文章目录

- 1. 主要贡献
- 2. 相关工作
- - 2.1 Object Pose Estimation
  - 2.2 Pose Dependent Image Generation
  - 2.3 3D Representations for Objects
  - 2.4 Latent Space Optimization
- 3. Method
- - 3.1 Pose-aware Image Generator
  - 3.2 Training
  - 3.3 Object Pose Estimation
- 4. Evaluation
- - 4.1 Comparison with state-of-the-art
  - 4.2 Component Analysis
  - 4.3 Robustness

1. 主要贡献

许多对象姿态估计算法都依赖于综合分析框架，该框架需要各个对象实例的显式表示。

作者提出将基于梯度的拟合过程与参数化神经图像合成模块相结合，该模块能够隐式表示整个对象类别的外观，形状和姿势，从而无需每个对象实例使用显式CAD模型。

图像合成网络被设计为有效地跨越姿势配置空间，从而可以使用模型容量来共同捕获形状和局部外观（即纹理）变化。在推断时间，合成图像通过基于外观的损失与目标进行比较，误差信号通过网络反向传播到输入参数。保持网络参数固定，这可以联合优化对象的姿势，形状和外观；

实验证明该方法可以仅从2D图像中以高精度恢复对象的方向；当提供深度测量结果时，为克服尺度模糊性，该方法可以成功地准确恢复完整的6DOF姿态。

2. 相关工作

2.1 Object Pose Estimation

考虑到它的实际重要性，有大量的工作集中在目标姿态估计。最先进的技术可以大致分为模板匹配技术和回归技术。模板匹配技术对齐3D CAD模型观察三维点云[4,56]，图像[24,29]，学习关键点[29,49,33,17,39]或 correspondence features [25,38,55]。相反，[41,22,53]将对象姿态估计作为分类或回归问题解决。但是，为了实现高精度，这些方法通常需要基于模板的精修，例如使用ICP [4]。这极大地限制了它们的适用性，因为在测试时存储并与所有可能的3D CAD模型进行比较在许多情况下是不切实际的。此外，捕获高保真和完整的3D模型通常很困难，对于某些应用程序甚至是不可能的。

为了解决这一问题，NOCS[50]提出通过学习重构，在RGB图像的标准坐标框架中建立三维物体模型，然后将重建数据与深度测量数据对齐，使用来自相同类别的对象来训练他们的重建网络，期望在测试时将其归纳为同一类别中看不见的实例。
LatentFusion[37]提出了一种基于三维潜在空间的物体表示方法用于不可见物体姿态估计，它需要测试对象的多视角图像，以形成测试时的潜在空间和深度测量。

作者的方法虽然也学习解决任务从同一类别的对象，但是一个完全生成的方法，同时恢复对象的姿态，形状和外观。因此，它允许直接合成对象的外观，消除了在3D中重建对象的中间步骤。与NOCS[50]和LatentFusion[37]相比，作者提出的模型可以从单个RGB图像作为输入进行3D对象姿态估计。

2.2 Pose Dependent Image Generation

研究了两种场景下与位姿或视点相关的图像生成。

其中一项工作是通过直接生成像素[23,48,34,44]或将像素从源视图扭曲到目标视图[57,40,35,46,9]来为给定的源图像合成新的视图。虽然这些技术可以用于呈现不同姿态的物体，但物体的外观和形状是由源图像控制的，不能被优化。

另一项工作处理的问题，解纠缠图像产生[8,16,27,42,19]，考虑到对象姿态是众多因素中的一个。近期作品[32]使用3D潜在空间在视点/姿态解纠缠上获得吸引人的结果。尽管所有提及的方法都能够生成具有不同姿势，形状和外观的对象，但是不能精确地控制姿势（例如，旋转一定程度的角度），这使得将其应用于绝对对象姿势估计任务的工作变得困难。

受到[32]的启发，作者提出的网络也采用了3D的潜空间。然而，在训练过程中，以监督的方式利用该模型将精确的绝对姿态知识整合到潜在的表示中。这是通过整合三维潜空间与条件VAE框架来实现的。与同样利用3D隐藏空间的[44]不同，作者的模型可以联合表示一个对象类别的多个实例，并泛化到不可见的实例。[31]使用位置感知图像生成视点估计，但以一种区别的方式。

2.3 3D Representations for Objects

一些研究已经解决了生成三维几何表示的问题，包括 meshes [28,47,12]、point sets [2,54,26]、voxels [52,6]和 implicit functions [36,30,10,45]。尽管这些生成模型还能够表示类别级别的对象，并且在理论上可以与差分渲染算法结合用于类别级别的对象拟合，但是所有上述技术仅考虑几何形状，而不考虑外观。因此，需要进行深度测量，并且丢弃了对象外观背后的丰富信息。相反，我们的方法允许利用外观信息，并且不需要深度映射作为输入。当生成纹理对象，它受到了依赖于3D meshes的限制。

相比之下，作者完全放弃了中间的几何估计任务，而专注于姿态条件下的外观生成。

2.4 Latent Space Optimization

CodeSLAM学习深度映射的潜在表示，在bundle调整期间优化潜在表示而不是逐像素深度值；GANFit 代表具有GAN的纹理贴图，并将latent code和3DMM参数共同拟合到人脸图像；Image2styleGan等通过迭代最小化图像重构误差，将自然图像嵌入到GANs的潜在空间中进行图像编辑。

通过迭代能量最小化更新潜表示的思想已被用于其他任务，受以上的启发，作者将潜在的对象外观和几何参数(姿态)共同优化。

3. Method

利用一个学习过的图像合成模块，能够在不需要访问实例 3D CAD 模型的情况下从单个RGB或RGB- d图像中恢复物体的三维姿态。

训练：通过利用合成对象的多视图图像在VAE框架中对生成器进行训练。将已知方向与KL散度一起生成的图像与真实图像之间的重建损失降至最低。训练后，生成器可以生成忠实反映（潜在）外观和所需姿势的图像。

推理：为了从分割的真实图像作为输入来估计物体姿态，该方法迭代地优化了物体姿态和形状，在保持固定训练网络权重的同时，最小化输入和生成图像之间的感知损失。

整个框架如图1所示，首先使用ShapeNet数据集合成对象的多视图图像训练一个 pose-aware 图像生成器 $G$ ，它能够生成对象图像 $I = G (R, T, z)$ ，它可以反应输入对象的 pose $(R, T)$ 和外观编码 $z$ 。在推理时，该方法以分割后的图像 $I$ 为输入，通过迭代优化对象的姿势和形状以最小化输入图像与合成图像 $G （ R, T, z ）$ 之间的差异来估计对象的姿势。

3.1 Pose-aware Image Generator

为了生成给定类别的不同实例的图像，寻求生成具有显着但可控制的形状和外观变化的图像。作者通过潜变量 $z$ 和所需的 $6 D o F$ 对象姿态对形状和外观进行编码，包括 $3D\ rotation\ R = R_xR_yR_z$ 和 $3D\ translation\ T = [t_x t_y t_z]$ 。 $z$ 轴定义为与相机主轴对齐，而 $y$ 轴指向上方。
为了提高效率并提高模型在表示形状和外观的较大变化方面的能力，作者将图像生成管道分离为两个阶段。首先，观察到可以使用2D操作对 $3D\ translations\ T$ 和平面内 $rotations\ R_z$ 进行建模，因此无需学习。因此，将网络 $G_{3D}$ 约束为仅生成面外旋转 $\hat I_{rot} = G_{3D}(R_x, Ry_, z)$ （即elevation $R_x$ 和 azimuth $R_y$ ）的图像。使用从 $3 D$ 平移 $T$ 和平面内旋转 $R_z$ 派生的 $2 D$ 图像变形操作 $W$ 对其余变换进行建模。完整的生成过程定义为 $\circ G_{3D}$ 。

Appearance and 3D Rotation.
为了生成不同外观、形状和姿态的物体图像，采用了一种基于三维风格的图像生成网络，类似于图2所示的[32]中所提出的网络。这个网络结合了一个3D特征体，它捕捉了3D旋转和一个基于样式的生成器[21]。这使模型能够从几何因素(如位姿和形状)中分离出整体外观变化。基于三维风格的图像生成网络主要包括四个步骤:
- 1)生成三维特征体;
- 2)根据姿态变换特征体;
- 3)将三维特征体投影为二维特征映射;
- 4)将特征映射解码为预测图像 $\hat I$
3D生成器和2D生成器都通过自适应实例归一化[18]以潜码 $z$ 为条件，分别对形状和外观的变化进行建模。对象方向R控制应用于3D特征量的变换。
Translation and 2D Rotation.
虽然基于3D风格的解码器原则上可以覆盖6个DoF姿态的整个空间，但最终的模型将需要非常大的容量和数据集来训练。因此，作者限制解码器到平面外旋转，并使用一个相似2D转换处理所有剩余的转换。warping field 如下：

3.2 Training

在如图1所示的条件VAE框架中训练图像生成器，以便对生成的图像实现精确的姿态控制。 VAE是一种自动编码器，通过最小化重构项以及潜在空间分布与规范化高斯之间的KL散度来训练。使用基于3D样式的图像生成网络作为解码器，并使用标准的CNN作为编码器。

> 在每次训练迭代中，编码器首先从随机选择的训练对象的图像中提取 latent code。 
> 然后，3D图像生成网络将此 latent code 与所需姿势一起作为输入，以生成所需对象处于所选姿势的图像。
> 编码器和解码器通过最小化生成的图像和ground-truth之间的重建损失（通过KL散度正规化）来共同训练。

$\lambda_{KL}$ 是正则化的加权，为 $1e^{-2}$ 。
所需的训练数据，即具有不同姿势的对象的图像和相应的姿势标签，是通过从ShapeNet数据集中渲染合成对象而获得的[7]。 由于平移和2D旋转是通过不需要训练的相似性变换建模的，因此出于训练效率的考虑，仅生成平面外旋转的训练样本。

3.3 Object Pose Estimation

经过训练的姿势感知图像生成器可以渲染各种形状，外观和姿势的对象。由于前向过程是可微的，所以可以通过迭代地细化网络输入（即姿势参数和潜在代码）来解决恢复其姿势，形状和外观的逆问题，从而使生成的目标与目标之间的差异图像最小化：

Energy Function
为了增强对域偏移的鲁棒性，我们采用了感知损失作为距离函数，并通过实验验证了该方法的有效性。在没有进一步正则化的情况下，作者发现该模型可以通过将潜编码推到有效域之外而收敛到退化解。为了避免这种不理想的解，我们惩罚到潜在空间原点的距离。由于训练期间使用的KL发散项，接近原点的代码对解码器更有可能有用，所以最后的 energy 函数如下：

$F_{vgg}$ 是在ImageNet上预先训练的VGG网络用于深度特征提取， $\hat I$ 参考公式2。
Initialization Strategy
由于上述能量函数是非凸的，基于梯度的优化方法容易产生局部极小值。因此，作者利用（共同训练的）编码器从相应的高斯分布中获取latent code和样本的条件分布的均值和方差进行初始化。

4. Evaluation

4.1 Comparison with state-of-the-art

Baseline ：NOCS
NOCS使用从ShapeNet CAD模型生成的综合数据和真实数据来训练网络，该网络能够从标准坐标系中的RGB图像中重建对象。随后，通过将重建与深度图对齐来恢复物体姿态。生成数据：CAMERA；真实数据：REAL275(真实的RGB-D图像：4300用于训练和2750用于测试；6个类别(相机、罐头、瓶子、碗、笔记本电脑和杯子)的42个真实对象实例分布在18个不同的场景中)
Our Method
训练使用合成数据CAMERA，但是没有将合成数据叠加到真实环境中，更重要的是，与NOCS不同，作者的方法不需要真实的图像和姿态标注来进行训练。 请注意，该方法仅依赖真实图像的2D注释来fine-tune对象分割网络（使用REAL275数据集）。 作者引入了一个由VGG组成的简单baseline，直接从2D图像回归对象的方向，在相同的合成数据上训练。注意，这是一个公平的比较，因为baseline和作者的方法使用相同的训练和测试数据。
Metrics
旋转误差： $e_R$ ；平移误差： $e_t$

$T_r$ 表示矩阵的迹，对于对称对象类别(瓶子、碗和罐子)，允许预测的3D bounding box 绕对象的垂直轴自由旋转，没有任何惩罚。
Results: Translation
下图展示了 Tanslation的结果：当使用Depth时，NOCS和作者提出方法旗鼓相当，这是使用RGB-D数据进行训练的；当仅使用RGB进行训练和测试，精度没有表现很好，作者解释说是由于2D观测的 inherent scale-ambiguity 不确定性导致的，是可以预料的，同时在实例级位姿估计的文献中也有类似的观察（RSS 2018：A convolutional neural network for 6d object pose estimation in cluttered scenes）。
Results: Orientation
作者的方法只使用RGB输入，但平均而言，测试结果与使用RGB-D以及在训练过程中带有配对姿势注释的真实图像的特权NOCS baseline相当，甚至更好。作者猜想罐头和瓶子的复杂纹理对于NOCS特征的回归是有问题的，并且相机的复杂几何结构对ICP提出了挑战。

图5可以看出，与NOCS相比，作者的方法产生了更准确的结果，特别是对于几何复杂的目标。这也可以解释NOCS在碗和笔记本电脑上的狭窄性能优势;这两种对象类型都有许多平面区域，这有利于ICP中使用的点对面度量。

4.2 Component Analysis

Image Generation
.首先，训练一个网络，其中姿势被直接连接到 latent code，然后解码到只有二维卷积的图像，后者本质上是一个标准的条件VAE(由w/o 3D表示)，没有KL散度项(由表1-a中的w/o VAE表示)。而图像生成网络在不进行正则化的情况下实现了较低的训练目标，这导致了潜在空间的不平滑，即只使用潜在空间中的少量样本进行图像生成，结果，由于不能产生信息梯度来指导潜在代码的更新，因此该拟合受到负面影响。
表1-a和图-6 表明缺少3D潜在空间会导致图像生成效果不佳，从而导致定位失败。
表1-b 展示了利用16维潜在空间可以很好地兼顾图像质量和姿态精度。
Optimization
从表2b可以看出，随着损耗的减小，旋转误差也减小了，这说明能量函数为位姿估计提供了一个有意义的信号。
如表2a所示，不同的损失函数对比，其它几个不如 perceptual loss，作者解释说可能是由于perceptual loss鼓励了语义对齐，而不是像素对齐，因此，它产生的结果是 globally aligned，而不是聚焦于局部区域。

4.3 Robustness

为了研究该方法对引起领域位移的各种因素的鲁棒性，我们在受控仿真环境下对该方法进行了评估。主要研究了在bounding box检测中，lighting,、occlusion 和 offsets 这三个经常处于真实数据和模拟数据之间的因素。在测试时，我们每次改变其中一个因素，并根据方向估计来评估平均误差。修改目标图像的亮度来照明，去除图像的某些区域来模拟遮挡，并在2D中转换图像来模拟不准确的2D检测。使用相同的训练数据训练VGG16网络从图像中返回旋转角度。众所周知，与生成方法相比，判别方法更容易过度拟合，这通常导致较差的泛化性能。我们为类别级姿势估计任务验证此发现。在训练判别方法时，我们也已经随机改变了这三个因素，但仅在有限的程度上（遮挡最高20％，照明最高40％，translation最高25％）。在测试时，我们在训练变量内外对样本进行网络测试。请注意，我们的方法在训练过程中永远不会看到增强的图像。

如图7所示，生成方法对训练实例和测试实例之间的差距不那么敏感，这是我们方法为了处理看不见的对象的关键设计目标。当改变这三个因素时，判别模型表现出显着的性能变化，尤其是当该因素超过训练分布的变化时。相比之下，我们的方法表现出较少的性能变化，这证明了我们的方法的鲁棒性。

使用深度学习模型U-Net进行训练基于哨兵2的作物分割数据集。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测计算机C9硕士_算法工程师分割数据深度学习 pytorch 人工智能
使用深度学习模型如U-Net进行训练基于哨兵2的作物分割。PyTorch框架为例，如何构建和训练U-Net模型来完成基于哨兵2的作物分割检测基于哨兵2的作物分割，共18种作物类型（背景，草地，软冬小麦，玉米，冬季大麦，冬季油菜，春季大麦，向日葵，葡萄藤，甜菜，冬季小黑麦，冬季硬质小麦，水果、蔬菜、花卉，土豆，豆科饲料，大豆，果园，混合谷物，高粱），38到61个不同时间段同一位置10通道多光谱图像，
2022.2.10训练思维练习钟佩颖 c语言
//输出十进制1234对应的八进制和十六进制//#include//intmain()//{//printf("0%o,0x%x\n",1234,1234);//return0;//}//将一个四位数反向输出//#include//intmain()//{//intn=0;//scanf_s("%d",&n);//while(n)//{//printf("%d",n%10);//n=n/10;//
华为魔术magic2拆机图_荣耀Magic拆解 weixin_39907713 华为魔术magic2拆机图
两年前的荣耀Magic2通过八曲面玻璃机身、智能系统和超级快充为手机行业带来了全新的理念——AI在系统中的运用。两年后，荣耀终于推出了荣耀Magic2，这款手机不但继承了一代Magic的智慧系统，还在手机外观和机身结构进行了大幅革新——采用滑屏设计。下面，就让我们一次探究魔法手机的内部结构。9月10日举办的2020华为开发者大会上，华为发布了全新的EMUI11。EMUI11充分借鉴了鸿蒙2.0的分
跨域问题中获取不到响应头header中的token HPF_99 springboot ajax 前端 jwt spring boot ajax跨域问题
在前后端分离项目整合springboot于jwt的过程中遇到后端在请响应头header中添加token前端进行验证的时候只能获取部分header中的数据而获取不到token解决方法就是在jwt生成token存入header中的时候添加header数据Access-Control-Expose-headers：值为想让前端获取的数据，如token之后在后端就可获取到header中的数据测试：前端获取
fp8、fp16和bp16的区别 SmallerFL NLP&机器学习 fp8 fp16 bp16 深度学习
文章目录1.FP8(8-bitFloatingPoint)2.FP16(16-bitFloatingPoint)3.BP16(BrainFloatingPoint)4.总结FP8、FP16和BP16是指不同精度的浮点数格式，主要用于计算机图形学和机器学习等领域。它们的区别在于表示数字的位数、精度和范围。1.FP8(8-bitFloatingPoint)位数：FP8使用8位来表示浮点数。精度和范围：
IDEA修改recent project的路径胖毁青春，瘦解百病 #IDEA
有时候需要将某些项目统一放到另外一个工作区间，此时可以通过修改下面的文件来解决文件路径问题C:\Users%username%.IntelliJIdea2019.3\config\options\recentProjects.xml.IntelliJIdea2019.3为2019年IDEA的路径，2020年后面升级之后移动到了C:\Users%username%\AppData\Roaming\J
ELK接入SpringBoot【Docker Compose】 bilibilidicks elk spring boot docker
安装Docker-Composecurl-Lhttps://github.com/docker/compose/releases/download/1.17.1/docker-compose-`uname-s`-`uname-m`-o/usr/local/bin/docker-compose随便找个地，创建docker-compose.yml文件，把这坨文本复制进去version:'3'servi
NASA 宇航员太空惊魂 30 天！波音飞船 5 大致命漏洞曝光：美国航天帝国正在崩塌？... 思快奇人工智能
【惊爆】原定8天的太空任务演变成生死拉锯战！当NASA宣布“星际客机”将提前两周返航时，全球目光突然聚焦：价值42亿美元的太空飞船为何沦为“星际牢笼”？波音与NASA的联合声明背后，一场动摇美国航天霸权的系统性危机正在爆发…第一章太空惊变72小时去年6月5日，那本应是一次充满荣耀与探索的太空之旅，星际客机载着两位精英宇航员冲天而起，冲破大气层，向着浩瀚宇宙进发。全世界都在期待着他们在太空中的新发现
前端2025 家里有只小肥猫前端
2025前端面试总结：趋势、技巧与准备建议随着前端技术的飞速发展，2025年的前端面试不仅考察技术深度，更注重实践能力和对新技术的掌握。作为一名前端开发者，如何在激烈的竞争中脱颖而出，是每一位求职者都需要思考的问题。本文将结合2025年的前端技术趋势，分享面试总结、常见问题及准备建议，帮助大家更好地应对未来的面试挑战。一、2025年前端技术趋势总结WebComponents的广泛应用WebComp
STMicroelectronics 系列：STM32G4 系列_（2）.STM32G4系列核心架构 kkchenkx 机器人控制系统和单片机开发 stm32 嵌入式硬件单片机
STM32G4系列核心架构1.介绍STM32G4系列是STMicroelectronics推出的一款高性能、低功耗的32位微控制器系列，基于ArmCortex-M4内核。该系列微控制器集成了多种高级功能，如高精度ADC、高速DAC、低功耗定时器等，适用于各种工业和消费类应用。本节将详细介绍STM32G4系列的核心架构，包括其内核、存储器、外设和系统配置等方面。
密码学与网络安全 - 11 密码学Hash函数 shiyivei #密码学与网络安全哈希算法 web安全安全 Hash函数消息认证
11密码学Hash函数Hash函数输入长度可变，而输出长度固定合格的Hash函数输出应该均匀分布，看起来随机Hash函数两个要求：1.抗碰撞性（找到两个不同的输入对应相同的输出在计算上不可行），2.单向性（通过Hash值找到输入值在计算上不可行）Hash函数的操作过程：把输入数据的长度填充成固定长度分组的整数倍，填充内容包括原始消息的位长度信息，填充长度信息能够增加攻击者更改数据而要保持hash值
网络安全清单网络安全Max web安全智能路由器安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快移除(Deprovisioning)移除（Deprovisioning）是一个除去现存用户帐户的过程，其包括用户帐户登记和设备失效。分布式编码规则(DER:DistinguishedEncodingRules)分布式编码规则(DER)是一个基本编码规则的子集，其提供一个严密的方法来描述任何ASN.1值来作为一个8位字节的字符串。指定网桥(
Feign vs Ribbon：微服务调用背后的双雄对决，你站哪一边？码农技术栈 ribbon 微服务 spring cloud 架构 spring boot
在微服务架构中，服务间的调用就像一场精密的“对话”。而SpringCloud家族中的Ribbon和Feign，正是这场对话的两位“翻译官”。它们看似都能实现服务调用，但背后的工作原理却截然不同。今天我们就用“说人话”的方式，揭开它们的秘密！一、角色定位：一个像“快递员”，一个像“智能管家”Ribbon：低调的负载均衡大师它像一位经验丰富的快递员，专注于如何高效分配任务（请求）。当你用RestTem
加密授权——获取计算机CPUID序列号（32位 64位均可以）程序猿小泽 C C++获取CPU的ID号加密授权
最近项目要用到加密授权，考虑了一下打算采用CPUID加密，上网找了资料整合如下，代码适合windows环境下32位和64位的均可。首先说下cmd下查看CPUID命令：wmiccpugetProcessorId在32位模式下，我们可以使用内嵌汇编来调用cpuid指令。但在64位模式下，VC编译器不支持内嵌汇编。于是微软提供了Intrinsics函数——编译器会将Intrinsics函数编译为对应的机
mysql通过视图插入数据_数据库视图 sql weixin_39550410 mysql通过视图插入数据
数据库必知词汇：数据库视图视图是从一个或几个基本表(或视图)中导出的虚拟的表。在系统的数据字典中仅存放了视图的定义，不存放视图对应的数据。视图与表(有时为与视图区别，也称表为基本表——BaseTable)不同，视图所对应的数据不进行实际存储，数据库中只存储视图的定义，在对视图的数据进行操作时，系统根据视图的定义去操作与视...文章萌萌怪兽2020-02-23113浏览量数据库优化之创建视图视图是保
Flutter动画实战指南：从入门到精通，打造流畅交互体验 Coderabo Flutter框架详解 flutter 交互
在Flutter的世界里，动画是提升用户界面互动性和吸引力的关键一环。作为一位资深的Flutter开发者，我深知动画功能不仅能够使应用看起来更加生动流畅，还能增强用户体验，使其在众多应用中脱颖而出。本文将深入探讨如何在Flutter中高效地使用动画功能，通过一步步指导和实例代码，让您掌握实现各类动画效果的技巧。Flutter动画基础Flutter提供了丰富的动画库，其核心在于Animation和A
教程 | 在 Linux 环境中安装 Docker（含2025最新镜像站加速，实测可用） The god of big data 大Big数据Data 容器那点事儿教程 linux docker 运维
在Linux环境中安装Docker的完整教程Docker是一种流行的容器化平台，可帮助用户快速构建、部署和运行应用程序。本教程将指导您如何在常见的Linux发行版（Ubuntu/Debian、CentOS/Fedora）上安装Docker。准备工作系统要求64位Linux系统（内核3.10或更高版本）。确保已安装curl或wget工具。以root用户或具有sudo权限的用户执行以下操作。卸载旧版本
【大模型】fp32 和 fp16 的区别，混合精度的原理。深度求索者 python pytorch
LLMs浮点数一、fp32和fp16的区别，混合精度的原理1.fp32与fp16的对比特性fp32（单精度）fp16（半精度）位数32位（4字节）16位（2字节）内存占用高低（仅为fp32的50%）数值范围约±3.4×10³⁸约±6.5×10⁴精度（尾数）23位（约7位有效十进制数）10位（约3位有效十进制数）用途高精度计算（如梯度更新）高效计算（如矩阵乘法）2.混合精度训练的原理核心思想：结合f
内网安装docker、docker-compose和harbor仓库保姆级教程 passion_flower_ 云计算
下图是用到的安装包安装docker1.关闭防火墙firewalld和selinxsystemctlstopfirewalldsed-i'/^SELINUX=/cSELINUX=disabled/'/etc/selinux/config配置systemctl启动dockervim/etc/systemd/system/docker.service[Unit]Description=DockerApp
前后端分离项目的验证码实现（前端Vue，后端TP）今天练肩感觉爆炸 vue thinkphp
1.TP安装依赖composerrequiretopthink/think-captcha=2.0.*2.生成验证码返回给前端//生成验证码publicfunctiongetCaptcha(){$config=[//验证码字符集合'codeSet'=>'0123456789',//验证码字体大小'fontSize'=>30,//字体'fontttf'=>'5.ttf',//验证码位数'length
PHP Captcha实现图片验证码生成及识别（附源码） mayday1102 PHP php captcha
目录什么是Captchacomposer安装思路修改Captcha.php源码调用什么是CaptchaCAPTCHA（CompletelyAutomatedPublicTuringTesttoTellComputersandHumansApart）是区分计算机和人类的一种程序算法。composer安装composerrequirephp-quickorm/captcha思路由于原扩展基于sessi
深度学习模型可视化：通俗易懂的全面解读 Crazy learner 模型部署深度学习人工智能
目录1.什么是深度学习模型可视化？2.张量（Tensors）：深度学习中的核心数据结构3.常见的节点操作**Gather**操作**Transpose**操作**Pow**操作**Add**操作**Mix**操作4.查看模型详情5.可视化工具总结在深度学习领域，理解模型内部的工作原理对于优化、调试和改进模型至关重要。随着神经网络的复杂性日益增加，开发者和研究人员逐渐意识到，可视化不仅是理解模型的一
python网格交易法详解_什么是网格交易？一文教会你网格交易策略 weixin_39793319 python网格交易法详解
一、网格交易法设定价值中枢，利用“档位”的模式对投资标的进行机械式操作，下跌时，进行分档买入，上涨时，进行分档卖出。网格法由于不依赖人为的思考,完全是一种程序行为,像渔网一样,利用行情的波动在网格区间内低买高卖，可以合理控制仓位，避免追涨杀跌,拥有较强的抗风险能力。例如国外一个经典的仓位管理系统，某只蓝筹股现价10元，本金是20万。则第一次买入10万元，另外每下跌1元买入1万元，每上涨1元卖出1万
2.2.1.2-网格交易(python网格交易附实战交易记录) Kelvin写代码投资 python 投资网格交易交易记录实证
跳转到根目录：知行合一：投资篇已完成：1、投资&技术 1.1.1投资-编程基础-numpy 1.1.2投资-编程基础-pandas 1.2金融数据处理 1.3金融数据可视化2、投资方法论 2.1.1预期年化收益率 2.1.2一个关于y=ax+b的故事 2.1.3-数据标准化 2.1.4-相关性分析 2.2.1.1-一个关于定投的故(姿)事(势) 2.2.1.2-网格交易 2.
docker-compose部署onlyoffice8.3.0并支持ssl，且支持通过nginx代理，关闭JWT配置 luopeng207663436 docker ssl nginx
编写docker-compose文件mkdir-p/data/onlyoffice&&echo"version:'3'services:onlyoffice:container_name:OnlyOfficeimage:onlyoffice/documentserver:8.3.0restart:alwaysports:-8088:80-64431:443environment:TZ:Asia/S
C#游戏开发：Unity引擎高级技巧与性能优化大冒险墨瑾轩一起学学C#【一】c#unity 性能优化
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嗨，游戏开发者们！欢迎来到一场充满魔法与惊喜的Unity引擎高级技巧与性能优化之旅。想象一下，你是一位勇敢的探险家，在一个由像素构成的奇幻世界里寻找宝藏。我们的目标不仅是制作出色的游戏，还要确保它们流畅运行，让玩家沉浸在无尽的乐趣中。那么，让我们一起跳进代码的
dnspod动态解析linux,NAS折腾记篇一：五分钟搞定威联通DNSPOD动态域名解析-简单教程+问题解决... 芒果绵绵冰 dnspod动态解析linux
NAS折腾记篇一：五分钟搞定威联通DNSPOD动态域名解析-简单教程+问题解决2021-01-1321:04:4814点赞156收藏28评论新人值友一枚，第一次发贴，请大家多多支持！2020年双11，因为每天都会打开张大妈看看，经过太多值友PO文轮番轰炸，终于下手了一台威联通NAS。从一开始完全搞不清状况的新人小白(存储池，卷，威联通的太多术证让人傻傻分不清)，到现在基本上把自己的NAS折腾得七七
华为鸿蒙2025,转载：华为鸿蒙，一个本属于2025年的产品激光不是红外线华为鸿蒙2025
华为鸿蒙，一个本属于2025年的产品原创老局长星海情报局昨天昨天，2020年9月16日，可能在很多人眼中是新中国科技史上“最为耻辱”的一天——美国针对华为的禁令正式生效，华为迎来了“断供时代”的第一个清晨。再往前几天，在东莞的松山湖，华为在“全球开发者大会”上高调地发布了“鸿蒙OS2.0”操作系统。在美国人收紧绞索的前一刻仍然能够淡然自若地发布新产品，明明是一个处在包围圈中的企业却表现得像是一个胜
用Android Compose写了一个电子木鱼青岛老渔民 android开发 Compose android学习 android jetpack android
闲的没事，用Compose写了一个电子木鱼，正好可以学习使用Animatable绘制动画。源码链接：https://github.com/qd98xuan/MeritWoodenFish下面对代码进行粗略解析，需要查看详细源码可以点击上面的链接。代码主体分为三部分：初始化动画类型数据和计数变量绘制计数Text绘制木鱼一、初始化动画类型数据和计数变量代码如下，通过代理函数创建了一个带有状态的敲击木鱼
合并两个有序数组（Leetcode）每天瞎忙的农民工 Leetcode 算法 leetcode 算法
解题思路：三个指针：$p1:指向nums1中的最后一个非零元素。$p2:指向nums2的最后一个元素。$p:指向nums1的最后一位，用于存储合并后的元素。从后往前填充：比较nums1[$p1]和nums2[$p2]，较大的放入nums1[$p]，指针向前移动。处理剩余元素：如果nums2中还有剩余的元素（p2>=0），直接拷贝到nums1。无需处理nums1剩余的元素：因为nums1的前半部分已
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p