小白学视觉

深度学习在三维环境重建中的应用

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自：计算机视觉联盟

最经典的计算机视觉问题是3-D重建。基本上可以分成两种路径：一是多视角重建，二是运动重建。前者有一个经典的方法是多视角立体视觉（MVS，multiple view stereo），就是多帧的立体匹配，这样采用CNN模型来解决也合理。传统MVS的方法可以分成两种：区域增长（region growing）和深度融合（depth-fusion）。当年CMU在美国超级碗（Superbowl）比赛展示的三维重建和视角转化，轰动一时，就是基于此路径，但最终没有被产品化（技术已经转让了）。

后者在机器人领域成为同步定位和制图（SLAM）技术，有滤波法和关键帧法两种，后者精度高，在稀疏特征点的基础上可以采用集束调整（BA，Bundle Adjustment），著名的方法如PTAM，ORB-SLAM1/2，LSD-SLAM，KinectFusion（RGB-D数据），LOAM/Velodyne SLAM（激光雷达数据）等。运动恢复结构（SFM）是基于背景不动的前提，计算机视觉的同行喜欢SFM这个术语，而机器人的同行称之为SLAM。SLAM比较看重工程化的解决方案，SFM理论上贡献大。

另外，视觉里程计（VO）是SLAM的一部分，其实只是估计自身运动和姿态变化。VO是David Nister创立的概念，之前以两帧图像计算Essential Matrix的“5点算法”而为人所知。

因为CNN已经在特征匹配、运动估计和立体匹配得到应用，这样在SLAM/SFM/VO/MVS的应用探索也就成了必然。

DeepVO

如图所示，经典VO流水线通常包括摄像机标定、特征检测、特征匹配（或跟踪）、异常值拒绝（例如RANSAC）、运动估计、尺度估计和局部优化（集束调整，BA）。

DeepVO基于深度递归卷积神经网络（RCNN）提出了一种端到端单目视觉里程计（VO）框架。由于以端到端的方式进行训练和部署，因此它直接从一系列原始RGB图像（视频）中推断出姿态，而不采用传统VO流水线中的任何模块。基于RCNN，它不仅通过CNN自动学习VO问题的有效特征表示，而且用深度递归神经网络隐式地建模串联动力学和关系。

如图所示是这个端到端VO系统的架构图：采用视频片段或单目图像序列作为输入；在每个时间步，作为RGB图像帧预处理，减去训练集的平均RGB值，可以将图像尺寸调整为64的倍数；将两个连续图像堆叠在一起以形成深RCNN的张量，学习如何提取运动信息和估计姿势。具体地，图像张量被馈送到CNN以产生单目VO的有效特征，然后通过RNN进行串行学习。每个图像对在网络的每个时间步产生姿势估计。VO系统随时间推移而发展，并在图像获取时估计新的姿势。

CNN具有9个卷积层，每层之后是除Conv6之外的ReLU激活，总共17层。网络中感受野的大小逐渐从7×7减少到5×5，然后逐渐减少到3×3，以捕捉小的有趣特征。引入零填充以适应感受野的配置或在卷积之后保持张量的空间维度。其中通道的数量，即用于特征检测的滤波器的数量，会增加以学习各种特征。

通过堆叠两个LSTM层来构造深度RNN，其中LSTM的隐藏状态是另一个的输入。在DeepVO网络中，每个LSTM层具有1000个隐藏状态。深度RNN基于从CNN生成的视觉特征在每个时间步输出姿势估计。随着相机移动并获取图像，这个进程随时间而继续。

UnDeepVO

UnDeepVO能够通过使用深度神经网络估计单目相机的6-DoF姿势及其视野的深度。有两个显着特征：一个是无监督深度学习方案，另一个是绝对的深度恢复。训练UnDeepVO时，通过使用立体图像对恢复尺度来，但测试时，使用连续的单眼图像。UnDeepVO还是一个单目系统。网络训练的损失函数基于时空密集信息，如图所示。

下图所示时UnDeepVO的架构图。姿势估计器是基于VGG的CNN架构，需要两个连续的单目图像作为输入，并预测它们之间的6-自由度（DoF）变换矩阵。由于旋转（由欧拉角表示）具有高度非线性，与平移相比通常难以训练。对于有监督的训练，一种流行的解决方案是将旋转估计损失给予更大的权重，如同归一化。为了更好地无监督学习训练旋转预测，在最后一个卷积层之后用两组独立的全连接层将平移和旋转分离。这样为获得更好的性能，引入一个权重标准化的旋转预测和平移预测。深度估计器主要基于编码器-解码器架构以生成致密深度图。与其他方法不同的是， UnDeepVO直接预测深度图，这是因为以这种方式训练时整个系统更容易收敛。

如图所示，用立体图像序列的时空几何一致性来定义损失函数。空间几何一致性表示左右图像对中的对应点之间的外极线约束，而时间几何一致性表示两个连续单目图像中的对应点之间的几何投影约束。这些约束构造最后的损失函数并使其最小化，而UnDeepVO学习端对端无监督方式估计尺度化的6-DoF姿势和深度图。简单提一下，空间损失函数包括光度一致性损失（Photometric Consistency Loss）、视差一致性损失（Disparity Consistency Loss）和姿态一致性损失（Pose Consistency Loss）；时间损失函数包括光度一致性损失和3-D几何校准损失（3D Geometric Registration Loss）。

VINet

如图是比较传统VIO（visual-inertial odometry）和基于深度学习的VINet方法。VINet时一种使用视觉和惯性传感器进行运动估计的流形（on-manifold）序列到序列的学习方法。其优点在于：消除相机和IMU之间繁琐的手动同步，无需手动校准；模型自然地结合特定领域信息，显著地减轻漂移。

VINet的架构图见下图所示。该模型包括CNN-RNN网络，为VIO任务量身定制。整个网络是可微分的，可以进行端到端训练实现运动估计。网络的输入是单目RGB图像和IMU数据，即一个6维向量，包含陀螺仪测量的加速度和角速度的x，y，z分量。网络输出是7维向量 - 3维平移和4维四元数（quaternion）- 姿势变化。从本质上讲，它学习将图像和IMU数据的输入序列转换为姿势的映射。

CNN-RNN网络执行从输入数据到李代数se(3)的映射。指数图将它们转换为特殊的欧几里德群SE(3)，然后可以在SE(3)中组成各个运动以形成轨迹。这样，网络需要近似的功能仍然随着时间的推移保持受限，因为相机帧到帧的运动是由平台在轨迹过程中复杂动力学定义的。借助RNN模型，网络可以学习平台的复杂运动动力学，并考虑到那些难以手工建模的序列依赖性。下图是其中SE(3) 级联层（composition layer）的示意图：无参数层，主要连接SE(3)群上帧之间的变换。

在LSTM模型中，隐藏状态被转移到下一个时间步，但输出本身不会反馈到输入。在里程计情况下，先前状态的可用性特别重要，因为输出基本上是每步增量位移的累积。因此，直接连接SE（3）级联层产生的姿态输出，作为下个时间步核心LSTM的输入。

SfM-Net

SfM-Net是一种用于视频运动估计几何觉察的神经网络，根据场景、目标深度、相机运动、3D目标旋转和平移等来分解帧像素运动。给定一图像帧序列，SfM-Net预测深度、分割、相机和刚体运动，并转换为密集的帧到帧运动场（光流），可以及时地对帧进行差分变形以匹配像素和反向传播。该模型可以通过不同程度的监督进行训练：1）通过重投影光度误差（完全无监督）自我监督训练，2）自身运动（摄像机运动）监督训练，或3）由深度图（例如，RGBD传感器）监督训练。

下图是SfM-Net的流程图。给定一对图像帧作为输入，模型将帧到帧像素运动分解为3D场景深度、3D摄像机旋转和平移、一组运动掩码和相应的3D刚性旋转和平移运动。然后，将得到的3D场景流反投影到2D光流中并相应地变形完成从这帧到下一帧的匹配像素。其中前向一致性检查会约束估计的深度值。

如下图是SfM-Net的架构图：对于每对连续帧It，It+1，一个conv / deconv子网络能预测深度dt，而另一个conv / deconv子网络预测一组K个分割掩码mt；运动掩码编码器的最粗特征图通过全连接层进一步解码，输出摄像机和K个分割的3D旋转和平移；使用估计的或已知的相机内参数将预测的深度转换为每帧点云；然后，根据预测的3D场景流（scene flow）对其进行变换，由3D摄像机运动和独立的3D掩码运动组成；将变换后的3D深度再投射回2D的下一图像帧，从而提供相应的2D光流场；可差分后向变形映射将图像帧It+1到It，并且梯度可基于像素误差来计算；对逆图像帧对It+1，It重复该过程来强加“前向-后向约束”，并且通过估计的场景运动约束深度dt和dt+1保持一致性。

如图是一些SfM-Net结果例子。在KITTI 2015，基础事实的分割和光流与SfM-Net预测的运动掩码和光流相比。模型以完全无监督的方式进行训练。

CNN-SLAM

借助于CNN的深度图预测方法，CNN-SLAM可以用于精确和密集的单目图像重建。CNN预测的致密深度图和单目SLAM直接获得的深度结果融合在一起。在单目SLAM接近失败的图像位置例如低纹理区域，其融合方案对深度预测赋予特权，反之亦然。深度预测可以估计重建的绝对尺度，克服单目SLAM的一个主要局限。最后，从单帧获得的语义标签和致密SLAM融合，可得到语义连贯的单视图场景重建结果。

如图是CNN-SLAM的架构图。CNN-SLAM采用基于关键帧的SLAM范例，特别是直接半致密（direct semi-dense）法作为基准。这种方法将不同视觉帧收集作为关键帧，其姿态经过基于姿态图（pose-graph）的优化方法全局修正。同时，通过帧与其最近的关键帧之间的变换估计，实现每个输入帧的姿态估计。

下面是一些结果：办公室场景（左）和NYU Depth V2数据集的两个厨房场景（中，右），第一行是重建，第二行是语义标签。

PoseNet

PoseNet是一个实时单目6 DOF重定位系统。它训练CNN模型以端映端方式从RGB图像回归6-DOF相机姿态，无需额外的工程或图形优化。该算法可以在室内和室外实时运行，每帧5ms。通过一个有效的23层深度卷积网络，PoseNet实现图像平面的回归，对于那些照明差、运动模糊并具有不同内参数的摄像头（其中SIFT校准失败）场景算法鲁棒。产生的姿势特征可推广到其他场景，仅用几十个训练样例就可以回归姿态参数。

PoseNet使用GoogLeNet作为姿态回归网络的基础；用仿射回归器替换所有3个softmax分类器；移除softmax层，并修改每个最终全联接层输出表示3-D位置（3）和朝向四元数（4）的7维姿态向量；在特征大小为2048的最终回归器之前插入另一个全联接层；在测试时，将四元数朝向矢量单位归一化。

如图是PoseNet的结果展示。绿色是训练示例，蓝色是测试示例和红色显示姿势预测。

需要补充一下，姿势回归采用以下目标损失函数的随机梯度下降来训练：

其中x是位置向量，q是四元数向量，β是选择的比例因子，以保持位置和朝向误差的预期值近似相等。

VidLoc

VidLoc是一种用于视频片段6-DoF定位的递归卷积模型。即使仅考虑短序列（20帧），它也可以平滑姿态的估计并且可以大大减少定位误差。

如图是VidLoc的架构模型。CNN部分的目标是从输入图像中提取相关的特征，这些特征可用于预测图像的全局姿态。CNN由堆叠的卷积和池化层构成，对输入图像操作。这里主要处理时间顺序的多个图像，采用VidLoc CNN的GoogleNet架构，其实只使用GoogleNet的卷积层和池化层，并删除所有全连接层。

当输入连续时间的图像流时，利用时间规律性可以获得大量的姿态信息。例如，相邻图像通常包含相同目标的视图，这可以提高特定位置的置信度，并且帧之间的运动也存在严格约束。为捕获这些动态相关性，在网络中使用LSTM模型。LSTM扩展了标准RNN，能够学习长期时间依赖性，是通过遗忘门、输入和输出复位门以及存储器单元来实现的。进出存储器单元的信息流由遗忘门和输入门调节，这允许网络在训练期间克服梯度消失问题，能够学习长期的相关性。LSTM输入是CNN输出，由一系列特征向量xt组成。LSTM将输入序列映射到输出序列，输出序列参数化为7维向量的全局姿态组成yt，包括平移向量和朝向四元数。为充分利用时间连续性，这里LSTM模型采用双向结构，如图所示。

为了模拟姿态估计的不确定性，采用混合密度网络（mixture density networks）方法。这种方法用混合模型取代了高斯模型，可以对多模态后验输出分布建模。

NetVLAD

大规模基于视觉的位置识别问题要求快速准确地识别给定查询照片的位置。NetVLAD是一种CNN架构中的一层，帮助整个架构直接以端到端的方式用于位置识别。其主要组成部分是一个通用“局部聚合描述子向量”（VLAD，Vector of Locally Aggregated Descriptors）层，受到图像检索中特征描述子池化法VLAD的启发。该层可以很容易地插入任何CNN架构中，并且可以通过反向传播（BP）进行训练。根据一个定义的弱监督排名损失（ranking loss）可以训练从谷歌街景时间机（Google Street View Time Machine）下载的相同位置的图像，以端到端的方式学习该架构参数。

如图是带NetVLAD层的CNN结构。该层用标准CNN层（卷积，softmax，L2归一化）和一个易于实现的聚合层NetVLAD来实现“VLAD核”聚合，可在有向无环图（DCG）中连接。

给定N个D-维局部图像特征描述符{xi}作为输入，将K个聚类中心（“视觉词”）{ck}作为VLAD参数，输出VLAD图像表示V是K×D维矩阵。该矩阵可转换为矢量，归一化后可作为图像表示。V的（j，k）元素计算如下：

其中xi（j）和ck（j）分别是第i个特征描述符和第k个聚类中心的第j维。ak（xi）将描述符xi的成员资格记录为第k个视觉单词，即如果集群ck是最接近解释xi的集群则为1，否则为0。

VLAD的不连续性源来自描述符xi到聚类中心ck的硬分布ak（xi）。为了使之可微分，将其替换为描述子的多个聚类软分配，即

将上式的平方项展开，很容易看出exp()项在分子和分母之间消掉，导致如下软分配

其中向量wk和标量bk

这样最终的“VLAD核”聚合公式变成

其中{wk}，{bk}和{ck}是每个群集k的可训练参数集。

在VLAD编码，来自不同图像但划归同一聚类的两个特征描述子对两个图像之间相似性测度的贡献是残差向量之间的标量积，其中残差向量是描述符与聚类锚点（anchor point）之间的差。锚点ck可以被解释为特定聚类k的新坐标系原点。在标准VLAD中，锚点被选为聚类中心（×），以便数据库中的残差均匀分布。然而如图所示，在监督学习设置中，来自不匹配图像的两个描述子可以学习更好的锚点，使新残差向量之间的标量积很小。

Learned Stereo Machine

伯克利分校提出的一个用于多视角立体视觉的深度学习系统，即学习立体视觉机（LSM）。与最近其他一些基于学习的3D重建方法相比，沿着观察光线做特征投影和反投影，它利用了问题的基础3D几何关系。通过可微分地定义这些操作，能够端到端地学习用于量度3D重建任务的系统。这种端到端学习能够在符合几何约束的同时共同推理形状的先验知识，能够比传统方法需要更少的图像（甚至单个图像）进行重建以及完成看不见的表面。

如图是LSM概述：一个或多个视图和摄像头姿态作为输入；通过特征编码器处理图像，然后使用可微分的反投影操作将其投影到3D世界坐标系中。

如图给出1D图和2D网格之间的投影和反投影示意图。（a）投影操作沿光线以等间隔z值采样值到1D图像中。在z平面的采样特征堆叠成通道形成投影的特征图。（b）反投影操作从特征图（1-D）中获取特征，并沿光线放置在相应与之相交的网格块。

然后，以递归方式匹配这些网格G以产生融合网格Gp，这里采用的是门控递归单元（GRU）模型。接着，通过3D CNN将其转换为Go。最后，LSM可以产生两种输出 - 从Go解码的体素占有网格（体素 LSM）或在投影操作之后解码的每视角的深度图（深度LSM）。

下图给出V-LSM的一些结果，

如图给出D-LSM的一些例子。

DeepMVS

DeepMVS是一种用于多视角立体视觉（MVS）重建的深度卷积神经网络（ConvNet）。将任意数量各种姿态的图像作为输入，首先产生一组平面扫描体积（plane-sweep volumes），并使用DeepMVS网络来预测高质量的视差图。其关键特点是（1）在照片级真实感的合成数据集上进行预训练；（2）在一组无序图像上聚合信息的有效方法；（3）在预训练的VGG-19网络集成多层特征激活函数。使用ETH3D基准验证了DeepMVS的功效。

算法流程分四步。首先，预处理输入图像序列，然后生成平面扫描容积（plane-sweep volumes）。接着，网络估计平面扫描容积的视差图，最后细化结果。如图所示。

下面两个图分别显示带超参数的DeepMVS体系结构。整个网络分三部分：1）补丁匹配（patch matching）网络，2）容积内特征聚合（intra volume feature aggregation）网络，3）容积之间特征聚合（inter volume feature aggregation）网络。除了最后一层，网络中所有卷积层都跟着一个可缩放指数线性单元（Scaled Exponential Linear Unit ，SELU）层。

为了进一步改进性能，将全连通条件随机场（DenseCRF）应用到视差预测结果。

MVSNet

给定参考图像I1和一组其相邻图像{Ii} Ni = 2，MVSNet提出了一种端到端深度神经网络来推断参考深度图D。在其网络中，首先通过2D网络从输入图像中提取深度图像特征{ Fi} Ni = 1。然后，通过可微分的单应性（Homography）变换将2D图像特征变形到参考相机坐标系，这样在3D空间中构建特征容积{Vi} Ni = 1。为了处理任意N视角图像输入，基于方差的成本测度将N个特征容积映射到一个成本容积C。与其他立体视觉和MVS算法类似，MVSNet使用多尺度3D CNN正则化成本容积，并通过软argmin 操作回归参考深度图D。在MVSNet末端应用一个细化网络进一步增强预测深度图的性能。由于在特征提取期间缩小了深度图像特征{Fi} Ni = 1，因此输出深度图大小是每个维度中原始图像大小的1/4。

MVSNet在DTU数据集以及Tanks and Temples数据集的中间集展示了最先进的性能，其中包含具有“从外看里”的摄像头轨迹和小深度范围的场景。但是，用16 GB内存 Tesla P100 GPU卡，MVSNet只能处理H×W×D = 1600×1184×256的最大重建尺度，并且会在较大的场景中失败，即Tanks and Temples的高级集合。

如图是MVSNet网络设计图。输入图像通过2D特征提取网络和可微分单应性变形生成成本容积。从正则化的概率容积回归最终的深度图输出，并且用参考图像细化。

下图是推断的深度图、概率分布和概率图。（a）DTU数据集的一个参考图像; （b）推断的深度图; （c）内点像素（顶部）和出格点像素（底部）的概率分布，其中x轴是深度假设索引，y轴是概率，红色线是软argmin结果; （d）概率图。

•Recurrent MVSNet

MVS方法的一个主要限制是可扩展性：耗费内存的成本容积（cost volume）正则化使得学习的MVS难以应用于高分辨率场景。Recurrent MVSNet是一种基于递归神经网络的可扩展多视角立体视觉框架。递归多视角立体视觉网络（R-MVSNet）不是一次性正则化整个3-D成本容积，而是通过门控递归单元（GRU）网络串行地沿深度值方向正则化2-D成本图。这大大减少了内存消耗，并使高分辨率重建成为可能。

下图比较了不同正则化方案的策略。一次性全局正则化成本容积C的替代方案是串行地沿深度方向处理成本容积。最简单的顺序方法是赢家通吃（WTA）的平面扫描（plane sweeping）立体视觉法，它粗略地用较好的值替换逐像素深度值，因此受到噪声的影响（如图（a））。为此，成本聚合法过滤不同深度的匹配成本容积C(d)（如图（b）），以便收集每个成本估算的空间上下文信息。遵循串行处理的思想，这里采用一种基于卷积GRU的更强大的递归正则化方案。该方法能够在深度方向上收集空间和单向上下文信息（如图（c）），与全空间3D CNN（如图（d））相比，这实现了差不多的正则化结果，但是运行时内存更加有效。

下图是R-MVSNet的框图介绍。从输入图像中提取深度图像特征，然后将其变形到参考相机坐标系的前向平行平面。在不同深度处计算成本图并由卷积GRU串行地正则化处理。网络被训练为具有交叉熵（cross-entropy）损失的分类问题。

如图是R-MVSNet的重建流水线直观图：（a）DTU图像；（b）来自网络的初始深度图；（c）最终深度图估计；（d）基础事实深度图；（e）输出点云；（f）深度图滤波的概率估计图；（g）初始深度图的梯度图；（h）细化后的梯度图。

参考文献

1. Kendall A, Grimes M, Cipolla R. “Posenet: A convolutional network for real-time 6-dof camera relocalization”，IEEE ICCV. 2015
2. Li X, Belaroussi R. “Semi-Dense 3D Semantic Mapping from Monocular SLAM”. arXiv 1611.04144, 2016.
3. J McCormac et al. “SemanticFusion: Dense 3D semantic mapping with convolutional neural networks”. arXiv 1609.05130, 2016
4. R Arandjelovic et al. “NetVLAD: CNN architecture for weakly supervised place recognition”, CVPR 2016
5. B Ummenhofer et al., "DeMoN: Depth and Motion Network for Learning Monocular Stereo", CVPR 2017
6. R Li et al. “UnDeepVO: Monocular Visual Odometry through Unsupervised Deep Learning”. arXiv 1709.06841, 2017.
7. S Wang et al.,“DeepVO: Towards End-to-End Visual Odometry with Deep Recurrent Convolutional Neural Networks”, arXiv 1709.08429, 2017
8. R Clark et al. "VidLoc: 6-doF video-clip relocalization". arXiv 1702.06521，2017
9. R Clark et al. "VINet: Visual-Inertial Odometry as a Sequence-to-Sequence Learning Problem." AAAI. 2017
10. D DeTone, T Malisiewicz, A Rabinovich. “Toward Geometric Deep SLAM”. arXiv 1707.07410, 2017.
11. S Vijayanarasimhan et al.,“SfM-Net: Learning of Structure and Motion from Video”, arXiv 1704.07804, 2017
12. K Tateno K et al. “CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction”. arXiv 1704.03489, 2017.
13. J Zhang et al. “Neural SLAM : Learning to Explore with External Memory”，arXiv 1706.09520， 2017
14. Wu J, Ma L, Hu X. “Delving deeper into convolutional neural networks for camera relocalization”，IEEE ICRA, 2017
15. A Kar, C Haene, J Malik, “Learned Stereo Machine”, NIPS, 2017
16. P Huang et al.,“DeepMVS: Learning Multi-view Stereopsis”, CVPR 2018
17. Y. Yao et al., “Mvsnet: Depth inference for unstructured multi-view stereo”. ECCV， 2018.
18. Y Yao et al.,“Recurrent MVSNet for High-resolution Multi-view Stereo Depth Inference”, CVPR 2019
19. G Zhai et al.,“PoseConvGRU: A Monocular Approach for Visual Ego-motion Estimation by Learning”, arXiv 1906.08095, 2019
20. X Han, H Laga, M Bennamoun,“Image-based 3D Object Reconstruction: State-of-the-Art and Trends in the Deep Learning Era”, arXiv 1906.06543, 2019
‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍下载1：OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。
下载3：OpenCV实战项目20讲
在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

你可能感兴趣的:(计算机视觉,神经网络,机器学习,人工智能,深度学习)

DeepSeek--通向通用人工智能的深度探索者油泼辣子多加专业名词解释人工智能
一、词源与全称“DeepSeek"由"Deep”（深度）与"Seek"（探索）组合而成，中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司"，英文对应"DeepSeekArtificialIntelligenceResearchInstitute"。这一命名体现了企业对深度学习技术与未知领域持续探索的双重追求。二、发展历程初创期（2023）公司成立于中国杭州，创始团队汇聚了来自
【计算机视觉】图像滤波油泼辣子多加计算机视觉计算机视觉人工智能 python 神经网络
1.图像滤波定义图像滤波是一种非常重要的图像处理技术，图像平滑、边缘检测、边缘增强、去除噪声都属于图像滤波，图像滤波是一种基于邻域的算法。通过图像滤波，可以实现图像平滑、边缘检测；图像平滑也叫图像模糊，用以去除图像中的噪声、伪影等，它是图像处理和计算机视觉的常见步骤。函数模糊类型特点使用场景cv.blur均值模糊简单快速，所有像素权重相等基础平滑和降噪cv.GaussianBlur高斯模糊中心权重
git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案爱编程的喵喵 Python基础课程 git github timeout port 443 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了gitclone出现fatal:un
Gradio 快速构建机器学习web可视化界面心得算法小菜鸟成长心得 python
1.操作完成提示try:#对输入的字符串代码进行编译运行exec(get_test_code_example)gr.Info("Modeltestingcompletedsuccessfully.")except:raisegr.Error("Modeltestingfailed.")用到了gr.Info()和gr.Errot(）
linux git clone出现fatal: unable to access Failed to connect to github.com port 443: Timed out解决方案 herosunly C/C++/Linux解决方案 linux git github timeout port 443
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了linuxgitclone出现fatal:unabletoaccessF
LSTM的推导与实现 YZXnuaa NLP Python库
最近在看CS224d，这里主要介绍LSTM(LongShort-TermMemory)的推导过程以及用Python进行简单的实现。LSTM是一种时间递归神经网络，是RNN的一个变种，非常适合处理和预测时间序列中间隔和延迟非常长的事件。假设我们去试着预测‘IgrewupinFrance...（很长间隔）...IspeakfluentFrench’最后的单词，当前的信息建议下一个此可能是一种语言的名字
flask+layui学生信息管理系统元宇宙中的程序员 flask layui python
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。一、数据库建模1、创建数据模型classStudentORM(db.Model):stu_id=d
Python 3.9它来啦！！！ python程序员小'鹏 python 编程语言经验分享程序人生
Python3.9，来了！小编本身就是一名python开发工程师，我自己花了三天时间整理了一套python学习教程，从最基础的python脚本到web开发，爬虫，数据分析，数据可视化，机器学习，等，这些资料有想要的小伙伴"点击"即可领取过去一年，来自世界各地的开发者们一直在致力于Python3.8的改进。Python3.9beta版本已经存在了一段时间，第一个正式版本于2020年10月5日发布。每
AI智能制造软件有什么用处雪叶雨林行业资讯 AI 人工智能制造
随着信息技术与制造业的深度融合，人工智能（AI）逐渐成为提升制造效率和灵活性的重要工具。AI智能制造软件通过集成数据分析、机器学习和自动化流程，为企业提供了优化生产、降低成本和提高质量的新途径。生产过程优化实时监控与反馈AI智能制造软件能够实时收集生产线上的各类数据，如温度、压力、速度等参数，并通过机器学习算法进行分析处理。一旦检测到异常情况，系统会立即发出警报并提供改进建议，帮助企业快速响应问题
ModuleNotFoundError: No module named ‘pywin32_bootstrap‘解决方案爱编程的喵喵 Python基础课程 python ModuleNotFound win32_bootstap 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ModuleNotFoundErro
SalFAU-Net:显著性目标检测的显著性融合注意U-Net 明初啥都能学会目标检测人工智能计算机视觉
SalFAU-Net:显著性目标检测的显著性融合注意U-Net摘要IntroductionRelatedWorksSalFAU-Net:SaliencyFusionAttentionU-NetforSalientObjectDetection摘要显著目标检测（SOD）在计算机视觉中仍然是一个重要的任务，其应用范围从图像分割到自动驾驶。基于全卷积网络（FCN）的方法在过去几十年里在视觉显著性检测方面
人脸识别的经典深度学习方法明初啥都能学会深度学习人工智能
人脸识别的经典深度学习方法引言1.卷积神经网络（CNN）1.1LeNet1.2AlexNet1.3VGGNet1.4ResNet2.人脸检测2.1Viola-Jones算法2.2基于深度学习的人脸检测3.人脸特征提取3.1主成分分析（PCA）3.2人脸对齐3.2.1基于特征点的对齐3.2.2基于深度学习的对齐4.人脸识别模型4.1传统机器学习方法4.2基于深度学习的方法5.公式解读5.1卷积运算5
AI智能获客工具的意义是什么雪叶雨林 AI 行业资讯人工智能
在当今竞争激烈的市场环境中，企业需要高效、精准的获客策略来维持增长和竞争力。AI智能获客工具的出现，为企业提供了一种全新的解决方案，通过自动化和智能化手段提高获客效率和质量。一、AI智能获客工具的核心价值1.1提高获客效率AI智能获客工具通过自动化流程，如自动筛选潜在客户、自动发送营销信息等，大幅减少了人力投入和时间成本，从而提高了获客效率。1.2精准定位潜在客户利用机器学习和大数据分析技术，AI
人物传记之新月篇暮雨哀尘人物传记篇哈希算法算法 c语言 python pycharm vscode windows
相关故事链接（及时更新）：Python的那些事第四篇：编程中的智慧之光控制结构-CSDN博客目录1.C语言程序：增强版加密与解密工具2.Python程序：增强版加密与解密工具功能对比表格详细功能解释人物传记简介新月，25世纪的杰出女性，以其在编程、人工智能和军事战略领域的卓越成就而闻名。她不仅是一位才华横溢的科学家，还是一位深受尊敬的军事领袖。新月的故事是关于智慧、勇气和创新精神的传奇。早年生活新
MicroAI™将人工智能培训引入RENESAS MCU sinat_41698914 人工智能 mcu big data
在端点部署的人工智能技术将加快资产密集型行业的上市时间达拉斯--(美国商业资讯)--边缘原生人工智能(AI)和机器学习(ML)产品领域的先驱MicroAITM今天宣布，公司已将其MicroAIAtomML™技术与RenesasRA微控制器(MCU)产品线进行整合。与全球微控制器领导者Renesas合作将机器学习引入MCU，并借助MicroAI直接在嵌入式环境中训练机器学习模型的能力——这在业界尚属
基于深度学习的遥感目标检测系统：UI界面、R-CNN模型与数据集准备 2025年数学建模美赛 R-CNN检测系统人工智能深度学习 r语言 cnn python ui 目标检测
一、引言遥感图像中的目标检测在很多领域，如环境监测、土地利用、城市规划、农业资源监测等方面有着广泛应用。遥感图像具有高分辨率和丰富的空间信息，但同时也带来了目标检测中的许多挑战，特别是在目标尺度变化、遮挡和复杂背景的情况下。因此，采用深度学习技术，尤其是卷积神经网络（CNN）和区域卷积神经网络（R-CNN），在遥感图像目标检测中取得了显著的成果。本文将详细介绍基于深度学习的遥感目标检测系统，使用R
DeepSeek R1：中国AI黑马的崛起与挑战码事漫谈 AI 人工智能
文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs）正以迅猛之势重塑我们的
ultralytics 是什么？博刻 AI 学习笔记 python
ultralytics是一个用于计算机视觉任务的Python库，专注于提供高效、易用的目标检测、实例分割和图像分类工具。它最著名的功能是实现YOLO（YouOnlyLookOnce）系列模型，特别是最新的YOLOv8。1.YOLO是什么？YOLO是一种流行的目标检测算法，以其速度快和精度高而闻名。YOLO的核心思想是将目标检测问题转化为一个回归问题，直接预测目标的边界框和类别。YOLOv8是YOL
Kaggle房价预测一名小菜鸟的学习之路深度学习pytorch 深度学习机器学习 python 人工智能神经网络
Kaggle房价预测作为深度学习基础篇章的总结，我们将对本章内容学以致用。下面，让我们动手实战一个Kaggle比赛：房价预测。本节将提供未经调优的数据的预处理、模型的设计和超参数的选择。我们希望读者通过动手操作、仔细观察实验现象、认真分析实验结果并不断调整方法，得到令自己满意的结果。%matplotlibinlineimporttorchimporttorch.nnasnnimportnumpya
C++ 与机器学习：构建高效推理引擎的秘诀 salsm C++编程魔法师 c++机器学习开发语言
随着深度学习模型逐渐从研究走向生产环境，推理能力成为部署中的关键环节。模型的推理引擎需要以极低的延迟快速处理输入数据，同时最大化地利用硬件资源。虽然Python被广泛用于模型的训练和开发，但C++却在推理领域独占鳌头，其性能优势和硬件控制能力无可替代。在这篇文章中，我们将从为什么选择C++、构建高效推理引擎的细节，以及相似的开源项目三个方面深入探讨如何利用C++打造高效的机器学习推理引擎。目录为什
《动手学深度学习》(PyTorch版) chaser&upper 深度学习 pytorch 深度学习 python
《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为PyTorch实现。原书作者：阿斯顿·张、李沐、扎卡里C.立顿、亚历山大J.斯莫拉以及其他社区贡献者，GitHub地址：https://github.com/d2l-ai/d2l-zh此书的中英版本存在一些不同，针对此书英文版的P
第76期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.关于使用大语言模型
从简单到深刻的认知发展 AI架构设计之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
认知发展，人工智能，深度学习，神经网络，机器学习，自然语言处理，计算机视觉1.背景介绍认知发展是人类从简单到复杂的思维方式演进的过程，它涉及感知、记忆、语言、推理和决策等多个方面。随着人工智能技术的飞速发展，我们开始尝试用计算机模拟人类的认知能力，构建能够学习、理解和解决复杂问题的智能系统。从早期的符号逻辑到如今的深度学习，人工智能的发展经历了多个阶段。早期的人工智能研究主要集中在规则和逻辑推理上
2025年1月27日人工智能与科技新闻：DeepSeek震撼全球科技市场海棠AI实验室 AI 瞭望塔人工智能科技
中国AI初创公司DeepSeek震撼全球科技市场DeepSeekR1模型的突破性发展在科技迅猛发展的时代，中国人工智能初创公司DeepSeek推出的R1模型，以其卓越的技术能力，在全球AI领域掀起一场变革。这不仅是技术层面的突破，更对全球科技市场产生深远影响。技术创新与突破全新语言处理架构：提升AI理解和生成能力超越传统模型的认知能力：实现更精准的自然语言推理多模态交互：支持文本、图像、语音等多维
第84期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能 gpt AIGC
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
新型人工智能“黑帽”工具：GhostGPT带来的威胁与挑战 FreeBuf- 资讯人工智能
生成式人工智能的发展既带来了有益的生产力转型机会，也提供了被恶意利用的机会。最近，AbnormalSecurity的研究人员发现了一个专门为网络犯罪创建的无审查AI聊天机器人——GhostGPT，是人工智能用于非法活动的新前沿，可以被用于网络钓鱼计划、恶意软件开发和漏洞利用开发。GhostGPT的主要特点快速处理：使攻击者能够快速生成恶意内容。无日志政策：声称不记录用户活动，吸引那些寻求匿名的人。
大数据和智能数据应用架构系列教程之：大数据与人工智能 AI天才研究院 AI实战大数据AI人工智能 Python实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.背景介绍概述“大数据”是指海量、高维、多样化的数据集合。随着人类对数据处理和管理的需求越来越复杂，越来越依赖机器学习、人工智能等新兴技术。在过去的一段时间里，越来越多的人开始关注到“大数据”这一颗龙头。如今，“大数据”已经成为一个新的名词，它既包含了大量的数据，也带来了巨大的价值。因此，研究、开发、应用“大数据”技术也逐渐成为各行各业的专业人才需求。在这个快速发展的
使用onnxruntime-web 运行yolov8-nano推理 CHEN_RUI_2200 机器学习 YOLO
ONNX（OpenNeuralNetworkExchange）模型具有以下两个特点促成了我们可以使用onnxruntime-web直接在web端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2。这使得用户可以在一个框架中训练模
深度神经网络（DNN）详解古龙飞扬 dnn 人工智能神经网络
深度神经网络（DNN，DeepNeuralNetwork）是人工智能领域中的一种重要模型，它通过模拟人脑神经网络的结构和工作原理，实现了对复杂数据的处理和决策。以下是对深度神经网络（DNN）的超详细解析：一、DNN的基本概念DNN是一种具有多个隐藏层的神经网络模型，其核心在于其深度，即包含多个隐藏层。这些隐藏层通过非线性变换，使得模型能够捕捉到数据中的复杂关系和模式。DNN通常由输入层、隐藏层和输
探索GigaChat与LangChain的完美结合：深度解析与实战指南 asdfujhgy langchain easyui 前端 python
探索GigaChat与LangChain的完美结合：深度解析与实战指南引言在人工智能的领域中，语言模型和嵌入技术正逐步改变我们与数据交互的方式。GigaChat作为一种创新的AI嵌入服务，结合LangChain可以提供强大的文本嵌入功能，促进自然语言处理任务的完成。本篇文章将带你深入了解如何结合GigaChat与LangChain进行文本嵌入，并提供实用的代码示例与解决方案。主要内容GigaCha
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {