Eason.wxd

深度相机（六）--Kinect v2.0 手势样本库制作

目录为1.如何使用Kinect Studio录制手势剪辑；2.如何使用Visual Gesture Builder创建手势项目；3.如何在我的C#程序中使用手势；4.关于录制、剪辑手势过程中的注意事项

　　1.使用KInect Studio录制手势剪辑

　　　　1.1打开Kinect Studio这款程序，当你安装完成Kinect SDK 2.0后它的快捷方式会出现在你的开始菜单中。

　　该软件是主要的功能是监视、录制、回放，我们使用它的录制功能录制手势原文件。软件的具体使用方法我们就不说了，在这里我们会详细说明我们使用的步骤。首先，你需要了解它能记录的数据类型是Color、Audio、Infrared、Depth这四种，之后它会根据Infrared和Depth来生成BodyFrame、BodyIndex。就是说你虽然在录制的时候选择了使用BodyFrame和BodyIndex，但是他们并不是被记录下来了，而是后期生成的。所以我们制作手势的话，最少需要选择的源为：Infrared、Depth、BodyFrame和BodyIndex。尽量不要选择Color，因为它的数据量太大，对我们的骨节点识别和手势动作的分析没有任何作用。

　　1.2 录制原始数据剪辑

　　当你使用这款程序时会发现，它能记录的信号源分为两种，一种是普通数据，它的扩展名为xef；另一种是原始数据，它的扩展名为xrf。这两种录制数据最大的不同就是骨架数据的保存，当你使用普通数据时，kinect在生成深度或骨架时，恰巧改变一些潜在算法，你的骨架数据可能会无效，而且录制之后就不能进行更新处理。当你使用原始数据时，就可以确保录制的剪辑时刻真实有效。但是，原始数据的文件大小会很大，而且在录制完成后还需要转换才能给Visual Gesture Builder来使用。

　　打开方法：设置里打开AdvancedSteamdisplay，这个选项在设置的最下面。

　　然后你就会发现可以记录的选项从原先的11个变成了现在的15个，然后你只需要选中其中的NuiRawIR11bit就可以记录到原始数据了。

　　录制过程：略

　　1.3 原始数据的转换

　　原始数据是不能够被Visual Gesture Builder直接使用的，使用命令提示符调出KSConvert程序，转换方法为KSConvert.exe路径路径

路径输入好后回车就可以转换了，当它转换完成后会出现：

　　该路径必须是一个没有中文的路径，即没有中文文件夹，文件名不能是中文（c:\User\文档\…也不可以），否则会转换失败。

转化完成后，你需要在Kinect Studio中再次检查身体框架记录的文件，Visual Gesture Builder无法使用没有身体框架的文件。

2.使用Visual Gesture Builder创建手势项目

　　2.1新建解决方案　　File/NewSolution

　　　　类比Visual Studio 中的解决方案，可以存放多个手势项目。

　　2.2新建手势项目

　　　　Create New Project

　　　　也可以使用向导创建

Gesture Name：手势的名字
Body Side：手势是哪一面的

　　　　可以选择Any、Right、Lift，当选择Any时代表你的手势不区分左右，就是说你想要一个右手举过头顶的手势识别，但是它会默认认为你左手举过头顶也符合

Gesture Type：手势类型　　Discrete（AdaBoostTrigger）离散　　Continuous（RFRProgress）连续

　　　　当你需要考虑一个手势的进度时，那你需要将手势做成连续的。除此之外你应该使用离散的手势处理

Training Settings

　　　　一些需要用到或者忽略的设置

2.3关于分析项目

项目创建完成后，你会在解决方案文件夹下得到两个东西（训练项目和分析项目），那个.a后缀名的实际上是你的分析项目，或者说是测试项目

你放置在训练项目中的手势剪辑会实际起作用，当你最后生成一个手势库文件时它默认也只识别训练项目中的剪辑。那么这么说分析项目是不是就没有用了呢？

并不是这样的，分析项目可以进行分析测试你手势的情况。比如，你同一个动作录制了10个剪辑（相信我，10个剪辑只能算基础），你在训练项目中添加了8个项目并标记好，生成库文件就能作用到分析项目中（需要将剩下的两个剪辑添加到分析项目中），从而看到你的手势实际标记的情况，是否需要修改，是否需要添加新的手势剪辑。当你又录制了新的剪辑后，添加到训练项目中去并标记好，重新生成库，重新分析，我们就能清楚的看到识别的效果的变化。

注意：

不要在训练和测试中用一样的剪辑，原因是你需要一个新的剪辑来确定你的标记是否合理，而不是用自己证明自己

2.4 添加剪辑并标记

　　添加剪辑后，你双击剪辑就能进去添加标记了。

如何添加标记：

　　使用方向左右键进行移动，Shift是选择键（等同于一直按下鼠标左键），Enter标记为真，空格键标记为假

如果希望退回去检查,可以按下Control键加箭头键快速定位关键帧

如果只标记真，你未做标记的会被自动标记为假

如果是连续手势，Enter标记为1，空格键标记为0，使用1~9可以标记0.1~0.9。比如我想在0~1中间的某个位置标记0.5（就是说在这个时候当前剪辑的人所做的手势已经完成了手势规定的50%），那么我就直接按下“5”就可以了。

2.5分析测试组

在.a后缀名的那个项目添加一个剪辑作为测试，然后右击分析项目→分析，选择你想分析的手势库（gba或gbd文件，如何生成gba或gbd我们后面介绍）

　　2.6实时预览

这个是比较直接的进行测试，不需要剪辑你直接在Kinect前进行演示就可以，同样需要生成好的手势库文件。

注意：当你只有一两个剪辑制作的姿势库的话，其实只有30-50%的置信值

　　2.7返回值

离散手势返回的结果有一个布尔值，表示是否做了那个手势；还有一个float值，是置信值，这个值能判定这个手势能否有效利用

连续手势只返回一个float值，这里是进度值，表示我在做的姿势距离数据库中的姿势的完成度还有多远。通常值为0-1，但是你也可以标记其他的值

2.8连续手势的自动标记

以上的内容大多是在讲离散手势的，下面可是接触比较复杂的连续手势，这里需要注意一下，平时使用时要记录的是一个瞬间的结果还是几个需要一定时间才能完成的结果，这样来选择你的手势是连续的还是离散的

平时使用时，你的手势80-90%都是离散的

离散手势：手势正在形成，或者没有

连续手势：追踪一个单一手势的进程，追踪动画或者与动画相连接

信号是一个可返回的浮点值，总是运行着

连续型手势中，没有置信值，会有一个进度值，为了判断它是否有效，你应该吧它和一个离散型手势连接在一起来作为判定依据，来测试确保其中一个手势是真实有效的

连续型手势需要标记那个进度值，从0-1中的数值，但是也可以使用自动标记。自动标记的使用方法：

1.用一个没有任何标记的新文件，先把它添加到分析里。分析中发现漏掉了它，意味着你的培训集合微弱，所以要强化培训。分析会捕捉它

干脆就把所有新的剪辑放进分析，做标记

然后，一旦标记完成，分析也已经运行起来了，然后我再决定我是否想把它留存在分析里，还是移动到培训里

2.选择该clip，移动到培训选项 Move To Training

3.相同文件名的clip在解决方案里，存在于相对应的状态离散手势分析项目里，并且已经被标记

4.右键点击你的状态连续手势分析项目，选择Generate Tags，当你有一个连续型手势时，它会打开手势对话的连接，在你的集合里现有的离散型手势中，哪些是你想对应的。进行指定标记的值的时候，需要注意指定这一状态的初始值及结束值。比如视频中的姐姐将左转、平行、右转三个离散手势和连续手势进行对应（注意：用到的必须是同一个手势剪辑）时，她将左转设置成0.5-0，平行设置成0.5，右转设置成0.5-1

点击确定标记，此时程序将查看尚未进行标记的所有有与之对应手势的剪辑来进行连续手势的自动标记

此时，当你点击某一个剪辑时就可以看到它已经被自动标记了。你可以再做细微调整，或根据需要进行中间手势（中值）的标记

调整好后，你需要选择AcceptTags，之后它就会从粉红色变成蓝色，表示这个标记不再是自动生成的了，而是人工检查的

有时候连续型手势的自动标记的内容有些你并不想要，那就删除

Ctrl+Shift+Delete

2.9离散手势的自动标记

其实离散型手势也是有自动标记的，但是没有生成标记选项，说白了就是利用分析项目的分析功能。

这时需要你首先已经存在一个手势数据库，也就是说，当你需要录制一个需要成百上千个剪辑的手势时，你可以先手动标记至少前5个（视频中的姐姐说5个使比较合适的数字，稍微复杂杂一点的需要10个，很细微的小手势的话需要大概20个，具体为5-20个之间，听起来好想不靠谱，不过她好想很认真的样子），然后利用这5个生成的数据库来进行自动标记。具体操作为

1.右键点击你的离散手势分析项目，点击分析，之后会出现分析结果。

2.在单个剪辑中，点击分析手势GenerateTags，点击生成标记（可以看到上图其实已经是已经标记好后再进行分析的，注意不要在已经人为标记过的剪辑内点击生成标记，通常认为标记要比分析更为精确）

通常情况下，分析取决于你手势的质量，不过他在检测手势时有一点滞后，而且检查手势确定完毕的用时稍微长了一些

当你的数据库变得更加精确时，就会在这个功能的作用下节省很多时间，当它不够精确时就很难分析出来

2.9生成手势库

　　直接右键解决方案，Build的是gbd文件。右键某个训练项目，Build的是这个训练项目的手势文件。

3.程序中使用手势

录制、剪辑、标记、生成等工作做完，我们就得到了一个后缀名为gbd的手势数据库的文件，那么我们的工作就算完成的差不多了，接下来就是将该文件加进我们的项目中，然后使用。接下来我们将在一个demo项目里进行演示

首先，在使用手势数据库之前我们需要做这几件事：

1.加入手势数据库

在加入手势数据库时需要注意，将gbd或gba文件添加到项目目录下，右键属性，将复制到输出目录选择为始终复制，生成操作选择为内容

2.引用类库

Microsoft.Kinect.VisualGestureBuilder.dll

这个时候需要注意，其实手势的这个类库是有两个的，在C:\Program Files\Microsoft SDKs\Kinect\v2.0_1409\Redist\VGB这个文件夹下有X64、X86两个文件夹，两个类库分别为X64、X86的，X64的稍微多10多kb，实际使用我也不清楚有没有影响，但是最好用X86的那个。这个需要注意一下。此外，在使用其他Kinect类库时，你会发现也会有两个，那么我们在引用的时候将鼠标移动到名称上会出现该类库的路径，可以看到它时X64还是X86，默认上面的那个是X86.

3.在debug文件夹下加入vgbtechs文件夹

需要添加C:\Program Files\Microsoft SDKs\Kinect\v2.0_1409\Redist\VGB\x86下的vgbtechs文件夹

在使用Kinectface来做面部识别时也会需要一个特殊的文件夹，请知晓

以上是我们使用手势库的先决条件，如果你已经完成了，那我们就继续进行吧！

需要用到的是KinectSensor,BodyFrameReader,Body,VisualGestureBuilderFrameReader,VisualGestureBuilderFrameSource……

以下是代码，这个代码不能直接使用，只是作为演示。先指定路径，然后遍历里面的手势并添加给VGB帧源，然后在帧到达事件处理程序中和手势库中的手势进行比对，输出结果。

1 private readonly string gestureDatabase = @"Database\Steering.gbd"; 2 3 private VisualGestureBuilderFrameSource vgbFrameSource = null; 4 private VisualGestureBuilderFrameReader vgbFrameReader = null; 5 6 public GestureDetector(KinectSensor kinectSensor) 7 { 8 if (kinectSensor == null) 9 {10 throw new ArgumentNullException("kinectSensor");11 }12 this.vgbFrameSource = new VisualGestureBuilderFrameSource(kinectSensor, 0);13 this.vgbFrameReader = this.vgbFrameSource.OpenReader();14 if (this.vgbFrameReader != null)15 {16 this.vgbFrameReader.IsPaused = true;17 }18 using (var database = new VisualGestureBuilderDatabase(this.gestureDatabase))19 {20 this.vgbFrameSource.AddGestures(database.AvailableGestures);21 }22 23 foreach (var gesture in this.vgbFrameSource.Gestures)24 {25 this.vgbFrameSource.SetIsEnabled(gesture, false);26 }27 }28 29 public void UpdateGestureData()30 {31 using (var frame = this.vgbFrameReader.CalculateAndAcquireLatestFrame())//计算并生成最新的VGB帧32 {33 if (frame != null)34 {35 var discreteResults = frame.DiscreteGestureResults;36 var continuousResults = frame.ContinuousGestureResults;37 38 if (discreteResults != null)39 {40 foreach (var gesture in this.vgbFrameSource.Gestures)41 {42 if (gesture.GestureType == GestureType.Discrete)43 {44 DiscreteGestureResult result = null;45 discreteResults.TryGetValue(gesture, out result);46 47 }48 49 if (continuousResults != null)50 {51 if (gesture.GestureType == GestureType.Continuous)52 {53 ContinuousGestureResult result = null;54 continuousResults.TryGetValue(gesture, out result);55 }56 }57 }58 }59 }60 }61 }

4.注意事项

　　官方视频里给的建议：

保持手势简单
- 复杂的手势应被分解成多个部分
避免过度标记
- 标记为手势的核心部分，避免标记准备动作和恢复性动作，原因是
  - 一部分对于机器学习算法，会产生混乱。需要帮助算法明白什么是重点
  - 你在程序中使用的肯定不止一个手势，会是多个，那么你就需要移除任何可能引起冲突的东
从静态姿势中分离手势
- 避免混合和匹配的框架，与动态手势
保持一致
- 开始和结束点应该是相同的，在所有剪辑的一个手势
验证标签
- 缺失或不正确的标签将混淆机器学习算法

　　我给自己的注意事项：

1.Kinect录制或采集的图像都是成像(镜像)的，所以你看到的效果可能是左右对调的。你只需要记住，并不是以Kinect的位置看问题，是以操作者的角度看的。好在，有标注

2.在本文中会出现一些专有名词，有解决方案、离散手势项目、离散手势分析项目、连续手势项目、连续手势分析项目、剪辑，大多和VisualStudio2015中的名词是相对应的级别

3.当标记变为蓝色时，不管在什么情况下（分析、离散、连续等）都是被人工确认过的且被接受的，这时程序会默认你已经知晓它的可使用性

4.所谓的机器学习，其实也只是你给它足够的资料库让它来进行分析对比。所以你给的库必须严谨、正确，不能模棱两可，它可不会思考

Ubuntu: 配置OpenCV环境达柳斯·绍达华·宁 ubuntu opencv linux
从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次，点赞4次，收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、移动机器人、动作理解、物体识别、分割和识别、实体影像立体视觉:来自两个摄像机的深度感知、运动跟踪、增强现实等
计算机视觉领域顶级会议和顶级期刊汇总 AdaCoding 论文阅读与写作计算机视觉人工智能
计算机视觉领域顶级会议和顶级期刊汇总一、计算机视觉顶会一档二档二、计算机视觉顶刊一、计算机视觉顶会一档1、ICCV，全称：IEEE/CVFInternationalConferenceonComputerVision国际计算机视觉会议，是公认的三个会议中级别最高的，收录率一般在20%左右，由IEEE主办。收录论文的内容：底层视觉与感知，颜色、光照与纹理处理，分割与聚合，运动与跟踪，立体视觉与运动结
立体视觉几何（三） dc爱傲雪和技术计算机视觉数码相机人工智能
立体视觉系统概述误差分析考虑对应于深度Z的视差d的匹配对。我们想要评估ΔZ，即视差误差引起的深度误差。将Z对d求导，得到：立体视觉中基线（baseline）、焦距（focallength）和立体重建的准确性之间的基本关系。“深度：立体重建的分辨率随着深度呈二次减小。这意味着立体视觉的适用性受到严重限制。”-这句话指出，随着物体距离相机的深度增加，立体重建的分辨率会二次减小。这意味着在较远的距离上，
双目视觉测宽仪系列模拟人眼高精测量！蓝鹏测控其他制造
双目视觉测宽仪系列基于机器视觉原理，两个工业相机就像人的双眼，可以形成立体视觉，这样就可以得到足够的信息判断被测物的距离，修正和消除距离变化对测量的影响，在线检测生产线上产品的宽度值。可广泛应用于轧制材料（热轧、冷轧）、机械部件、钢板、铁板、金属板、厚板等板材类产品的在线检测。具有非接触、实时测量、精度高等优点。技术参数：测量范围：500-3000mm（定制）测量方式：双工业相机，自发光/光源补光
科普类——进行基线设计、系统测试和优化的立体视觉软件与工具（七） JANGHIGH 科普类无人驾驶自动驾驶
科普类——进行基线设计、系统测试和优化的立体视觉软件与工具（七）在立体视觉领域，有许多立体视觉软件和工具可以帮助工程师进行基线设计、系统测试和优化。以下是一些常用的立体视觉软件和工具：Meshroom：这是一个基于AliceVision摄影测量计算机视觉框架的免费开源三维重建软件。Meshroom可以处理大规模的图像数据集，进行立体视觉重建。OpenMVG(OpenMultipleViewGeom
三维重建开源函数库或者工具冰清-小魔鱼遥感 GIS 计算机视觉目标检测人工智能
三维重建使用摄影测量、计算机视觉技术，利用立体视觉恢复真实相机姿态，获取现实物体的三维信息，并进行虚拟三维场景重现。1、OpenDroneMapODM是一个基于航空影像的三维重建集成工具箱，利用多幅航空影像恢复相机姿态和3D场景，可以生产点云、三维贴图模型、正射影像、数字表面模型、数字高程模型等，提供Web接口，支持CUDA加速，基础函数库使用OpenSfM,OpenMVS,PDAL,Entwin
【三维重建】双目立体视觉 Patrick star` 人工智能
通过极几何可以求得极线，现在我们需要将左边的图变成右边的平行视图。所有的极线都经过极点(e/e')，如果极点位于无穷远处，那所有的极线都平行。(极几何的基础知识可以参考这篇文章：【三维重建】对极几何-CSDN博客)平行视图中，可以利用视差就得深度，视差越小深度越深。如何得到平行视图呢？
[Python图像处理] 使用OpenCV创建深度图 AI technophile Python图像处理实战 python 图像处理计算机视觉
使用OpenCV创建深度图双目视觉创建深度图相关链接双目视觉在传统的立体视觉中，两个摄像机彼此水平移动，用于获得场景上的两个不同视图(作为立体图像)，就像人类的双目视觉系统：通过比较这两个图像，可以以视差的形式获得相对深度信息，该视差编码对应图像点的水平坐标的差异。两个立体图像中单个像素的位移量称为视差(disparity)，像素的视差与其在场景中的深度成反比。可以用灰度值对每个像素的视差进行编码
11. 双目视觉之立体视觉基础宛如新生 slam中的标定问题数码相机
目录1.深度恢复1.1单目相机缺少深度信息1.2如何恢复场景深度？1.3深度恢复的思路2.对极几何约束2.1直观感受2.2数学上的描述1.深度恢复1.1单目相机缺少深度信息之前学习过相机模型，最经典的就是小孔成像模型。我们知道相机通过小孔成像模型对世界点的观测是缺少深度信息的。我们得到的只是世界点在相机平面上的一个投影。如下图，世界点P只要是在那条红色线上，他在相机上的成像位置就是P‘，所以我们无
12. 双目视觉之极线矫正宛如新生 slam中的标定问题数码相机
目录1.为何要进行极线矫正？2.极线矫正过程。1.为何要进行极线矫正？之前的文章立体视觉基础中介绍单目相机无法获得深度信息，我们可以通过多个相机来实现立体视觉。通过两个相机对某场景同时观测时，当我们知道了相机的内（外）参以及两者之间的基线，然后通过某种方式找到两相机对同一世界点的观测的关联关系（类似特征匹配），就可以计算出视差，最终通过下列公式计算出观测到的世界点的深度。我们假设双目相机已经标定完
第六篇【传奇开心果系列】Python的OpenCV库技术点案例示例：摄像头标定传奇开心果编程 Python库OpenCV 技术点案例示例短博文 opencv 计算机视觉 python
传奇开心果博文系列系列博文目录Python的OpenCV库技术点案例示例系列博文目录一、前言二、OpenCV摄像头标定介绍三、摄像头内外参数标定示例代码和扩展四、立体视觉标定示例代码和扩展五、归纳总结系列博文目录Python的OpenCV库技术点案例示例系列博文目录一、前言OpenCV摄像头标定：包括摄像头内外参数标定、立体视觉标定等功能。二、OpenCV摄像头标定介绍OpenCV是一个广泛使用的
双目立体视觉——视差图（stereo matching）三种相似度算法实现 7lingqi7 1024程序员节 python 笔记学习
目录双目立体视觉的理解：平行视图的极几何（第二种实现视差图的思路）图像校正（cameracalibration）实现——相似度匹配，视差计算重要影响参数实验报告讨论部分SGBM算法示例，这个效果更好，速度也更快。【双目视觉】SGBM算法应用（Python版）_落叶随峰的博客-CSDN博客任务：生成视差图关键词：视差原理（平行视图的极几何），图像校正，相似度匹配，视差计算和匹配图片数据集：visio
立体视觉几何 (二) dc爱傲雪和技术计算机视觉
1.视差2.立体匹配立体匹配的基本概念:匹配目标:在立体匹配中，主要目标是确定左图像中像素的右图像中的对应像素。这个对应像素通常位于相同的行。视差（Disparity）:视差d是右图像中对应像素xr和左图像中像素xl之间的水平位置差。视差是深度信息的关键指标。匹配方法:方法涉及在左图像中以某个像素为中心取一个窗口W，然后将这个窗口沿水平方向平移视差d，并将其放置在右图像中。接着比较左图像中窗口W和
立体视觉几何（一） dc爱傲雪和技术计算机视觉
1.什么是立体视觉几何立体视觉=对应+重建：•对应：给定一幅图像中的点pl，找到另一幅图像中的对应点pr。•重建：给定对应关系(pl,pr)，计算空间中相应点的3D坐标P。立体视觉：从图像中的投影恢复场景中点的三维位置的过程类型：基于窗口/局部的算法和全局算法三角测量：给定pl，我们知道点P位于连接pl和左光心Cl的直线Ll上。**假设我们确切地知道相机的参数，我们可以显式计算Ll和Lr的参数。*
重大突破！单向结构光系统校准方法，平面测量精度提高2.5倍，球面测量精度提高2倍 3DCV 学习计算机视觉人工智能算法深度学习平面
作者：小柠檬|来源：3DCV在公众号「3DCV」后台，回复「原论文」获取论文本文提出了一种新颖的单向结构光系统标定方法，该方法利用白色平面作为标定目标，而不是具有圆点或方格方块等物理特征的传统目标。该方法通过采用具有投影随机图案和平面拟合的立体视觉来重建白色平面。为了促进校准过程，使用了辅助摄像机和辅助投影仪。实验结果表明，所提出的方法对于单向结构光系统具有较高的标定精度。原文链接：重大突破！单向
vslam论文24：ESVIO: 基于事件相机的双目VIO（RAL 2023） xsyaoxuexi 视觉SLAM论文阅读 c++人工智能学习笔记
摘要异步输出低延迟事件流的事件相机为具有挑战性的情况下的状态估计提供了很大的机会。尽管近年来基于事件的视觉里程测量技术得到了广泛的研究，但大多数都是基于单目的，而对立体事件视觉的研究很少。在本文中，我们介绍了ESVIO，这是第一个基于事件的立体视觉惯性里程计，它利用了事件流、标准图像和惯性测量的互补优势。我们建议的pipeline包括ESIO(纯基于事件的)和ESVIO(带有图像辅助的事件)，它们
OpenCV-Python(43):姿势估计图灵追慕者 opencv-python opencv calib3D模块姿势估计摄像机标定立体视觉 3D重构
目标学习了解calib3D模块学习在图像中创建3D效果calib3D模块OpenCV-Python的calib3D模块是OpenCV库中的一个重要模块，用于摄像头标定和三维重建等计算机视觉任务。该模块提供了一些函数和类，用于摄像头标定、立体视觉和三维重建等方面的操作。下面是一些calib3D模块常用的函数和类的介绍：1.findChessboardCorners()：用于在一张图片中查找棋盘格角点
工业相机相关概念词介绍：ISP算法、线阵相机、常用术语明月醉窗台应用工具使用介绍图像处理相关算法数码相机接口隔离原则算法计算机视觉图像处理
工业相机相关概念词介绍：ISP算法、线阵相机、常用术语ISP基本框架及算法介绍相机的常用设置50个常用术语关于立体视觉相关算法，可参考我的专栏：https://blog.csdn.net/yohnyang/category_11720857.html0.ISP基本框架及算法介绍ISP(ImageSignalProcessor)，即图像处理，主要作用是对前端图像传感器输出的信号做后期处理，主要功能有
使用opencv做双目测距（相机标定+立体匹配+测距） AAI机器之心 opencv 数码相机人工智能 pytorch 机器学习计算机视觉
最近在做双目测距，觉得有必要记录点东西，所以我的第一篇博客就这么诞生啦~双目测距属于立体视觉这一块，我觉得应该有很多人踩过这个坑了，但网上的资料依旧是云里雾里的，要么是理论讲一大堆，最后发现还不知道怎么做，要么就是直接代码一贴，让你懵逼。所以今天我想做的，是尽量给大家一个明确的阐述，并且能够上手做出来。一、标定首先我们要对摄像头做标定，具体的公式推导在learningopencv中有详细的解释，这
ZED使用指南（八）Depth Sensing Happy_Cabbage ZED2 计算机视觉人工智能
ZED立体相机再现了人类双目视觉的工作方式。通过比较左眼和右眼看到的两种视图，不仅可以推断深度，还可以推断空间中的3D运动。ZED立体相机可以捕捉到场景的高分辨率3D视频，通过比较左右图像之间的像素位移可以估计深度和运动。深度感知深度感知是指确定物体之间的距离，以三维的角度看世界。到目前为止，深度传感器仅限于近距离和室内的深度感知，限制了其在手势控制和身体跟踪方面的应用。ZED是第一个使用立体视觉
双目立体视觉进入“上车”时代，这家厂商如何“领跑”全球高工智能汽车汽车
车载双目立体视觉正在迎来爆发式增长的窗口期。《高工智能汽车》了解到，继大众、丰田、零跑等越来越多主机厂开始从单目切换为双目方案之后，小鹏汽车也已经布局双目立体感知方案，以提高L2及以上智能驾驶的安全性和可靠性。现阶段，以NOA为代表的高阶智能驾驶系统，已经成为了车企决战智能化下半场竞争的关键。根据高工智能汽车研究院最新发布数据显示，2023年1-9月，中国市场（不含进出口）乘用车前装标配（软硬件）
OpenCV 中 core, imgcodecs, imgproc, calib3d, highgui, dnn, features2d, flann, gapi, ml, objc等分别是什么？型者无疆 opencv 3d dnn
下面是关于这些OpenCV模块的简要说明：core:OpenCV核心功能模块，提供了基本的数据结构、图像处理函数和数学运算等常见功能。imgcodecs:图像编解码模块，用于读取、写入和编解码各种图像格式，如JPEG、PNG等。imgproc:图像处理模块，提供了图像处理和操作的函数，包括滤波、边缘检测、几何变换等。calib3d:相机标定和三维重建模块，用于相机标定、立体视觉、姿态估计和三维物体
Active Stereo Without Pattern Projector论文精读你不困我困论文精读深度学习计算机视觉
1.背景补充主动立体相机和被动立体相机的主要区别在于它们获取立体视觉信息的方式主动立体相机12：主动立体视觉是指寻找最佳的视角去重建目标或者场景1。主动视觉的实现方式通常有：改变环境中的光照条件、改变相机的视角、移动相机自身位置等，其目的是提高感知结果的质量1。主动立体视觉还包括没有先验的场景信息去主动识别或是跟踪，存在与环境的交互1。结构光法采用主动投射已知图案的方法来实现匹配特征点，达到较高的
RC-MVSNet：无监督的多视角立体视觉与神经渲染--论文笔记（2022年）知识推荐号 MVS论文笔记论文阅读图像处理 python 三维重建
RC-MVSNet：无监督的多视角立体视觉与神经渲染--论文笔记（2022年）摘要1引言2相关工作2.1基于监督的MVS2.2无监督和自监督MVS2.3多视图神经渲染3实现方法3.1无监督的MVS网络3.2参考试图合成3.3深度渲染一致性Chang,D.etal.(2022).RC-MVSNet:UnsupervisedMulti-ViewStereowithNeuralRendering.In:
PCL深度图像 RangeImage Ivy_daisy PCL PCL RangeImage
http://www.cnblogs.com/li-yao7758258/p/6474699.html目前深度图像的获取方法有激光雷达深度成像法，计算机立体视觉成像，坐标测量机法，莫尔条纹法，结构光法等等，针对深度图像的研究重点主要集中在以下几个方面，深度图像的分割技术，深度图像的边缘检测技术，基于不同视点的多幅深度图像的配准技术，基于深度数据的三维重建技术，基于三维深度图像的三维目标识别技术，深
【2021集创赛】基于ARM-M3的双目立体视觉避障系统 SOC设计极术社区 IC技术竞赛作品分享 arm开发
本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。团队介绍参赛单位：上海电力大学队伍名称：骇行队总决赛奖项：二等奖1.摘要随着信息技术的发展，AGV（AutomatedGuidedVehicle，AGV）无人自动导航小车已被广泛应用于智能制造、智慧物流等场景。AGV搬运车的导航系统主要利用视觉、激光雷达等传感器，其主控系统大多使用多个芯片及其复杂嵌入式系统实现，成
《视觉SLAM十四讲》-- 建图算法导航视觉SLAM十四讲 SLAM 算法计算机视觉
11建图11.1概述（1）地图的几类用处：定位：导航：机器人在地图中进行路径规划；避障重建交互：人与地图之间的互动（2）几类地图稀疏地图稠密地图语义地图11.2单目稠密重建11.2.1立体视觉（1）稠密重建中，我们需要知道每个像素（或大部分像素）的距离，对此有以下几种方案：使用单目相机，估计相机运动，并且三角化计算像素的距离；使用双目相机，利用左右目的视差计算像素的距离；使用RGB-D相机直接获取
halcon——缺陷检测常用方法总结（光度立体）明月清风_@ Halcon 计算机视觉人工智能深度学习 python 机器学习
引言机器视觉中缺陷检测分为一下几种：blob分析+特征模板匹配(定位)+差分光度立体特征训练测量拟合频域+空间域结合：halcon——缺陷检测常用方法总结(频域空间域结合)-唯有自己强大-博客园(cnblogs.com)深度学习前一篇总结了频域与空间域的结合使用，本篇就光度立体的缺陷检测做一个总结。光度立体在工业领域，表面检测是一个非常广泛的应用领域。在halcon中，使用增强的光度立体视觉方法，
Deep Learning for Monocular Depth Estimation: A Review.基于深度学习的深度估计 qaaaaaaz 计算机视觉深度学习人工智能
传统的深度估计方法通常是使用双目相机，计算两个2D图像的视差，然后通过立体匹配和三角剖分得到深度图。然而，双目深度估计方法至少需要两个固定的摄像机，当场景的纹理较少或者没有纹理的时候，很难从图像中捕捉足够的特征来匹配。所以最近单目深度估计发展的越来越快，但是由于单目图像缺乏可靠的立体视觉关系，因此在三维空间中回归深度本质上是一种不适定问题。单目图像采用二维形式来重新反射三维世界，然而，有一维场景叫
MVSNet论文笔记知识推荐号 MVS论文笔记论文阅读图像处理多视图三维重建深度学习
MVSNet论文笔记摘要1引言2相关基础2.1多视图立体视觉重建（MVSReconstruction）2.2基于学习的立体视觉（LearnedStereo）2.3基于学习的多视图的立体视觉（LearnedMVS）Yao,Y.,Luo,Z.,Li,S.,Fang,T.,Quan,L.(2018).MVSNet:DepthInferenceforUnstructuredMulti-viewStereo
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

深度相机（六）--Kinect v2.0 手势样本库制作

你可能感兴趣的:(立体视觉)