Raywit

基于深度图手势识别(一)Pose-REN讲解

基于深度图手势识别Pose-REN讲解

Abstract
1. Introduction
2. Related Work

2.1. Depth-based Hand Pose Estimation
2.2. Cascaded Method
2.3. Hierarchical Structure of Neural Network

3. REN

3.1. Pose Guided Region Extraction
3.2. Structured Region Ensemble
3.3. Training

原文：Pose Guided Structured Region Ensemble Network for Cascaded Hand Pose
Estimation
收录：2017

Abstract

基于单深度图的姿态估计是计算机视觉和人机交互中的一个重要课题。尽管近年来卷积神经网络使得这一领域有了很大的发展，但准确的手部姿态估计仍然是一个具有挑战性的问题。本文提出Pose- REN网络来提高手部姿态估计的性能。提出的这个方法在初始姿态估计的指导下，从卷积神经网络的特征图中提取区域，来生成更优、更有代表性的手部姿态估计特征，然后根据手部关节的拓扑结构，利用树状的全连接对提取的特征区域进行层次集成，该网络直接回归手姿态的精确估计，并利用迭代级联方法得到最终的手姿态。

※论文核心思想：

提出了一种新的特征提取方法；
提出了一种基于手的拓扑结构来融合不同关节特征的分层方法。

1. Introduction

准确的三维手姿态估计是人机交互和虚拟现实中最重要的技术之一，因为它可以提供与对象交互和执行动作的基本信息。多亏深度相机的出现，例如Microsoft Kinect、Intel Realsense Camera等，使得单深度的姿态估计近年来引起了广泛的研究兴趣，然而，由于存在严重的自遮挡、手部关节高度复杂、深度图像质量低、视点变化大、手指自相似等问题，手部姿态估计是一个极具挑战性的问题。
(手部姿态估计难在哪些地方？为何是一个挑战任务？)

利用CNN进行手部姿态估计，取得了很大的进步。之前基于CNN的方法要么预测每一个关节的概率图 (热图 heatmaps)，并从热图中估计手的姿态，要么使用反馈回路和空间注意机制等复杂的设计，然而，这些表现远远不能令人满意。最近，Guo等人提出了一种区域集成网络(REN)，该网络（基于单一网络，直接回归手部关节的三维位置）极大地提高了手部姿态估计的性能。
(之前基于CNN方法：①通过热图来估计手势；②使用反馈回路等复杂设计。但是这些方法的表现不如REN)

REN将最后卷积层的特征图分成几个空间块，并被之后的FC整合到一块，然而，REN使用统一的网格来提取特征区域，对所有的特征都进行同等的处理，这并不能充分获得特征图的空间信息以及具有高度代表性的特征。
( ①REN不足之处；②讲述REN网络大致流程 )

在迭代求精的过程中，REN则是以先前估计的位姿作为输入，并在每次迭代中预测更准确的结果。

在先前预测的手部姿态的指导下，提出了一种新的特征提取方法，得到最优的和有代表性的手姿态估计特征。
受到递归神经网络的启发，又提出了一种基于手的拓扑结构来融合不同关节特征的分层方法。来自同一手指关节的特征被整合在第一层，来自所有手指的特征被融合在后面的层来预测最终的手部姿势。

在第2节里，回顾了与REN高度相关的先前的工作。在第3节中，详细介绍了REN网络。第4节提供了对公共数据集和消融研究的评价。第五部分是本文的简要结论。

2. Related Work

回顾相关工作：

最近的基于深度的手部姿态估计算法；
由于REN基本上是建立在级联的框架上，因此介绍用于手姿态估计的级联方法；
由于用到层次结构连接，因此回顾关于神经网络层次结构的相关工作。

2.1. Depth-based Hand Pose Estimation

① Generative methods(生成方法) 对自封闭区域或缺失区域具有较强的鲁棒性，并能保证输出合理的手部姿态，然而，会需要一个复杂和耗时的优化过程，并且很可能陷入局部操作时间的陷阱。

② Discriminative methods(判别方法) 直接从标记的训练数据中学习到预测器。预测器可以预测每个手关节的概率图(heatmap)，也可以直接预测手关节的三维坐标，因此不需要任何复杂的手工模型，完全是数据驱动的，速度快，适用于实时应用。

③ Hybrid methods(混合方法) 结合判别法和生成法来获得更好的手部姿态估计性能，some work在通过判别法获得初始手部模型后，再采用生成法，但是混合方法仍然需要预先定义手部模型的属性，比如骨骼的长度。

REN基本上属于判别法的范畴，不依赖于任何预定义的手模型，直接使用一个级联的框架来预判手部位姿的三维位置，而不需要任何后处理过程。

2.2. Cascaded Method

同类的网络需要训练多个模型进行细化，并独立预测手关节的不同部位，而REN只需迭代一个模型来改进手姿态的估计。Oberweger等人提出了一种用于手部姿态估计的反馈环框架，判别方法用来生成一个初始手部模型，然后使用广义CNN从初始手姿态生成深度图像，然后使用更新网络通过比较合成深度图像和输入深度图像改进手姿态。

2.3. Hierarchical Structure of Neural Network

Du等人提出了一种多层次的循环神经网络(RNN)来实现基于骨骼的人体动作识别，整个骨架被分成五部分，并被送入RNN的不同分支，骨架的不同部分按层次结构融合，生成更高层次的表示。

Madadi等人[40]提出了一种树状CNN结构，该结构在不同的分支上回归局部位姿，并在最后一层融合所有的特征。

上述方法则是不同部分位姿的特征是独立学习的，而REN 在所有关节的卷积层中共享特征，并从特征图中分层融合不同的区域来获得最终手部姿态估计。

3. REN

A simple CNN (用 Init-CNN 来表示) 预测一个初始的手部姿态 pose₀（用来作为级联结构的初始化)；
所提出的框架结构以先前估计的手姿态 pose_t-1 和 深度图 作为输入，深度图送进CNN中来生成特征图，根据输入的手势 pose_t-1 ，来从特征图中提取特征区域；
利用结构连接对不同关节的特征进行层次集成，回归细化后的手部位姿 pose_t 。

具体：给定一个深度图 D ，以及3D坐标集合 $P=\{p_{i}=(p_{xi},p_{yi},p_{zi})\}_{i=1}^{J}$ （总共J个关节点），通过使用习得的回归模型 R 来改进 t 阶段的手部姿势：

3.1. Pose Guided Region Extraction

步骤一：用CNN生成特征图；
        使用CNN并且利用残差连接生成特征图（CNN 由6层卷积和2个残差连接组成，每个卷积层后面都有ReLU激活函数，每两个卷积层后面跟着最大池化层)；

步骤二：将真实坐标转换到像素坐标；
        用 F 来表示最后一个卷积层的feature map，前一阶段手部姿态估计的3D坐标为 $P^{t-1}=\{(p_{xi}^{t-1},p_{yi}^{t-1},p_{zi}^{t-1})\}_{i=1}^{J}$ ，将 P^t-1 作为 F 的指导来提取特征区域。特别注意的是：首先得使用深度相机的固有参数将真实世界的坐标投影到图像像素坐标中，如下式所示：


步骤三：在前阶段手部姿态指导下，用矩形来提取特征图；
        使用一个矩形窗口裁剪这个关节的特征区域，矩形窗口 $b_{ui}^{t},b_{vi}^{t},w,h)$ 中的 $b_{ui}^{t}、b_{vi}^{t}$ 是左上角坐标，通过下式得到：

        而式子中的 α_w、α_h：

        式中的 w_F、h_F、w_D、h_D 分别是特征图 F、深度图 D 的宽和高。

总结上述步骤用一个函数 crop() 来表示对第i个关节点裁剪：

最左边图像则是最后卷积层输出的特征图，由于通道数很多，这里只选择一个channel来描述如何根据关节点指导来切割特征图；其中绿点和红点表示先前估计的手部姿势的两个关节点(掌心关节和中指的掌指关节)。

3.2. Structured Region Ensemble

上述步骤则是得到切割后的特征区域，融合这些特征区域的一种直观的方法是将每个区域分别与 FC 连接，然后将这些层融合，从而回归到REN所采用的最终手势。即先将来自同一手指关节(包括手掌关节)的特征融合。然后再去融合不同手指的特征，回归最后的手部姿势。

        假设 ${F_{j}^{t}\}_{j=1}^{M}$ 为切割后的特征区域集合，M 是特征区域总数，通过 FC 后则是：

        上面说的 j 和 M 分别是索引、特征区域总数，但想用别的符号来表示，针对单个手指来制定，第 i 根手指特征区域集合 ${I_{j}^{i}\}_{j=1}^{M_{i}}$ ， M_i 则是第 i 根手指总关节数。这样是为了便于将同一手指特征融合，用 concate 实现融合，fc 全连接(2048维，后面跟着ReLU和dropout，rate=0.5)：

3.3. Training

        上式中：N_T 是训练样本数，D_i 是深度图， $P_{i}^{0}$ 是初始手部姿态， $P_{i}^{gt}$ 是相应手部姿态GT (ground truth)。

        在 t 阶段时，利用 t-1 阶段的训练集 T^t-1 来训练回归模型 R^t，可以得到训练集中每个样本的细化手姿态：

        再把细化样本 $\bar{T^{t}}$ 添加到训练集中得到增强训练集 T^t：

        下一轮获得回归模型 R^t+1，直到获得回归模型 R^T。

采用随机梯度下降法(SGD)，批量大小为128，动量为0.9；

采用0.0005的权重衰减；

学习速率设置为0.001，每隔25个epoch除以10；

每个阶段对模型进行100个epoch的训练。

你可能感兴趣的:(图像处理)

OpenCV实战：图像颜色识别与提取、掩膜制作
前言在计算机视觉和图像处理领域，颜色识别是一项基础而重要的技术。无论是交通标志识别、工业分拣还是美颜滤镜开发，都离不开对特定颜色的处理。本文将带你全面掌握使用OpenCV进行颜色识别的关键技术，包含完整的代码实现和原理讲解。一、颜色空间基础1.1RGB颜色空间在图像处理中，最常见的就是RGB颜色空间。RGB颜色空间是我们接触最多的颜色空间，是一种用于表示和显示彩色图像的一种颜色模型。RGB代表红色
OpenCV图像添加水印
一、前言在数字图像处理中，为图片添加水印是一项常见且重要的技术。无论是版权保护、品牌宣传还是防止未经授权的使用，水印都能发挥重要作用。OpenCV作为一款强大的计算机视觉库，提供了丰富的功能来实现各种水印效果。本教程将详细介绍如何使用OpenCV为图像添加文字水印和图片水印。二、环境准备在开始之前，请确保已安装以下环境：Python3.xOpenCV库（可通过pipinstallopencv-py
OpenCV图像噪点消除五大滤波方法慕婉0307 opencv基础 opencv 人工智能计算机视觉
在数字图像处理中，噪点消除是提高图像质量的关键步骤。本文将基于OpenCV库，详细讲解五种经典的图像去噪滤波方法：均值滤波、方框滤波、高斯滤波、中值滤波和双边滤波，并通过丰富的代码示例展示它们的实际应用效果。一、图像噪点与滤波基础1.1常见图像噪声类型高斯噪声：符合正态分布的随机噪声椒盐噪声：随机出现的黑白像素点泊松噪声：光子计数噪声量化噪声：模拟信号数字化过程中产生1.2滤波方法分类滤波类型特点
LSNet: 基于侧向抑制的神经网络碳酸的唐模型养成与叙述有意思的py库神经网络人工智能深度学习
引言在计算机视觉领域，我们一直在寻找灵感来源以提高图像处理和识别的效果。而人类视觉系统作为经过数百万年进化的精密系统，无疑是最好的参考对象之一。今天，我要向大家介绍一个名为LSNet（LateralSuppressionNetwork，侧向抑制网络）的技术，它模拟了人类视觉系统中的侧向抑制机制，为计算机视觉任务带来了新的可能性。什么是侧向抑制？侧向抑制（LateralSuppression），也被
AEPR人像磨皮润肤美容插件的使用指南觉昧
本文还有配套的精品资源，点击获取简介：AEPR人像磨皮润肤美容插件是一款结合AdobeAfterEffects和Photoshop的专业图像处理工具，用于视频和图像后期制作。该插件简化了人像美容过程，提供美白、磨皮和润色功能，帮助用户获得理想的视觉美感。通过使用该插件，用户能够轻松改善肤色和皮肤质地，而高斯模糊、斑点修复和色彩平衡调整等技术则保证了皮肤质感的自然与细腻。为了实现最佳效果，用户需要遵
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
车牌号识别Delphi演示程序：轻松实现车牌识别技术瞿巧群Justin
车牌号识别Delphi演示程序：轻松实现车牌识别技术去发现同类优质开源项目:https://gitcode.com/项目介绍在智能交通系统领域，车牌号识别是一项至关重要的技术。今天，我们要介绍的是一个基于Delphi语言开发的车牌号识别演示程序。该程序能够高效识别并处理车牌号码，为交通监控、停车场管理等领域提供了极大的便利。项目技术分析本项目基于Delphi环境开发，利用先进的图像处理技术，实现了
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于OpenCv的图片倾斜校正系统详细设计与具体代码实现1.背景介绍1.1图像处理的重要性在当今数字时代,图像处理技术在各个领域都扮演着重要角色。无论是在计算机视觉、模式识别、医学影像、遥感探测还是多媒体处理等领域,图像处理都是不可或缺的核心技术。通过对图像进行预处理、增强、分割、特征提取等操作,可以从图像中获取有价值的信息,为后续的分析和决策提供支持。1.2图像倾斜问题及其影响在实际应用中,由于
PyWavelets shangjg3 PyTorch pytorch 人工智能 python
PyWavelets（pywt）是Python中用于小波变换的核心库，提供了丰富的信号处理和图像处理功能。以下是其核心功能的详细介绍：1.小波变换基础（1）离散小波变换（DWT）将信号分解为近似系数（Approximation）和细节系数（Detail）。importpywtimportnumpyasnp#示例信号signal=np.array([1
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
10个基于Python的计算机视觉实战项目云博士的AI课堂基于Python计算机视觉 python 计算机视觉机器视觉人工智能
10个基于Python的计算机视觉实战项目，涵盖多个领域和应用场景，每个项目均附有GitHub地址、概述、解决的问题及应用场景：1.PCV图像处理与计算机视觉库GitHub地址:jesolem/PCV概述:提供计算机视觉基础算法的Python实现，包括图像分割、直方图均衡化、图像增强等。解决的问题:简化图像处理流程，支持快速实现算法原型。应用场景:学术研究、教学实验、图像预处理任务。2.基于朴素贝
如何使用 ligpng 库进行图片解码应用开发openwrt linux sdd20x平台 ruihuan_2000 SSD20X openwrt linux 嵌入式 c++
文章目录前言一、libpng是什么？二、使用步骤1.引入库及头文件2.解码过程总结前言如何使用libpng库进行图片解码应用开发。一、libpng是什么？libpng是一个开源的、跨平台的图像处理库，用于处理和支持PNG（PortableNetworkGraphics）图像格式。PNG是一种无损压缩的图像格式，广泛用于互联网上的图像传输和存储。libpng提供了一系列的API和函数，使开发者可以在
Gen AI：重塑未来的创造力工具箱一杯酒zpy 人工智能
目录页一、GenAI工具箱助力大学生涯1.通用GenAI工具2.GenAI科研辅助1.文献阅读与论文写作2.数据分析与可视化3.AI翻译工具二、GenAI办公、学习助手1.PPT制作2.表格制作3.AI思维导图4.AI办公5.AI图像处理6.AI视频处理7.AI音频处理8.AI编程工具9.AI搜索引擎说明：网盘资源密码获取：关注微信公众号【土木岛】，后台回复文件框中提示的对应关键词自动发送。点击查
Qt, OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合奇树谦 QT qt opencv 图像处理
原文链接：https://developer.aliyun.com/article/1463740文章目录Qt,OpenCV与OpenGL协同作战：图像处理与三维图形界面的完美结合1.引言图像处理与三维图形界面的重要性Qt,OpenCV与OpenGL简介与应用场景QtOpenCVOpenGL结合Qt,OpenCV与OpenGL的优势与价值2.Qt基础知识与特性Qt库的组成与功能Qt库的安装与使用Q
【人工智能】微调的秘密武器：释放大模型的无限潜能蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在人工智能迅猛发展的今天，大规模语言模型（LLMs）以其强大的通用能力席卷各行各业。然而，如何让这些通用模型在特定领域或任务中发挥最大潜力？答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力
【运维】Python与Ansible协同作战：打造自动化服务器配置管理的终极解决方案蒙娜丽宁 Python杂谈人工智能运维 python ansible
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在现代IT运维中，服务器配置管理是一项繁琐但至关重要的任务。手动配置多台服务器不仅耗时，还容易出错。本文深入探讨如何利用Python结合Ansible工具实现自动化服务器配置管理与环境部署。通过Python脚本调用AnsibleAPI，我们可以动态生成配
Python实现图像处理的快速傅里叶变换（FFT）或离散余弦变换（DCT）闲人编程图像处理图像处理 python 计算机视觉 FFT DCT 傅里叶离散余弦变换
目录Python实现图像处理的快速傅里叶变换（FFT）或离散余弦变换（DCT）一、引言1.1图像处理简介1.2快速傅里叶变换与离散余弦变换简介1.3本文目标与结构二、理论背景与数学原理2.1快速傅里叶变换（FFT）介绍2.2离散余弦变换（DCT）介绍2.3两者的应用领域与区别三、算法实现3.1快速傅里叶变换（FFT）实现3.1.1使用Python实现FFT3.1.2图像的频域处理3.2离散余弦变换
信号处理算法：快速傅里叶变换(FFT)_（2）.FFT算法的原理与实现 kkchenkx 信号处理技术仿真模拟信号处理算法
FFT算法的原理与实现1.引言快速傅里叶变换（FastFourierTransform,FFT）是一种高效的算法，用于计算离散傅里叶变换（DiscreteFourierTransform,DFT）及其逆变换。DFT在信号处理、图像处理、通信工程等领域中有着广泛的应用，但其计算复杂度为O(N2)O(N^2)O(
c语言opencv所用库函数,Py之cv2：cv2库(OpenCV，opencv-python)的简介、安装、使用方法(常见函数、方法等)最强详细攻略... weixin_39729272 c语言opencv所用库函数
##关于OpenCV简介##OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写，它的主要接口也是C++语言，但是依然保留
零基础学 OpenCV + Python 图像处理：手把手带你做人脸识别（附代码+典型案例）猫头虎 #Python专栏 opencv python 图像处理计算机视觉 AIGC AI编程人工智能
零基础学OpenCV+Python图像处理：手把手带你做人脸识别（附代码+典型案例）关键词：opencv-python、opencv图像处理、opencv人脸识别代码python、python安装opencv库亮点提示：本文面向零基础读者，手把手教你从环境搭建到实战应用，一步步深入，让你快速掌握OpenCV+Python图像处理与人脸识别技术。文中附带完整示例代码与典型案例，可直接复制、运行与深度
鱼眼相机标定与畸变矫正：高效提升图像质量的利器何盼思Kit
鱼眼相机标定与畸变矫正：高效提升图像质量的利器【下载地址】鱼眼相机标定及畸变矫正工具包`fisheye_cali.zip`包含了一套完整的解决方案，通过使用OpenCV库的功能，本工具能够帮助用户准确地完成鱼眼相机的参数标定，进一步执行图像的畸变矫正。此过程对于增强图像处理应用的精确度至关重要，特别是在需要广阔视野的应用场景中项目地址:https://gitcode.com/open-source
Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍一起搞IT吧人工智能计算机视觉图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：Camera相机人脸识别系列专题分析之三：一张图片的人脸识别过程原理这一篇我们开始讲：Camera相机人脸识别系列专题分析之四：Camera相机领域人脸识别和人脸属性检测介绍目录一、背景二、：Camera相机领域人脸识别2.1：影像相关基础知识2.1.1pipeline简介2.1.2Raw阈图像处理2.2：Camera相机人脸识别2.3：
OpenCV边缘填充方式详解慕婉0307 opencv基础 opencv 计算机视觉人工智能
一、边缘填充概述在图像处理中，边缘填充（BorderPadding）是一项基础而重要的技术，特别是在进行卷积操作（如滤波、边缘检测等）时，处理图像边缘像素需要用到周围的像素值。由于图像边缘的像素没有完整的邻域，因此需要通过某种方式对图像边界进行扩展。边缘填充的主要应用场景包括：图像滤波（如高斯滤波、中值滤波等）卷积神经网络（CNN）中的卷积层形态学操作（如膨胀、腐蚀）图像特征提取二、OpenCV中
基于FPGA的数字图像处理【1.5】 BinaryStarXin FPGA图像处理 fpga开发 FPGA与图像处理 FPGA技术优势硬件工程 dsp开发射频工程驱动开发
第2章FPGA与图像处理随着图像分辨率的大幅度提升和图像处理算法复杂度的提升，传统的串行处理器已经越来越不能满足图像处理的实时性需求。多核结构处理、GPU处理及FPGA很快在实时性图像处理领域得到了迅速的发展。本章将重点介绍基于FPGA的实时性图像处理。FPGA通过为每个功能建立单独的硬件来实现整个应用程序所需要的逻辑功能，这使其很适合图像处理，尤其是采用流水线来处理视频流，可以在同一个时刻进行多
高通 Camera 架构全景图：Sensor–ISP–DPU–GPU 数据流向解析观熵影像技术全景图谱：架构调优与实战架构接口隔离原则影像 Camera
高通Camera架构全景图：Sensor–ISP–DPU–GPU数据流向解析关键词高通Snapdragon、Camera架构、ISP模块、DPU、GPU、数据路径、硬件加速、图像处理流程摘要本文将深入解析高通Snapdragon平台下Camera系统的全链路数据流向，从Sensor输入到ISP图像信号处理、再到DPU显示输出与GPU并行处理的完整通路。通过结合MSM系列SoC的实际驱动架构与硬件模
高性能图像处理库：深入了解 Pyvips 萧鼎 python基础到进阶教程图像处理人工智能
高性能图像处理库：深入了解Pyvips在处理超大图像文件或需要高效图像处理的场景中，Pyvips是一个备受推崇的库。与传统的图像处理库（如PIL、OpenCV）相比，Pyvips以其速度快、内存占用低和功能强大而著称。本文将带你全面了解Pyvips，并通过实战案例展示它的高效应用。一、什么是Pyvips？Pyvips是基于libvips的Python绑定。libvips是一个C语言编写的开源图像处
【QT】QPointF、QRectF、QPolygonF 介绍我不是程序猿儿 QT之路 qt 开发语言
QPointF确实存在于Qt框架中，它是一个类，用于表示二维空间中的一个点，其中包含了浮点精度的x和y坐标。主要特点和用途高精度坐标：QPointF使用double类型来存储x和y坐标，这提供了比QPoint（后者存储整数坐标）更高的精度。这在需要精确定位或处理图形和界面元素时特别有用，例如在绘图、图像处理或任何需要几何计算的应用中。数学运算支持：QPointF提供了一系列便利的数学运算，如加法、
Python编程：图像增强倔强老吕 C++与python交互编程 python opencv 计算机视觉图像增强
图像增强图像增强是数字图像处理中的重要技术，旨在改善图像质量或突出图像中的有用信息，为后续的分析和处理提供更好的基础。空间域图像增强灰度变换定义灰度变换是一种点处理（pointprocessing）操作，可表示为：s=T(r)其中：r：输入图像像素的原始灰度值（通常范围[0,L-1]，如8位图像为[0,255]）s：变换后的输出灰度值T：灰度变换函数核心特性单像素操作：输出值仅取决于对应位置的输入
AI智能抠图源码系统实现一键抠图包含完整的代码包+搭建指南
一、开发背景：AI技术重塑图像处理行业在传统图像处理领域，抠图是一项高门槛、高耗时的技术工作。Photoshop等工具需要专业设计师手动绘制路径、调整蒙版，处理一张复杂人像图可能需要数小时。随着电商、社交媒体和自媒体行业的爆发式增长，全球每天产生超过10亿张商品图、人像图和创意素材，传统抠图方式已无法满足市场需求。AI技术的突破为这一难题提供了解决方案。2019年Remove.bg的推出标志着AI
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他