奥比中光3D视觉开发者社区

【机器人识别抓取】基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计

目录

导读
1 引言
- 1.1 抓取综合方法
- 1.2 基于视觉的机器人抓取系统
2 抓取检测、视觉伺服和动态抓取
- 2.1抓取检测
- 2.2 视觉伺服控制
- 2.3 动态抓取
3 本文实现的方法
- 3.1 网络体系结构
- 3.2 Cornell 抓取数据集
- 3.3 结果评估
- 3.4 视觉伺服网络体系结构
- 3.5 VS数据集

作者丨ljc_coder @CSDN
编辑 | 3D视觉开发者社区

论文名称：Real-Time Deep Learning Approach to Visual Servo Control and Grasp Detection for Autonomous Robotic Manipulation

（基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计：综述）

导读

抓取综合方法是机器人抓取问题的核心，本文从抓取检测、视觉伺服和动态抓取等角度进行讨论，提出了多种抓取方法。各位对机器人识别抓取感兴趣的小伙伴，一定要来看一看！千万别错过~

1 引言

找到理想抓取配置的抓取假设的子集包括：机器人将执行的任务类型、目标物体的特征、关于物体的先验知识类型、机械爪类型，以及最后的抓取合成。

注：从本文中可以学习到视觉伺服的相关内容，用于对动态目标的跟踪抓取或自动调整观察姿态，因为观察的角度不同，预测的抓取框位置也不同，抓取物品离相机位置越近，抓取预测越准。

1.1 抓取综合方法

抓取综合方法是机器人抓取问题的核心，因为它涉及到在物体中寻找最佳抓取点的任务。这些是夹持器必须与物体接触的点，以确保外力的作用不会导致物体不稳定，并满足一组抓取任务的相关标准。

抓取综合方法通常可分为分析法和基于数据的方法。

分析法：指使用具有特定动力学行为的灵巧且稳定的多指手构造力闭合

基于数据的方法：指建立在按某种标准的条件下，对抓取候选对象的搜索和对象分类的基础上。（这一过程往往需要一些先验经验）

1.2 基于视觉的机器人抓取系统

基于视觉的机器人抓取系统一般由四个主要步骤组成，即目标物体定位、物体姿态估计、抓取检测（合成）和抓取规划。

一个基于卷积神经网络的系统，一般可以同时执行前三个步骤，该系统接收对象的图像作为输入，并预测抓取矩形作为输出。

而抓取规划阶段，即机械手找到目标的最佳路径。它应该能够适应工作空间的变化，并考虑动态对象，使用视觉反馈。

目前大多数机器人抓取任务的方法执行一次性抓取检测，无法响应环境的变化。因此，在抓取系统中插入视觉反馈是可取的，因为它使抓取系统对感知噪声、物体运动和运动学误差具有鲁棒性。

2 抓取检测、视觉伺服和动态抓取

抓取计划分两步执行：

首先作为一个视觉伺服控制器，以反应性地适应对象姿势的变化。

其次，作为机器人逆运动学的一个内部问题，除了与奇异性相关的限制外，机器人对物体的运动没有任何限制。

2.1抓取检测

早期的抓取检测方法一般为分析法，依赖于被抓取物体的几何结构，在执行时间和力估计方面存在许多问题。此外，它们在许多方面都不同于基于数据的方法

基于数据的方法Jiang、Moseson和Saxena等人仅使用图像，从五个维度提出了机器人抓取器闭合前的位置和方向表示，如下图，该五维表示足以对抓取姿势的七维表示进行编码[16]，因为假定图像平面的法线近似，因此三维方向仅由给出。

本文的工作重点是开发一种简单高效的CNN，用于预测抓取矩形。在训练和测试步骤中，所提出的网络足够轻，可以联合应用第二个CNN，解决视觉伺服控制任务。

因此，整个系统可以在机器人应用中实时执行，而不会降低两项任务的精度。

2.2 视觉伺服控制

经典的视觉伺服（VS）策略要求提取视觉特征作为控制律的输入。我们必须正确选择这些特征，因为控制的鲁棒性与此选择直接相关。

最新的VS技术探索了深度学习算法，以同时克服特征提取和跟踪、泛化、系统的先验知识以及在某些情况下处理时间等问题。

Zhang等人开发了第一项工作，证明了在没有任何配置先验知识的情况下，从原始像素图像生成控制器的可能性。作者使用Deep Q-Network ，通过深度视觉运动策略控制机器人的3个关节，执行到达目标的任务。训练是在模拟中进行的，没有遇到真实的图像。

遵循强化学习方法的工作使用确定性策略梯度设计新的基于图像的VS或Fuzzy Q-Learning，依靠特征提取，控制多转子空中机器人。

在另一种方法中，一些研究视觉伺服深度学习的工作是通过卷积神经网络进行的。CNN的泛化能力优于RL，因为RL学习的参数是特定于环境和任务的。.

本文设计了四种卷积神经网络模型作为端到端视觉伺服控制器的潜在候选。网络不使用参考图像和当前图像以外的任何类型的附加信息来回归控制信号。因此，所提出的网络作为实际上的控制器工作，预测速度信号，而不是相对姿态。

2.3 动态抓取

学习感知行为的视觉表征，遵循反应范式，直接从感觉输入生成控制信号，无需高级推理，有助于动态抓取。

强化学习方法适用于特定类型的对象，并且仍然依赖于某种先验知识，因此，最近大量研究探索了将深度学习作为解决闭环抓取问题的方法。

Levine等人提出了一种基于两个组件的抓取系统。第一部分是预测CNN，其接收图像和运动命令作为输入，并输出通过执行这样的命令，所产生的抓取将是令人满意的概率。第二个部分是视觉伺服功能。这将使用预测CNN来选择将持续控制机器人成功抓取的命令。这称为是深度强化学习，需要很久的训练时间。

2019年，Morrison, Corke 和 Leitner 开发了一种闭环抓取系统，在这种系统中，抓取检测和视觉伺服不是同时学习的。作者使用完全CNN获取抓取点，并应用基于位置的视觉伺服，使抓取器的姿势与预测的抓取姿势相匹配。

3 本文实现的方法

VS的目的是通过将相机连续获得的图像与参考图像进行比较，引导操纵器到达机器人能够完全看到物体的位置，从而满足抓取检测条件。因此，该方法的应用涵盖了所有情况，其中机器人操作器（相机安装在手眼模式下）必须跟踪和抓取对象。

该系统包括三个阶段：设计阶段、测试阶段和运行阶段。第一个是基于CNN架构的设计和训练，以及数据集的收集和处理。在第二阶段，使用验证集获得离线结果，并根据其准确性、速度和应用领域进行评估。第三阶段涉及在机器人上测试经过训练的网络，以评估其在实时和现实应用中的充分性。

在运行阶段，系统运行的要求是事先获得目标对象的图像，该图像将被VS用作设定点。只要控制信号的L1范数大于某个阈值，则执行控制回路。

单个参考图像作为视觉伺服CNN的输入之一呈现给系统。相机当前获取的图像作为该网络的第二个输入，并作为抓取CNN的输入。这两个网络都连续运行，因为抓取CNN实时预测矩形以进行监控，VS网络执行机器人姿势的实时控制。

VS CNN预测一个速度信号，该信号乘以比例增益，以应用于相机中。机器人的内部控制器寻找保证相机中预测速度的关节速度。在每次循环执行时，根据机器人的当前位置更新当前图像，只要控制信号不收敛，该循环就会重复。

当满足停止条件时，抓取网络的预测映射到世界坐标系。机器人通过逆运动学得到并到达预测点，然后关闭夹持器。

3.1 网络体系结构

该卷积网络架构被用于抓取检测。网络接收224×224×3的RGB图像作为输入，无深度信息。

layer 1 由32个3×3卷积组成，layer 2 包含164个卷积。在这两种情况下，卷积运算都是通过步长2和零填充（zero-padding）执行的，然后是批标准化（batch normalization）和2×2最大池化。layer 3 包含96个卷积，其中卷积使用步长1和零填充执行，然后仅执行批标准化。layer 4 ，也是最后一层，卷积层由128个卷积组成，以步长1执行，然后是2×2最大池化。

在最后一层卷积之后，生成的特征映射在包含4608个元素的一维向量中被展开。进一步传递到两个全连接（FC）层，每个层有256个神经元。在这些层次之间，训练期间考虑50%的dropout rate。

最后，输出层由5个神经元组成，对应于编码抓取矩形的** 值。在所有层中，使用的激活函数都是ReLU**，但在输出层中使用线性函数的情况除外。

3.2 Cornell 抓取数据集

为了对数据集真值进行编码，使用四个顶点的x 和y 坐标编译抓取矩形。

参数分别表示矩形中心点的 x和y 坐标，可从以下公式获得：

计算夹持器开口 w 和高度 h ，同样根据四个顶点计算：

最后，表示夹持器相对于水平轴方向的由下式给出：

3.3 结果评估

3.4 视觉伺服网络体系结构

与抓取不同，设计用于执行机械手视觉伺服控制的网络接收两个图像作为输入，并且必须回归六个值，考虑到线性和角度相机速度，这些值也可以分为两个输出。共有四个模型处理VS任务。

模型1-直接回归（最终实验效果最佳）。它基本上与抓取网络相同，除了在第三卷积层中包含最大池化和不同的输入维度，这导致特征图上的比例差异相同。

模型2-任务特定回归。网络输入被串联，第三组特征图由两个独立的层序列处理（多任务网络）。因此，网络以两个3D矢量的形式预测6D速度矢量。具体来说，该结构由一个共享编码器和两个特定解码器组成 - 一个用于线速度，另一个用于角速度。

模型3简单地由第三个卷积层产生的特征映射连接，因此第四个层的输入深度是原来的两倍。而模型4有一个相关层，帮助网络找到每个图像的特征表示之间的对应关系。原始相关层是flow network FlowNet的结构单元。

3.5 VS数据集

该数据集能够有效地捕获机器人操作环境的属性，具有足够的多样性，以确保泛化。

机器人以参考姿态为中心的高斯分布的不同姿态，具有不同的标准偏差（SD）。

下表为参考姿势（分布的平均值）和机器人假设的标准偏差集（SD）。

SD选择考虑了机器人在VS期间必须执行的预期位移值。

从高SD获得的图像有助于网络了解机器人产生大位移时图像空间中产生的变化。

当参考图像和当前图像非常接近时，从低SD获得的实例能够减少参考图像和当前图像之间的误差，从而在稳态下获得良好的精度。

平均SD值有助于网络在大部分VS执行期间进行预测。

版权声明：本文为奥比中光3D视觉开发者社区特约作者授权原创发布，未经授权不得转载，本文仅做学术分享，版权归原作者所有，若涉及侵权内容请联系删文。

3D视觉开发者社区是由奥比中光给所有开发者打造的分享与交流平台，旨在将3D视觉技术开放给开发者。平台为开发者提供3D视觉领域免费课程、奥比中光独家资源与专业技术支持。点击加入3D视觉开发者社区，和开发者们一起讨论分享吧~

或可微信关注官方公众号 3D视觉开发者社区，获取更多干货知识噢！

你可能感兴趣的:(3D视觉,机器人,人工智能,算法)

2023-09-15 五角大楼探索生成式人工智能解决方案泰格
佳文砺道智库2023-09-1409:58发表于北京据“防务头条”网9月12日报道，美国研究机构“特殊竞争力研究项目”（SCSP）的一份报称告，如果美国想在制定生成式人工智能的开发和使用规范方面引领全球，就必须增加联邦研发支出，建立新的政府机构，或者改变现有的政府机构。生成式人工智能可以加速新药和网络安全解决方案的发现，从根本上实现更好的计算机网络，并提高公众的理解。但在对手手中，它可能会导致更多
企业级3D TLC？看英特尔专家怎么说! weixin_33691817
也许有人会说，3DNAND有什么好说的，三星早在前年就发布了3DV-NAND，就是基于3DTLC设计的，48层，单Die容量256Gb;此后，SKHynix、东芝/闪迪、Intel/美光等豪门都开始涉足3DNAND产品。但需要提醒的是，在这里谈论的是企业级产品市场应用。考虑到频繁读写，以及企业级应用场景对可靠性、稳定性的需求，专业人士指出，这是完全不同的市场。顺便说一句：企业级闪存产品应用，2DM
CVE-2005-4900：TLS SHA-1 安全漏洞修复详解 Nova_CaoFc 运维日常技术博文分享安全 linux 服务器运维
前言在信息安全日益重要的当下，任何微小的加密弱点都可能被攻击者利用，从而导致数据泄露、流量劫持或更严重的业务中断。本文将结合实际环境中常见的Nginx配置示例，深入剖析CVE-2005-4900（TLS中使用SHA-1哈希算法）的危害，并提供完整、可操作的修复流程。一、什么是CVE-2005-4900漏洞CVE-2005-4900定位于TLS协议中使用SHA-1作为消息认证和签名哈希算法的安全漏洞
内存受限编程：从原理到实践的全面指南景彡先生 C++进阶 c++缓存
在嵌入式系统、物联网设备、移动应用等场景中，内存资源往往极为有限。如何在内存受限的环境中设计高效、稳定的程序，是每个开发者都可能面临的挑战。本文将从硬件原理、操作系统机制、算法优化到代码实现技巧，全面解析内存受限编程的核心技术。一、内存受限环境概述1.1典型内存受限场景场景可用内存范围典型应用8位单片机几KB-64KB传感器节点、简单控制器32位嵌入式系统64KB-512MB智能家居设备、工业控制
深入探索C++ STL：从基础到进阶
目录引言一、什么是STL二、STL的版本三、STL的六大组件容器（Container）算法（Algorithm）迭代器（Iterator）仿函数（Functor）空间配置器（Allocator）配接器（Adapter）四、STL的重要性五、如何学习STL六、STL的缺陷总结引言在C++的世界里，标准模板库（STL）是一项极为强大的工具。它不仅为开发者提供了可复用的组件库，更是一个融合了数据结构与算
【加解密与C】Rot系列(二)Rot13
Rot13简介Rot13（Rotateby13places）是一种简单的字母替换加密算法，属于凯撒密码（Caesarcipher）的特例。它将字母表中的每个字母替换为字母表中距离它13个位置的字母。例如，字母A替换为N，B替换为O，以此类推。由于英文字母有26个字符，Rot13的特点是加密和解密使用相同的算法。Rot13算法规则对字母表中的每个字母，进行如下替换：大写字母A-Z：A→N，B→O，…
DSC(Display Stream Compression) 显示流压缩技术解析
DSC(DisplayStreamCompression)是一种由VESA(视频电子标准协会)开发的视觉无损显示压缩技术，主要用于解决高分辨率、高刷新率显示设备的数据传输带宽问题。DSC技术核心特点视觉无损压缩：虽然是有损压缩，但人眼几乎无法察觉质量损失低延迟：压缩/解压延迟极低(通常<1行扫描时间)固定比率压缩：支持3:1、2:1和1.5:1等固定压缩比实时处理：能够实时压缩和解压视频流DSC工
CCF编程能力等级认证GESP—C++1级—20250628
CCF编程能力等级认证GESP—C++1级—20250628单选题（每题2分，共30分）判断题（每题2分，共20分）编程题(每题25分，共50分)假期阅读值日单选题（每题2分，共30分）1、2025年4月19日在北京举行了一场颇为瞩目的人形机器人半程马拉松赛。比赛期间，跑动着的机器人会利用身上安装的多个传感器所反馈的数据来调整姿态、保持平衡等，那么这类传感器类似于计算机的()。A.处理器B.存储器
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
LeetCode-268-丢失的数字醉舞经阁半卷书
丢失的数字题目描述：给定一个包含[0,n]中n个数的数组nums，找出[0,n]这个范围内没有出现在数组中的那个数。进阶：你能否实现线性时间复杂度、仅使用额外常数空间的算法解决此问题?示例说明请见LeetCode官网。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/missing-number/著作权归领扣网络所有。商业转载请联系官方授权，非商
python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
云原生环境中Consul的动态服务发现实践 AI云原生与云计算技术学院 AI云原生与云计算云原生 consul 服务发现 ai
云原生环境中Consul的动态服务发现实践关键词：云原生,服务发现,Consul,微服务,动态注册,健康检查,Raft算法摘要：本文深入探讨云原生环境下Consul在动态服务发现中的核心原理与实践方法。通过剖析Consul的架构设计、核心算法和关键机制，结合具体代码案例演示服务注册、发现和健康检查的全流程。详细阐述在Kubernetes、Docker等云原生技术栈中的集成方案，分析实际应用场景中的
云原生环境里Nginx的故障排查思路 AI云原生与云计算技术学院 AI云原生与云计算云原生 nginx 运维 ai
云原生环境里Nginx的故障排查思路关键词：云原生、Nginx、故障排查、容器化、Kubernetes摘要：本文聚焦于云原生环境下Nginx的故障排查思路。随着云原生技术的广泛应用，Nginx作为常用的高性能Web服务器和反向代理服务器，在容器化和编排的环境中面临着新的故障场景和挑战。文章首先介绍云原生环境及Nginx的相关背景知识，接着阐述核心概念和联系，详细讲解故障排查的核心算法原理与操作步骤
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用 AI云原生与云计算技术学院 AI云原生与云计算 perl 服务器网络 ai
谷歌云(GCP)入门指南：从零开始搭建你的第一个云应用关键词：谷歌云、GCP、云应用搭建、入门指南、云计算摘要：本文旨在为初学者提供一份全面的谷歌云（GCP）入门指南，详细介绍如何从零开始搭建第一个云应用。通过逐步分析推理，我们将涵盖背景知识、核心概念、算法原理、数学模型、项目实战、实际应用场景、工具资源推荐等多个方面，帮助读者深入理解GCP的使用方法和搭建云应用的流程，为后续的云计算实践打下坚实
量化自动交易机器人合约现货策略开发实战指南 mxh5201133 机器人智能合约区块链量化自动交易合约现货交易机器人
量化交易正在重塑金融市场格局，自动交易机器人(19I零3八11陆⑦二）凭借其**无情绪干扰、高执行精度与7×24小时运作**的优势，已成为机构与个人投资者的核心工具。本文将深入解析合约现货双市场量化机器人的**策略设计、技术实现与系统架构**，并附关键模块的代码示例。---一、核心策略模块开发与实现1.**网格策略：震荡市场的收益引擎**网格策略的核心是**“仓位管理优于择时”**，通过构建价格区
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
474天，日精进，只为目标达成找方法！吕You
大家好，我是英丽今天是我的日精进行动第474天，和大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。2018年经营模式升级，为您的企业打造三个统一：统一形象（广告视觉产品）统一符号（企业形象设计）统一思想（文化标准建设）1、比学习:准备互助会的过程里，学习统筹的运作的重要性，作为主管人员的安排与协调能力很有必要，全局观念让我们感受到不同的人放在不同的位置上，会更有价值，
【数据结构与算法】力扣 88. 合并两个有序数组秀秀_heo 数据结构与算法 leetcode 算法职场和发展
题目描述88.合并两个有序数组给你两个按非递减顺序排列的整数数组nums1**和nums2，另有两个整数m和n，分别表示nums1和nums2中的元素数目。请你合并nums2**到nums1中，使合并后的数组同样按非递减顺序排列。注意：最终，合并后数组不应由函数返回，而是存储在数组nums1中。为了应对这种情况，nums1的初始长度为m+n，其中前m个元素表示应合并的元素，后n个元素为0，应忽略。
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
面试高频题力扣 130. 被围绕的区域洪水灌溉(FloodFill) 深度优先遍历(dfs) 暴力搜索 C++解题思路每日一题 Q741_147 C/C++每日一题：从语法到算法面试 leetcode 深度优先 c++洪水灌溉
目录零、题目描述一、为什么这道题值得你花时间掌握？二、题目拆解：提取核心关键点三、解题思路：从边界入手，反向标记四、算法实现：深度优先遍历（DFS）+两次遍历五、C++代码实现：一步步拆解代码拆解时间复杂度空间复杂度七、坑点总结八、举一反三九、总结零、题目描述题目链接：被围绕的区域题目描述：示例1：输入：board=[[“X”,“X”,“X”,“X”],[“X”,“O”,“O”,“X”],[“X”
2007. 从双倍数组中还原原数组
【算法题解析】还原双倍数组—从打乱的数组恢复原数组题目描述给定一个整数数组changed，该数组是通过对一个原始数组original的每个元素乘以2并打乱顺序后得到的。你的任务是判断给定的changed是否为某个original数组的双倍数组，并返回该原数组。具体来说，存在一个数组original，使得对original中的每个元素x，changed中都包含x和2*x两个元素（顺序可能被打乱）。如
Redis Desktop Manager 0.8.8.384 安装教程（下载安装+快捷方式设置+包含安装包） IDOlaoluo redis 数据库缓存
1.下载安装包先去官网或者靠谱的下载站找到这个版本的安装包（文件名就是redis-desktop-manager-0.8.8.384.exe），双击它开始安装。提供安装包下载：https://pan.quark.cn/s/6d1054394b3d2.开始安装向导双击后弹出一个安装界面，直接点“Next”（下一步）就行。3.同意协议会看到一个用户协议，勾选“Iaccepttheagreement”（
【Python】人脸识别宅男很神经 python 开发语言
第一章：计算机视觉与图像处理的基石在深入人脸识别之前，我们必须首先牢固掌握计算机视觉和图像处理的基本概念。人脸，本质上就是一张复杂的图像，对图像的理解是所有高级视觉任务的起点。1.1图像的本质：像素与数字化表示图像，在我们看来是连续的画面，但在计算机内部，它却是离散的数值矩阵。1.1.1什么是像素？图像的最小单元像素（Pixel），是构成数字图像的最小单位。可以将其想象成一个微小的彩色点。一张数字
最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
聚众识别漏检难题？陌讯多尺度检测实测提升 92%
一、开篇痛点：复杂场景下的聚众识别困境在安防监控、大型赛事等场景中，实时聚众识别是保障公共安全的核心技术。但传统视觉算法常面临三大难题：一是密集人群重叠导致小目标漏检率超30%，二是光照变化（如夜间逆光）引发误报率飙升，三是复杂背景干扰下实时性不足（FPS＜15）。某景区监控项目曾反馈，开源模型在节假日人流高峰时，因漏检导致预警延迟达20秒，存在严重安全隐患。这些问题的根源在于传统算法的局限性：单
Ico图标制作转换器：一键将图像转换为Windows图标艾古力斯
本文还有配套的精品资源，点击获取简介：ico图标制作转换器是一款便捷的软件工具，专为图像到ico文件格式的转换而设计。它支持常见图像格式如jpg、png、bmp和gif，并允许用户自定义ico图标大小和颜色深度，以适应不同显示需求。软件简化了图标创建过程，尤其对非专业设计师友好，且可能包含如IconWorkshop等高级编辑功能。ico图标在网页设计和软件开发中至关重要，这款工具的使用对于保持视觉
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
Python 算法基础篇之线性搜索算法：顺序搜索、二分搜索挣扎的蓝藻 Python算法初阶：入门篇 python 算法开发语言
Python算法基础篇之线性搜索算法：顺序搜索、二分搜索引用1.顺序搜索算法2.二分搜索算法3.顺序搜索和二分搜索的对比a)适用性b)时间复杂度c)前提条件4.实例演示实例1：顺序搜索实例2：二分搜索总结引用在算法和数据结构中，搜索是一种常见的操作，用于查找特定元素在数据集合中的位置。线性搜索算法是最简单的搜索算法之一，在一组数据中逐一比较查找目标元素。本篇博客将介绍线性搜索算法的两种实现方式：顺
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他