干了这碗汤

PointNet、PointNet++代码解析

分类任务

主文件 train_classification.py

源代码

"""
Author: Benny
Date: Nov 2019
"""

import os
import sys
import torch
import numpy as np

import datetime
import logging
import provider
import importlib
import shutil
import argparse

from pathlib import Path
from tqdm import tqdm
from data_utils.ModelNetDataLoader import ModelNetDataLoader

BASE_DIR = os.path.dirname(os.path.abspath(__file__))
ROOT_DIR = BASE_DIR
sys.path.append(os.path.join(ROOT_DIR, 'models'))

def parse_args():
    '''PARAMETERS'''
    parser = argparse.ArgumentParser('training')
    parser.add_argument('--use_cpu', action='store_true', default=False, help='use cpu mode')
    parser.add_argument('--gpu', type=str, default='0', help='specify gpu device')
    parser.add_argument('--batch_size', type=int, default=24, help='batch size in training')
    parser.add_argument('--model', default='pointnet_cls', help='model name [default: pointnet_cls]')
    parser.add_argument('--num_category', default=40, type=int, choices=[10, 40],  help='training on ModelNet10/40')
    parser.add_argument('--epoch', default=200, type=int, help='number of epoch in training')
    parser.add_argument('--learning_rate', default=0.001, type=float, help='learning rate in training')
    parser.add_argument('--num_point', type=int, default=1024, help='Point Number')
    parser.add_argument('--optimizer', type=str, default='Adam', help='optimizer for training')
    parser.add_argument('--log_dir', type=str, default=None, help='experiment root')
    parser.add_argument('--decay_rate', type=float, default=1e-4, help='decay rate')
    parser.add_argument('--use_normals', action='store_true', default=False, help='use normals')
    parser.add_argument('--process_data', action='store_true', default=False, help='save data offline')
    parser.add_argument('--use_uniform_sample', action='store_true', default=False, help='use uniform sampiling')
    return parser.parse_args()


def inplace_relu(m):
    classname = m.__class__.__name__
    if classname.find('ReLU') != -1:
        m.inplace=True


def test(model, loader, num_class=40):
    mean_correct = []
    class_acc = np.zeros((num_class, 3))
    classifier = model.eval()

    for j, (points, target) in tqdm(enumerate(loader), total=len(loader)):

        if not args.use_cpu:
            points, target = points.cuda(), target.cuda()

        points = points.transpose(2, 1)
        pred, _ = classifier(points)
        pred_choice = pred.data.max(1)[1]

        for cat in np.unique(target.cpu()):
            classacc = pred_choice[target == cat].eq(target[target == cat].long().data).cpu().sum()
            class_acc[cat, 0] += classacc.item() / float(points[target == cat].size()[0])
            class_acc[cat, 1] += 1

        correct = pred_choice.eq(target.long().data).cpu().sum()
        mean_correct.append(correct.item() / float(points.size()[0]))

    class_acc[:, 2] = class_acc[:, 0] / class_acc[:, 1]
    class_acc = np.mean(class_acc[:, 2])
    instance_acc = np.mean(mean_correct)

    return instance_acc, class_acc


def main(args):
    def log_string(str):
        logger.info(str)
        print(str)

    '''HYPER PARAMETER'''
    os.environ["CUDA_VISIBLE_DEVICES"] = args.gpu

    '''CREATE DIR'''
    timestr = str(datetime.datetime.now().strftime('%Y-%m-%d_%H-%M'))
    exp_dir = Path('./log/')
    exp_dir.mkdir(exist_ok=True)
    exp_dir = exp_dir.joinpath('classification')
    exp_dir.mkdir(exist_ok=True)
    if args.log_dir is None:
        exp_dir = exp_dir.joinpath(timestr)
    else:
        exp_dir = exp_dir.joinpath(args.log_dir)
    exp_dir.mkdir(exist_ok=True)
    checkpoints_dir = exp_dir.joinpath('checkpoints/')
    checkpoints_dir.mkdir(exist_ok=True)
    log_dir = exp_dir.joinpath('logs/')
    log_dir.mkdir(exist_ok=True)

    '''LOG'''
    args = parse_args()
    logger = logging.getLogger("Model")
    logger.setLevel(logging.INFO)
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    file_handler = logging.FileHandler('%s/%s.txt' % (log_dir, args.model))
    file_handler.setLevel(logging.INFO)
    file_handler.setFormatter(formatter)
    logger.addHandler(file_handler)
    log_string('PARAMETER ...')
    log_string(args)

    '''DATA LOADING'''
    log_string('Load dataset ...')
    data_path = 'data/modelnet40_normal_resampled/'

    train_dataset = ModelNetDataLoader(root=data_path, args=args, split='train', process_data=args.process_data)
    test_dataset = ModelNetDataLoader(root=data_path, args=args, split='test', process_data=args.process_data)
    trainDataLoader = torch.utils.data.DataLoader(train_dataset, batch_size=args.batch_size, shuffle=True, num_workers=10, drop_last=True)
    testDataLoader = torch.utils.data.DataLoader(test_dataset, batch_size=args.batch_size, shuffle=False, num_workers=10)

    '''MODEL LOADING'''
    num_class = args.num_category
    model = importlib.import_module(args.model)
    shutil.copy('./models/%s.py' % args.model, str(exp_dir))
    shutil.copy('models/pointnet2_utils.py', str(exp_dir))
    shutil.copy('./train_classification.py', str(exp_dir))

    classifier = model.get_model(num_class, normal_channel=args.use_normals)
    criterion = model.get_loss()
    classifier.apply(inplace_relu)

    if not args.use_cpu:
        classifier = classifier.cuda()
        criterion = criterion.cuda()

    try:
        checkpoint = torch.load(str(exp_dir) + '/checkpoints/best_model.pth')
        start_epoch = checkpoint['epoch']
        classifier.load_state_dict(checkpoint['model_state_dict'])
        log_string('Use pretrain model')
    except:
        log_string('No existing model, starting training from scratch...')
        start_epoch = 0

    if args.optimizer == 'Adam':
        optimizer = torch.optim.Adam(
            classifier.parameters(),
            lr=args.learning_rate,
            betas=(0.9, 0.999),
            eps=1e-08,
            weight_decay=args.decay_rate
        )
    else:
        optimizer = torch.optim.SGD(classifier.parameters(), lr=0.01, momentum=0.9)

    scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=20, gamma=0.7)
    global_epoch = 0
    global_step = 0
    best_instance_acc = 0.0
    best_class_acc = 0.0

    '''TRANING'''
    logger.info('Start training...')
    for epoch in range(start_epoch, args.epoch):
        log_string('Epoch %d (%d/%s):' % (global_epoch + 1, epoch + 1, args.epoch))
        mean_correct = []
        classifier = classifier.train()

        scheduler.step()
        for batch_id, (points, target) in tqdm(enumerate(trainDataLoader, 0), total=len(trainDataLoader), smoothing=0.9):
            optimizer.zero_grad()

            points = points.data.numpy()
            points = provider.random_point_dropout(points)
            points[:, :, 0:3] = provider.random_scale_point_cloud(points[:, :, 0:3])
            points[:, :, 0:3] = provider.shift_point_cloud(points[:, :, 0:3])
            points = torch.Tensor(points)
            points = points.transpose(2, 1)

            if not args.use_cpu:
                points, target = points.cuda(), target.cuda()

            pred, trans_feat = classifier(points)
            loss = criterion(pred, target.long(), trans_feat)
            pred_choice = pred.data.max(1)[1]

            correct = pred_choice.eq(target.long().data).cpu().sum()
            mean_correct.append(correct.item() / float(points.size()[0]))
            loss.backward()
            optimizer.step()
            global_step += 1

        train_instance_acc = np.mean(mean_correct)
        log_string('Train Instance Accuracy: %f' % train_instance_acc)

        with torch.no_grad():
            instance_acc, class_acc = test(classifier.eval(), testDataLoader, num_class=num_class)

            if (instance_acc >= best_instance_acc):
                best_instance_acc = instance_acc
                best_epoch = epoch + 1

            if (class_acc >= best_class_acc):
                best_class_acc = class_acc
            log_string('Test Instance Accuracy: %f, Class Accuracy: %f' % (instance_acc, class_acc))
            log_string('Best Instance Accuracy: %f, Class Accuracy: %f' % (best_instance_acc, best_class_acc))

            if (instance_acc >= best_instance_acc):
                logger.info('Save model...')
                savepath = str(checkpoints_dir) + '/best_model.pth'
                log_string('Saving at %s' % savepath)
                state = {
                    'epoch': best_epoch,
                    'instance_acc': instance_acc,
                    'class_acc': class_acc,
                    'model_state_dict': classifier.state_dict(),
                    'optimizer_state_dict': optimizer.state_dict(),
                }
                torch.save(state, savepath)
            global_epoch += 1

    logger.info('End of training...')


if __name__ == '__main__':
    args = parse_args()
    main(args)

最远点采样FPS代码解析

注意：一般深度学习框架中都会使用批操作，来加速收敛。
因此采样函数的输入输出应当也要包含批。

def farthest_point_sample(xyz, npoint):
    """
    Input:
        xyz: pointcloud data, [B, N, C]
        npoint: number of samples
    Return:
        centroids: sampled pointcloud data, [B, npoint, C]
    """
    device = xyz.device
    B, N, C = xyz.shape
    S = npoint
    centroids = torch.zeros(B, S, dtype=torch.long).to(device)
    distance = torch.ones(B, N).to(device) * 1e10
    farthest = torch.randint(0, N, (B,), dtype=torch.long).to(device)
    batch_indices = torch.arange(B, dtype=torch.long).to(device)
    for i in range(S):
        centroids[:, i] = farthest
        centroid = xyz[batch_indices, farthest, :].view(B, 1, 3)
        dist = torch.sum((xyz - centroid) ** 2, -1)
        mask = dist < distance
        distance[mask] = dist[mask]
        farthest = torch.max(distance, -1)[1]
    return centroids

知识储备

pytorch、python知识点

nn.BatchNorm1d：批数据的归一化，详细说明可参考这里。

最远点采样 ( Farthest Point Sampling )

本质：一句话概括就是不断迭代地选择距离已有采样点集合的最远点。
最远点采样(Farthest Point Sampling)是一种常用的采样算法，特别是在激光雷达3D点云数据中。这篇文章介绍最远点采样方法在一维、二维、三维点集中的使用。附有numpy写的代码和实例。

FPS算法原理步骤：

输入点云有N个点，从点云中选取一个点P0作为起始点，得到采样点集合S={P0}。
计算所有点到P0的距离，构成N维数组L，从中选择最大值对应的点作为P1，更新采样点集合S={P0，P1}。
计算所有点到P1的距离，对于每一个点Pi，其距离P1的距离如果小于L[i]，则更新L[i] = d(Pi, P1)，因此，数组L中存储的一直是每一个点到采样点集合S的最近距离。
选取L中最大值对应的点作为P2，更新采样点集合S={P0，P1，P2}。
重复2-4步，一直采样到N’个目标采样点为止。

原理和实现代码（python）

ModelNet40数据集介绍

ModelNet40数据集是用于分类的点云数据集，包含了40个类别，训练集有9843个点云数据，验证集有2468个点云数据，数据集目录结构如下：

更多介绍请点击

代码实现（基于pytorch）

源码地址

环境配置

（1）Windows系统
python 3.8 cuda 11.1 pytorch 1.8.0 torchvision 0.9.0
（2）ubuntu系统
python 3.7 cuda 11.1 pytorch 1.8.0 torchvision 0.9.0

代码解析

可参考

目录结构

models：网络模型，如分割模型，分类模型，pointNet模型，pointNet++模型等
log??
data_utils??
visualizer：可视化

README

对于版本迭代的说明。

略…

工具链的安装

The latest codes are tested on Ubuntu 16.04, CUDA10.1, PyTorch 1.6 and Python 3.7:

conda install pytorch==1.6.0 cudatoolkit=10.1 -c pytorch

分类任务运行指南

下载数据集

Data Preparation
Download alignment ModelNet here and save in data/modelnet40_normal_resampled/.

运行代码

你可能感兴趣的:(机器视觉)

机器视觉在OCR（字符识别）检测中的应用
目前，对印刷品的检测工作一般采用人工方法进行质量检测，然后再由工作人员将成品和次品进行分类堆放。这样一来，不仅增加了工作人员的劳动强度，而且检测质量也难以得到保障。其次，则是效率低下，浪费时间成本。印品质量自动检测系统满足印刷企业对于产品质量控制的需求。系统采用自主研发的表面缺陷检测、色彩测量、快速建模等核心算法，广泛适用于包装印刷、标签印刷、商业印刷质量在线检测和印后终检。机器视觉用于印刷、包装
2025年人工智能、虚拟现实与交互设计国际学术会议学术小八学术人工智能 vr 交互
重要信息官网：www.aivrid.com时间：2025年10月17-19日地点：中国-东莞部分介绍征稿主题包括但不限于：生物特征模式识别机器视觉专家系统深度学习智能搜索自动编程智能控制智能机器人系统组件虚拟现实平台用于VR/AR的AI平台数据和生成、操作、分析和验证浸入式环境和虚拟世界的生成优化和现实的渲染人工智能与用户体验个性化推荐系统情感计算与用户响应虚拟现实与沉浸式技术沉浸式环境设计交互设
机器视觉通用平台之拟合圆工具类小治视觉算法 visual studio c#
usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Runtime.InteropServices;usingSystem.Text;usingSystem.Threading.Tasks;usingCvBase;usingSystem.IO;usingSystem.Drawing.Drawing2D;u
内嵌式触摸显示器在工业视觉设备中的应用 Jwest2021 计算机外设
内嵌式触摸显示器在工业视觉设备中的应用日益广泛，其重要性不容忽视。以下是对内嵌式触摸显示器在工业视觉设备中应用的具体分析：一、应用背景工业视觉设备是智能制造的重要组成部分，它依赖于先进的图像处理和机器视觉技术，实现对生产线上产品质量的自动化检测和控制。随着工业4.0和智能制造的推进，工业视觉设备在生产线上的作用愈发关键。而内嵌式触摸显示器作为人机交互的重要界面，为工业视觉设备提供了直观、便捷的操作
如何为工业相机匹配最佳镜头 51camera 机器视觉产品资料查询平台工业相机工业镜头工业相机
工业镜头选型为什么重要？工业镜头与普通相机镜头不同，它的核心任务是满足‌高精度、稳定性、环境适应性‌等严苛需求。选型不当可能导致：成像模糊：影响缺陷检测或尺寸测量精度；成本浪费：高价镜头无法适配实际场景；系统卡顿：镜头与相机、光源不匹配，拖慢处理速度。选型要精准匹配需求。在工业自动化、机器视觉、智能检测等领域，工业镜头作为工业相机的“眼睛”起着重要作用，选择合适的镜头才能让成像更精准、高效。那么如
看不见的光，看得见的细节：短波红外工业相机的神秘力量！ 51camera 工业相机短波红外相机
随着市场需求的挖掘和机器视觉技术的发展，短波红外工业相机在工业、医疗、食品等领域的应用越来越广泛。其中半导体检测和食品检测是两大主要应用市场，占据较大的市场份额。今天我们来看看短波红外相机。短波红外(Short-WaveInfrared简称SWIR，通常指0.9~1.7μm波长的光线)是一种比可见光波长更长的光。这些光不能通过“肉眼”看到，也不能用“普通相机”检测到。由于被检测物体的材料特性，一些
机器视觉通用平台之拟合直线工具类小治视觉 c#算法 visual studio 视觉检测
usingSystem;usingSystem.Collections.Generic;usingSystem.IO;usingSystem.Linq;usingSystem.Text;usingSystem.Threading.Tasks;usingCvBase;usingCWindowTool;usingHalconDotNet;namespaceCvImageTool{publicclass
机器视觉OpenCV：OpenCV图像基本操作数字化与智能化机器学习之机器视觉 opencv 人工智能计算机视觉
一、图像读写操作（一）读取图像方法：cv2.imread(filename,flags=None)参数说明：filename(字符串)：-必须参数。-指定要读取的图像文件的路径。可以是相对路径或绝对路径。-支持多种图像格式，如.jpg,.png,.bmp,.tiff,.jpeg等。flags(整数)：-可选参数。-指定读取图像的方式。不同的标志位会影响图像的加载方式。-常见的标志位包括：-cv2.
Python机器学习实战——逻辑回归（附完整代码和结果）小白熊XBX 机器学习机器学习 python 逻辑回归
Python机器学习实战——逻辑回归（附完整代码和结果）关于作者作者：小白熊作者简介：精通c#、Halcon、Python、Matlab，擅长机器视觉、机器学习、深度学习、数字图像处理、工业检测识别定位、用户界面设计、目标检测、图像分类、姿态识别、人脸识别、语义分割、路径规划、智能优化算法、大数据分析、各类算法融合创新等等。联系邮箱：[email protected]科研辅导、知识付费答疑、个性化定制
圆柱电池自动分选机：电池生产线的智能守护者 b***2511 大数据人工智能
在新能源产业的浪潮中，圆柱电池作为电动汽车、储能系统及各类便携式电子设备的核心能量单元，其性能与质量的优化成为了行业发展的关键。随着技术的不断进步和市场的日益成熟，圆柱电池的生产效率与品质要求也越来越高。而圆柱电池自动分选机，作为电池生产线上的关键设备，正以其高效、精准、智能的特点，成为提升电池生产效率与品质的重要力量。一、圆柱电池自动分选机的工作原理圆柱电池自动分选机主要利用先进的机器视觉技术和
机器视觉：ransac算法详解无水先生数字图形和图像处理算法计算机视觉
目录一、说明：二、算法步骤三、算法代码四、其它补充一、说明：RANSAC是一种常用的参数估计方法，全称为RandomSampleConsensus（随机抽样一致性）。它通过随机选择数据中的一部分，然后根据这些数据拟合模型，统计模型与其他数据的偏差，最终筛选出符合一定阈值的数据，用于估计参数。RANSAC可以应用于很多领域，如计算机视觉、机器人和地理信息系统等。其优点在于对噪声数据和异常值有很强的鲁
Halcon 初步了解科学的发展-只不过是读大自然写的代码图形编程 c#视觉处理 Halcon
1.Halcon概述Halcon是德国MVTec公司开发的一套完善的机器视觉算法包，也是一款功能强大的视觉处理软件，为工业自动化领域提供了全面的解决方案。它拥有应用广泛的机器视觉集成开发环境，提供了一套丰富的图像处理和机器视觉算法，可以在各种工业应用中进行图像分析、目标检测、测量、定位、识别等任务。Halcon的核心功能包括图像处理、特征提取与匹配、3D视觉、深度学习、条码识别、OCR识别以及视觉
【EI会议征稿】东北大学主办第三届机器视觉、图像处理与影像技术国际会议（MVIPIT 2025）诗远Yolanda 图像处理计算机视觉考研视频机器学习论文阅读
一、会议信息大会官网：www.mvipit.org官方邮箱：[email protected]会议地点：辽宁沈阳主办单位：东北大学会议时间：2025年9月27日-9月29日二、征稿主题集中但不限于“机器视觉、图像处理与影像技术”等其他相关主题。机器视觉：视觉中的统计机器学习；立体视觉标定；几何建模与处理；人脸识别与手势识别；早期视觉和生物学启发的视觉；光流法和运动追踪；图像分割和图像分类；基于模型的视觉
（全网最全，打光测试解决高反光产品）在机器视觉2D中，遇到高反光产品打光测试怎么办？苏州大视通机器视觉杂说科技人工智能计算机视觉 opencv
关键原则：优先从物理层面消除反光（光源/光学），算法作为补充。偏振方案成本通常低于更换光源，且效果显著，建议优先尝试。在机器视觉打光测试中出现反光问题会严重影响图像质量，导致特征模糊、边缘丢失或检测失败。以下是系统性的解决方案，可根据实际情况组合应用：一、调整光源方案改变光源角度斜射照明：避免光源直射反光区域（如30°-60°环光、条形光侧打）。同轴光优化：对镜面物体改用低角度环形光（如<15°）
Delta视觉定位系统东城十三 vuca 数码相机计算机视觉目标跟踪算法人工智能机器学习
Delta视觉定位系统软件应用背景Delta机器人以并联构型实现“轻量、高速、高精度”三位一体，成为高速分拣、精密装配、食品包装等领域的佼佼者。然而，其卓越的物理性能要转化为实际作业中的高精度定位取放能力，视觉定位系统是不可或缺的“眼睛”和“导航员”。尤其在面对高速运动目标或随机摆放（无序）物体的复杂场景时，视觉系统是实现高效、精准作业的核心技术保障。通过机器视觉实时识别目标物体的位置与姿态，引导
机器视觉_图像算法（六）——形状矩(Hu) 智能之心 #机器视觉_图像算法形状矩 opencv
图像形状矩：一个从一幅数字图形中计算出来的矩集，通常描述了该图像形状的全局特征，并提供了大量的关于该图像不同类型的几何特性信息，比如大小、位置、方向及形状等。一阶矩与形状有关，二阶矩显示曲线围绕直线平均值的扩展程度，三阶矩则是关于平均值的对称性的测量。由二阶矩和三阶矩可以导出一组共7个不变矩。而不变矩是图像的统计特性，满足平移、伸缩、旋转均不变的不变性，在图像识别领域得到了广泛的应用。一般由mom
【C# + HALCON 机器视觉】机器视觉在汽车内饰板塑料部件装配中的实战应用 AI_DL_CODE 机器视觉：C#+HALCON c#HALCON 机器视觉汽车零部件装配内饰装配形状匹配人机交互
摘要：本文聚焦C#与HALCON技术在汽车内饰板塑料部件自动化装配领域的深度应用，详细阐述基于形状匹配算法的视觉定位技术、C#开发的人机交互界面及设备通信集成方案。通过完整的实操流程和代码示例，展示如何解决传统人工装配精度不稳定的问题，实现装配效率提升35%、良品率从92%提升至98%的显著成效，为汽车制造行业自动化升级提供技术参考。文章目录【C#+HALCON机器视觉】机器视觉在汽车内饰板塑料部
LabVIEW工业指针仪表检测 LabVIEW开发 LabVIEW开发案例 labview 深度学习 LabVIEW开发案例
用LabVIEW融合深度学习与机器视觉技术，构建适用于复杂工业环境的多类指针式仪表自动检测系统。通过集成品牌硬件与优化算法架构，实现仪表实时定位、图像增强、示数读取全流程自动化，解决传统人工巡检效率低、误差大的问题，满足煤矿、变电站等场景的智能化监测需求。应用场景工业设备监控：煤矿通风设备压力表、变电站电压电流表、集气站流量仪表等圆形指针式设备的实时状态监测。恶劣环境检测：适用于高温、高压、粉尘或
2025——》机器视觉之opencv/图片和视频的加载和显示基本知识详解
下面我将详细介绍OpenCV中图片和视频加载与显示的基本知识。一、OpenCV简介OpenCV(OpenSourceComputerVisionLibrary)是一个广泛用于计算机视觉任务的开源库，支持多种编程语言（如Python、C++），提供了丰富的图像处理和计算机视觉算法。二、图片操作基础1.图片的加载pythonimportcv2#加载图片image=cv2.imread('example
机器视觉工程师如何进行图像去噪和增强 zhangzhechun_02 运维深度学习人工智能机器人自动化
python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位C#视觉应用开发问题系列c#串口应用开发问题系列microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析
机器视觉工程师如何进行条码与二维码识别优化 zhangzhechun_02 自动化运维深度学习人工智能机器人
python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位C#视觉应用开发问题系列c#串口应用开发问题系列microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析
使用Halcon进行图像预处理的策略 AI_Guru人工智能计算机视觉图像处理人工智能
图像预处理是机器视觉系统中的一个关键步骤，它有助于提高图像质量，从而使得后续的图像分析和特征提取更加准确。在Halcon中，图像预处理通常包括滤波、对比度增强、归一化、边缘增强等操作。以下是一些使用Halcon进行图像预处理的策略，以及相应的示例代码。图像预处理策略滤波：去除图像噪声，如高斯滤波、中值滤波等。对比度增强：提高图像的对比度，如直方图均衡化、对比度限制自适应直方图均衡化（CLAHE）。
Halcon 图像预处理算子、。纯牛奶最单纯*￣▽￣* 计算机视觉人工智能图像处理
在机器视觉领域，图像的预处理算法十分重要。对于一些成像质量较差，受噪声影响较大的场景中，为保证视觉测量，定位，检测效果的稳定性。、往往第一步就是对图像做处理，这里对常用的预处理算法做总结。*腐蚀图像增加暗部，减少亮部gray_erosion_rect(Image,ImageMin,11,11)*膨胀图像增加增加，减少暗部gray_dilation_rect(Image,ImageMax,11,11
图像基础算法学习笔记 jerry201108 视觉基础知识学习笔记计算机视觉
目录概要一、图像采集二、图像标注四、图像几何变换五、图像边缘检测Sobel算子Scharrt算子Laplacian算子Canny边缘检测六、形态学转换十三、图像去噪概要参考书籍：《机器视觉与人工智能应用开发技术》廖建尚，钟君柳出版时间：2024-02-01图像采集图像标注：绘制直线、矩阵、圆形、椭圆和多边形图像灰度转换：灰度化、二值化等图像转换方法图像几何变换：图像旋转、图像镜像、图像缩放、图像透
探索大规模实例分割新天地 —— LVIS API深度解析与应用推广芮奕滢Kirby
探索大规模实例分割新天地——LVISAPI深度解析与应用推广去发现同类优质开源项目:https://gitcode.com/在机器视觉领域，数据集的丰富性和多样性是推动技术进步的关键。LVIS（LargeVocabularyInstanceSegmentation），以其独特的名字和深远的意义，在实例分割界掀起了一场革新风暴。LVIS，这个名字发音为“el-vis”，不仅仅是一个数据集，更是一套强
受大脑启发的人工智能在令人震惊的视觉突破中学会像人类一样看东西大咖分享课人工智能
一种名为Lp-Convolution的新型受大脑启发的AI方法通过动态重塑CNN过滤器来增强图像识别能力，将生物现实性与改进的性能和效率相结合。IBS-Yonsei研究团队在ICLR2025上介绍了一种新颖的Lp-Convolution方法。延世大学基础科学研究所(IBS)和马克斯·普朗克研究所的研究团队开发了一种新的人工智能(AI)技术，使机器视觉更接近人脑处理视觉信息的方式。这种被称为Lp-C
机器视觉开发-使用yolo训练和验证自己的模型派葛穆 YOLO 深度学习机器学习
创建一个文件夹，包含如下子目录，images存放训练（train）和验证图片（val），一般是8:2的数量比例，labels存放对应的yolo格式内容的标注文件（与图片同名.txt）。创建一个.yaml格式的配置文件，如Goods.yamlpath:D:\Desktop\Python文件\仿真单件分离系统\Goods#数据集根路径train:images/train#训练集路径val:images
【MATLAB源码】机器视觉与图像识别技术(4)---模式识别与视觉计数 §ꦿCFོ༉ 机器视觉与图像识别技术计算机视觉算法人工智能图像处理 matlab 深度学习
系列文章目录第一篇文章：【MATLAB源码】机器视觉与图像识别技术—视觉系统的构成(视频与图像格式转换代码及软件下载)第二篇文章：【MATLAB源码】机器视觉与图像识别技术(2)—图像分割基础第三篇文章：【MATLAB源码】机器视觉与图像识别技术(2)续—图像分割算法第四篇文章：【MATLAB源码】机器视觉与图像识别技术(3)—数字形态学处理以及图像特征点提取模式识别与视觉计数
基于机器视觉的水果分拣系统-分拣终端设计(源码+万字报告+讲解) 炳烛之明科技人工智能
目录摘要1Abstract1第1章绪论21.1课题研究背景与意义21.2水果分拣系统研究现状31.3水果分拣系统应用前景4第2章系统设计方案42.1水果分拣终端总体框图42.2系统研究内容及设计要求52.3方案整体设计5第3章系统硬件电路设计63.1总体硬件框图63.2主控芯片及其最小系统73.3直流电机及其驱动73.4机械臂设计83.5WiFi模块8第4章系统软件设计84.1总体软件设计框图84
HALCON 深度学习训练 3D 图像的几种方式优缺点 LeonDL168 Halcon 深度学习 3d 人工智能 HALCON训练3D图像深度学习训练3D图像 HALCON python
HALCON深度学习训练3D图像的几种方式优缺点**在计算机视觉和工业检测等领域，3D图像数据的处理和分析变得越来越重要，HALCON作为一款强大的机器视觉软件，提供了多种深度学习训练3D图像的方式。每种方式都有其独特的设计思路和应用场景，了解它们的优缺点有助于根据具体需求选择最合适的训练方法。基于体素化的训练方式优点数据结构规整：体素化将3D图像转换为类似3D网格的数据结构，这种规整的数据形式能
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他