Cecilia_lu

mmsegmentation 训练自制数据集全过程

1.简介

mmsegmentation是目前比较全面和好用的用于分割模型的平台，原始的github链接
https://github.com/open-mmlab/mmsegmentation

2.GPU环境配置

我是按照自己的经历步骤配置环境的，目前把我配置环境的过程记录一下。
我的服务器信息： Ubuntu 16.04.6 LTS (GNU/Linux 4.4.0-151-generic x86_64)
在服务器上已经安装了anaconda的，所以使用anaconda创建一个mmsegmentation训练的虚拟环境

【1】创建虚拟环境：

conda create -n mmlab python=3.8 目前我觉得3.7，3.8应该都可以的(其中mmlab是为该虚拟环境起的名字其他都OK的)

【2】激活虚拟环境：

conda activate mmlab

【3】安装所需要的包：

将原repo的代码我直接download到服务器上了，cd 到 mmsegmentation-master 目录下面，直接执行 pip install -r requirements.txt

【4】安装额外的包：

需要根据自己的机器cuda的版本安装对应的pytorch和torchversion
cuda版本和torch版本的对应关系

torch版本和torchversion版本的对应关系

我的cuda版本是10.1版本的，所以我安装的版本如下图所示：
注意：还需要安装一下mmcv，mmcv根据自己的cuda版本和torch版本进行选择，github上专门的repo下有说明，mmcv和mmcv-full只需要安装一个即可，mmcv-full是比较全面的我安装的是mmcv-full，详细的说明见mmcvrepo
根据repo中的这个表格选择安装的命令即可。

完成上述安装应该基本重要的都差不多了，如果跑的过程中提示没有某个模块的话再另行安装。

3.使用pascolvoc公开数据集跑mmsegmentation

【1】下载pascolvoc公开数据集

数据集下载镜像网站，这个是我找到的比较靠谱的镜像网站，我用的macbook_pro,下载了一个迅雷，用迅雷下载真的很快数据集有1.9G，迅雷下载可以有3M/s。

因为下载的是公开数据集，mmsegmentation是直接支持这种数据格式的，打开数据的话大概长这样，不用去做额外的操作，直接解压好后就是这样就OK了。

在mmsegmentation-master下面创建名字为data的文件夹，将上面下载的解压后的数据文件夹直接复制到data下面，这样数据就准备好了。

【2】配置自己训练的config

为了不打乱原repo的config, 建议直接创建一个自己要训练模型的config文件夹，我在mmsegmentation-master文件夹下创建了一个my_model的文件夹，这次主要是想实验deeplabv3+,所以在my_model下面又创建了一个名为deeplabv3plus的文件夹，整体结构如下：

所有的实验训练的config文件全部放在mmsegmentation-master/my_model/deeplabv3plus下面，当然你的config放在其他地方也无所谓，训练的时候配置文件的路径选择好就可以了，我这是为了区分自己的和原来的才这样操作。
config文件总共包括5个主要的：

1.选择训练config

根据自己想训练的网络在mmsegmentation-master/configs目录下选择自己想要选取的网络模型及输入尺寸，迭代次数等选择一个config文件，例如：我想训练deeplabv3plus的pascol公开数据集所以我选择的是：deeplabv3plus_r50-d8_512x512_20k_voc12aug.py文件，将这个选择好的文件放在自己创建好的mmsegmentation-master/my_model/deeplabv3plus文件夹下。

我们选择好的config里面的内容是

2.选择网络模型config

根据第一步选择好的config, 我们把模型config拿过来，复制mmsegmentation-master/configs/_base_/models/deeplabv3plus_r50-d8.py放在自己创建好的mmsegmentation-master/my_model/deeplabv3plus文件夹下.

3.选择数据config

此处注意⚠️：因为我们下载的是voc12数据集没有进行增强，所以数据config选择pascal_voc12.py
根据第一步选择好的config, 我们把数据config拿过来，复制mmsegmentation-master/configs/_base_/datasets/pascal_voc12.py放在自己创建好的mmsegmentation-master/my_model/deeplabv3plus文件夹下.

4.选择迭代进程config

根据第一步选择好的config, 我们把数据config拿过来，复制mmsegmentation-master/configs/_base_/schedules/schedule_20k.py放在自己创建好的mmsegmentation-master/my_model/deeplabv3plus文件夹下.

5.选择default_run_time

根据第一步选择好的config, 我们把数据config拿过来，复制mmsegmentation-master/configs/_base_/default_runtime.py放在自己创建好的mmsegmentation-master/my_model/deeplabv3plus文件夹下.
完成上述5步，config的选择基本完成最后我们的文件夹下应该是这样子。实际上你要用什么根据自己要训练的网络和迭代次数等去按照步骤选取就可以了。

【3】按照需求修改自己训练的config

因为文件的位置变了，所以我们按照自己的需要可以去修改config了。
1.修改deeplabv3plus_r50-d8_512x512_20k_voc12aug.py修改后：

2.修改pascal_voc12.py后：
主要修改数据集的地址，我这里填写了绝对地址的，这样保证不会错

3.修改schedule_20k.py
看自己的需求，原始的是下面我框起来的内容最大迭代次数，以及模型保存的间隔，评估的间隔，根据自己的需求改就OK了。

【4】开始训练

如果为了方便直接在mmsegmentation-master/tools/train.py里面改自己要传的内容
我直接改了下面这两个，当然你也可以进行外部穿参数
其中config是我们选择的第一个py文件的路径
work_dir是我们训练的模型及log的保存路径

修改完成后直接在终端cd 进mmsegmentation-master文件夹，
然后执行python tools/train.py即可进行模型训练了，如果你遇到终端跑报没有mmseg的modeule的问题可以在train.py中加上：

import sys
sys.path.append('xxx/xxx/mmsegmentation-master') #你的代码文件夹的绝对路径即可

【5】模型进行图片预测

完成训练后可以进行图片预测了，在我们训练所填的work_dir目录下应该会有若干.pth结尾的模型。
修改mmsegmentation-master/demo/image_demo.py
（1）要预测的图片的路径
（2）训练时候的config文件的路径
（3）模型文件路径

修改完成后执行python demo/image_demo.py 就可以看到图片了。如果是在服务器上保存图片需要你自己改改代码了。
注意⚠️：另外如果你是在cpu上进行图片预测的话，要把deeplabv3plus_r50-d8.py里面的SyncBN 改成BN才可以。

4.制作自己的数据集跑mmsegmentation

【1】数据标注

语义分割的标注通常是使用labelme进行标注，labelme安装

conda create -n labelme python=3.6
conda activate labelme

pip install pyqt
pip install pillow
pip install labelme

直接终端labelme即可打开labelme进行数据标注
标注好的数据通常是一个图片带一个标注的json结果

我这里有之前其他平台的标注数据需要转化成labelme格式的方便检查标注，或者有其他用处，可以将其他格式的转化成labelme可以打开的标注数据

def gen_labelme_dict(self, sub_contour_dict, img_name, img_w, img_h, img_path):
        labelme_dict = {
            'version':'4.2.10',
            'flags':{},
            'shapes':[],
            'imagePath':img_name,
            'imageData':'',
            'imageHeight':img_h,
            'imageWidth':img_w
        }
        shapes = []
        for label, sub_cnt_list in sub_contour_dict.items():
            for sub_cnt in sub_cnt_list:
                label_dict = defaultdict()
                label_dict['label'] = label_dict.get(label, label)
                points = sub_cnt.reshape(-1, 2).tolist()
                label_dict['points'] = points
                label_dict['group_id'] = None
                label_dict['shape_type'] = 'polygon'
                label_dict['flags'] = {}
                with open(img_path, 'rb') as binary_file:
                    binary_file_data = binary_file.read()
                    base64_encoded_data = base64.b64encode(binary_file_data)
                    base64_message = base64_encoded_data.decode('utf-8')
                labelme_dict['imageData'] = base64_message
                shapes.append(label_dict)
        labelme_dict['shapes'] = shapes
        return labelme_dict
# 其中sub_contour_dict这张图片上标注的轮廓的集合大概类似于
# {'类别1': [contour1, contour2,...], '类别2': [contour1, contour2,...]...,
# contour1 的格式是np.array,shape是[-1,1,2]
}

【2】自己的数据集mask制作

有了数据集文件夹下是若干图片和若干json文件，要进行训练的mask制作了

# -*- coding: utf-8 -*-
import os
import json
import glob
import shutil
import tqdm
import cv2
import numpy as np
from PIL import Image
from sklearn.model_selection import train_test_split

np.random.seed(0)
# 如果自己的数据集是中文或者英文像我这样用数字映射一下，特别提醒的是如果你没有背景类别也要在前面加上背景类别为0，自己的其他类别按照顺序往后映射
label_mapping = {
    '背景': 0,
    '客厅': 1,
    '餐厅': 2,
    '厨房': 3,
    '玄关': 4,
    '户内走道': 5,
    '卫生间干区': 6
}


def labelme2seg(json_files: list, output_path: str):
    for json_file in tqdm.tqdm(json_files, desc="transforming："):
        with open(json_file, encoding="utf-8") as f:
            json_data = json.load(f)
        img_path = json_file.replace('json', 'png')
        img = cv2.imread(img_path)
        img_h,img_w = img.shape[:2]
        img_data = np.zeros((img_h, img_w), dtype=np.uint8)
        labels_data = json_data["shapes"]
        # 将目标物区域像素填充为对应ID号
        for label_data in labels_data:
            # 下面这行，你的label不是数字的话，是汉字或者其它，自己记得稍微改一下，映射成数字，从0开始
            goods_id = int(label_mapping[label_data["label"]])
            location = np.asarray(label_data["points"], dtype=np.int32)
            cv2.fillPoly(img_data, [location], color=(goods_id, goods_id, goods_id))

        res_img_name = os.path.basename(json_file).replace(".json", ".png")
        cv2.imwrite(os.path.join(output_path, res_img_name), img_data)
        # res_img = Image.fromarray(img_data, mode="P")
        # res_img.save(os.path.join(output_path, res_img_name))


    return


def gen_train_val_data(labelme_path, save_path):
    img_dir_train = os.path.join(save_path, "img_dir", "train")
    img_dir_val = os.path.join(save_path, "img_dir", "val")
    img_dir_test = os.path.join(save_path, "img_dir", "test")

    ann_dit_train = os.path.join(save_path, "ann_dir", "train")
    ann_dir_val = os.path.join(save_path, "ann_dir", "val")
    ann_dir_test = os.path.join(save_path, "ann_dir", "test")

    if not os.path.exists(img_dir_train):
        os.makedirs(img_dir_train)
    if not os.path.exists(img_dir_val):
        os.makedirs(img_dir_val)
    if not os.path.exists(img_dir_test):
        os.makedirs(img_dir_test)

    if not os.path.exists(ann_dit_train):
        os.makedirs(ann_dit_train)
    if not os.path.exists(ann_dir_val):
        os.makedirs(ann_dir_val)
    if not os.path.exists(ann_dir_test):
        os.makedirs(ann_dir_test)
    
    json_list_path = glob.glob(labelme_path + "/*.json")
    train_path, test_val_path = train_test_split(json_list_path, test_size=0.2)
    test_path, val_path = train_test_split(test_val_path, test_size=0.2)

    # 制作mask：
    labelme2seg(train_path, ann_dit_train)
    labelme2seg(val_path, ann_dir_val)
    labelme2seg(test_path, ann_dir_test)

     # 图复制进对应位置
    for file in tqdm.tqdm(train_path, desc="copy train_img"):
        shutil.copy(file.replace(".json", ".png"), img_dir_train)
    for file in tqdm.tqdm(val_path, desc="copy val_img"):
        shutil.copy(file.replace(".json", ".png"), img_dir_val)
    for file in tqdm.tqdm(test_path, desc="copy test_img"):
        shutil.copy(file.replace(".json", ".png"), img_dir_test)


if __name__ == '__main__':
    labelme_path = r"/Users/cecilia/Desktop/new_data"
    save_path = r"/Users/cecilia/Desktop/my_dataset"

    gen_train_val_data(labelme_path, save_path)

执行完上述代码后会在自己save_path下生成对应的标注mask文件和训练的图片文件，可以根据自己的训练比例验证集比例进行修改划分比例。
将生成的数据文件夹命名为my_dataset包含如下内容，放在mmsegmatation-master下即可：

【3】配置mydataset

配置适合自己数据集的dataset文件
在mmseg/datasets新建一个文件my_dataset.py仿造其它的数据集写下如下内容：

from .builder import DATASETS
from .custom import CustomDataset


@DATASETS.register_module()
class MyDataset(CustomDataset):
    # 写你实际的类别名就好了，跟生成mask是映射的数字顺序一致即可，有背景不需要改没有背景记得与生成mask时一样一定要在第一个加上background
    CLASSES = (
       '背景', '客厅', '餐厅', '厨房', '玄关', '户内走道', '卫生间干区'
    )
    # 这个数量与上面个数对应就好了,只是最后的预测每个类别对应的mask颜色
    PALETTE = [[0, 0 , 0], [215, 0 , 255], [255, 0, 0], [0, 255, 0], [0, 0, 255],
               [0, 215, 255], [215, 255, 0]]

    def __init__(self, **kwargs):
        super(MyDataset, self).__init__(
            **kwargs
        )

然后在mmseg/datasets/__init__.py中把自己的数据集添加进去(主要是添加以下两行)：

from .my_dataset import MyDataset
# 在 __all__中添加自己的类名
__all__ = [
    '......', 'LoveDADataset', 'MyDataset'       # 最后添加这个
]

【4】配置自己训练config

按照上述讲的3.使用pascolvoc公开数据集跑mmsegmentation下面的【2】配置自己训练的config配置自己的config就可以了，注意这里我们使用了自己的数据集格式，所以要在mmsegmentation-master/my_model/deeplabv3plus下创建一个my_datasets.py用这个代替pascal_voc12.py
里面的内容为：

# dataset settings
dataset_type = 'MyDataset'
data_root = '/Users/cecilia/Desktop/mmsegmentation-master/my_dataset' #填你生成的mask数据集的那个路径
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
crop_size = (512, 512)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations'),
    dict(type='Resize', img_scale=(1024, 1400), ratio_range=(0.5, 2.0)), # img_scale根据自己的图片大小填写
    dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),
    dict(type='RandomFlip', prob=0.5),
    dict(type='PhotoMetricDistortion'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size=crop_size, pad_val=0, seg_pad_val=255),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_semantic_seg']),
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(1024, 1400),
        # img_ratios=[0.5, 0.75, 1.0, 1.25, 1.5, 1.75],
        flip=False,
        transforms=[
            dict(type='Resize', keep_ratio=True),
            dict(type='RandomFlip'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='ImageToTensor', keys=['img']),
            dict(type='Collect', keys=['img']),
        ])
]

data = dict(
    samples_per_gpu=2,
    workers_per_gpu=1,
    train=dict(
        type='RepeatDataset',
        times=40000,
        dataset=dict(
            type=dataset_type,
            data_root=data_root,
            img_dir='img_dir/train',
            ann_dir='ann_dir/train',
            pipeline=train_pipeline)),
    val=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='img_dir/val',
        ann_dir='ann_dir/val',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='img_dir/test',
        ann_dir='ann_dir/test',
        pipeline=test_pipeline)
)

上述注释的地方修改成自己的就OK了，其他一般不需要修改
这个修改了以后注意这个训练的config里面的pascol_voc.py要改成my_datasets.py，另外类别数要改成我们自己的类别数量了，记住是自己的实际类别+背景

其他的几个文件，就根据自己的迭代数量和模型保存数量进行修改即可，模型选的不一样按照上面介绍的步骤选择自己的config就可以了。

【5】模型训练

在tools/train.py中设置好自己的config路径及work_dir路径或者外部传参

# 内部改好的话执行
python tools/train.py
# 外部传参数执行
python tools/train.py xxx/xxx/deeplabv3plus_r50-d8_512x512_20k_voc12aug.py

有一点需要注意的是，如果你的图片是jpg格式，mask是png格式，应该没问题，要是不是这两种格式的话，需要在mmseg/datasets/custom.py中修改你的图片的格式

训练起来大概是这个输出：

【6】模型预测

如果要进行图片的预测展示demo的效果的话需要修改mmseg/core/evaluation/class_names.py在这里面加

def mydata_classes():
    return ['背景','客厅', '餐厅', '厨房', '玄关', '户内走道', '卫生间干区']

def mydata_palette():
    return [[0, 0 , 0],[215, 0 , 255], [255, 0, 0], [0, 255, 0], [0, 0, 255],
               [0, 215, 255], [215, 255, 0]]
#另外dataset_aliases = {}该字典中加上
 'mydata': ['mydata']

修改demo/image_demo.py里面的图片路径，模型路径还有数据格式就OK，或者是你直接外部传参数。运行image_demo.py就可以图片展示了。

以上是mmsegmentation训练的一些内容，有问题的话还可在交流，应该是比较全面了，希望你能自己跑起来！！！

一文读懂 Linux 下 Docker 搭建及简单应用 Waitccy linux docker 运维服务器
一、引言在Linux系统的运维与开发场景中，Docker凭借其高效的容器化技术，极大地简化了应用部署与管理流程。它打破了传统环境配置的复杂性，实现应用及其依赖的封装，确保在不同环境中稳定运行。本文将详细介绍在Linux系统下搭建Docker的步骤，并通过几个简单应用示例，带你快速上手Docker。二、Linux下Docker搭建（一）准备工作系统要求：建议使用主流的Linux发行版，如Ubuntu
debian(ubuntu) 系统 vsftpd 配置虚拟帐号 eli960 LINUX vsftpd ftp
首先说明帐号的认证通过pam认证方式,采用pam的mysql插件.安装libpam-mysql和vsftpdapt-getinstalllibpam-mysqlapt-getinstallvsftpdmysql的库,表,字段,假设如下:库名DBV表名TB字段USER和PASSWORD数据库的帐号密码DBUSERDBPASSWROD/etc/pam.d/vsftpd的内容如下authrequired
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
区块链环境配置自用 Xmas190 其它区块链
FabricLab1.Fabric环境搭建与基本操作2.Fabric链码基础3.Fabric项目架构Fabric实践一：环境搭建与基本操作一、Fabric环境搭建本文用于指导Fabric在基于Ubuntu的Linux系统中的安装与配置，如有未安装过的同学可以参考本指南自行配置。相关组件版本号：名称版本Ubuntu16.04Fabric1.4Docker20.10.5Docker-compose1.
《AI医疗系统开发实战录》第6期——智能导诊系统实战骆驼_代码狂魔程序员的法宝人工智能 django python neo4j 知识图谱
关注我，后期文章全部免费开放，一起推进AI医疗的发展核心主题：如何构建95%准确率的智能导诊系统？技术突破：结合BERT+知识图谱的混合模型设计一、智能导诊架构设计python基于BERT的意图识别模型（PyTorch）fromtransformersimportBertTokenizer,BertForSequenceClassificationimporttorchclassTriageMod
RK平台下Buildroot驱动编译环境入门 ItJavawfc RK系统-驱动驱动学习 Kernel Ubuntu Buildroot
提示：低配置电脑下驱动编译环境搭建，驱动学习环境准备文章目录目的需求环境Ubuntu18Desk桌面开发环境Buildroot编译环境基本要求个人环境VM环境配置+Buildroot编译环境配置Buildroot编译总结目的搭建驱动开发编译环境硬件环境要求不达标如何进行配置规避，使编译环境编译OK为后续自己开发工作中，学习环境做一个简单的指导需求这里我需要搭建的环境是Ubuntu上面用Linux源
C++在线OJ负载均衡项目平凡的小y c++开发语言
1.演示项目项目源码链接：2.项目所用技术和开发环境所用技术C++STL标准库Boost准标准库(字符串切割)cpp-httplib第三方开源网络库ctemplate第三方开源前端网页渲染库jsoncpp第三方开源序列化、反序列化库负载均衡设计MySQLCconnectAce前端在线编辑器html/css/js/jquery/ajax开发环境Ubuntu云服务器vscodeMysqlWorkben
Docker 容器基础技术：namespace 寻雾&启示 docker 容器运维
在容器内进程是隔离的，比如容器有自己的网络和文件系统，容器内进程的PID为1，这些都是依赖于Linuxnamespace所提供的隔离机制。本篇我们来了解下Linux有哪些namespace，以及它们是如何实现隔离的。文中案例代码均由ChatGPT生成，在Linux内核5.15.0-124-generic，ubuntu22.04LTS系统上测试通过。namespace类型每个进程都有自己所属的nam
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
程序代码篇---Pyqt的密码界面 Ronin-Lotus 程序代码篇上位机知识篇 pyqt 数据库 python ubuntu
文章目录前言一、代码二、代码解释2.1用户数据库定义2.2窗口初始化2.3认证逻辑2.5角色处理2.6错误处理优化2.7功能扩展说明2.7.1用户类型区分管理员普通用户其他用户2.7.2安全增强建议三、运行效果四、运行命令五、界面改进建议5.1密码显示5.2用户头像显示5.3输入框动画效果5.4加载进度显示5.5键盘快捷键前言本文简单介绍了在Ubuntu系统上使用Python的Pyqt创建密码登录
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
环境配置（1）：笔记本window、虚拟机ubuntu、开发板三者互ping通信，并且虚拟机ubuntu和开发板能上网 lishing6 ubuntu linux mcu 嵌入式硬件 arm开发物联网硬件工程
1.配置网络我们配置网络是为了方便后续调试开发板系统或者应用程序时，能够使用tftp协议nfs协议等拷贝文件，以及设置文件系统启动方式为nfs挂载启动。2.设置Ubuntu使用NAT网络NAT是什么意思？NetworkAddressTranslation，网络地址转换。举个例子，在NAT里，Windows就是一个爱护孩子的父亲，Ubuntu就是受保护的小孩。小孩要买东西，都由他父亲代劳，别人根本不
Linux部署模型报错OSError: Error no file named pytorch_model.bin, tf_model.h5, model.ckpt.index or flax_mod dkgee linux pytorch 运维
报错内容：OSError:Errornofilenamedpytorch_model.bin,tf_model.h5,model.ckpt.indexorflax_model.msgpackfoundindirectory主要原因是transformer版本不对，需要升级pipinstall--upgradehuggingface_hubpipinstalltransformers[torch]其
Ubuntu 20.04 安装并使用Cursor 爱学习的小道长 AI ubuntu linux 运维 python ai
1.安装1.1下载cursor官网：https://www.cursor.com/cn点击下载LINUX查看下载下来的文件：$ls~/Downloads/Cursor-0.47.8-82ef0f61c01d079d1b7e5ab04d88499d5af500e3.deb.glibc2.25-x86_64.AppImage/home/xxx/Downloads/Cursor-0.47.8-82ef0
Ubuntu-Server 设置多个ip和多个ipv6 笔记250320 kfepiza #Linux CentOS Ubuntu 等 #控制台命令行 Shell脚本 sh cmd 等网络通讯传输协议物联 ubuntu tcp/ip 笔记
Ubuntu-Server设置多个ip和多个ipv6在UbuntuServer上为同一网卡配置多个IPv4和IPv6地址，Ubuntu-server-16用的是/etc/network/interfaces配置的networkingUbuntu-server-17.10及更新版本默认用的是systemd-networkd+Netplan,用Netplan来管理systemd-networkd对于U
ubuntu环境使用海康威视SDK获取视频流 Joemt ubuntu 人工智能计算机视觉
获取监控摄像头视频流可以采用rtsp快速获取，但是该方案可能出现延时较大的情况，而采用海康威视提供的SDK可以降低延时。#include#include#include#include#include#include#include"HCNetSDK.h"#include"iniFile.h"#include"PlayM4.h"//解码回调视频为YUV数据(YV12)，音频为PCM数据voidCA
Ubuntu实时读取音乐软件的音频流冬瓜~ Linux开发 ubuntu 音视频数据库 portaudio
文章目录一.前言二.开发环境三.具体操作四.实际效果一.前言起因是这样的，我需要在Ubuntu中，实时读取正在播放音乐的音频流，然后对音频进行相关的处理。本来打算使用的Pipewire+Helvum的方式实现，好处是可以直接利用Helvum图形化工具对软件输出的音频进行重定向，但是由于使用的是Ubuntu20.04，默认的音频服务器使用的是PulseAudio，替换为Pipewire后，播放的音频
利用docker部署单节点milvus并实现图像化管理听说唐僧不吃肉 Linux docker milvus
Docker部署单机版milvus使用DockerCompose安装Milvusstandalone（即单机版），进行一个快速milvus的体验。1.前提条件系统可以使用centos或者ubuntu系统已经安装docker和docker-composemilvus版本这里选择2.3.12.启动etcd、minio、milvus由于milvus依赖etcd和minio，因此需要先启动这2个组件。同样
Linux——Linux系统编程之基于TFTP实现服务器与开发板间的文件传输实战总结 Winter_world Linux系统 TFTP服务器搭建 TFTP文件传输
目录0引言1TFTP服务器搭建1.1TFTP基础1.2Ubuntu搭建TFTP服务器1.3测试TFTP服务器2开发板实现TFTP文件传输2.1同一网段2.2配置2.3客户端与服务器的通信0引言我们前面总结的Linux字符设备、串口编程博文中，在虚拟机中编译得到可执行文件后，都是通过U盘连接开发板进行测试验证的，或者就是把可执行文件编译到最小系统中，再OTG烧写进开发板，这两种方法都比较麻烦，这里我
NVIDIA Dynamo源码编译 Luchang-Li 大模型推理引擎大模型推理引擎 dynamo
Refhttps://github.com/PyO3/maturinRust程序设计语言代码库：https://github.com/ai-dynamo/dynamohttps://github.com/ai-dynamo/nixldynamo/container/Dockerfile.vllm相关whl包官方提供了4个whl包ai_dynamo#这个包ubuntu22.04也可以用，ubuntu
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
在macOS上使用镜像文件制作安装系统U盘 YaeSaraki macos
在macOS上制作安装系统U盘1：下载ISO文件确保您已经下载了所需的ISO文件。例如，文件名可能是ubuntu-22.04-live-server-amd64.iso。2：插入USB驱动器将您希望用来创建安装U盘的USB驱动器插入到您的macOS电脑中。3：找到USB驱动器的设备路径打开终端应用程序（您可以在Applications>Utilities中找到它）。运行以下命令以列出所有存储设备：
基于roop/insightface将视频中包含指定人脸的视频片段提取并合并成新视频阆遤 python roop pytorch insightface
利用insightface.app.FaceAnalysis提最一个视频中包含指定人脸的视频片段，并将其合并成一个新视频，使用“buffalo_l”模型，模型需安装在代码当前目录下的.\models中。需要roop或其他支持pytorch、insightface、moviepy的环境。pytorch安装请见我其他文章。#cython:language_level=3str#-*-coding:ut
关于pytorch3d的安装诚威_lol_中大努力中人工智能 pytorch 人工智能 python
更新1：2025_2_04今天发现，原来的pytorch3d不见了，在我的aaa1环境中。重新安装，我发现最好用的还是去github下载最新的pytorch3d的zip，unzip之后，进去pipinstall-e.然后安装成功！1、参考文章1：windows安装PyTorch3D详细指南-哔哩哔哩(bilibili.com)这篇文章巨好2、参考文章2：pytorch3d/INSTALL.mdat
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C