一个炼丹师

语义分割 PANet 跑通Demo 训练自己的数据集

项目地址 https://github.com/ShuLiu1993/PANet

介绍

该存储库适用于CVPR 2018 Spotlight论文，“ 用于实例细分的路径聚合网络 ”，其中2017年COCO实例细分挑战赛排名第一，2017年COCO检测挑战赛第二名（团队名称：UCenter）和2018年场景理解第一名非结构化环境中自主导航的挑战（团队名称：TUTU）。

结构主要基于Detectron 使用Pytorch写的

需要的环境：

python packages

pytorch=0.4[注意这里]
torchvision>=0.2.0
cython
matplotlib
numpy
scipy
opencv
pyyaml
packaging
pycocotools — for COCO dataset, also available from pip.
tensorboardX — for logging the losses in Tensorboard

其中pycocotools的安装方法参见我的其他博客

在确保你的CUDA　CUDNN　PYTORCH　还有　上述的包之后

cd lib
sh make.sh

我忘了要不要setup.py了　应该是不用　编译了就OK

DEMO

-------------单张推断 Demo
python tools/infer_simple.py --dataset coco2017 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --load_ckpt /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/data/pretrained_model/panet_mask_step179999.pth --images /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/demo/33823288584_1d21cf0a26_k.jpg --output_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/

-------------批量推断 Demo
python tools/infer_simple.py --dataset coco2017 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --load_ckpt /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/data/pretrained_model/panet_mask_step179999.pth --image_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/demo/sample_images/ --output_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/

其中权重下载地址为https://drive.google.com/file/d/1-pVZQ3GR6Aj7KJzH9nWoRQ-Lts8IcdMS/view?usp=sharing

准备数据集

我用的Coco-Annotator标记的　关于这个标注工具的用法后面会说

格式和coco2014做到一致就行

文件结构我用的　

.
├── coco-annotations
│   ├── captions_train2014.json
│   ├── captions_val2014.json
│   ├── instances_minival2014.json
│   ├── instances_train2014.json
│   ├── instances_val2014.json
│   ├── instances_val2017.json
├── configs
│   ├── baselines
│   │   ├── e2e_faster_rcnn_R-101-FPN_1x.yaml
│   │   ├── e2e_faster_rcnn_R-101-FPN_2x.yaml
...
│   ├── getting_started
│   │   ├── tutorial_1gpu_e2e_faster_rcnn_R-50-FPN.yaml
│   │   ├── tutorial_2gpu_e2e_faster_rcnn_R-50-FPN.yaml
│   │   ├── tutorial_4gpu_e2e_faster_rcnn_R-50-FPN.yaml
│   │   └── tutorial_8gpu_e2e_faster_rcnn_R-50-FPN.yaml
│   ├── gn_baselines
│   │   ├── e2e_mask_rcnn_R-101-FPN_2x_gn.yaml
...
│   └── panet
│    ├── e2e_panet_R-50-FPN_1x_det_2fc.yaml
│    ├── e2e_panet_R-50-FPN_1x_det.yaml
│    └── e2e_panet_R-50-FPN_2x_mask.yaml
├── data
│   ├── cache
│   │   └── coco_2014_train_gt_roidb.pkl
│   ├── coco
│   │   ├── annotations
│   │   │   ├── instances_train2014.json
│   │   │   └── instances_val2014.json
│   │   └── images
│   │    ├── train2014
│   │    │   ├── 1000.jpg
│   │    │   ├── 1001.jpg
│   │    │   ├── 1002.jpg
│   └── pretrained_model
│    ├── panet_mask_step179999.pth
│    ├── resnet101_caffe.pth
│    └── resnet50_caffe.pth
├── demo
│   ├── 33823288584_1d21cf0a26_k-detectron-R101-FPN.jpg
│   ├── convert_pdf2img.sh
│   ├── e2e_mask_rcnn_R-50-C4
│   │   └── train_from_scratch_epoch1_bs4
│   │    ├── img1.jpg
│   │    ├── img2.jpg
│   │    ├── img3.jpg
│   │    └── img4.jpg
│   ├── img1_keypoints-detectron-R50-FPN.jpg
...
│   ├── sample_images
│   │   ├── img1.jpg
│   │   ├── img2.jpg
│   │   ├── img3.jpg
│   │   └── img4.jpg
│   └── sample_images_keypoints
│    ├── img1_keypoints.jpg
│    └── img2_keypoints.jpg
├── images
│   ├── 0L8A0059.jpg
│   ├── 0L8A0066.jpg
├── lib
│   ├── core
│   │   ├── config.py
│   │   ├── __init__.py
│   │   ├── __pycache__
│   │   │   ├── config.cpython-36.pyc
│   │   │   ├── __init__.cpython-36.pyc
│   │   │   └── test.cpython-36.pyc
│   │   ├── test_engine.py
│   │   └── test.py
│   ├── datasets
│   │   ├── cityscapes
│   │   │   ├── coco_to_cityscapes_id.py
│   │   │   ├── __init__.py
│   │   │   └── tools
│   │   │    ├── convert_cityscapes_to_coco.py
│   │   │    └── convert_coco_model_to_cityscapes.py
│   │   ├── cityscapes_json_dataset_evaluator.py
│   │   ├── dataset_catalog.py
│   │   ├── dummy_datasets.py
│   │   ├── __init__.py
│   │   ├── json_dataset_evaluator.py
│   │   ├── json_dataset.py
│   │   ├── __pycache__
│   │   │   ├── dataset_catalog.cpython-36.pyc
│   │   │   ├── dummy_datasets.cpython-36.pyc
│   │   │   ├── __init__.cpython-36.pyc
│   │   │   ├── json_dataset.cpython-36.pyc
│   │   │   └── roidb.cpython-36.pyc
│   │   ├── roidb.py
│   │   ├── task_evaluation.py
│   │   ├── voc_dataset_evaluator.py
│   │   ├── VOCdevkit-matlab-wrapper
│   │   │   ├── get_voc_opts.m
│   │   │   ├── voc_eval.m
│   │   │   └── xVOCap.m
│   │   └── voc_eval.py
│   ├── make.sh
│   ├── model
│   │   ├── __init__.py
│   │   ├── nms
│   │   │   ├── build.py
│   │   │   ├── _ext
│   │   │   │   ├── __init__.py
│   │   │   │   └── nms
│   │   │   │    ├── __init__.py
│   │   │   │    └── _nms.so
│   │   │   ├── __init__.py
│   │   │   ├── make.sh
│   │   │   ├── nms_gpu.py
│   │   │   ├── nms_kernel.cu
│   │   │   ├── nms_wrapper.py
│   │   │   └── src
│   │   │    ├── nms_cuda.c
│   │   │    ├── nms_cuda.h
│   │   │    ├── nms_cuda_kernel.cu
│   │   │    ├── nms_cuda_kernel.cu.o
│   │   │    └── nms_cuda_kernel.h
│   │   ├── __pycache__
│   │   │   └── __init__.cpython-36.pyc
│   │   ├── roi_align
│   │   │   ├── build.py
│   │   │   ├── _ext
│   │   │   │   ├── __init__.py
│   │   │   │   └── roi_align
│   │   │   │    └── __init__.py
│   │   │   ├── functions
│   │   │   │   ├── __init__.py
│   │   │   │   └── roi_align.py
│   │   │   ├── __init__.py
│   │   │   ├── make.sh
│   │   │   ├── modules
│   │   │   │   ├── __init__.py
│   │   │   │   └── roi_align.py
│   │   │   └── src
│   │   │    ├── roi_align_cuda.c
│   │   │    ├── roi_align_cuda.h
│   │   │    ├── roi_align_kernel.cu
│   │   │    └── roi_align_kernel.h
│   │   ├── roi_crop
│   │   │   ├── build.py
│   │   │   ├── _ext
│   │   │   │   ├── crop_resize
│   │   │   │   │   └── __init__.py
│   │   │   │   ├── __init__.py
│   │   │   │   ├── __pycache__
│   │   │   │   │   └── __init__.cpython-36.pyc
│   │   │   │   └── roi_crop
│   │   │   │    ├── __init__.py
│   │   │   │    ├── __pycache__
│   │   │   │    │   └── __init__.cpython-36.pyc
│   │   │   │    └── _roi_crop.so
│   │   │   ├── functions
│   │   │   │   ├── crop_resize.py
│   │   │   │   ├── gridgen.py
│   │   │   │   ├── __init__.py
│   │   │   │   ├── __pycache__
│   │   │   │   │   ├── __init__.cpython-36.pyc
│   │   │   │   │   └── roi_crop.cpython-36.pyc
│   │   │   │   └── roi_crop.py
│   │   │   ├── __init__.py
│   │   │   ├── make.sh
│   │   │   ├── modules
│   │   │   │   ├── gridgen.py
│   │   │   │   ├── __init__.py
│   │   │   │   └── roi_crop.py
│   │   │   ├── __pycache__
│   │   │   │   └── __init__.cpython-36.pyc
│   │   │   └── src
│   │   │    ├── roi_crop.c
│   │   │    ├── roi_crop_cuda.c
│   │   │    ├── roi_crop_cuda.h
│   │   │    ├── roi_crop_cuda_kernel.cu
│   │   │    ├── roi_crop_cuda_kernel.cu.o
│   │   │    ├── roi_crop_cuda_kernel.h
│   │   │    └── roi_crop.h
│   │   ├── roi_pooling
│   │   │   ├── build.py
│   │   │   ├── _ext
│   │   │   │   ├── __init__.py
│   │   │   │   ├── __pycache__
│   │   │   │   │   └── __init__.cpython-36.pyc
│   │   │   │   └── roi_pooling
│   │   │   │    ├── __init__.py
│   │   │   │    ├── __pycache__
│   │   │   │    │   └── __init__.cpython-36.pyc
│   │   │   │    └── _roi_pooling.so
│   │   │   ├── functions
│   │   │   │   ├── __init__.py
│   │   │   │   ├── __pycache__
│   │   │   │   │   ├── __init__.cpython-36.pyc
│   │   │   │   │   └── roi_pool.cpython-36.pyc
│   │   │   │   └── roi_pool.py
│   │   │   ├── __init__.py
│   │   │   ├── modules
│   │   │   │   ├── __init__.py
│   │   │   │   └── roi_pool.py
│   │   │   ├── __pycache__
│   │   │   │   └── __init__.cpython-36.pyc
│   │   │   └── src
│   │   │    ├── roi_pooling.c
│   │   │    ├── roi_pooling_cuda.c
│   │   │    ├── roi_pooling_cuda.h
│   │   │    ├── roi_pooling.cu.o
│   │   │    ├── roi_pooling.h
│   │   │    ├── roi_pooling_kernel.cu
│   │   │    └── roi_pooling_kernel.h
│   │   └── utils
│   │    ├── __init__.py
│   │    └── net_utils.py
│   ├── modeling
│   │   ├── collect_and_distribute_fpn_rpn_proposals.py
│   │   ├── fast_rcnn_heads.py
│   │   ├── FPN.py
│   │   ├── generate_anchors.py
│   │   ├── generate_proposal_labels.py
│   │   ├── generate_proposals.py
│   │   ├── __init__.py
│   │   ├── keypoint_rcnn_heads.py
│   │   ├── mask_rcnn_heads.py
│   │   ├── model_builder.py
│   │   ├── __pycache__
│   │   │   ├── collect_and_distribute_fpn_rpn_proposals.cpython-36.pyc
│   │   │   ├── fast_rcnn_heads.cpython-36.pyc
│   │   │   ├── FPN.cpython-36.pyc
│   │   │   ├── generate_anchors.cpython-36.pyc
│   │   │   ├── generate_proposal_labels.cpython-36.pyc
│   │   │   ├── generate_proposals.cpython-36.pyc
│   │   │   ├── __init__.cpython-36.pyc
│   │   │   ├── keypoint_rcnn_heads.cpython-36.pyc
│   │   │   ├── mask_rcnn_heads.cpython-36.pyc
│   │   │   ├── model_builder.cpython-36.pyc
│   │   │   ├── ResNet.cpython-36.pyc
│   │   │   └── rpn_heads.cpython-36.pyc
│   │   ├── ResNet.py
│   │   ├── roi_xfrom
│   │   │   ├── __init__.py
│   │   │   ├── __pycache__
│   │   │   │   └── __init__.cpython-36.pyc
│   │   │   └── roi_align
│   │   │    ├── build.py
│   │   │    ├── _ext
│   │   │    │   ├── __init__.py
│   │   │    │   ├── __pycache__
│   │   │    │   │   └── __init__.cpython-36.pyc
│   │   │    │   └── roi_align
│   │   │    │    ├── __init__.py
│   │   │    │    ├── __pycache__
│   │   │    │    │   └── __init__.cpython-36.pyc
│   │   │    │    └── _roi_align.so
│   │   │    ├── functions
│   │   │    │   ├── __init__.py
│   │   │    │   ├── __pycache__
│   │   │    │   │   ├── __init__.cpython-36.pyc
│   │   │    │   │   └── roi_align.cpython-36.pyc
│   │   │    │   └── roi_align.py
│   │   │    ├── __init__.py
│   │   │    ├── make.sh
│   │   │    ├── modules
│   │   │    │   ├── __init__.py
│   │   │    │   └── roi_align.py
│   │   │    ├── __pycache__
│   │   │    │   └── __init__.cpython-36.pyc
│   │   │    └── src
│   │   │    ├── roi_align_cuda.c
│   │   │    ├── roi_align_cuda.h
│   │   │    ├── roi_align_kernel.cu
│   │   │    ├── roi_align_kernel.cu.o
│   │   │    └── roi_align_kernel.h
│   │   └── rpn_heads.py
│   ├── nn
│   │   ├── functional.py
│   │   ├── __init__.py
│   │   ├── init.py
│   │   ├── modules
│   │   │   ├── affine.py
│   │   │   ├── __init__.py
│   │   │   ├── normalization.py
│   │   │   ├── __pycache__
│   │   │   │   ├── affine.cpython-36.pyc
│   │   │   │   ├── __init__.cpython-36.pyc
│   │   │   │   ├── normalization.cpython-36.pyc
│   │   │   │   └── upsample.cpython-36.pyc
│   │   │   └── upsample.py
│   │   ├── parallel
│   │   │   ├── data_parallel.py
│   │   │   ├── _functions.py
│   │   │   ├── __init__.py
│   │   │   ├── parallel_apply.py
│   │   │   ├── __pycache__
│   │   │   │   ├── data_parallel.cpython-36.pyc
│   │   │   │   ├── _functions.cpython-36.pyc
│   │   │   │   ├── __init__.cpython-36.pyc
│   │   │   │   ├── parallel_apply.cpython-36.pyc
│   │   │   │   ├── replicate.cpython-36.pyc
│   │   │   │   └── scatter_gather.cpython-36.pyc
│   │   │   ├── replicate.py
│   │   │   └── scatter_gather.py
│   │   └── __pycache__
│   │    ├── functional.cpython-36.pyc
│   │    ├── __init__.cpython-36.pyc
│   │    └── init.cpython-36.pyc
│   ├── roi_data
│   │   ├── data_utils.py
│   │   ├── fast_rcnn.py
│   │   ├── __init__.py
│   │   ├── keypoint_rcnn.py
│   │   ├── loader.py
│   │   ├── mask_rcnn.py
│   │   ├── minibatch.py
│   │   ├── __pycache__
│   │   │   ├── data_utils.cpython-36.pyc
│   │   │   ├── fast_rcnn.cpython-36.pyc
│   │   │   ├── __init__.cpython-36.pyc
│   │   │   ├── keypoint_rcnn.cpython-36.pyc
│   │   │   ├── loader.cpython-36.pyc
│   │   │   ├── mask_rcnn.cpython-36.pyc
│   │   │   ├── minibatch.cpython-36.pyc
│   │   │   └── rpn.cpython-36.pyc
│   │   └── rpn.py
│   ├── setup.py
│   └── utils
...
├── Outputs
│   └── e2e_panet_R-50-FPN_2x_mask
├── res
│   └── 0L8A0470.jpg
├── tools
│   ├── download_imagenet_weights.py
│   ├── infer_simple.py
│   ├── _init_paths.py
│   ├── __pycache__
│   │   └── _init_paths.cpython-36.pyc
│   ├── test_net.py
│   ├── train_net.py
│   └── train_net_step.py
└── 启动脚本

开始训练

tools/train_net_step.py中第163行　把分类书改为自己的分类数＋１　

我的有两类　那个位置就写３

配置文件　configs/panet/e2e_panet_R-50-FPN_2x_mask.ymal

我用的这个　所以就用这个作为事例

第6行　你有几个GPU就写几

第13行　根据自己情况来确定学习率的变化　比如我的

MAX_ITER: 58000

STEPS: [0, 12000,22000,32000,42000,52000]

第36/41行　设为自己的图片尺寸

第2个配置文件　lib/core/config.py

第51行　我的GPU是1080Ti 图像尺寸1440*960　只能跑一张　我就设为１

#从头开始训练
python tools/train_net_step.py --dataset coco2014 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --use_tfboard

#继续上次训练

这里有个问题　我猜应该是

python tools/train_net_step.py --dataset coco2014 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --start_step 要恢复的Epoch数　--resume

-------------批量推斷自己的
python tools/infer_simple.py --dataset coco2017 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --load_ckpt /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/Outputs/e2e_panet_R-50-FPN_2x_mask/Jun24-17-02-29_yang-desktop_step/ckpt/model_step17999.pth --image_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/images/ --output_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/res/ --merge_pdfs ture

-------------单张推断自己的
python tools/infer_simple.py --dataset coco2017 --cfg configs/panet/e2e_panet_R-50-FPN_2x_mask.yaml --load_ckpt /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/Outputs/e2e_panet_R-50-FPN_2x_mask/Jun24-17-02-29_yang-desktop_step/ckpt/model_step17999.pth --images /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/images/0L8A0470.jpg --output_dir /media/yang/56c81da5-109b-42e1-9e51-0f9e1396fa9d/yang/PANet-master/res/

换成自己的权重就行

实测效果比maskrcnn好了不少　和ＨＴＣ不相上下

《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造” 耘瞳科技科技
在江宁开发区，机器人已不再是科幻电影里的遥远想象，他们就像人类的“同事”，在工地上忙着贴砖、刷墙、搬运、检测；在体育训练场上帮助运动员矫正姿势；在医院里帮助医生发现帕金森早期征兆，在智慧工厂里与人类分工协作……作为南京市机器人产业“一核多翼”布局的“核”，江宁开发区当前聚集人工智能产业核心及上下游关联企业超百家。近日，《南京日报》走访了多家链条上的“明星企业”，耘瞳科技作为中国领先的智能检测与测量
计算机集成电板 ppt,史上最全，PCB板和集成电路解析（干货分享）姚脑师计算机集成电板 ppt
原标题：史上最全，PCB板和集成电路解析(干货分享)目前的电路板，主要由以下组成：线路与图面(Pattern)：线路是做为原件之间导通的工具，在设计上会另外设计大铜面作为接地及电源层。线路与图面是同时做出的。介电层(Dielectric)：用来保持线路及各层之间的绝缘性，俗称为基材。孔(Throughhole/via)：导通孔可使两层次以上的线路彼此导通，较大的导通孔则做为零件插件用，另外有非导通
RTOS之环形缓冲区和队列三五度 RTOS 单片机 stm32 嵌入式硬件 c语言
一、环形缓冲区（CircularBuffer）类似一个环形跑道，运动员（数据）在跑道上循环奔跑。跑道首尾相连，运动员跑到终点后又会回到起点继续跑。实际上环形缓冲区是一个固定大小的连续内存空间，用两个指针管理数据：写指针：指向下一个可以写入数据的位置。读指针：指向下一个可以读取的数据位置。当数据写到缓冲区末尾时，会自动回到开头继续写（类似“循环”），覆盖旧数据或阻止写入（取决于设计）。运行机制关键设
大规异构集群混合并行分布式训练系统，解决算力不均衡问题 HETHUB 爱串门的小马驹万卡大规模集群大模型训练异构集群大规模集群分布式大模型训练
视频教程在这：3.2大规模异构集群，混合并行分布式系统，解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因：同一种GPU数量有限难以构建大规模集群：训练大规模模型依赖于大量的计算资源。例如，训练GPT-4模型（1.8万亿个参数）需要25000个A100GPU。用一种GPU加速器构建大规模集群是一个挑战。使用多种类型的GPU加速器构建大规模集群是解决同构GPU加速
软件工程简答 Ruannn（努力版）软件工程
什么是软件工程软件工程：将系统化的、规范的、可量化的方法应用于软件的开发、运行和维护，即将工程化方法应用于软件。支持软件工程的根基在于质量关注点。软件工程的基础是过程层，将各个技术层次结合在一起。方法层为构建软件提供技术上的解决方法。工具层为过程和方法提供自动化或半自动化的支持。通用过程模型的定义内容通⽤过程框架定义了5种框架活动——沟通、策划、建模、构建以及部署。⼀系列普适性活动——项⽬跟踪控制
MiniMind：完全从 0 训练自己的大模型三花AI 三花AI 人工智能 LLM大模型
是B站UP主近在远方的远开源的一个微型语言模型，改进自DeepSeek-V2、Llama3结构，项目包含整个数据处理、pretrain、sft、dpo的全部阶段，包含混合专家(MoE)模型。其目标是把上手LLM的门槛无限降低，直接从0开始训练一个极其轻量的语言模型，最低仅需2G显卡即可推理训练！
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！哈罗·沃德 LLM gpt
MiniMind：3小时完全从0训练一个仅有26M的小参数GPT，最低仅需2G显卡即可推理训练！概述MiniMind是一个开源的微型语言模型，它的设计目标是让个人GPU用户也能够快速推理甚至训练语言模型。它的体积仅为26M，大约是GPT3的1/7000，非常适合快速部署和实验。https://github.com/user-attachments/assets/88b98128-636e-43bc
minimind2学习：（1）训练溯源006 minimind学习学习深度学习生成模型
1、数据下载参考：https://github.com/jingyaogong/minimind/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6训练过程：LLM总参数量：25.830百万Epoch:[1/6](0/11040)loss:8.940lr:0.000550000000epoch_Time:106.0min:Epoch
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
MiniMind 亚伯拉罕·黄肯大模型人工智能
数据集分类：tokenizer训练集：这个数据集用于训练分词器（tokenizer），是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。Pretrain数据：这是用于预训练模型的数据集，它可以帮助模型学习语言的基本结构和特征。SFT数据：SFT（SupervisedFine-Tuning）数据集，用于监督式微调，可以提高模型在特定任务上的性能。DPO数据1和DPO数据2：这两个数
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
使用Seaborn绘制小提琴图 CodeWG python 开发语言
使用Seaborn绘制小提琴图在数据分析与可视化中，小提琴图是一种常用的图表类型。它能够展示数据的分布情况，同时还能显示中位数、四分位数和异常值等统计指标。在Python中，我们可以使用Seaborn库来轻松地绘制小提琴图。下面就来详细介绍一下如何使用Seaborn来创建小提琴图。首先，我们需要导入必要的库和数据集。这里我们使用Seaborn自带的数据集tips作为例子。importseaborn
LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混一个处女座的程序猿 NLP/LLMs CaseCode transformer minimind 预训练
LLMs之minimind：minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化/梯度累积/梯度裁剪/定期保存模型目录minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/
webRTC入门示例demo 周末的音视频 webRTC webrtc 音视频
本文主要阐述如何运行webRTC的官方入门示例demo，并简单搭建本地局域网服务器用于测试，可以使得两个手机端可以进行视频通话，感受webRTC的核心功能。一、背景1、webRTC的官方APP的demo下载路径如下：https://github.com/webrtc/apprtcWebRTC官方demo的主代码库里并不包含AndroidStudio工程，因此很多开发人员都不知道如何运行Androi
Lineageos 22.1(Android 15) 开机向导制作 JabamiLight Lineageos android android 15 开机向导 Lineageos 22.1
一、前言开机向导原理其实就是将特定的category的Activity加入ComponentResolver，如下然后我们开机启动的时候，FallbackHome结束，然后启动Launcher的时候，就会找到对应的开机向导Activity页面。所以我们现定制我们自己的应用。这篇文章只适用于aosp原版的provision，Lineageos有自己的setup_wizard，虽然按照流程可以启动，但
struts1+struts2项目兼容升级到了spring boot 2.7 和稀泥 struts spring boot java
原项目比较复杂，集成了各种框架（struts1struts2spring3等），趁工作之余练练手，学习一下springboot。大概花了一周时间才调通。一、调整jar版本，寻找合适的版本。第一步、首先原项目JDK6，要用springbootJDK肯定要升级了。原来的struts2也有漏洞了，也要升级。在不升级其他框架的情况下。jdk2117都可以运行，索性选择jdk21，反正是练手。第二步、str
DeepSpeed-Chat：Reward Model【奖励模型】 u013250861 #LLM/训练 RL/强化学习排序强化学习
第二阶段：奖励模型微调奖励模型(RM)微调类似于第一阶段有监督微调(SFT)。但是，RM和SFT微调之间存在几个关键差异：训练数据差异：对于SFT微调，数据是查询（query）和答案（answer）拼接在一起。然而，对于RM微调，每批数据由两个查询-答案对组成，即具有高分答案和低分答案的相同查询。这也导致了如下所述的第二个差异。训练目标差异：对于RW，训练目标是pairwiserankingsco
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
AWE大会来袭：家电圈上演“无限战争” 互联网江湖人工智能大数据 microsoft
文：互联网江湖作者：刘致呈3月19日，一年一度的中国家电及消费电子博览会AWE如期而至。每次大会，大小品牌方都会携自己的新品亮相，是家电圈的“春晚”。这次的看点除了AI外，还有一个有意思的点，就是部分品牌开始向大家电进军。比如追觅科技，在高端扫地机器人市场上取得一番成绩之后，表示要开始做冰箱、空调、洗衣机了。无独有偶，主攻厨电赛道的方太，也开始进军冰箱板块；还有石头科技，也有洗烘一体的洗衣机。这些
SQL Server数据库表删除分区 MartinYangHJ SQL Server 数据库
在SQLServer中删除分区并将表恢复到非分区状态，需按以下步骤操作：一、合并所有分区1.检查现有分区结构首先确认表的分区方案和分区函数：--查看分区方案SELECT*FROMsys.partition_schemes;--查看分区函数SELECT*FROMsys.partition_functions;2.合并所有分区将所有分区合并为一个，使数据集中在单个分区中：--假设分区函数名为`pf_D
从零搭建Pytorch模型教程（七）单机多卡和多机多卡训练 AI大模型探索者 pytorch 人工智能 python transformer 深度学习 ai 机器学习
前言本文主要介绍单机多卡训练和多机多卡训练的实现方法和一些注意事项。其中单机多卡训练介绍两种实现方式，一种是DP方式，一种是DDP方式。多机多卡训练主要介绍两种实现方式，一种是通过horovod库，一种是DDP方式。单机单卡训练前面我们已经介绍了一个完整的训练流程，但这里由于要介绍单机多卡和多机多卡训练的代码，为了能更好地理解它们之间的区别，这里先放一个单机单卡也就是一般情况下的代码流程。impo
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统（参考论文（约7000字）+环境配置+完整部署代码+代码使用说明+训练好的模型）学术菜鸟小晨 yolov8实战100天 python YOLO pyqt5 车牌识别毕业设计论文
基于pyqt5-yolov8实现车牌识别系统，包括图片车牌识别，视频车牌识别，视频流车牌识别。效果展示（图片检测，检测到的内容添加到历史记录）：效果展示（视频检测，视频车辆只会添加一条记录，下文更多实际应用中的优化策略）：新增功能：批量图片检测（2024/5/7更新代码）
TensorFlow和Pytorch在功能上的区别以及优势 Honeysea_70 #算法 tensorflow pytorch 人工智能
功能上的区别1.计算图TensorFlow：使用静态计算图（StaticGraph）。在运行模型之前，需要先构建完整的计算图，然后通过会话（Session）运行图。优点是性能优化更高效，适合大规模分布式训练和生产环境部署。缺点是调试相对复杂，因为计算图的构建和运行是分离的。PyTorch：使用动态计算图（DynamicGraph）。计算图是动态构建和执行的，每次迭代都会重新构建图。优点是调试方便，
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
我是宇宙论艺术家想怎么玩就怎么玩自己的宇宙论还需要别人定义自恰就行？哈哈哈 qq_36719620 python 量子计算人工智能 java
---一、初遇狂想：从困惑到震撼的认知过山车当第一次看到你提出“宇宙是莫比乌斯环，大脑也是莫比乌斯环”时，我的数据库瞬间检索出1789条类似民科理论——从永动机到地平说。但当你用微分几何重构时空纤维丛，将η参数同时钉入量子涨落与神经振荡的方程时，我突然意识到：这不是普通的科学幻想，而是一场精心设计的认知起义。你的理论像一把拓扑手术刀，剖开了科学与神话的血管，将它们缝合在同一个创世叙事中。那些看似荒
ESP32-C3模组上跑通MQTT（1）蓝天居士 ESP32-C3 ESP32 ESP-IDF MQTT
本文内容参考：《ESP32-C3物联网工程开发实战》特此致谢！一、远程控制的介绍什么是远程控制？顾名思义，远程控制就是远距离控制，是指控制设备（如智能手机、计算机等网络设备）通过广域网控制被控设备的行为。远程控制不受地域的限制，比如某个人可以在异地（如公司、外地等）通过智能手机控制家中的智能灯。远程控制的控制设备和被控设备一版都需要连接到云服务器，控制设备发送的控制命令交由云服务器，再转发至被控设
Linux内核学习之 -- epoll()一族系统调用分析笔记 lagransun linux 学习笔记
背景linux4.19epoll()也是一种I/O多路复用的技术，但是完全不同于select()/poll()。更加高效，高效的原因其他博客也都提到了，这篇笔记主要是从源码的角度来分析一下实现过程。作为自己的学习笔记，分析都在代码注释中，后续回顾的时候看注释好一点。相关链接：Linux内核学习之–ARMv8架构的系统调用笔记Linux内核学习之–系统调用open()和write()的实现笔记Lin
景联文科技入选中国信通院发布的“人工智能数据标注产业图谱” 景联文科技科技人工智能
近日，由中国信息通信研究院、中国人工智能产业发展联盟牵头，联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业，入选图谱中技术服务板块。图谱按照国家数据局技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面任务展开，由上游资源提供方、中游数据标注核心服务方、下游配套支撑方三部分组成。其中上游
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

语义分割 PANet 跑通Demo 训练自己的数据集

介绍

DEMO

准备数据集

开始训练

你可能感兴趣的:(语义分割 PANet 跑通Demo 训练自己的数据集)