算法恩仇录

工业视觉钢材缺陷检测实战项目

工业视觉钢材缺陷检测实战项目

项目背景概述

质量是制造企业的核心竞争力之一，企业对产品质量的要求越来越高。但是，产品在制造过程中有时会出现表面缺陷，如何进行高效的质量控制来避免表面瑕疵产生，一直是制造企业面临的棘手问题之一。

传统主要通过人工抽检进行检测，由于抽检率低、实时性差，且受检测人员经验、疲劳状态等主观因素影响，往往检测结果稳定性不高，准确性无法保障，易出现瑕疵漏检等情况，难以适应高效的生产和质量要求。

随着数智技术发展，基于机器视觉的表面缺陷检测应用得以在实践中展开，大大提高了产线品控效率，避免了因作业条件、主观判断等因素影响检测结果的准确性和稳定性，在产品制造过程中，可以实现对每一环节、每一件产品表面缺陷的实时检测，更精确、快速的识别产品表面瑕疵缺陷，同时也节省了制造企业在质检环节的人工投入，降低了人力成本支出。目前在新能源、汽车、电子、包装、印刷、化工、食品、塑胶、纺织等制造领域广泛应用。

解决思路

从零搭建一个基于深度学习的缺陷检测系统：通过喂给神经网络大量的历史缺陷数据集，进行模型训练，最终使用深度学习模型进行实时工业产品缺陷检测。

更多请查看：
工业缺陷检测场景简介

代码实战：YOLOv5实现钢材表面缺陷检测

针对钢材缺陷检测任务，将使用 Yolo V5 对数据集的图像进行检测。下载 Yolo V5 的 github 源码，配置好数据集。

源码地址：https://github.com/ultralytics/yolov5

YOLOv5 是 You Only Look Once (YOLO) 计算机视觉模型系列中的一个模型。YOLOv5 通常用于检测物体。YOLOv5 有四个主要版本：小型 (s)、中型 (m)、大型 (l) 和超大型 (x)，每个版本都提供更高的准确率。每个变体也需要不同的时间来训练。

在上图中，您可以看到 YOLOv5 的所有变体训练速度都比 EfficientDet 快。最准确的 YOLOv5 模型 YOLOv5x 可以比 EfficientDet D4 模型以相似的准确度更快地处理图像。

YOLO 模型是第一个将边界框预测过程与端到端可微网络中的类标签连接起来的对象检测器。

YOLOv5 架构概述

YOLOv5 是从输入图像中创建特征，然后将这些特征输入预测系统，系统预测对象的位置，并在周围绘制框，并预测它们的类别。

YOLO 网络由三个主要部分组成。

1. Backbone: New CSP-Darknet53
1. Neck: SPPF, New CSP-PAN
1. Head: YOLOv3 Head

关于 YOLO 更多内容可查看以下文章:

YOLOv4

YOLOv5

查看数据集

由东北大学（NEU）发布的表面缺陷数据库，收集了热轧钢带的六种典型表面缺陷，即轧制氧化皮（RS），斑块（Pa），开裂（Cr），点蚀表面（ PS），内含物（In）和划痕（Sc）。该数据库包括1,800个灰度图像：六种不同类型的典型表面缺陷，每一类缺陷包含300个样本。

对于缺陷检测任务，数据集提供了注释，指示每个图像中缺陷的类别和位置。对于每个缺陷，黄色框是指示其位置的边框，绿色标签是类别分数。

数据集

随机查看四张图片
训练集图片数量
测试集图片数量

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import os
from matplotlib import pyplot as plt 
import cv2 as cv

train_image_path = '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/images'
valid_image_path = '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid/images'

train_dir = os.listdir(train_image_path)
valid_dir = os.listdir(valid_image_path)

print('训练集数量', len(train_dir))
print('测试集数量', len(valid_dir))

训练集数量 1740
测试集数量 60

标签情况：
[‘crazing’,
‘inclusion’,
‘patches’,
‘pitted_surface’,
‘rolled-in_scale’,
‘scratches’]

fig,ax = plt.subplots(1,4,figsize=(10,5))
image = cv.imread(os.path.join(valid_image_path,"crazing_10.jpg"))
ax[0].imshow(image)
image = cv.imread(os.path.join(valid_image_path,"inclusion_10.jpg"))
ax[1].imshow(image)
image = cv.imread(os.path.join(valid_image_path,"patches_10.jpg"))
ax[2].imshow(image)
image = cv.imread(os.path.join(valid_image_path,"scratches_10.jpg"))
ax[3].imshow(image)
fig.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gLji5tzU-1680494033696)(output_3_0.png)]

创建系统文件

!ls

__notebook_source__.ipynb

下载 YoloV5

# Download YOLOv5
!git clone https://github.com/ultralytics/yolov5  # clone repo
    
%cd yolov5
# Install dependencies

%pip install -qr requirements.txt  # install dependencies
!ls

import torch
print(f"Setup complete. Using torch {torch.__version__} ({torch.cuda.get_device_properties(0).name if torch.cuda.is_available() else 'CPU'})")

Cloning into 'yolov5'...
remote: Enumerating objects: 15123, done.[K
remote: Counting objects: 100% (78/78), done.[K
remote: Compressing objects: 100% (66/66), done.[K
remote: Total 15123 (delta 42), reused 33 (delta 12), pack-reused 15045[K
Receiving objects: 100% (15123/15123), 14.19 MiB | 9.17 MiB/s, done.
Resolving deltas: 100% (10359/10359), done.
/kaggle/working/yolov5
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
tensorflow-io 0.21.0 requires tensorflow-io-gcs-filesystem==0.21.0, which is not installed.
dask-cudf 21.10.1 requires cupy-cuda114, which is not installed.
beatrix-jupyterlab 3.1.7 requires google-cloud-bigquery-storage, which is not installed.
tensorflow 2.6.4 requires h5py~=3.1.0, but you have h5py 3.8.0 which is incompatible.
tensorflow 2.6.4 requires numpy~=1.19.2, but you have numpy 1.21.6 which is incompatible.
tensorflow 2.6.4 requires typing-extensions<3.11,>=3.7, but you have typing-extensions 4.1.1 which is incompatible.
tensorflow-transform 1.9.0 requires tensorflow!=2.0.*,!=2.1.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,<2.10,>=1.15.5, but you have tensorflow 2.6.4 which is incompatible.
tensorflow-serving-api 2.9.0 requires tensorflow<3,>=2.9.0, but you have tensorflow 2.6.4 which is incompatible.
gcsfs 2022.5.0 requires fsspec==2022.5.0, but you have fsspec 2023.1.0 which is incompatible.
dask-cudf 21.10.1 requires dask==2021.09.1, but you have dask 2022.2.0 which is incompatible.
dask-cudf 21.10.1 requires distributed==2021.09.1, but you have distributed 2022.2.0 which is incompatible.[0m[31m
[0m[33mWARNING: Running pip as the 'root' user can result in broken permissions and conflicting behaviour with the system package manager. It is recommended to use a virtual environment instead: https://pip.pypa.io/warnings/venv[0m[33m
[0mNote: you may need to restart the kernel to use updated packages.
CITATION.cff	 README.zh-CN.md  detect.py   requirements.txt	tutorial.ipynb
CONTRIBUTING.md  benchmarks.py	  export.py   segment		utils
LICENSE		 classify	  hubconf.py  setup.cfg		val.py
README.md	 data		  models      train.py
Setup complete. Using torch 1.11.0 (Tesla P100-PCIE-16GB)

配置 YAML 文件

训练集图片和标签的地址
验证图片和标签的地址
类别数量
类别名称

# Create .yaml file 
import yaml

data_yaml = dict(
    train = '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/train',
    val = '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid',
    nc = 6,
    names = ['crazing', 'inclusion', 'patches', 'pitted_surface', 'rolled-in_scale', 'scratches']
)

# creating the file in the yolov5/data.yaml directory

with open('data.yaml', 'w') as outfile:
    yaml.dump(data_yaml, outfile, default_flow_style=True)

!ls

CITATION.cff	 README.zh-CN.md  data.yaml   models		train.py
CONTRIBUTING.md  benchmarks.py	  detect.py   requirements.txt	tutorial.ipynb
LICENSE		 classify	  export.py   segment		utils
README.md	 data		  hubconf.py  setup.cfg		val.py

训练 Yolov5 模型

!wandb disabled
# -- img
!python train.py --img 640 --batch 16 --epochs 70 --data ./data.yaml --weights yolov5n.pt

W&B disabled.
[34m[1mwandb[0m: WARNING ⚠️ wandb is deprecated and will be removed in a future release. See supported integrations at https://github.com/ultralytics/yolov5#integrations.
[34m[1mtrain: [0mweights=yolov5n.pt, cfg=, data=./data.yaml, hyp=data/hyps/hyp.scratch-low.yaml, epochs=70, batch_size=16, imgsz=640, rect=False, resume=False, nosave=False, noval=False, noautoanchor=False, noplots=False, evolve=None, bucket=, cache=None, image_weights=False, device=, multi_scale=False, single_cls=False, optimizer=SGD, sync_bn=False, workers=8, project=runs/train, name=exp, exist_ok=False, quad=False, cos_lr=False, label_smoothing=0.0, patience=100, freeze=[0], save_period=-1, seed=0, local_rank=-1, entity=None, upload_dataset=False, bbox_interval=-1, artifact_alias=latest
[34m[1mgithub: [0mup to date with https://github.com/ultralytics/yolov5 ✅
YOLOv5  v7.0-97-gfa4bdbe Python-3.7.12 torch-1.11.0 CUDA:0 (Tesla P100-PCIE-16GB, 16281MiB)

[34m[1mhyperparameters: [0mlr0=0.01, lrf=0.01, momentum=0.937, weight_decay=0.0005, warmup_epochs=3.0, warmup_momentum=0.8, warmup_bias_lr=0.1, box=0.05, cls=0.5, cls_pw=1.0, obj=1.0, obj_pw=1.0, iou_t=0.2, anchor_t=4.0, fl_gamma=0.0, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, degrees=0.0, translate=0.1, scale=0.5, shear=0.0, perspective=0.0, flipud=0.0, fliplr=0.5, mosaic=1.0, mixup=0.0, copy_paste=0.0
[34m[1mClearML: [0mrun 'pip install clearml' to automatically track, visualize and remotely train YOLOv5  in ClearML
[34m[1mComet: [0mrun 'pip install comet_ml' to automatically track and visualize YOLOv5  runs in Comet
[34m[1mTensorBoard: [0mStart with 'tensorboard --logdir runs/train', view at http://localhost:6006/
Downloading https://ultralytics.com/assets/Arial.ttf to /root/.config/Ultralytics/Arial.ttf...
100%|█████████████████████████████████████████| 755k/755k [00:00<00:00, 115MB/s]
Downloading https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5n.pt to yolov5n.pt...
100%|██████████████████████████████████████| 3.87M/3.87M [00:00<00:00, 19.4MB/s]

Overriding model.yaml nc=80 with nc=6

                 from  n    params  module                                  arguments                     
  0                -1  1      1760  models.common.Conv                      [3, 16, 6, 2, 2]              
  1                -1  1      4672  models.common.Conv                      [16, 32, 3, 2]                
  2                -1  1      4800  models.common.C3                        [32, 32, 1]                   
  3                -1  1     18560  models.common.Conv                      [32, 64, 3, 2]                
  4                -1  2     29184  models.common.C3                        [64, 64, 2]                   
  5                -1  1     73984  models.common.Conv                      [64, 128, 3, 2]               
  6                -1  3    156928  models.common.C3                        [128, 128, 3]                 
  7                -1  1    295424  models.common.Conv                      [128, 256, 3, 2]              
  8                -1  1    296448  models.common.C3                        [256, 256, 1]                 
  9                -1  1    164608  models.common.SPPF                      [256, 256, 5]                 
 10                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]              
 11                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']          
 12           [-1, 6]  1         0  models.common.Concat                    [1]                           
 13                -1  1     90880  models.common.C3                        [256, 128, 1, False]          
 14                -1  1      8320  models.common.Conv                      [128, 64, 1, 1]               
 15                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']          
 16           [-1, 4]  1         0  models.common.Concat                    [1]                           
 17                -1  1     22912  models.common.C3                        [128, 64, 1, False]           
 18                -1  1     36992  models.common.Conv                      [64, 64, 3, 2]                
 19          [-1, 14]  1         0  models.common.Concat                    [1]                           
 20                -1  1     74496  models.common.C3                        [128, 128, 1, False]          
 21                -1  1    147712  models.common.Conv                      [128, 128, 3, 2]              
 22          [-1, 10]  1         0  models.common.Concat                    [1]                           
 23                -1  1    296448  models.common.C3                        [256, 256, 1, False]          
 24      [17, 20, 23]  1     14883  models.yolo.Detect                      [6, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [64, 128, 256]]
Model summary: 214 layers, 1772035 parameters, 1772035 gradients, 4.2 GFLOPs

Transferred 343/349 items from yolov5n.pt
[34m[1mAMP: [0mchecks passed ✅
[34m[1moptimizer:[0m SGD(lr=0.01) with parameter groups 57 weight(decay=0.0), 60 weight(decay=0.0005), 60 bias
[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01), CLAHE(p=0.01, clip_limit=(1, 4.0), tile_grid_size=(8, 8))
[34m[1mtrain: [0mScanning /kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/labels... 1740 ima[0m
[34m[1mtrain: [0mWARNING ⚠️ /kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/images/crazing_120.jpg: 1 duplicate labels removed
[34m[1mtrain: [0mWARNING ⚠️ /kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/images/inclusion_62.jpg: 1 duplicate labels removed
[34m[1mtrain: [0mWARNING ⚠️ /kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/images/patches_198.jpg: 1 duplicate labels removed
[34m[1mtrain: [0mWARNING ⚠️ Cache directory /kaggle/input/neu-det-yolo/NEU-DET-YOLO/train is not writeable: [Errno 30] Read-only file system: '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/train/labels.cache.npy'
[34m[1mval: [0mScanning /kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid/labels... 60 images,[0m
[34m[1mval: [0mWARNING ⚠️ Cache directory /kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid is not writeable: [Errno 30] Read-only file system: '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid/labels.cache.npy'

[34m[1mAutoAnchor: [0m3.24 anchors/target, 0.989 Best Possible Recall (BPR). Current anchors are a good fit to dataset ✅
Plotting labels to runs/train/exp/labels.jpg... 
Image sizes 640 train, 640 val
Using 2 dataloader workers
Logging results to [1mruns/train/exp[0m
Starting training for 70 epochs...

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       0/69      1.97G    0.09443    0.03959    0.05022         55        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124    0.00296      0.481     0.0128    0.00385

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       1/69      2.35G    0.06365    0.04147    0.03278         53        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.289      0.184      0.155     0.0502

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       2/69      2.35G    0.05978    0.03654    0.01634         54        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.623      0.115      0.106     0.0314

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       3/69      2.35G    0.05594    0.03582   0.009596         61        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.354      0.183      0.137     0.0408

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       4/69      2.35G    0.05291    0.03502   0.008263         43        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.519      0.248      0.196     0.0832

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       5/69      2.35G     0.0503    0.03501   0.007264         59        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.53      0.489      0.446      0.171

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       6/69      2.35G    0.04788    0.03487   0.005603         64        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.676      0.244       0.37      0.155

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       7/69      2.35G    0.04748    0.03407   0.004983         49        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.389      0.463      0.436      0.166

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       8/69      2.35G    0.04573    0.03439   0.004757         42        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.661      0.394      0.451      0.194

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
       9/69      2.35G    0.04492    0.03452   0.005419         53        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.664      0.227       0.32      0.153

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      10/69      2.35G    0.04409    0.03477   0.004775         44        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.547      0.418      0.487       0.19

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      11/69      2.35G    0.04299    0.03376   0.004574         54        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.601      0.464      0.519      0.227

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      12/69      2.35G    0.04276    0.03345   0.004303         53        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.758      0.249      0.354      0.129

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      13/69      2.35G    0.04196    0.03305    0.00328         50        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.543      0.619      0.634      0.313

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      14/69      2.35G    0.04184    0.03385    0.00348         44        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.604       0.54      0.604      0.291

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      15/69      2.35G    0.04103    0.03317   0.003495         56        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.516        0.5      0.577      0.255

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      16/69      2.35G    0.04057    0.03466   0.003991         47        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.586      0.645      0.645      0.325

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      17/69      2.35G    0.04042    0.03322   0.003537         59        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.431      0.488      0.431      0.209

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      18/69      2.35G    0.04006    0.03223   0.003051         44        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.66      0.601       0.68      0.344

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      19/69      2.35G    0.04016    0.03271   0.003451         57        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.764      0.563      0.689      0.369

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      20/69      2.35G    0.03986    0.03239   0.003499         40        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.601      0.653      0.682      0.339

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      21/69      2.35G     0.0389    0.03197   0.002634         74        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.609      0.634      0.679       0.33

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      22/69      2.35G    0.03842    0.03221   0.002661         62        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.727      0.594      0.661      0.311

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      23/69      2.35G    0.03829    0.03186   0.002919         46        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.672      0.618      0.675      0.344

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      24/69      2.35G    0.03862    0.03224   0.003158         55        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.644      0.607      0.643      0.321

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      25/69      2.35G      0.038    0.03322   0.002688         59        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.52      0.459      0.542      0.244

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      26/69      2.35G    0.03716     0.0322   0.002437         56        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.666      0.611      0.682       0.33

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      27/69      2.35G    0.03762    0.03201   0.002927         57        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.621      0.718      0.698      0.367

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      31/69      2.35G    0.03674    0.03125   0.002392         50        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.573       0.65      0.697      0.352

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      32/69      2.35G    0.03653    0.03224   0.002655         54        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.57       0.65      0.639      0.322

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      33/69      2.35G    0.03657    0.03263   0.002156         43        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.625      0.655      0.669       0.36

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      34/69      2.35G    0.03644     0.0318   0.002517         79        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.673      0.628       0.65      0.315

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      35/69      2.35G    0.03589    0.03214   0.002322         57        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.697      0.634      0.678      0.368

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      36/69      2.35G    0.03553    0.03124   0.002237         52        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.702       0.66      0.701      0.369

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      37/69      2.35G    0.03639    0.03221   0.001992         64        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.643      0.697      0.672      0.356

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      38/69      2.35G    0.03528    0.03118   0.002051         53        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.658      0.631       0.67      0.352

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      39/69      2.35G    0.03554    0.03098   0.001782         42        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.641      0.659      0.703      0.337

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      40/69      2.35G    0.03527    0.03145   0.001548         49        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.672      0.679      0.721      0.374

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      41/69      2.35G    0.03571    0.03147   0.001659         58        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.728      0.617      0.702      0.377

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      42/69      2.35G    0.03504    0.03086   0.001852         48        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.669      0.626       0.68      0.369

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      43/69      2.35G    0.03468    0.03048   0.001757         52        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.66      0.609      0.654      0.328

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      44/69      2.35G     0.0349    0.03125   0.001606         55        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.672      0.646      0.699      0.346

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      48/69      2.35G    0.03405    0.03076   0.001546         56        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.707      0.639      0.707       0.37

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      49/69      2.35G     0.0346    0.03047   0.001458         58        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.734      0.639      0.711      0.369

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      50/69      2.35G    0.03389    0.03134   0.001409         66        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.627      0.704      0.716      0.397

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      51/69      2.35G    0.03325    0.03028   0.001466         56        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.687      0.628      0.703      0.372

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      52/69      2.35G    0.03395    0.03087   0.001405         55        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.643      0.713      0.738      0.405

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      53/69      2.35G    0.03332    0.03026   0.001586         76        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.721      0.634      0.713      0.385

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      54/69      2.35G    0.03341    0.03028    0.00154         50        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.631       0.66      0.695      0.354

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      55/69      2.35G    0.03331     0.0293    0.00161         52        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.702      0.669      0.728      0.392

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      56/69      2.35G    0.03322    0.03058   0.001471         61        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.633      0.748      0.729       0.41

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      57/69      2.35G    0.03292    0.03025   0.001636         63        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.739      0.675      0.737        0.4

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      58/69      2.35G    0.03289    0.03107   0.001286         53        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.606      0.689      0.699      0.383

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      59/69      2.35G    0.03278    0.03055   0.001203         58        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.62       0.68      0.703      0.378

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      64/69      2.35G    0.03166    0.02994   0.001321         67        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.68      0.707      0.727      0.398

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      65/69      2.35G    0.03225    0.03032  0.0009906         56        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.732      0.706      0.732      0.403

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      66/69      2.35G    0.03212    0.03041    0.00102         71        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.728      0.719      0.746      0.415

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      67/69      2.35G    0.03151    0.02948   0.001617         36        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.67      0.684      0.719      0.399

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      68/69      2.35G    0.03154    0.02955    0.00113         57        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.721      0.673      0.731      0.409

      Epoch    GPU_mem   box_loss   obj_loss   cls_loss  Instances       Size
      69/69      2.35G    0.03151    0.03004   0.001312         49        640: 1
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.673      0.677      0.743      0.411

70 epochs completed in 0.653 hours.
Optimizer stripped from runs/train/exp/weights/last.pt, 3.9MB
Optimizer stripped from runs/train/exp/weights/best.pt, 3.9MB

Validating runs/train/exp/weights/best.pt...
Fusing layers... 
Model summary: 157 layers, 1767283 parameters, 0 gradients, 4.2 GFLOPs
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.717      0.719      0.746      0.417
               crazing         60         18      0.617      0.278       0.44       0.12
             inclusion         60         27      0.448      0.571      0.505      0.234
               patches         60         26      0.836      0.923      0.913      0.593
        pitted_surface         60         14      0.943          1      0.995      0.771
       rolled-in_scale         60         19      0.751      0.842      0.838      0.412
             scratches         60         20      0.707        0.7      0.785      0.372
Results saved to [1mruns/train/exp[0m
[34m[1mwandb[0m: WARNING ⚠️ wandb is deprecated and will be removed in a future release. See supported integrations at https://github.com/ultralytics/yolov5#integrations.
Exception ignored in: 
Traceback (most recent call last):
  File "/opt/conda/lib/python3.7/site-packages/torch/utils/data/dataloader.py", line 1358, in __del__
  File "/opt/conda/lib/python3.7/site-packages/torch/utils/data/dataloader.py", line 1283, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status'
Exception ignored in: 
Traceback (most recent call last):
  File "/opt/conda/lib/python3.7/site-packages/torch/utils/data/dataloader.py", line 1358, in __del__
  File "/opt/conda/lib/python3.7/site-packages/torch/utils/data/dataloader.py", line 1283, in _shutdown_workers
AttributeError: 'NoneType' object has no attribute 'python_exit_status'

训练观察

# -- img
!python train.py --img 640 --batch 16 --epochs 60 --data ./data.yaml --weights yolov5n.pt

Model summary: 157 layers, 1767283 parameters, 0 gradients, 4.2 GFLOPs
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124       0.64      0.683      0.745       0.39
               crazing         60         18      0.625      0.278      0.544      0.175
             inclusion         60         27      0.444      0.563      0.553      0.255
               patches         60         26      0.639      0.886      0.895      0.548
        pitted_surface         60         14      0.867      0.931      0.986      0.711
       rolled-in_scale         60         19      0.623      0.737      0.737      0.315
             scratches         60         20      0.641        0.7      0.757      0.333

# -- img
!python train.py --img 640 --batch 16 --epochs 70 --data ./data.yaml --weights yolov5n.pt

Model summary: 157 layers, 1767283 parameters, 0 gradients, 4.2 GFLOPs
                 Class     Images  Instances          P          R      mAP50   
                   all         60        124      0.717      0.719      0.746      0.417
               crazing         60         18      0.617      0.278       0.44       0.12
             inclusion         60         27      0.448      0.571      0.505      0.234
               patches         60         26      0.836      0.923      0.913      0.593
        pitted_surface         60         14      0.943          1      0.995      0.771
       rolled-in_scale         60         19      0.751      0.842      0.838      0.412
             scratches         60         20      0.707        0.7      0.785      0.372

查看模型在验证集的效果

!ls
%cd runs

%cd train/exp

%ls

真实标签

val_batch1_labels_path = "/kaggle/working/yolov5/runs/train/exp/val_batch1_labels.jpg"
img = cv.imread(val_batch1_labels_path)
type(img)
plt.figure(figsize=(15, 15))
plt.imshow(img)

预测效果

val_batch1_pred_path = "/kaggle/working/yolov5/runs/train/exp/val_batch1_pred.jpg"
img = cv.imread(val_batch1_pred_path )
type(img)
plt.figure(figsize=(15, 15))
plt.imshow(img)

模型测试

%cd /kaggle/working/yolov5
%ls

!python detect.py --source /kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid/images/crazing_1.jpg --weights /kaggle/working/yolov5/runs/train/exp/weights/best.pt

%cd /kaggle/working/yolov5/runs/detect/exp/
%ls

crazing_1_path = "/kaggle/working/yolov5/runs/detect/exp/crazing_1.jpg"
img = cv.imread(crazing_1_path)
plt.imshow(img)

将预测结果变成 CSV 格式

竞赛需要提交 CSV 格式的文件

函数准备

确保 utils 文件夹在当前路径下

%cd /kaggle/working/yolov5
%ls

from utils.dataloaders import *
from utils.general import *

# datasets.py 里有 LoadImages 方法 、letterbox 方法
# general.py 里有 non_max_suppression 方法


def scale_coords(img1_shape, coords, img0_shape, ratio_pad=None):
    # Rescale coords (xyxy) from img1_shape to img0_shape
    if ratio_pad is None:  # calculate from img0_shape
        gain = min(img1_shape[0] / img0_shape[0], img1_shape[1] / img0_shape[1])  # gain  = old / new
        pad = (img1_shape[1] - img0_shape[1] * gain) / 2, (img1_shape[0] - img0_shape[0] * gain) / 2  # wh padding
    else:
        gain = ratio_pad[0][0]
        pad = ratio_pad[1]

    coords[:, [0, 2]] -= pad[0]  # x padding
    coords[:, [1, 3]] -= pad[1]  # y padding
    coords[:, :4] /= gain
    clip_coords(coords, img0_shape)
    return coords

def clip_coords(boxes, img_shape):
    # Clip bounding xyxy bounding boxes to image shape (height, width)
    boxes[:, 0].clamp_(0, img_shape[1])  # x1
    boxes[:, 1].clamp_(0, img_shape[0])  # y1
    boxes[:, 2].clamp_(0, img_shape[1])  # x2
    boxes[:, 3].clamp_(0, img_shape[0])  # y2

def detect1Image(im0, imgsz, model, device, conf_thres, iou_thres):
    img = letterbox(im0, new_shape=imgsz)[0]
    # Convert
    img = img[:, :, ::-1].transpose(2, 0, 1)  # BGR to RGB, to 3x416x416
    img = np.ascontiguousarray(img)


    img = torch.from_numpy(img).to(device)
    img =  img.float()  # uint8 to fp16/32
    img /= 255.0   
    
    if img.ndimension() == 3:
        img = img.unsqueeze(0)

    # Inference
    pred = model(img, augment=False)[0]

    # Apply NMS
    pred = non_max_suppression(pred.cpu(), conf_thres, iou_thres)
    

    boxes = []
    scores = []
    class_names = []
    
    for i, det in enumerate(pred):  # detections per image
        # save_path = 'draw/' + image_id + '.jpg'
        
        if det is not None and len(det):
            # Rescale boxes from img_size to im0 size
            det[:, :4] = scale_coords(img.shape[2:], det[:, :4], im0.shape).round()

            # Write results
            for *xyxy, conf, cls in det:
                boxes.append([int(xyxy[0]), int(xyxy[1]), int(xyxy[2]), int(xyxy[3])])
                scores.append(conf)
                class_names.append(cls)

    return np.array(boxes), np.array(scores), np.array(class_names)

def format_prediction_string(class_names, scores, boxes):
    pred_strings = []
    for j in zip(class_names, scores, boxes):
        pred_strings.append("{0} {1:.4f} {2} {3} {4} {5}".format(j[0], j[1], j[2][0], j[2][1], j[2][2], j[2][3]))

    return " ".join(pred_strings)

source = '/kaggle/input/neu-det-yolo/NEU-DET-YOLO/valid/images'
weights = '/kaggle/working/yolov5/runs/train/exp/weights/best.pt'

if not os.path.exists(weights):
        print('best.pt 路径不对')

imgsz = 640  
conf_thres = 0.5
iou_thres = 0.6

device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')

imagenames =  os.listdir(source)

# 导入模型
model = torch.load(weights, map_location=device)['model'].float()  # load to FP32  
model.to(device).eval()

# 导入图片
dataset = LoadImages(source, img_size=imgsz)

# 记录预测结果
results = []

# 预测结果随机展示
# fig, ax = plt.subplots(5, 2, figsize=(30, 70))

# 计数，用于展示 10 张图
count = 0

for name in imagenames:
    image_id = name.split('.')[0]
    # 读入图片
    im01 = cv2.imread('%s/%s.jpg'%(source,image_id))  # BGR
    assert im01 is not None, 'Image Not Found '
    im_w, im_h = im01.shape[:2]
    # boxes 矩形框 xyxy，scores：[confidence, class] 
    boxes, scores, class_names = detect1Image(im01, imgsz, model, device, conf_thres, iou_thres)
    print('图像的ID : ', image_id)
    print('图像的 boxes ：', boxes)
    print('图像的 scores ：',scores)
    print('图像的 class_names ：',class_names)
    
    if boxes is not None: 
#         for boxe in boxes:
#             boxes[:, 2] = boxes[:, 2] - boxes[:, 0]
#             boxes[:, 3] = boxes[:, 3] - boxes[:, 1]
            
        boxes = boxes[scores >= 0.05].astype(np.int32)
        scores = scores[scores >=float(0.05)]
    
    result = {
            'image_id': image_id,
            'PredictionString': format_prediction_string(class_names, scores, boxes)
        }

    results.append(result)

test_df = pd.DataFrame(results, columns=['image_id', 'PredictionString'])
# test_df.to_csv('submission.csv', index=False)
test_df.head()

路径转化到 Output

%ls

test_df.to_csv('submission.csv', index=False)

你可能感兴趣的:(人工智能,计算机视觉,深度学习)

Radiance Fields from VGGSfM和Mast3r:两种先进3D重建方法的比较与分析 2401_87458718 3d
VGGSfM和Mast3r:3D场景重建的新方向在计算机视觉和3D重建领域,如何从2D图像重建3D场景一直是一个充满挑战的研究课题。近年来,随着深度学习技术的发展,一些新的方法被提出并取得了显著的进展。本文将重点介绍两种最新的基于深度学习的3D重建方法:VGGSfM和Mast3r,并通过GaussianSplatting技术对它们的性能进行全面比较和分析。VGGSfM:基于视觉几何的深度结构运动恢
基于 PyTorch 的 MNIST 手写数字分类模型欣然～ pytorch 分类人工智能
一、概述本代码使用PyTorch框架构建了一个简单的神经网络模型，用于解决MNIST手写数字分类任务。代码主要包括数据的加载与预处理、神经网络模型的构建、损失函数和优化器的定义、模型的训练、评估以及最终模型的保存等步骤。二、依赖库torch：PyTorch深度学习框架的核心库，提供了张量操作、自动求导等功能。torch.nn：PyTorch的神经网络模块，包含了各种神经网络层、损失函数等。torc
探索Google AI聊天模型的集成和使用 qahaj 人工智能 python
随着人工智能的飞速发展，GoogleAI的聊天模型提供了强大的自然语言处理能力，可以应用于多种场景中。本文将为你介绍如何通过GoogleAI和LangChain库来使用这些聊天模型。技术背景介绍GoogleAI提供了一系列强大的聊天模型，这些模型具备不同的功能和参数设置。它们不仅可以通过GoogleAI服务访问，还可以通过GoogleCloudVertexAI以企业级功能使用。在本文中，我们将重点
“租赁业务ERP+deepseek”模式的应用软件研究员汽车 DeepSeek 汽车租赁系统
汽车租赁业务从上世纪90年代发展至今，从传统的人工管理到软件辅助，随着互联网的发展，业务公司对汽车租赁系统提出了更高的要求，比如自助订单，业务推广、客户资质评估，车辆风控，风险预警等，又随着近期人工智能的出现，业务公司对业务系统的期望更高，期望都节约更多人工成本，让管理变得简单快捷高效和智能。所以就引发人们新的启发：“业务系统ERP+deepseek”，但业务系统ERP+deepseek能否满足业
高效快速教你DeepSeek如何进行本地部署并且可视化对话大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
科技文章：高效快速教你DeepSeek如何进行本地部署并且可视化对话摘要：随着自然语言处理（NLP）技术的进步，DeepSeek作为一款基于深度学习的语义搜索技术，广泛应用于文本理解、对话系统及信息检索等多个领域。本文将探讨如何高效快速地在本地部署DeepSeek，并结合可视化工具实现对话过程的监控与分析。通过详尽的步骤、案例分析与代码示例，帮助开发者更好地理解和应用DeepSeek技术。同时，本
不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
【论文阅读】实时全能分割模型万里守约论文阅读论文阅读图像分割图像处理计算机视觉
文章目录导言1、论文简介2、论文主要方法3、论文针对的问题4、论文创新点总结导言在最近的计算机视觉领域，针对实时多任务分割的需求日益增长，特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战，本文介绍了一种新方法——RMP-SAM（Real-TimeMulti-PurposeSegmentAnything），旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l

工业视觉钢材缺陷检测 实战项目