Silence_Zzz

《Pytorch模型推理及多任务通用范式》第五节作业

课程学习

本节课主要对于大白AI课程：https://mp.weixin.qq.com/s/STbdSoI7xLeHrNyLlw9GOg

《Pytorch模型推理及多任务通用范式》课程中的第五节课进行学习。

作业题目

包含以下必做题和思考题

1、必做题：

1.1 自己找 2 张其他图，用 Yolox_s 进行目标检测，并注明输入尺寸和两个阈值。

2、思考题：

2.1 Yolox_s：用 time 模块和 for 循环，对”./images/1.jpg” 连续推理 100 次，统计时间开销。有 CUDA 的同学，改下代码： self.device=torch.device(‘cuda’)，统计时间开销。

2.2 有 CUDA 的同学，分别用 Yolox_tiny、 Yolox_s、 Yolox_m、 Yolox_l、 Yolox_x对”./images/1.jpg” 连续推理 100 次，统计时间开销。

3、总结

3.1 作业总结

3.2 课程总结

作业答案

1、必做题

1.1 找两张图片用 Yolox_s 进行目标检测

这里我还是用前两节课的猫和狗图片，输入尺寸和两个阈值都为默认值，输入尺寸为640，置信度阈值为0.5，nms阈值为0.45：

输出结果如下：

2、思考题：

2.1 统计时间开销

和之前的的思考题内容一致，不再做细致的讨论，修改__main__代码如下：

if __name__ == '__main__':
    import time

    print("Starting")
    # 实例化
    print("Loading Weight...")
    t_all_LW = 0
    t_start = time.time()
    model_detect = ModelPipline()
    label_names = model_detect.label_names
    t_end = time.time()
    t_all_LW += t_end - t_start
    print("Loading Weight Time：{}".format(t_all_LW))
    
    # 加载图片
    image = cv2.imread('./images/1.jpg')

    # 第一次推理时间
    print("First Predicting...")
    t_all_FP = 0
    t_start = time.time()
    result = model_detect.predict(image)
    t_end = time.time()
    t_all_FP += t_end - t_start
    print("First Predicting Time：{}".format(t_all_FP))

    # 一百次推理时间
    print("100 Predicting...")
    t_all = 0
    for i in range(100):
        t_start = time.time()
        result = model_detect.predict(image)
        t_end = time.time()
        t_all += t_end - t_start
    print("100 Predicting Time：{}".format(t_all))

    # 可视化
    print("Visualization...")
    if result is not None:
        bboxes, scores, labels = result
        image = vis(image, bboxes, scores, labels, label_names)
    cv2.imwrite('./demos/1.jpg', image)
    
    print("Ending")

先测试下cpu的推理速度：

Starting
Loading Weight…
Loading Weight Time：0.2010512351989746
First Predicting…
First Predicting Time：0.6204280853271484
100 Predicting…
100 Predicting Time：52.23311710357666
Visualization…
Ending

因为是s模型，推理速度还可以，接着测试cuda下的推理速度，修改self.device = torch.device(‘cuda’)，开始测试：

Starting
Loading Weight…
Loading Weight Time：1.889430046081543
First Predicting…
First Predicting Time：0.8607349395751953
100 Predicting…
100 Predicting Time：4.55137825012207
Visualization…
Ending

结论和之前相同。

2.2 使用cuda测试YoloX的各个版本

首先我们下载权重文件:

三个小时，先摸会吧。。算了，太慢了，我还是科学上网去github上下载吧。

这里我先下好了YoloX_m的模型，修改./models_yolox/yolox_s.py 中的 depth 和 width和YoloX_m的对应，这里我将模型的宽度和深度写成了字典，方便调用，修改后的yolox.py文件如下。

import torch.nn as nn
from .yolo_head import YOLOXHead
from .yolo_pafpn import YOLOPAFPN


class YOLOX(nn.Module):
    def __init__(self, num_classes, yolox_version="yolox_s"):
        super().__init__()
        # yolox的深度和宽度
        self.num_classes = num_classes
        self.depth_width = {
            "yolox_tiny": [0.33, 0.375],
            "yolox_s": [0.33, 0.50],
            "yolox_m": [0.67, 0.75],
            "yolox_l": [1.00, 1.00],
            "yolox_x": [1.33, 1.25],
        }
        self.depth, self.width = self.depth_width[version]
        self.in_channels = [256, 512, 1024]
        self.backbone = YOLOPAFPN(self.depth, self.width, in_channels=self.in_channels)
        self.head = YOLOXHead(self.num_classes, self.width, in_channels=self.in_channels)


    def forward(self, x):
        fpn_outs = self.backbone(x)
        outputs = self.head(fpn_outs)
        return outputs

修改完成后，再修改get_model代码如下：

def get_model(self):
        # Lesson 2 的内容
        model = YOLOX(num_classes=self.num_classes, yolox_version="yolox_m")
        pretrained_state_dict = torch.load('./weights/yolox_m.pth', map_location=lambda storage, loc: storage)[
            "model"]
        model.load_state_dict(pretrained_state_dict, strict=True)
        model.to(self.device)
        model.eval()
        return model

使用cuda开始推理，推理结果如下：

Starting
Loading Weight…
Loading Weight Time：2.1591570377349854
First Predicting…
First Predicting Time：0.941857099533081
100 Predicting…
100 Predicting Time：9.919167518615723
Visualization…
Ending

这时候，推理时间没有问题，但是github上下载的模型的预测结果出了问题，根本没有预测到任何目标，yolox_m的模型，居然效果不如yolox_s？这肯定是哪里出了问题。

果然，在github的yolox仓库里发现了问题，官方在8.19的更新中，更换了最新的模型，去除了归一化的过程，所以这时候如果用旧代码去推理新模型，这样肯定会出问题。

我根据官方提示，定位到源码的yolox/data/dataloading.py中的ValTransform类：

class ValTransform:
    """
    Defines the transformations that should be applied to test PIL image
    for input into the network

    dimension -> tensorize -> color adj

    Arguments:
        resize (int): input dimension to SSD
        rgb_means ((int,int,int)): average RGB of the dataset
            (104,117,123)
        swap ((int,int,int)): final order of channels

    Returns:
        transform (transform) : callable transform to be applied to test/val
        data
    """

    def __init__(self, swap=(2, 0, 1), legacy=False):
        self.swap = swap
        self.legacy = legacy

    # assume input is cv2 img for now
    def __call__(self, img, res, input_size):
        img, _ = preproc(img, input_size, self.swap)
        if self.legacy:
            img = img[::-1, :, :].copy()
            img /= 255.0
            img -= np.array([0.485, 0.456, 0.406]).reshape(3, 1, 1)
            img /= np.array([0.229, 0.224, 0.225]).reshape(3, 1, 1)
        return img, np.zeros((1, 5))

其中我们可以看到，如果想用老模型，只需要重新进行归一化处理即可，反过来思考，我们要使用新的模型，只需要去除preprocess代码中的归一化操作就可以得到正常的推理了：

    def preprocess(self, image):
        # 原图尺寸
        h, w = image.shape[:2]
        # 生成一张 w=h=640的mask，数值全是114
        padded_img = np.ones((self.inputs_size[0], self.inputs_size[1], 3)) * 114.0
        # 计算原图的长边缩放到640所需要的比例
        r = min(self.inputs_size[0] / h, self.inputs_size[1] / w)
        # 对原图做等比例缩放，使得长边=640
        resized_img = cv2.resize(image, (int(w * r), int(h * r)), interpolation=cv2.INTER_LINEAR).astype(np.float32)
        # 将缩放后的原图填充到 640×640的mask的左上方
        padded_img[: int(h * r), : int(w * r)] = resized_img
        # BGR——>RGB
        padded_img = padded_img[:, :, ::-1]
        # # 归一化和标准化，和训练时保持一致,新模型不再需要归一化
        # inputs = padded_img / 255
        # inputs = (inputs - np.array([0.485, 0.456, 0.406])) / np.array([0.229, 0.224, 0.225])
        ##以下是图像任务的通用处理
        # (H,W,C) ——> (C,H,W)
        inputs = padded_img.transpose(2, 0, 1)
        # (C,H,W) ——> (1,C,H,W)
        inputs = inputs[np.newaxis, :, :, :]
        # NumpyArray ——> Tensor
        inputs = torch.from_numpy(inputs)
        # dtype float32
        inputs = inputs.type(torch.float32)
        # 与self.model放在相同硬件上
        inputs = inputs.to(self.device)
        return inputs, r

这时候报错了：

Traceback (most recent call last):
File “D:/VSCodeProject/Pytorch_Learning/pytorch-推理范式/lesson_5/inference_detection.py”, line 132, in
result = model_detect.predict(image)
File “D:/VSCodeProject/Pytorch_Learning/pytorch-推理范式/lesson_5/inference_detection.py”, line 31, in predict
inputs, r = self.preprocess(image)
File “D:/VSCodeProject/Pytorch_Learning/pytorch-推理范式/lesson_5/inference_detection.py”, line 71, in preprocess
inputs = torch.from_numpy(inputs)
ValueError: At least one stride in the given numpy array is negative, and tensors with negative strides are not currently supported. (You can probably work around this by making a copy of your array with array.copy().)

根据提示，显示，将NumpyArray —> Tensor的过程中，加入copy函数：

# NumpyArray ——> Tensor
inputs = torch.from_numpy(inputs.copy())

重新进行推理：

推理正常，且识别效果要比yolox_s版本要好，推理时间正常：

Starting
Loading Weight…
Loading Weight Time：2.163299560546875
First Predicting…
First Predicting Time：0.8040077686309814
100 Predicting…
100 Predicting Time：7.489165544509888
Visualization…
Ending

接着我们依次测试yolox_tiny、yolox_l和yolox_x:

yolox_tiny推理结果和推理速度：

Starting
Loading Weight…
Loading Weight Time：1.8215892314910889
First Predicting…
First Predicting Time：0.7729787826538086
100 Predicting…
100 Predicting Time：3.979935646057129
Visualization…
Ending

yolox_l推理结果和推理速度：

Starting
Loading Weight…
Loading Weight Time：2.417222499847412
First Predicting…
First Predicting Time：0.8462471961975098
100 Predicting…
100 Predicting Time：11.834988832473755
Visualization…
Ending

yolox_x推理结果和推理速度：

Starting
Loading Weight…
Loading Weight Time：3.007777690887451
First Predicting…
First Predicting Time：0.9800820350646973
100 Predicting…
100 Predicting Time：19.388036489486694
Visualization…
Ending

数据汇总如下表，时间单位为秒(s)：

yolox_version	Loading Weight Time	First Predicting Time	100 Predicting Time
yolox_tiny	1.8215892314910889	0.7729787826538086	3.979935646057129
yolox_s	1.889430046081543	0.8607349395751953	4.55137825012207
yolox_m	2.163299560546875	0.8040077686309814	7.489165544509888
yolox_l	2.417222499847412	0.8462471961975098	11.834988832473755
yolox_x	3.007777690887451	0.9800820350646973	19.388036489486694

我们可以看到，在同等的gpu下，模型加载速度和除去第一次后的模型推理速度，会随着模型的增大而变慢，且幅度较大，而首次推理时间幅度较小，在第三节课的作业中，我也说到了其原因，是因为需要cuda初始化，有额外的耗时。多个模型的存在可以更好的在工业上进行部署，比如小算力的硬件，可以选择yolox_s或者yolox_tiny模型，或者是更小的yolox_nano模型，而在大算力的服务器端，可以选择yolox_l、yolo_x的模型去训练部署算法。这种scaled的方法，最早来自EfficientNet，但是在yolov4和yolov5引入后，在工业部署方面，也取得不错的效果。

3、总结

最后一次作业啦，也是认真的完成，这里先对此次作业总结，再对课程进行总结。

3.1 作业总结

此次作业，使用大潘老师教我们的推理三板斧去做yolox的模型推理预测，关于三部分的作用，老师在第三次课已经介绍完成了，后面的两次课可以说是对第三节课的巩固和推理扩展。yolox在暑假发布的时候，我就down下来跑了demo，但是当时在用使用yolov5的框架在训练模型。这次作业原本是想用老师提供的模型文件去做，但是百度网盘下载真的很慢，所以选择了去官网下载新的权重，却遇到了一个bug，所幸很快解决了问题，正常完成了作业。

3.2 课程总结

那再谈谈本次课程吧，按照大潘老师的问题来回答。

1）这次课程对你的帮助有哪些？

首先非常感谢大潘老师还有大白老师给了我这样一个机会，学习到Pytorch推理的通用范式，老师辛苦了。通过四次课的作业，我慢慢的理解了模型推理不过是这么一回事，加载模型、前处理、模型推理、后处理，输出检测结果，整个推理过程简单清晰，之前可能也只能是用别人写好的代码来进行推理，现在感觉可以尝试自己去写写看。

我是一个研三在读生，读了个双非的研究生，老师对这些东西的了解程度几乎为零，实验室之前的师兄也只是半懂不懂，代码层面的几乎没怎么做过，几乎全靠自学。学习目标检测一年左右了（研一受到疫情的影响），目前秋招工作已经找好了，在一个刚成立没多久的公司做视觉算法工程师。虽然都说视觉很卷，但那只是说针对大厂来看，小厂或是小公司对视觉算法工程师的需求还是蛮多的。幸运的在十月中旬就找好了一份工作，准备忙完学校的事情就去那边实习，所学的东西只有在实践中才能不断提升自己。

报名大白的课程是因为大白的yolo系列详解，自今我电脑了还有大白老师的yolov3的网络框架图，对于一个刚刚入门视觉的小白来说，大白老师给我的帮助真的很大。这次能够参加大潘老师的课程，对我来说，更是深层次的理解了模型推理的过程，我相信，在之后的工作中，一定能够用到这些东西。希望后续的课程，也能继续参加。

2）对课程的优化改进有什么建议？

以下是我对这次课程的建议：

1、采取视频+代码演示的形式

采取视频+代码演示的形式可以更直观的展现代码层面的运行和调试，对于新手来说可能会更友好点，同时也更好的避免了时间问题错过老师的课程。虽然大潘老师的课堂笔记真的很赞，但是如果是视频课的形式，也可以将课程上传到b站等视频网站中，对于宣传来说，视频的效果是直观且有效的，缺点是需要花费更多的时间来管理视频的录制和上传（毕竟课程是老师空闲时间准备的，辛苦啦大潘老师）。

2、介绍工作过程中的完整流程

对于我来说，即将步入工作环境，但是只是在实验室经过自己的训练来看，对整个工作过程中的完整流程还是不太了解，对于新手来说，更是无从下手，很多人只是按教程跑了一遍罢了，这很难在工作中展示自己的核心竞争力。

3、可以介绍下数据加载（Dataloader）和训练（Training）的过程（yolox，源码解析？）

做为算法部署来看，只需要拿到模型，然后进行推理就可以了，但是很多时候，算法工程师应该需要调试数据加载和并进行训练，这两部分相对于推理部分来说，要更为复杂，因此之后如果有进阶课程，希望可以讲一讲这两部分细节。

4、介绍模型部署方面的知识结构或体系

最后，算法在能够推理过后，其实远远还不能够达到部署的要求，关于算法部署，一直都没有成熟的课程介绍，不同端侧的区别，不同推理框架的介绍和使用，其实部署方面好像更多的是硬件工程师来做，但是免不了有的算法工程师也需要完成这些工作，因此希望在之后的课程中能够了解到模型部署方面的知识结构或体系。

以上，是我对本次课程的个人总结和建议啦！下次课程见！！

QGraphicView绘制圆形示例杨逸潼 qt 开发语言
#include#include#include#include#include#includeintmain(intargc,char*argv[]){
PyTorch 训练一个分类器亚里平台工具类 pytorch训练网络
文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4训练网络5测试网络6在GPU上训练模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用PyTorch训练一个用于图像分类的卷积网络模型。这里记录一下，学习一波写法，供以后查阅，自己跑的项目在github上，稍微修改了一下训练策略，能使分类精度从53%提升到65%；并且增加了训
LeetCode --- 2185. Counting Words With a Given Prefix 解题报告杨鑫newlfe Python 算法 LeetCode leetcode 算法数据结构 python 面试
Question:Youaregivenanarrayofstringswordsandastringpref.Returnthenumberofstringsinwordsthatcontainprefasaprefix.Aprefixofastringsisanyleadingcontiguoussubstringofs.Example1:Input:words=["pay","attenti
《C程序设计》第三章练习答案西蒙尼的马竞 c语言算法开发语言
习题1.假如我国国民生产总值的年增长率为9%，计算10年后我国国民生产总值与现在相比增长多少百分比，计算公式为p=(1+r)^nr为年增长率，n为年数，p为与现在相比的倍数。#include#includeintmain(){doubler=0.09;intn=10;doublep;p=pow((1+r),n);printf("After10years,increasepercentageis:%
TypeError: expected np.ndarray (got numpy.ndarray)问题处理天籁忍者运行错误 numpy PyTorch 环境配置版本冲突代码运行
问题描述：更换设备后重新搭建的anaconda环境，装好numpy、pytorch后运行相关代码，出现该错误。原因：numpy版本有问题。解决方法：我的numpy版本是1.14，重新卸载，下载好1.19的whl文件重新安装，代码可以运行。以上解决方法供参考。
Java 2.2(计算圆柱的体积)编写程序，读入圆柱体的半径和高，并使用下列公式计算圆柱体的体积：此生不配你情深几何学 java eclipse
面积=半径x半径xp体积=面积x高下面是一个运算示例：Entertheradiusandlengthofacylinder(请输入圆柱的半径和高):5.512Theareais95.0331(它的面积是95.0331)Thevolumeis1140.4(它的体积是1140.4)packageSecond;importjava.util.Scanner;publicclassCylinder{pub
python导入自定义py文件 hutaotaotao python基础和进阶 python 开发语言
目录1.导入当前目录下的py文件2.导入当前目录下某个文件夹里的py文件3.导入上级目录下某个文件夹里的py文件1.导入当前目录下的py文件比如写了一个tool_func.py，里面放了一些工具函数，将其放在主函数代码main.py的同级目录下#file:tool_func.pydefget_second_max_value(data:list):iflen(data)==0:returnNone
python 2和python3 引用flask框架连接数据库sqlalchemy F_Liberalism
python2和python3引用flask框架连接数据库sqlalchemy参考：https://blog.csdn.net/guotiangong/article/details/80139612Flask-SQLAlchemyFlask-SQLAlchemy是Flask的数据库扩展,简化了Flask程序中使用SQLAlchemy的操作,和其他Flask扩展一样,Flask-SQLAlchem
《C程序设计》第六章练习答案西蒙尼的马竞 c语言算法 c++
【例6.1】对10个数组元素依次赋值为0,1,2,3,4,5,6,7,8,9,要求按逆序输出。#includeintmain(){inti,a[10];for(i=0;i=0;i--){printf("%d",a[i]);}printf("\n");return0;}【例6.2】用数组来处理求Fibonacci数列问题。#includeintmain(){inti;intf[20]={1,1};f
开源模型应用落地-DeepSeek-R1-Distill-Qwen-7B与vllm实现推理加速的正确姿势（一）开源技术探险家开源模型-实际应用落地 #人工智能自然语言处理语言模型深度学习
一、前言在当今人工智能技术迅猛发展的时代，各类人工智能模型如雨后春笋般不断涌现，其性能的优劣直接影响着应用的广度与深度。从自然语言处理到计算机视觉，从智能安防到医疗诊断，AI模型广泛应用于各个领域，人们对其准确性、稳定性和高效性的期望也与日俱增。在此背景下，DeepSeek模型的出现为行业带来了新的曙光。DeepSeek团队开发的DeepSeek-R1-Distill-Qwen-7B模型，利用蒸馏
蓝桥杯——试题集——入门训练唐煜鑫蓝桥杯 c语言
入门训练BEGIN-1A+B问题问题描述输入A、B，输出A+B。输入格式输入的第一行包括两个整数，由空格分隔，分别表示A、B。输出格式输出一行，包括一个整数，表示A+B的值。样例输入1245样例输出57数据规模与约定-10000intmain(){inta,b;scanf("%d%d",&a,&b);printf("%d",a+b);return0;}BEGIN-2序列求和问题描述求1+2+3+…
队列—学习走啦小孩算法 c++数据结构蓝桥杯学习
1.手写队列的实现使用数组实现队列是一种常见的方法。队列的基本操作包括入队（enqueue）和出队（dequeue）。队列的头部和尾部分别用head和tail指针表示。代码实现constintN=10000;//定义队列容量，确保够用intque[N];//队列，用数组模拟inthead=0;//head始终指向队头。que[head]是队头。开始时队列为空，head=0inttail=-1;//
org.apache.flink.runtime.client.JobInitializationException: Could not start the JobMaster. ForwardSummer Error集锦大数据 JVM java jvm flink
IDEA执行Flink的类的main方法时，遇到如下错误，还以为是啥大错误，没想到只是路径错了，txt的文件格式没有拼全，加上txt就好了。Exceptioninthread"main"java.lang.RuntimeException:java.util.concurrent.ExecutionException:java.lang.RuntimeException:org.apache.fl
RAID详解 h韩 linux 运维
RAID（RedundantArrayofIndependentDisks）是一种通过将多个硬盘组合在一起，提供冗余、性能优化或两者兼备的技术。RAID通过对硬盘的控制和数据分布方式，改善了数据存储的可靠性、容量和速度。RAID的核心目的是通过不同的方式利用多个硬盘来实现数据冗余和加速数据读写。不同的RAID级别提供了不同的冗余和性能平衡。常见的RAID级别RAID0(条带化，Striping)特
Flink执行jar报错：java.io.IOException: Error opening the Input Split file 或者 java.io.FileNotFoundExceptio 故明所以 Flink jar flink 大数据
一、报错内容Flink执行jar时，报如下错误：org.apache.flink.client.program.ProgramInvocationException:Jobfailed.(JobID:80bbed7b2180c6fd5904c29e7e8af447)atorg.apache.flink.client.program.rest.RestClusterClient.submitJob(
python中keras_Python深度学习——keras（一） weixin_39534321 python中keras
神经网络的核心组件是层(layer)，它是一种数据处理模块，可以看成是一个数据过滤器。进去一些数据，出来的数据变得更加有用(吃进去的是草，挤出来的是奶)。大多数深度学习，都是将若干个简单的层给链接起来，实现渐进式的数据过滤，也就是数据蒸馏(过滤到一定程度就等同于蒸馏)首先来看一个数字识别的案例(1)读取训练集和测试集fromkeras.datasetsimportmnist#加载keras中的mn
探索2025年的编程新趋势：技术、工具与未来展望桂月二二 wasm 人工智能前端
随着2025年的到来，编程技术领域依旧在高速发展。一些新兴的技术方向、工具和方法正在悄然改变开发者的日常实践。如果您是一名开发者，无论是资深还是初入门道，跟上这些趋势将让您的技能保持前沿，并为职业发展打下坚实基础。本文将从多个维度深入探讨当前最值得关注的编程技术，希望为您的技术提升带来启发。一、AI驱动的编程辅助工具人工智能已成为程序开发的重要组成部分。以下是几款2025年值得关注的AI驱动编程工
Caused by: java.lang.ClassNotFoundExceptionorg/apache/flink/shaded/jackson2/com/fasterxml/jackson/co 木生火18624 大数据实战异常错误
Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/flink/shaded/jackson2/com/fasterxml/jackson/core/JsonParseExceptionatorg.apache.flink.runtime.webmonitor.WebMonitorEndpoint.initializeH
Android研发去美团面试，被面试官用各种原理蹂躏，所幸最终拿到Offer 2401_87029500 android 面试职场和发展
一个线程是否只有一个Looper？如何保证一个线程只有一个Looper？多线程的方式有哪些？生产者消费者模式wait和sleep的区别String、StringBuffer、StringBuilder的区别ANR异常发生条件如何分析ANR自定义View和ViewGroup事件处理分发，拦截，处理。GC算法四大引用强，软，弱，虚，并说明下合适GC动画View动画，属性动画，帧动画。再说下View和属
CTF密码学常见加密及解密脚本二 mist1star 密码学开发语言
一.摩斯密码摩斯密码的介绍：由美国人萨缪尔·摩尔斯（SamuelMorse）及其助手阿尔弗雷德·维尔（AlfredVail）在1836年发明的。摩斯密码的原理基于两种基本信号：点和划（或称为短音和长音），通过它们的组合来表示字母、数字和符号。摩斯密码的基本原理：1.点和划点(·)：最短的信号，表示一个短音划(-)：较长的信号，表示一个长音2.间隔字母间间隔：表示两个字母之间的间隔，通常是三个点的长
2025年02月02日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：oumi项目地址url：https://github.com/oumi-ai/oumi项目语言：Python历史star数：1416今日star数：205项目维护者：xrdaukar,oelachqar,taenin,wizeng23,kaisopos项目简介：构建最先进基础模型所需的一切，从头到尾。项目名称：Qwen2.5-VL项目地址url：https://github.com/Qw
OpenAI发布"深度研究"AI助手：开启复杂问题分析新纪元
OpenAI近日宣布推出一款新的AI"代理"，旨在帮助用户通过ChatGPT平台进行深入、复杂的研究工作。这项新功能被恰如其分地命名为"深度研究"（deepresearch）。根据OpenAI周日发布的博客文章，这项新功能主要面向"在金融、科学、政策和工程等领域从事密集知识工作，需要进行全面、精确和可靠研究的人群"。该公司还表示，对于那些需要仔细研究才能做出购买决定的商品，如汽车、家电和家具等，这
机器学习笔记20241017 tt555555555555 学习笔记深度学习机器学习笔记人工智能
文章目录torchvisiondataloadernn.module卷积非线性激活模型选择训练误差泛化误差正则化权重衰退的基本概念数学表示权重衰退的效果物理解释数值稳定性（GradientVanishing）梯度消失原因解决方法梯度爆炸（GradientExplosion）定义原因解决方法总结继续跟着小土堆学pytorchtorchvision#导入torchvision库，主要用于处理图像数据集
基于BiGRU的预测模型及其Python和MATLAB实现追蜻蜓追累了机器学习深度学习 cnn lstm 神经网络 gru 回归算法
##一、背景在当今快速发展的数据驱动的时代，尤其是在自然语言处理（NLP）、时间序列预测、语音识别等任务中，深度学习技术的应用已经变得越来越普遍。传统的机器学习算法往往无法很好地捕捉数据中的时序信息和上下文关系，因此深度学习中的循环神经网络（RNN）逐渐成为解决这一问题的重要工具。RNN能够处理序列数据，但它们在长序列数据的学习中存在梯度消失和梯度爆炸的问题。为了解决这些问题，长短期记忆网络（LS
关于双塔模型的简单介绍 eso1983 python 算法推荐算法
双塔模型是一种常用于推荐系统和信息检索等领域的深度学习架构，其核心思想是将用户和物品分别映射到不同的向量空间，通过计算两个向量的相似度来预测用户对物品的偏好或相关性。1.python示例使用python语言来简单示例一下实现过程如下：importtensorflowastffromtensorflow.keras.layersimportInput,Dense,Embedding,Concaten
学习Python的一些在线资源推荐 eso1983 学习 python 开发语言
任何一门开发语言的学习都需要理论和实践结合起来，有时间的小伙伴可以通过在线课程、官方文档、开源项目来夯实基础。以下是个人认为比较好的学习路径，可以供大家参考学习：在线课程平台Coursera：推荐理由：Coursera上有许多来自知名大学和机构的Python课程。这些课程通常有完整的教学大纲、作业和测试，并且有专业的教师团队进行教学支持。课程内容质量高，经过精心设计，可以系统地学习Python。核
DeepSeek在协同过滤和深度学习技术中的应用场景 python算法(魔法师版) 深度学习人工智能
DeepSeek作为一个集成多种先进技术的平台，利用协同过滤和深度学习技术在多个领域实现了创新应用。以下是一些具体的场景和示例，展示了这些技术如何被应用于实际问题中。一、推荐系统电子商务协同过滤：在电商平台中，协同过滤用于根据用户的历史行为（如购买记录、浏览历史等）推荐相关商品。基于用户的相似性或项目的相似性来生成个性化推荐。Python深色版本fromsurpriseimportDataset,
手机上运行AI大模型(Deepseek等) zd200572 智能手机人工智能 deepseek
最近deepseek的大火，让大家掀起新一波的本地部署运行大模型的热潮，特别是deepseek有蒸馏的小参数量版本，电脑上就相当方便了，直接ollama+open-webui这种类似的组合就可以轻松地实现，只要硬件，如显存，RAM足够，参数量合适，速度还可以接受。本地部署的意义在于，一是可以数据不上网，让一些私密的数据有所保障，二是可以实现一些在线限制的功能。在手机上运行的意义，其实更多可能是玩玩
为什么命令“echo -e “\033[9；0]“ ＞ /dev/tty0“能控制开发板上的LCD不熄屏？昊虹AI笔记嵌入式 Linux系统终端
为什么命令"echo-e“\033[9;0]”>/dev/tty0"能控制开发板上的LCD不熄屏？在回答这个问题前请先阅读我之前写的与tty和终端有关的博文https://blog.csdn.net/wenhao_ir/article/details/145431655然后再来看这条命令的解释就要容易些了。这条命令的作用可以分解如下：echo-e"\033[9;0]">/dev/tty0echo-
一篇文章了解AI大神何凯明 Ai知识精灵人工智能
何凯明（KaimingHe）是一位在国际计算机视觉和深度学习领域享有盛誉的科学家。以下是对他的一些详细介绍：个人背景：何凯明出生于中国，后赴美国深造。他分别在2007年和2011年在清华大学获得学士和博士学位，专业是电子工程。职业经历：在完成博士学位后，何凯明加入了微软亚洲研究院（MicrosoftResearchAsia）。2015年，他加入了FacebookAIResearch（FAIR），成
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d

《Pytorch模型推理及多任务通用范式》第五节作业

课程学习

作业题目

1、必做题：

2、思考题：

3、总结

作业答案

1、必做题

1.1 找两张图片用 Yolox_s 进行目标检测

2、思考题：

2.1 统计时间开销

2.2 使用cuda测试YoloX的各个版本

3、总结

3.1 作业总结

3.2 课程总结

你可能感兴趣的:(大白AI课程,pytorch,目标检测,深度学习)