AidLux

零基础边缘端智慧交通训练营 | Lesson 3

5个课时实现车辆检测+安全算法，玩转智慧交通AI应用！

欢迎大家来到AidLux零基础边缘端智慧交通训练营~

前面两节课，主要介绍了AI项目安全风险和AI安全技术的一些背景，及使用AidLux实现AI功能的方式。

在第三节课，我们主要完成车辆检测模型的训练和部署测试，以及应用“以数据为中心”策略完成一个小作业，内容框架如下：

1 车辆检测数据集的梳理

2 云服务器训练Yolov5车辆检测模型

3 PC端车辆检测模型推理测试

4 AidLux端模型推理测试

5 课堂小作业

lesson3

1. 车辆检测数据集的梳理

因为后续的章节将从车辆检测入手，所以本节课先带着大家手把手训练一个检测模型，并转化成AidLux可以部署的方式，进行推理测试。

这里主要选用了Kaggle开源的车辆数据集，

Car Object Detection | Kaggle

数据集中总共包含了三个方面的内容：1001张的训练数据集，175张的测试数据集，以及一个标签csv文件。

这个数据集是一个典型的小量级数据，这在实际项目中非常常见，后续我们将用“以数据为中心”的思想对数据集进行优化。

这里已经把数据集以及下面的训练代码、数据清洗脚本都整理好了，大家可以交流，以便后期自己训练时挑选使用。

可以看到Lesson3_code资料文件夹里，除了包含car_train_data.zip（车辆数据集）以外，还包含data_prepare_code（数据预处理文件夹）和yolov5_code（模型训练测试文件夹）。

接下来，我们对数据集进行标注转换以及训练验证集划分，因为本次主要使用YOLOv5算法，我们需要将数据标签转换成YOLOv5可以训练的格式，而数据集划分按照9:1的方式进行，即90%是训练集，10%是验证集。

在lesson3_code/data_prepare_code文件中，编写了相关代码data_code_car.py。

使用VScode编程软件打开data_code_car.py，首先修改其中的image_dir，train_val_dir，csv_reader，schuil.copy中的三个路径。

运行代码，完成后可以看到，在car_train_data文件夹中多了image_txt和train_val_txt两个文件夹，image_txt包含了数据和标签，train_val_txt包含了训练集和验证集的调用列表。

不过这个代码在本地不需要运行，等我们将代码与数据上传到云服务器后，再进行训练数据的生成，这样就不用再改标签里的路径了。

2. 云服务器训练Yolov5车辆检测模型

2.1 云服务器介绍

有了车辆数据集，我们就可以训练检测模型了。在本次训练营中，我们选用工业界最常用的YOLOv5算法。

考虑到有些同学有GPU服务器，有些同学没有，针对没有GPU服务器的同学，为了能够测试一整套的流程，大家可以采用云服务器来进行替代。本次课程采用的算力平台是AutoDL AI算力云，官网地址：AutoDL-品质GPU租用平台-租GPU就上AutoDL

首先点击右上角的“注册”选项进行注册。

在进入后台的主页面，点击左上角的“算力市场”。

可以看到不同的区域，有一些空闲的GPU服务器，每台服务器的显卡型号以及算力都不尽相同，大家可以根据自己的需求进行选择。当我们刚注册会员时，会赠送10元的代金劵，这个我们训练模型已经足够，训练完基础模型还有9块多的余额。

2.2 查看符合条件的云网盘

我们需要将数据集和代码都先上传到云服务器的网盘里面，后面就可以直接在上面操作。

在实例中大家可以看到，不同地方的设备，云服务器的网盘也要选择对应位置。比如说使用北京A区的GPU，那就要将代码和数据也存在北京A区的网盘中。

我们在这里使用的都是北京A区的GPU与网盘。后面实例购买的时候，还是购买北京的实例，就可以在系统盘中直接找到相应的文件。

如果后面再购买其他地区的实例，则在系统盘中，就找不到相应的数据文件。

2.3 训练&验证集图片上传

我们再将前面的一些文件，传输到“我的网盘”里面。主要上传三个文件：

（1）数据集

为了方便上传，将数据集压缩成car_train_data.zip，大家下载的Lesson3_code文件夹中，已经将其压缩了。car_train_data.zip中主要包含了训练所需的数据。

（2）数据预处理代码

将data_prepare_code文件夹，进行压缩，变成data_prepare_code.zip文件夹。data_prepare_code文件夹中包含了数据预处理代码，能够将数据集制作成YOLOv5能够过读取训练的格式。

（3）YOLOv5训练代码

将Yolov5_code训练代码，进行压缩，变成yolov5_code.zip。Yolov5_code文件夹将是我们训练和测试车辆检测模型的核心部分。

（4）后台上传文件——点击AutoDL后台的我的网盘，将刚刚的三个zip文件进行上传，当然可能网络原因，有的文件可以上传的会稍微慢一些。

2.4 新建实例设备

到了这里，我们的代码、数据集都准备好了，就准备新建一个实例设备操作了。这里还是选择和网盘所对应的，北京A区的实例。

可以自己选择一个GPU服务器，可以看到显示多少钱，这里展示的都是单卡的价格，有的设备必须要N卡一租的，可以看到对应的价格。

点击进入后，可以修改两个地方，一个是GPU数量，一个是新建实例的基础镜像。

我们这里GPU数量选择1，表示单卡。新建实例镜像，选择了Pytorch的yolov5镜像，其中YOLOv5训练所需的依赖库都配置好了，十分方便。

我们也可以看到最下方，有一个可用代金券，即表示我们可以先免费使用10元钱。

点击“立即创建”后，就可以看到创建的实例了。

点击右面的“JupyterLab”，可以进入控制台页面。

可以点击下面的“终端”，打开一个终端页面，就可以进行操作了。

当然如果一个终端页面不够操作的话，可以点击左上方的“+”号，新增加几个终端页面。比如我们这里新建了4个终端页面。

并且在上面，我们看到autodl-nas即我们刚刚使用的网盘。

进入autodl-nas文件夹后，我们也可以看到，里面有刚刚新上传的三个zip文件，我们使用unzip命令进行解压。

最后可以看到，三个文件夹都被解压成功：

解压完成后，我们开始制作训练数据集。

先查看一下训练数据集car_train_data的路径，因为会涉及到转换后的txt路径，在云服务器上运行加训练。

先cd car_train_data文件夹，再输入pwd，可以看到这时的数据集路径是：/root/autodl-nas/car_train_data

然后再去修改代码中的路径，首先cd data_prepare_code文件夹里，再vim data_code_car.py，将第一小节中讲到的三个路径进行修改。

按键盘上的“i”，进入代码的编辑状态，移动到路径处，修改成云服务器上对应的路径，我们这里是/root/autodl-nas/car_train_data，大家可以对应修改。

修改完成后，按键盘上的Esc键，跳出编辑状态。

再输入“:”，会跳出输入框，再输入"wq!"，表示对于该修改内容，保存编辑强制退出，回到原始页面。

在运行data_code_car.py，数据集就生成好了。

2.5 训练车辆检测模型

训练车辆检测模型，主要用到/autodl-nas/yolov5_code文件夹了，我们主要对里面的文件进行参数配置。

（1）新建car.yaml

因为训练的是车辆检测模型，所以在yolov5_code/data文件夹下新建一个car.yaml文件。

不过需要注意的是，训练集和验证集的路径都要修改一下，此外还有类别数，以及类别标签。

（2）修改train.py参数

而yolov5_code/train.py文件中，主要修改models初始化模型的路径，这里使用的yolov5n的模型权重。

cfg即模型对应的网络结构路径，data是新增的car.yaml路径。

此外还有epochs训练迭代的次数，batch-size大小，当然imgsz也可以修改，这里默认640。

（3）修改models/yolov5n.yaml

修改其中的类别数量，因为车辆就一个类别，所以修改成1。

（4）训练车辆检测模型

上面的配置文件都修改好以后，由于我们选用了YOLOv5镜像，可以直接输入python train.py，就可以开始训练了。

训练过程中，一般会得到两个模型，一个best.pt，即epoch迭代的过程中，map精度对比比较好保存的模型。

一个是last.pt，即迭代过程中，最后一次epoch保存的模型。

比如我们训练过程中，保存的这两个，在后面测试的时候，主要使用best.pt文件。

2.6 下载检测模型

在AutoDL的我的网盘，找到runs下面最新训练车辆检测模型，路径可以参考：

将best.pt模型下载下来，修改成yolov5n_car_best.pt。并放到yolov5_code/models文件夹中。

3. PC端车辆检测模型推理测试

在上一节中，我们在云服务平台训练了车辆检测模型，并将其下载到了本地。接下来我们在自己本地PC电脑上进行模型测试和模型转换。

当我们训练出一个车辆检测模型，比如我们本节课选用的最最轻量型的yolov5n.pt文件。我们首先要在pc端使用测试集进行效果测试。

3.1 Python相关功能库的安装

为了让每个人，不管是小白还是有经验的朋友都能运行。我们特意找了一台空白的电脑，没有安装任何功能库的电脑进行整体的测试，发现还有一些库还需要安装。

这时我们就需要配置相应的测试环境，以下是一些需要配置的依赖库，大家可以对照着进行下载安装：

（1）Pytorch核心库安装

首先就是Pytorch库安装：这里选择1.8.1版本的Pytorch进行安装，如果没有安装Pytorch，运行代码时就会报错：

我们使用如下的安装命令对Pytorch进行快速安装：

pip install torch==1.8.1 -i Simple Index

其中-i Simple Index字段是使用了清华源进行下载时的加速。

在安装完成Pytorch之后，还有一个非常重要的依赖库需要配套安装，那就是torchvision依赖库。

torchvision下载时的版本选择要与Pytorch版本相适配，这里我们选择0.9.1版本的torchvision进行安装。

torchvision的安装命令如下：

pip install torchvision==0.9.1 -i Simple Index

（2）其他依赖库安装

除了Pytorch，代码中还有一系列的依赖库，这里也列出相关的下载链接，可以一个个下载安装。

Pandas下载：pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple

yaml下载：pip install pyyaml -i https://pypi.tuna.tsinghua.edu.cn/simple

tqdm下载：pip install tqdm -i https://pypi.tuna.tsinghua.edu.cn/simple

matplotlib下载：pip install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

seaborn下载：pip install seaborn -i https://pypi.tuna.tsinghua.edu.cn/simple

scipy下载：pip install scipy -i https://pypi.tuna.tsinghua.edu.cn/simple

ipython下载：pip install ipython -i https://pypi.tuna.tsinghua.edu.cn/simple

3.2 模型推理测试

我们使用yolov5的模型，对于images里面的图片进行推理，测试一下效果。

打开detect_image.py文件，这里主要修改代码中的模型、图片路径、yaml文件。

其中data/images/tests文件夹中已经包含了测试集的所有数据。

使用Run->"Run Without Debuging"，运行后可以得到一张张推理的图片效果（使用空格键快速切换不同图片的检测结果）。

4. AidLux端模型推理测试

在PC端完成测试之后，在实际项目中，我们主要是在边缘端AidLux上进行使用。在第二节课中，我们也讲过，AidLux主要针对推理部分，在底层进行了加速优化，非常适合AI模型的部署使用。

不过想要将pt模型移植到AidLux上并使用，还要进行转换模型和修改推理代码的操作。

4.1 pt模型转换成tflite模型

模型转换的文件是yolov5_code/export.py文件，因为我们准备在AidLux中运行tflite格式的模型，因此主要修改其中的三个地方。

因为需要tensorflow，所以运行时会报错：

所以再输入：pip install tensorflow==2.4.1 -i https://pypi.tuna.tsinghua.edu.cn/simple，下载安装tensorflow库。

安装好再运行export.py文件，在models文件夹下面，可以看到生成的yolov5_car_best-fp16.tflite文件。

4.2 AidLux端推理代码理解

针对AidLux中推理测试的代码，这里放到yolov5_code/aidlux文件夹的yolov5.py中了，大家也可以将训练好的tflite放到AidLux文件夹中。

其中包含了很多AidLux专属的函数接口，大家可以点击这里查看下相关的函数说明。

当然其中的代码和原本PC端的代码有一些不同，这里梳理讲解一下，主要分为三个部分：

（1）加载相关的函数库

（2）模型初始化以及加载

其中主要用到两个函数接口，一个是aidlite_gpu.aidlite()和aidlite.ANNMode()

AidLite初始化的说明：

AidLite加载模型的说明：

此外还有两行in_shape，out_shape，这里可以通过netron查看一下相关的模型参数。

我们可以使用https://netron.app/，打开刚刚的yolov5_car_best-fp16.tflite文件。点击最下方的输出单元，可以看到输出的信息。

（3）模型推理测试代码

接下来就是在Aidlxu进行模型推理，使用测试集测试模型效果了。相关的代码如下所示：

4.3 代码复制到AidLux中

和第二节课中讲的AidLux的使用说明和详细操作实例一样，我们将yolov5的代码，全部上传到AidLux的home下面。

还是通过Cloud_ip在电脑端访问AidLux，打开文件浏览器，进入home下方，点击上传按钮，将Lesson3_code/yolov5_code文件夹进行上传。

4.4 远程连接AidLux

在第二节课中，我们讲解了使用SSH，连接到AidLux的方式。大家也可以远程连接到Lesson3_code，当看到VScode左下角部分的SSH:AIDLUX呈现绿色，即说明远程连接成功。

4.5 推理测试Aidlux端代码

打开yolov5_code/aidlux文件夹中的yolov5.py进行模型推理测试，在平板/手机版本的AidLux和PC端网页的AidLux中，都可以看到推理的显示结果。

PS：需要注意的是，在运行的时候，需要把手机版本里面的AidLux页面叉掉，免得会有冲突，运行的线程会直接被killed掉。

5. 课堂小作业

以上就是第三节课的内容，我们主要学习了如何使用云服务器，训练yolov5的车辆检测模型。

并将训练好的检测模型，转换成AidLux可以使用的tflite模型，且对测试数据进行推理测试，看到实际的效果。

本节课最后留一个小作业，在第二节课中，我们讲到了“以数据为中心”的鲁棒机器学习策略，大家可以在车辆检测训练中进行尝试。

完成整个车辆检测模型的训练过程后，大家可以发现，我们使用的数据只有1000+的量级，在实际项目中，这是远远不够的，我们需要制作更多的数据来提升模型的检测效果与鲁棒性。

5.1 数据增强技术扩展性讲解

这里给出一些数据增强库，大家可以尝试对车辆数据集进行一定的增强，并尝试进行优化训练。

（1）imgaug：https://github.com/aleju/imgaug

（2）albumentations：https://github.com/albumentations-team/albumentations

（3）autoaugment：https://github.com/4uiiurz1/pytorch-auto-augment

（4）imagecorruptions：https://github.com/bethgelab/imagecorruptions

这里以imgaug为例，其包含了color、blur、blend、weather、contrast等数据增强的方式。

首先需要安装imgaug库：pip install imgaug -i Simple Index

接着设置数据增强模式：

需要注意的是，一些裁剪、旋转等会产生label变化的增强，需要同时修改label文件。在这里，大家可以先尝试不会改变label的数据增强方式，后续我们的特殊测试集也是不包含改变label变化的。

接下来我们就可以输入数据进行增强了：

5.2 小作业内容

数据增强，在模型训练过程中，可以快速增加训练数据集的数量，在一定程度上，对于模型的泛化性还是有一些帮助的。

所以在上面的数据增强演示的基础上，大家可以尝试一下各种数据增强的方式。

在最后的大作业中，我们也将使用一些特殊的测试集来检验模型优化的成果，大家可以将生成的数据用于训练优化模型，作为大作业的部分成果。

以上就是第三节课的内容。

完成作业的同学可以将增强的各式图片选取几张交流分享，本节课所需的数据集、资料包也都在这里。

不懂英语可以学编程吗?,不懂英文可以学编程吗 P5688346 人工智能
大家好，给大家分享一下英语不好能学python编程吗，很多人还不知道这一点。下面详细解释一下。现在让我们来看看！Sourcecodedownload:本文相关源码提到人工智能，就不得不提Python编程语言，大多数人觉得编程语言肯定会涉及到很多代码，满屏的英文字母，想想就头疼，觉得自己不会英语，肯定学不好Python，但是不会英语到底能不能够学习Python呢，下面小编给大家分析分析。其实各位想要
Python基于深度学习的动物图片识别技术的研究与实现 Java老徐 Python 毕业设计 python 深度学习开发语言深度学习的动物图片识别技术 Python动物图片识别技术
博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来，还有大家
【深度学习与大模型基础】第7章-特征分解与奇异值分解 lynn-66 深度学习与大模型基础算法机器学习人工智能
一、特征分解特征分解（EigenDecomposition）是线性代数中的一种重要方法，广泛应用于计算机行业的多个领域，如机器学习、图像处理和数据分析等。特征分解将一个方阵分解为特征值和特征向量的形式，帮助我们理解矩阵的结构和性质。1.特征分解的定义对于一个n×n的方阵A，如果存在一个非零向量v和一个标量λ，使得：则称λ为矩阵A的特征值，v为对应的特征向量。特征分解将矩阵A分解为：其中：Q是由特征
《当人工智能遇上广域网：跨越地理距离的通信变革》程序猿阿伟人工智能
在数字化时代，广域网作为连接全球信息的纽带，让数据能够在不同地区的网络之间流动。然而，地理距离给广域网数据传输带来诸多挑战，如高延迟、低带宽、信号衰减和不稳定等问题。幸运的是，飞速发展的人工智能技术为解决这些难题提供了新的方向，开启了广域网传输的新篇章。广域网传输面临的地理挑战广域网覆盖范围极为广泛，可连接不同城市、国家甚至跨越洲际，这使得数据传输要跨越漫长的地理距离。以跨国公司的广域网为例，其总
震惊！ “深度学习”都在学习什么扉间798 深度学习学习人工智能
常见的机器学习分类算法俗话说三个臭皮匠胜过诸葛亮这里面集成学习就是将单一的算法弱弱结合算法融合用投票给特征值加权重AdaBoost集成学习算法通过迭代训练一系列弱分类器，给予分类错误样本更高权重，使得后续弱分类器更关注这些样本，然后将这些弱分类器线性组合成强分类器，提高整体分类性能。（一）投票机制投票是一种直观且常用的算法融合策略。在多分类问题中，假设有多个分类器对同一数据进行分类判断。每个分类器
NLP高频面试题（十）——目前常见的几种大模型架构是啥样的 Chaos_Wang_ NLP常见面试题自然语言处理架构人工智能
深入浅出：目前常见的几种大模型架构解析随着Transformer模型的提出与发展，语言大模型迅速崛起，已经成为人工智能领域最为关注的热点之一。本文将为大家详细解析几种目前常见的大模型架构，帮助读者理解其核心差异及适用场景。1.什么是LLM（大语言模型）？LLM通常指参数量巨大、能够捕捉丰富语义信息的Transformer模型，它们通过海量的文本数据训练而成，能够实现高度逼真的文本生成、复杂的语言理
深度学习 | pytorch + torchvision + python 版本对应及环境安装 zfgfdgbhs 深度学习 python pytorch
目录一、版本对应二、安装命令（pip）1.版本（1）v2.5.1~v2.0.0（2）v1.13.1~v1.11.0（3）v1.10.1~v1.7.02.安装全过程（1）选择版本（2）安装结果参考文章一、版本对应下表来自pytorch的github官方文档：pytorch/vision:Datasets,TransformsandModelsspecifictoComputerVisionpytor
机器学习 Day01人工智能概述山北雨夜漫步机器学习人工智能
1.什么样的程序适合在gpu上运行计算密集型的程序：此类程序主要运算集中在寄存器，寄存器读写速度快，而GPU拥有强大的计算能力，能高效处理大量的寄存器运算，因此适合在GPU上运行。像科学计算中的数值模拟、密码破解等场景的程序，都属于计算密集型，在GPU上运行可大幅提升运算速度。易于并行的程序：GPU采用SIMD架构，有众多核心，同一时间每个核心适合做相同的事。易于并行的程序能充分利用GPU这一特性
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要