E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
waymo数据集
数据处理和分析之数据降维:t-SNE:使用t-SNE进行数据可视化实践
数据处理和分析之数据降维:t-SNE:使用t-SNE进行数据可视化实践数据降维简介降维技术的重要性在数据科学和机器学习领域,数据降维是一种关键的技术,用于减少
数据集
的维度,同时保留数据的结构和重要信息。
kkchenkx
·
2025-03-16 04:17
数据挖掘
信息可视化
算法
聚类
均值算法
数据挖掘
机器学习
#PyCharm 2024.1新增功能
以下是对这些新增功能的详细解析:一、智能编码辅助HuggingFace模型和
数据集
文档预览PyCharm2024.1引入了HuggingFace模型和
数据集
的快速文档预览功能。
Dingdangr
·
2025-03-16 02:05
pycharm
ide
python
孪生网络模型,当训练集与测试集共用一个
数据集
时,训练准确率为100%,而测试准确率仍在50%左右浮动
问题描述【问题】孪生网络模型,测试效果异常:当训练集与测试集共用一个
数据集
(样本、标签完全相同)时,训练准确率为100%,而测试准确率仍在50%左右浮动(正常来说测试的都
bug菌¹
·
2025-03-16 01:26
全栈Bug调优(实战版)
pytorch
机器学习
在MATLAB中进行并行计算和GPU加速?
在MATLAB中进行并行计算和GPU加速是提升计算性能和处理大规模
数据集
的重要手段。下面将详细介绍如何在MATLAB中实现这些技术。
琛哥的程序
·
2025-03-16 00:18
网络
服务器
人工智能
大模型工程师学习日记(十五):Hugging Face 模型微调训练(基于 BERT 的中文评价情感分析)
1.datasets库核心方法1.1.列出
数据集
使用datasets库,你可以轻松列出所有HuggingFace平台上的
数据集
:fromdatasetsimportlist_datasets#列出所有
数据集
MMMMMMMay Love Code
·
2025-03-15 20:52
学习
bert
人工智能
深度学习
自然语言处理
全量微调
**ResNet-SE + MFCC** 训练框架,包括 **数据加载、训练流程**,以及 **混淆矩阵** 可视化示例
依赖库安装如果你还没安装相关库,请先执行:pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类
数据集
大霸王龙
·
2025-03-15 19:10
系统分析业务
矩阵
python
线性代数
人工智能
机器学习
深度学习
max_samples,batch_size,gradient_accumulation_steps这三个分别的联系和区别
这三个参数都是控制训练数据如何被处理的,它们的作用和区别如下:1.max_samples(最大样本数)定义:限制每个
数据集
最多使用多少条数据。
背太阳的牧羊人
·
2025-03-15 19:09
模型微调
batch
机器学习
人工智能
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr
中文标记的新词汇)→保存新的分词模型、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型、(prepare_pretrain_dataset.py文件)将原始
数据集
进行处理
一个处女座的程序猿
·
2025-03-15 18:38
CaseCode
NLP/LLMs
精选(人工智能)-中级
Colossal
LLaMA-2
自然语言处理
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定
数据集
实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定
数据集
实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件
一个处女座的程序猿
·
2025-03-15 18:38
NLP/LLMs
精选(人工智能)-中级
Colossal-AI
LLaMA-2
大语言模型
自然语言处理
【大一新生必收藏系列】❤机器学习7大方面,30个
数据集
。纯干货分享❤
而事实上一定是,质量高的
数据集
可能是最重要的!
数据集
在机器学习算法项目中具有非常关键的重要性,
数据集
的大小、质量
.Boss.
·
2025-03-15 18:05
机器学习
人工智能
python
算法
开发语言
笔记
#大一新生
llm数据存储基础设施
AI原生数据库,可提供对密集向量、稀疏向量、张量(多向量)和全文的快速混合搜索项目仓库:https://github.com/infiniflow/infinity关键特性令人难以置信的快在百万级矢量
数据集
上实现
galileo2016
·
2025-03-15 17:24
人工智能
机器学习驱动的智能化电池管理技术与应用
故障诊断人工智能机器学习基础人工智能的发展机器学习的关键概念机器学习在电池管理中的应用案例介绍人工智能在电池荷电状态估计中的应用荷电状态估计方法概述基于迁移学习的SOC估计(1)基于迁移学习的SOC估计方法
数据集
萌萌可爱郭德纲
·
2025-03-15 15:07
机器学习
人工智能
超详细的Numpy基础教程!!!
Numpy在数据科学中非常重要,因为它提供了高效的数组处理能力和广泛的数学函数库,这对于处理大规模
数据集
、进行科学计算和机器学习等任务至关重要。
不会爬虫的闲鱼
·
2025-03-15 11:08
numpy
数据分析
python
数据标注工具及其对预训练模型性能的影响
这些模型通过在大规模无标注文本
数据集
上进行预训练,学习到丰富的语言知识和语义表示,并在下游任务中展现出优异的性能。BERT、GPT-3等预训练模型的出现,标志着NLP领域进入了一个新的时代。
AGI大模型与大数据研究院
·
2025-03-15 10:00
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Java Stream 流从零到一全指南
JavaStream是Java8引入的一种用于处理
数据集
合的API,提供了声明式的方式进行数据处理。它能够支持函数式编程风格,极大地简化了集合操作,提高了代码的可读性和可维护性。
秋.
·
2025-03-15 09:54
JAVA
windows
java
开发语言
流
strem
vue中el-tree的懒加载
这种方法可以显著提高页面的加载速度和响应性能,特别是在大型
数据集
上。要使用el-tree的懒加载功能,需要在树形控件组件中提供一个load方法。
zhz5214
·
2025-03-15 09:22
vue
vue.js
elementui
javascript
前端
kettle数据同步
Kettle是一个强大的
数据集
成工具,可以用来实现各种数据同步的需求。
zhz5214
·
2025-03-15 09:22
数据同步
java
etl
big
data
数据仓库
运维开发
基于纯视觉的 GUI 代理的屏幕解析工具(OmniParser)
一、技术原理1.
数据集
构建:从流行网页和应用中提取数据,构建可交互图标检测
数据集
和图标描述
数据集
,为模型训练提供基础。
deepdata_cn
·
2025-03-15 09:51
应用软件
GUI
GEE
数据集
——Harmonized Landsat Sentinel-2 (HLS) 卫星sentinel-2哨兵-2(HLS)
简介统一大地遥感卫星哨兵-2(HLS)项目通过虚拟卫星传感器群提供一致的地表反射率(SR)和大气层顶部亮度(TOA)数据。陆地成像仪(OLI)安装在美国宇航局/美国地质调查局的联合陆地卫星8号和陆地卫星9号上,而多光谱仪(MSI)则安装在欧洲的哥白尼哨兵-2A号和哨兵-2B号卫星上。通过综合测量,可以每2到3天以30米的空间分辨率对陆地进行全球观测。HLS项目使用一套算法来获得OLI和MSI的无缝
此星光明
·
2025-03-15 09:18
GEE数据集专栏
sentinel
遥感
影像
gee
数据集
nasa
HLS-2
Google Earth Engine——导入无云 Sentinel-2 图像和NDVI计算
在本练习结束时,您将能够搜索、查找和可视化范围广泛的遥感
数据集
。在第一个练习中,我们将重点关注
此星光明
·
2025-03-15 09:17
GEE教程训练
sentinel
人工智能
gee
ndvi
归一化植被指数
波段运算
遥感
RV1126笔记三十七:PaddleOCR检测模型训练
PaddleOCR检测模型训练及验证测试1、准备
数据集
在PaddleOCR目录下新建文件夹:train_data,这个文件夹用于存放
数据集
的。
殷忆枫
·
2025-03-15 05:16
RV1126项目实战
笔记
大语言模型微调和大语言模型应用的区别?
过程:通常涉及准备领域特定的
数据集
、设计合适的损失函数、调整超参数(例如学习率、批量大小等),以及选择冻结或解冻部分参数来更新模型
AI Echoes
·
2025-03-15 05:38
深度学习
人工智能
机器学习
大语言模型微调和大语言模型应用的区别?
核心:通过额外的训练(使用特定
数据集
)优化模型的性能,提升其在特定场景下的效果。例如:将通用模型微调为法律咨询、医疗诊断或金融分析的专业模型。
AI Echoes
·
2025-03-15 04:34
人工智能
深度学习
机器学习
pytorch实现cifar10多分类总结
cifar-10简介:CIFAR-10是一个常用的图像分类
数据集
,每张图片都是3×32×32,3通道彩色图片,分辨率32×32。
L_pyu
·
2025-03-15 00:31
人工智能
pytorch
分类
多分类—微调DistilBERT对生物医学文本进行实验方法多分类:Automated Text Mining of Experimental Methodologies from Biomedical
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper:https://arxiv.org/abs/2404.13779github:本文做的就是微调DistilBERT去做多分类任务,训练自己的
数据集
小小帅AIGC
·
2025-03-14 23:56
information
extraction
人工智能
自然语言处理
语言模型
多分类
学术领域
生物医学
Python爬虫教程:如何通过接口批量下载视频封面(FFmpeg技术实现)
实际上,视频封面不仅能提供重要的信息(例如视频标题、主题或情感等),而且它们也能作为
数据集
中的重要属性,用于视频分类、推荐系统等应用。
Python爬虫项目
·
2025-03-14 20:23
python
爬虫
开发语言
数据库
数据分析
scrapy
selenium
python进程与线程_python进程和线程
(一个线程运行一段时间后会释放GIL,另一个线程获取GIL便会执行,然后再释放)进程:是具有一定独立功能的程序关于某个
数据集
合上的一次运行活动。进程是系统进行资源分配和调度的一个独立单位。
weixin_39543758
·
2025-03-14 16:21
python进程与线程
KNN算法实例_手写识别系统
在数据处理过程中,将使用一个常见的手写数字
数据集
,如MNIST
数据集
。
数据集
我们将使用MNIST
数据集
,它包含60000个训练样本和10000个测试样本。
V文宝
·
2025-03-14 16:47
机器学习
算法
深入浅出 K 近邻算法:原理、实践与应用
无论是处理简单
数据集
,还是面对复杂的数据分布,KNN都展现出独特的魅力。本文将深入探讨KNN算法的原理、特点、优缺点、实现步骤以及在分类和回归任务中的具体应用。
烂蜻蜓
·
2025-03-14 12:50
机器学习
近邻算法
算法
医学人工智能影像诊断数据收集与整理
下面我会给出一个简单的示例流程,介绍如何收集、整理和准备医学影像
数据集
,并提供一些基础的Python代码示例。数据收集首先,你需要收集包含医学影像的
数据集
。
V搜xhliang0246
·
2025-03-14 12:18
人工智能
健康医疗
算法
Python 爬虫实战:开放
数据集
抓取与大数据分析应用
引言在数据驱动的时代,开放
数据集
成为了各领域研究和应用的宝贵资源。通过抓取和分析开放
数据集
,我们可以挖掘出有价值的信息,为决策提供支持。
西攻城狮北
·
2025-03-14 10:04
python
爬虫
数据分析
Hive高级SQL技巧及实际应用场景
Hive高级SQL技巧及实际应用场景引言ApacheHive是一个建立在Hadoop之上的数据仓库基础设施,它提供了一个用于查询和管理分布式存储中的大型
数据集
的机制。
小技工丨
·
2025-03-14 07:40
大数据随笔
sql
hive
数据仓库
大数据
LangChain实战:利用LangChain SQL Agent和GPT进行文档分析和交互
我最近接触到一个非常有趣的挑战,涉及到人工智能数字化大量文件的能力,并使用户可以在这些文件上提出复杂的与数据相关的问题,比如:数据检索问题:涉及从数据库中获取特定数据点或
数据集
,例如“电子产品类别中有多少产品
AGI八零后
·
2025-03-14 05:57
langchain
sql
gpt
高效集成销售订单数据到MySQL的方法
聚水潭
数据集
成到MySQL的技术案例分享在企业的数据处理和分析过程中,如何高效地将聚水潭系统中的销售订单
数据集
成到MySQL数据库中,是一个关键的技术挑战。
CL_IN
·
2025-03-14 05:55
mysql
android
数据库
2024年上半年系统架构设计师论文真题
一、论大数据lambda架构大数据处理架构是专门用于处理和分析巨量复杂
数据集
的软件架构。它通常包括数据收集、存储、处理、分析和可视化等多个层面,旨在从海量、多样化的数据中提取有价值的信息。
任铄
·
2025-03-14 02:07
软考2024年上半年真题
系统架构设计师
架构设计
软考
2024
论文
范文
真题
基于YOLOv5的车牌识别系统:从
数据集
到UI界面的实现
1.引言随着智能交通系统的发展,车牌识别技术已成为交通管理、停车场自动化、路面监控等应用中的关键技术之一。车牌识别系统(LicensePlateRecognition,LPR)主要用于识别车辆的车牌号码,并将其转化为可以进一步处理的数据。车牌识别系统通常由图像处理、字符识别、目标检测等多种技术组成。近年来,随着深度学习技术的飞速发展,基于卷积神经网络(CNN)的目标检测算法,如YOLO(YouOn
深度学习&目标检测实战项目
·
2025-03-14 01:33
YOLOv5实战项目
YOLO
ui
分类
数据挖掘
目标跟踪
【系统架构设计师】2024年上半年真题论文: 论大数据lambda架构(包括解题思路和素材)
更多内容请见:备考系统架构设计师-专栏介绍和目录文章目录真题题目(2024年上半年试题1)解题思路论文素材参考真题题目(2024年上半年试题1)大数据处理架构是专门用于处理和分析巨量复杂
数据集
的软件架构
数据知道
·
2025-03-14 01:29
系统架构
架构
系统架构设计师
软考高级
论文
【大模型新书】基于RAG的生成式AI:使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道
Kindle版即包含免费的PDF格式电子书主要特点实现RAG的可追溯输出,将每个响应与其源文档链接,构建可靠的多模态对话智能体在管道中集成RAG、实时人类反馈改进和知识图谱,交付准确的生成式AI模型在动态检索
数据集
与微调静态数据之间平衡成本与性能书籍描述基于
AI大模型-大飞
·
2025-03-13 23:18
人工智能
大模型学习
AI产品经理
语言模型
大模型
RAG
大模型教程
Labelme转Voc、Coco
Q:在github找的cv代码基本都是根据现有且流行的公共
数据集
格式组织的训练
数据集
,这导致我使用labelme标注好之后需要我们重新组织
数据集
labelme2coco#!
小慧1024
·
2025-03-13 22:09
python
Java Stream 流的常见用法和场景,以及注意事项
Stream流提供了一种高效、易读且功能强大的方式来处理
数据集
合,支持顺序和并行两种处理方式。
明天过后ww
·
2025-03-13 20:29
java
windows
Pandas真实案例进阶:从数据清洗到高性能分析的完整指南
案例背景:电商用户行为分析假设某电商平台提供以下
数据集
(模拟数据包含100万条记录),需完成用户行为分析:user_logs.csv:用户浏览、加购、下单日志user_profiles.csv:用户地域
Eqwaak00
·
2025-03-13 20:26
Pandas
python
开发语言
科技
pandas
基于SWIFT和Qwen1.5-0.5B-Chat进行大模型全参微调(魔搭社区)
1,swift框架安装pipinstallms-swift2,模型下载gitclonehttps://www.modelscope.cn/qwen/Qwen1.5-0.5B-Chat.git二、
数据集
准备使用
m0_65156252
·
2025-03-13 18:47
大模型学习笔记
python
开发语言
计算机视觉算法实战——车道线检测
本文将深入探讨当前主流的车道线检测算法,选择性能最好的算法进行详细介绍,并涵盖
数据集
、代码实现、优秀论文、具体应用以及未来的研究方向和改进方向。1.当前相关的算法✨✨车道线检测算法
喵了个AI
·
2025-03-13 17:32
计算机视觉实战项目
计算机视觉
支持 40+ 插件,Spring AI Alibaba 简化智能体私有
数据集
成
作者:张震霆&何裕墙,SpringAIAlibabaContributor在AI智能体(AIAgent)开发的过程中,RAG(Retrieval-AugmentedGeneration)和ToolCalling已经成为两种至关重要的模式。RAG通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和推理能力。通过这种方式,智能体不仅能依赖于模型的预
阿里云云原生
·
2025-03-13 16:29
人工智能
spring
数据挖掘
用Python在Excel工作表中创建数据透视图
数据透视图是基于数据透视表创建的Excel图标,它能够帮助我们从复杂的
数据集
中提炼出有价值的信息,提供直观且易于理解的数据视图。
·
2025-03-13 15:48
【图像去噪】论文复现:TPAMI 2025!全面提升单图像去噪泛化性!像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现,跑通源码,修改各种报错,框架详解,注释详细!
本文亮点:跑通Pixel2Pixel全部源码,包含
数据集
准备、制作像素库(PixelBank)、训练和推理等,
十小大
·
2025-03-13 14:11
pytorch
人工智能
python
深度学习
计算机视觉
图像处理
图像去噪
图像去雾常见
数据集
高质量的
数据集
是算法研究的基础,本文将介绍一些常用的图像去雾
数据集
,包括其特点、应用场景以及下载地址。
梦姐的编程日志
·
2025-03-13 13:09
图像处理
深度学习
人工智能
点云从入门到精通技术详解100篇-基于激光雷达点云的三维目标检测
目录前言图像目标检测算法研究现状点云目标检测算法研究现状基于投影图的方法基于体素的方法基于点云的多模态融合方法2地面点云滤波及神经网络2.1目标检测
数据集
及采集设备2.1.1KITTI
数据集
2.1.2车载激光雷达
格图素书
·
2025-03-13 13:08
目标检测
人工智能
计算机视觉
Epoch 和 Batch Size的设计 + 模型的早停策略(基于上篇)
1.Epoch的设计epoch表示整个
数据集
被模型完整遍历一次。
一只小铁柱
·
2025-03-13 13:08
batch
开发语言
分布式并行策略概述
可以显著减少训练时间,尤其是当模型较小,而
数据集
较大时。缺点:随着模型大小的增加,每个处理单元需要的内存也增加,可能受限于单个GPU的内存容量。大规模时通
灵海之森
·
2025-03-13 10:11
LLM
算法
分布式
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他