E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
训练bug调试and注意事项
全方位解析:大语言模型评测方法的综合指南
自2017年Transformer模型提出以来,自然语言处理研究逐步转向基于该框架的预
训练
模型,如BERT、GPT、BART和T5等。这些预
训练
模型与下游任务适配后,持续刷新最优结果。
大模型玩家
·
2025-03-01 08:28
语言模型
人工智能
自然语言处理
深度学习
agi
大模型
搜索引擎
大语言模型原理与工程实践:手把手教你
训练
7B 大语言模型 自动化
训练
框架
大语言模型原理与工程实践:手把手教你
训练
7B大语言模型自动化
训练
框架关键词:大语言模型、7B模型、自动化
训练
、深度学习、神经网络、自然语言处理、分布式计算文章目录大语言模型原理与工程实践:手把手教你
训练
AI天才研究院
·
2025-03-01 07:24
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)目录顺序如下国内外,垂直领域大模型Agent和指令微调等
训练
框架开源指令,预
训练
,rlhf,对话,agent
训练
数据梳理
代码讲故事
·
2025-03-01 07:54
智能工具
Prompt
LLM
AIGC
模型
开源
数据集
深度学习
OpenCV 入门(六) —— Android 下的人脸识别
OpenCV入门系列:OpenCV入门(一)——OpenCV基础OpenCV入门(二)——车牌定位OpenCV入门(三)——车牌筛选OpenCV入门(四)——车牌号识别OpenCV入门(五)——人脸识别模型
训练
与
tmacfrank
·
2025-03-01 07:53
Android
#
NDK
opencv
android
人工智能
【读书笔记】《What is Mathematics》第一章:自然数
我数学渣锻炼自己解决问题的能力数据结构逻辑
训练
为将来转行数据科学做底子(也许永远都不会转)考研(emmm想考一个非全日制玩一玩,感觉非全日制很适合工科学生)嗯,有了以上的理由,所以一定要坚持下去✊为什么是这本书
还没入门的大菜狗
·
2025-03-01 07:21
具体数学
读书笔记
BERT模型深入理解——自然语言处理的里程碑
BERT创新性地使用预
训练
+微调模式,先用预
训练
在大量无标注的语料中进行自监督学习,学习到语言的通用规律,然后在少量有标注的数据中进行有监督学习,适配更精细化的任务。这种模式一直影响到最新的大模型结
cufewxy2018
·
2025-03-01 06:47
自然语言处理
bert
人工智能
怎样通过人机融合智能去除“机器幻觉”?
机器幻觉指的是人工智能模型在处理信息时,做出错误的、非理性的判断或预测,这种现象往往源于模型在
训练
数据中的偏差、不完全信息或过度依赖某些特定模式。
人机与认知实验室
·
2025-03-01 06:45
【附源码】基于opencv+pyqt5搭建的人脸识别系统
文章目录前言一、人脸检测二、人脸识别1.
训练
识别器2.识别人脸三、界面相关1.Qlabel展示图片2.表格跟随内容而增加和减少3.选择图片文件4.警告框四、源码获取总结前言人脸识别技术作为人工智能领域的一颗璀璨明珠
~啥也不会~
·
2025-03-01 06:12
opencv
人工智能
计算机视觉
人脸识别
pyqt
计算机视觉与机器学习之文档解析与向量化技术加速多模态大模型
训练
与应用——文件向量化大模型!
目录前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术Layout-engine1.3.3、文档树提取关键技术Catalog-engine1.3.4、双栏1.3.5、非对称双栏1.3.6、双栏+表格1.3.7、无线表格1.3.8、合并单元格
知世不是芝士
·
2025-03-01 04:57
计算机视觉
人工智能
大语言模型
ai大模型
多模态大模型
机器学习
LLM
GitHub每日最火火火项目(2.28)
olmocr项目介绍:olmocr是由allenai开发的一款用于将PDF文件线性化,以适配大语言模型(LLM)数据集和
训练
的工具包。在大语言模型的
训练
过程中,数据的格式和预处理极为关键。
FutureUniant
·
2025-03-01 03:50
github日推
github
人工智能
计算机视觉
音视频
ai
深入理解PyTorch模型
训练
所需的数据集
在PyTorch中,模型
训练
的核心是数据集(Dataset)。数据集是模型
训练
的基础,它提供了模型
训练
所需的所有输入数据和对应的标签。理解数据集的结构、加载方式以及如何预处理数据是成功
训练
模型的关键。
mosquito_lover1
·
2025-03-01 03:20
pytorch
人工智能
python
YOLOv9与YOLOv8创新点差异概述:
这意味着模型在
训练
过程中可能更加关注梯度信息的质量和流向,从而更有效地进行参数
奔强的程序
·
2025-03-01 02:42
YOLO
DeepSeek 最新发布 DeepEP:一款用于 MoE 模型
训练
和推理的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
Nextjs项目服务器部署(简)
文章目录一、nextjs一、安装PM2二、使用PM2启动Next.js应用三、配置自动重启四、设置系统服务(持久化)五、常用命令六、验证部署
注意事项
后面记得改要将Next.js项目的npmrunstart
风吹落叶花飘荡
·
2025-03-01 00:00
服务器
运维
【数据结构】哈希表
目录哈希表基本思想基本原理哈希表工作机制简化描述关于查找、插入和删除HashMap主要成员变量主要方法内部实现细节
注意事项
哈希表哈希表是一种基于哈希函数的数据结构,它通过键值对的形式存储数据,并允许通过键快速查找对应的值
alien爱吃蛋挞
·
2025-02-28 23:54
数据结构
Java
深入Java接口与类
数据结构
java
使用YOLOv8
训练
自己的数据集:详细教程
使用YOLOv8
训练
自己的数据集:详细教程引言YOLOv8是Ultralytics团队开发的新一代目标检测算法,以其高效的性能和简洁的API而闻名。
zru_9602
·
2025-02-28 22:52
人工智能
YOLO
谁说消费级硬件不能玩 DeepSeek - R1 微调?手把手教你进阶AI玩家
微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源,但借助正确的工具,在消费级硬件上进行高效
训练
是可行的。
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
谈谈DeepSeek-v3在算力约束下的出色工作
在算力约束下的出色工作原创渣Bzartbot2024年12月28日22:52上海寒冷的周末,加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了Llama3405B模型,要知道Meta
训练
强化学习曾小健
·
2025-02-28 22:19
Deepseek原理与使用
人工智能
PyTorch 常见的损失函数:从基础到大模型的应用
PyTorch常见的损失函数:从基础到大模型的应用在用PyTorch
训练
神经网络时,损失函数(LossFunction)是不可或缺的“裁判”。
阿正的梦工坊
·
2025-02-28 22:19
LLM
PyTorch
pytorch
人工智能
python
深入理解 Vue 的异步更新机制:原理、应用与最佳实践
本文将深入探讨Vue的异步更新机制,从其基础概念、工作原理,到实际应用中的
注意事项
与最佳实践,全方位剖析这一特性。Vue的响应式系统:异步更新的基石在深入了解异
东锋1.3
·
2025-02-28 22:49
vue.js
vue.js
前端
javascript
DeepSeek五天开源5大杀器实测:
训练
成本砍半+推理速度起飞,算法圈已疯(附删库跑路教程)
算法圈惊呼:
训练
成本腰斩,AGI进度条拉爆!根本学不完,学不完速删祖传代码,GitHub星链已就位:https://github.com/deepseek-aiDay1:FlashMLA(
AI仙人掌
·
2025-02-28 22:18
人工智能
深度学习
人工智能
大模型
算法
开源
Spring Boot项目@Cacheable注解的使用
下面详细介绍如何使用@Cacheable注解以及相关的配置和
注意事项
。1.基本用法1.1添加依赖首先,确保你的项目中包含了SpringCache的依赖。
m0_54851477
·
2025-02-28 22:47
面试
学习路线
阿里巴巴
spring
boot
spring
java
目标检测YOLO实战应用案例100讲-面向无人机图像的小目标检测
目录知识储备YOLOv8无人机拍摄视角小目标检测数据集结构环境部署说明安装依赖模型
训练
权重和指标可视化展示
训练
YOLOv8PyQt5GUI开发主窗口代码main_window.py使用说明无人机目标跟踪一
林聪木
·
2025-02-28 19:00
无人机
目标检测
人工智能
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)
本文目录如下:目录1概述2运行结果2.1有/无策略奖励2.2
训练
结果12.2
训练
结果23参考文献4Python代码、数据、文章1概述文献来源:根据微电网或微能源网是否与主电网相连接,可将其分为并网型和独立型
@橘柑橙柠桔柚
·
2025-02-28 19:58
python
算法
人工智能
基于深度学习的SSD口罩识别项目完整资料版(视频教程+课件+源码+数据)
算法原理回顾.mp403数据集收集.mp404自定义数据集.mp405生成anchors.mp406展示anchors.mp407计算iou值.mp408计算target.mp409定义模型.mp410模型
训练
AI方案2025
·
2025-02-28 18:54
深度学习
人工智能
Python 爬虫实战:在饿了么,爬取美食店铺销量与好评率数据
工具与库2.3法律与道德声明三、实战篇3.1分析饿了么页面3.2模拟登录3.3获取店铺列表3.4爬取更多店铺数据3.5数据存储四、分析篇4.1数据清洗4.2热门店铺分析4.3好评率分析五、总结与展望六、
注意事项
一
西攻城狮北
·
2025-02-28 18:18
python
爬虫
美食
实战案例
Pytest学习笔记(6)-配置文件pytest.ini
文章目录配置文件pytest.ini前言常用配置项markerstestpathsaddoptsxfail_strictlog_clinorecursedirs更改测试用例收集规则
注意事项
配置文件pytest.ini
_黎晟
·
2025-02-28 17:13
Pytest学习笔记
python
测试用例
开发语言
2.8 通过微调提升模型的准确度与效率-大模型ACP模拟题-真题
A.通过低秩矩阵间接影响模型行为B.会直接修改原始模型权重✅C.支持参数回退操作D.
训练
效率高于全参微调解析:LoRA通过添加额外参数而非修改原权重实现微调当
训练
过程中出现
admin皮卡
·
2025-02-28 17:12
阿里云大模型ACP-考试回忆
人工智能
java
ai
基于Python实现的【机器学习】小项目教程案例
以下是一个基于Python实现的【机器学习】小项目教程案例,结合的经典案例与最佳实践,涵盖数据预处理、模型
训练
与评估全流程,并附详细代码说明与结果分析:案例1:鸢尾花分类(SVM算法)数据集:IrisDataset
xinxiyinhe
·
2025-02-28 16:03
人工智能
github
python
机器学习
【AI论文】SongGen:用于文本到歌曲生成的单阶段自回归Transformer模型
现有方法通常采用多阶段生成流程,导致
训练
和推理过程繁琐。在本文中,我们提出了SongGen,一个完全开源的单阶段自回归Transformer模型,专为可控歌曲生成而设计。
东临碣石82
·
2025-02-28 15:58
人工智能
回归
transformer
低代码革命:基于DeepSeek微调模型实现前端代码自动生成与私有JS API调用的实战指南
从模型
训练
、代码生成到API集成,提供全面的实战方法论,结合CodeBLEU评估指标与异步调用优化技巧,确保代码质量与执行效率。
Light60
·
2025-02-28 15:58
低代码
实战篇
AI应用
低代码开发
DeepSeek
微调模型
JavaScript
API
智能生成
Python深度学习实践:使用TensorFlow构建图像分类器
我们将深入探讨卷积神经网络(CNN)的基本原理,实现一个能够识别MNIST手写数字的数据集模型,并通过实战代码演示整个过程,最终展示模型的
训练
与评估。
Evaporator Core
·
2025-02-28 13:42
Python开发经验
python
深度学习
tensorflow
STM32 微控制器库RCC_OscInitTypeDef结构参数介绍
`HSIState`(5)`HSICalibrationValue`(6)`LSIState`(7)`PLL`3.使用步骤(1)定义结构体(2)配置结构体成员(3)调用HAL初始化函数4.示例代码5.
注意事项
降薪码农
·
2025-02-28 13:42
单片机开发
stm32
嵌入式硬件
单片机
DeepSeek掘金——DeepSeek R1架构和
训练
过程图解
DeepSeek掘金——DeepSeekR1架构和
训练
过程图解为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。
不二人生
·
2025-02-28 12:09
DeepSeek掘金指南
人工智能
大模型
【001】C++的第一个程序Hello World
C++的第一个应用程序(HelloWorld程序)引言一、代码二、代码解释三、
注意事项
四、注释语句总结引言作者简介:专注于C/C++高性能程序设计和开发,理论与代码实践结合,让世界没有难学的技术。️
Lion 莱恩呀
·
2025-02-28 12:07
C++从零开始到精通
c++
开发语言
vscode
linux
深度学习进阶:构建多层神经网络
我们还会使用更复杂的分类任务来
训练
模型,并评估其性能。1.多层神经网络的结构在实际应用中,深度学习模型通常包含多个隐藏层,这种结构被称为深度神经网络(DNN)。多层神经网络能够学习更
孤寂大仙v
·
2025-02-28 12:37
深度学习
神经网络
人工智能
大模型调优方法:提示工程、RAGs 与微调对比
就算是强大的预
训练
LLM也可能无法直接满足项目中的特定需求。
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
实现一个 RDMA 用户态驱动程序
实际上,高性能、易维护、易定制的网络基础设施对于提升AI
训练
、推理的效率是至关重要的一环。
·
2025-02-28 11:17
SQLite自增列相关内容
文章目录相关知识创建表插入数据查看自增列重置自增列
注意事项
参考文档相关知识SQLite的自增用法和MySQL类似:使用的关键字是AUTOINCREMENT(MySQL用的是AUTO_INCREMENT)
秦时明月之君临天下
·
2025-02-28 10:52
SQLite
sqlite
jvm
数据库
pytorch基础-layernormal 与 batchnormal
nn.LayerNorm(层归一化)和nn.BatchNorm(批量归一化)是深度学习中常用的两种归一化方法,都有助于提高模型的
训练
效率和稳定性,但它们在归一化维度、应用场景、计算方式等方面存在明显区别
yuweififi
·
2025-02-28 10:49
pytorch
人工智能
python
通过TensorFlow实现简单深度学习模型(2)
前文我们已经实现了对每批数据的
训练
,下面继续实现一轮完整的
训练
。完整的
训练
循环一轮
训练
就是对
训练
数据的每个批量都重复上述
训练
步骤,而完整的
训练
循环就是重复多轮
训练
。
yyc_audio
·
2025-02-28 10:47
人工智能
深度学习
python
机器学习
Pytorch使用手册—使用TACOTRON2进行文本到语音转换(专题二十四)
一、概述本教程展示了如何使用torchaudio中的预
训练
Tacotron2构建文本到语音的管道。文本到语音的管道流程如下:文本预处理首先,输入的文本被编码为一系列符号。
AI专题精讲
·
2025-02-28 09:43
Pytorch入门到精通
pytorch
人工智能
python
Transformer 代码剖析2 - 模型
训练
(pytorch实现)
参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可
训练
参数统计参数数量返回总数技术解析
lczdyx
·
2025-02-28 09:38
Transformer代码剖析
transformer
pytorch
深度学习
人工智能
python
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记
LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明,可以通过text-imagegenerator提取高质量的三维模型,尽管该生成模型并未经过三维
训练
Im Bug
·
2025-02-28 07:24
3d
论文阅读
神经网络中的Adagrad
Adagrad(AdaptiveGradient)是一种自适应学习率的优化算法,专门设计用于在
训练
过程中自动调整每个参数的学习率。
化作星辰
·
2025-02-28 07:53
神经网络
人工智能
深度学习
DeepSeek R1 简单指南:架构、
训练
、本地部署和硬件要求
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下,增强LLM解决复杂问题的能力上,取得了重要进展。DeepSeek-R1技术概述模型架构DeepSeek-R1不是一个单独的模型,而是包括DeepSeek-R1-Zer
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
C++库std::future
std::future介绍成员函数作用使用场景异步任务并发控制结果获取用法示例使用std::async关联异步任务使用std::promise与std::future配合结果获取与异常处理
注意事项
其他std
码农葫芦侠
·
2025-02-28 06:17
C++库
c++
JavaScript BOM(浏览器对象模型)与 `setTimeout` 函数:控制浏览器行为的利器
`setTimeout`函数:实现延时操作⏳基本语法:示例:基本使用`setTimeout`返回值:定时器ID示例:取消定时器`setTimeout`的实际应用`setTimeout`的
注意事项
⚠️小结
人才程序员
·
2025-02-28 06:15
杂谈
javascript
开发语言
ecmascript
firefox
html5
jquery
safari
【python 机器学习】sklearn ROC曲线与AUC指标
通俗介绍:学术解释:2.在`sklearn`中绘制ROC曲线与计算AUC2.1导入库和数据2.2加载数据集2.3
训练
模型2.4预测概率2.5计算FPR、TPR和AUC2.6绘制ROC曲线3.解析ROC曲线和
人才程序员
·
2025-02-28 06:11
杂谈
机器学习
python
sklearn
人工智能
深度学习
神经网络
目标检测
月之暗面改进并开源了 Muon 优化算法,对行业有哪些影响?
互联网各领域资料分享专区(不定期更新):Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大模型
训练
领域引发了广泛关注,其核心创新在于显著降低算力需求(相比AdamW减少48%的FLOPs
互联网之路.
·
2025-02-28 05:11
知识点
开源
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他