E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预积分
NAS(神经架构搜索)基准数据集
在NAS(神经架构搜索)任务中,基准数据集是指专门设计并提供固定的搜索空间、评价指标和
预
训练结果的数据集,用于公平评估和比较不同NAS算法的表现。
TAICHIFEI
·
2025-02-08 03:31
神经架构搜索(NAS)
架构
神经网络
人工智能
机器学习
《量化绿皮书》Chapter 2 Brain Teasers 脑筋急转弯
是经典的量化求职刷题书籍之一,包含以下七章:Chapter1GeneralPrinciples通用技巧Chapter2BrainTeasers脑筋急转弯Chapter3CalculusandLinearAlgebra微
积分
与线性代数
量仔搞靓化
·
2025-02-07 22:03
量化绿皮书
金融
传统AI算法工程师转型指南:如何成功切入大模型领域赛道“
通过这个项目了解到了文本的大致编解码流程,以及一些常见的文本
预
训练任务(mlm等等)。在做项目的过程中,为了节省训练成本,阅读了很多peft(参数高效微调)的文献,并且实践了lor
大模型玩家
·
2025-02-07 17:33
人工智能
算法
面试
ai
职场和发展
语言模型
agi
如何应对ADAS/AD海量数据处理挑战?
目录一、问题背景二、内部构建或获取
预
组装解决方案三、总结随着软件定义汽车的发展,车辆生成的数据量也以前所未有的速度不断增加。这些数据包含广泛的信息,包括传感器数据、遥测数据、诊断数据等。
康谋自动驾驶
·
2025-02-07 15:50
汽车
数据分析
自动驾驶
测试
人工智能
深度搜索MoE:利用大规模
预
训练模型提升信息检索效能
深度搜索MoE:利用大规模
预
训练模型提升信息检索效能DeepSeek-MoE项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-MoE项目简介DeepSeek-MoE
杭律沛Meris
·
2025-02-07 15:20
JVM篇——JVM调优实战,JVM调优参数汇总
什么是调优1、根据需求进行JVM规划和
预
调优2、优化运行JVM运行环境(慢、卡顿,一般都是通过单接口压测或者Skywalking进行全链路压测3、解决JVM运行过程中出现的各种问题,比如MemoryLeak
Be explorer
·
2025-02-07 12:02
JVM
jvm
服务器
运维
基于 DeepSeek-R1 模型微调(SFT)技术详解
目录引言1.1大模型时代与微调的重要性1.2本文目的与结构概述DeepSeek-R1模型基础2.1模型简介2.1.1模型架构2.1.2
预
训练数据与目标2.2模型特点与优势2.2.1语言理解与生成能力2.2.2
zhangjiaofa
·
2025-02-07 10:43
大模型
DeepSeek-R1
SFT
模型微调
大模型生态开源工具整理
最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型训练LLaMA-Factory整体介绍LLaMA-Factory是一个开源的微调框架,为开发者提供简便高效的工具,以便在
预
训练模型基础上快速适应特定任务需求
miracletiger
·
2025-02-07 08:35
开源
三角有理式
积分
——万能代换公式详细推导
三角有理式
积分
中的万能代换是指一种将许多复杂的待积函数转化为某些简单的有理式的技巧,以方便进行
积分
的操作。在考试中,如果一道题实在解不出,可利用万能公式进行代换求解。万能代换详细推导详细推导
Curz酥
·
2025-02-07 02:54
其它
学习
大数据
抽象代数
数据分析
Ollama安装部署deepseek
内置的模型下载llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大规模
预
训练语言模型
angel725
·
2025-02-07 02:53
llama
ai
深度学习篇---深度学习相关知识点&关键名词含义
文章目录前言第一部分:相关知识点一、基础铺垫层(必须掌握的核心基础)1.数学基础•线性代数•微
积分
•概率与统计2.编程基础3.机器学习基础二、深度学习核心层(神经网络与训练机制)1.神经网络基础2.激活函数
Ronin-Lotus
·
2025-02-06 21:21
深度学习篇
深度学习
人工智能
机器学习
pytorch
paddlepaddle
python
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2训练一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载
预
训练权重5.5从OpenAI加载
预
训练权重此前,我们使用一个由一本短篇小说集组成的有限数据集训练了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
Seed Edge- AGI(人工智能通用智能)长期研究计划
目标与定位核心目标是做比
预
训练和大模型迭代更长期、更基础的AGI前沿研究,为AI研究者提供更自由的探索空间和资源支持,探索AGI的新方法,推动通用智能的边界。支持措
自不量力的A同学
·
2025-02-06 13:29
人工智能
java使用react_基于JVM使用React.js和Spring Boot建立同构的Web应用
这是一个展示如何使用Java的SpringBoot实现
预
渲染前端MVC(MVC-frontend)的同构Web应用开源项目:winterbe/spring-react-example·GitHub所谓同构
tarv
·
2025-02-06 05:01
java使用react
宾馆民宿酒店住宿管理系统+小程序项目需求分析文档
主要包含功能有门店管理,门店地图,房间管理,住宿设置,房费管理(平日价,周末价,钟点房价格,节假日价格),房态管理(
预
CSDN专家-赖老师(软件之家)
·
2025-02-06 05:25
SpringBoot
java讲座
微信小程序
mybatis
uniapp
vue
springboot
redis
AIGC从入门到实战:基于大模型的人工智能应用的涌现和爆发
1.2大模型:AIGC的基石AIGC的核心驱动力在于大规模
预
训练模型(简称“大模型”)。这些模型拥
AI天才研究院
·
2025-02-06 01:00
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【Mamba之模型训练系列(四)】将 mamba 扩展到多模态大型语言模型,实现高效推理
将mamba扩展到多模态大型语言模型,实现高效推理背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干训练策略训练数据训练阶段
预
训练阶段多模态指令调整阶段微调策略训练细节训练策略的关键结论实验验证实验设置性能比较推理速度消融研究关键结论参考文献这篇文章介绍了一个名为
愷创作者
·
2025-02-06 00:45
Mamba及多模态模型训练系列
语言模型
人工智能
自然语言处理
OpenCV4.8 开发实战系列专栏之 28 - 图像
积分
图算法
进贾老师OpenCV学堂交流群,+V:OpenCVXueTang_Asst本文关键知识点:图像
积分
图算法
积分
图像是Crow在1984年首次提出,是为了在多尺度透视投影中提高渲染速度,是一种快速计算图像区域和与平方和的算法
gloomyfish
·
2025-02-05 10:38
OpenCV4.8
从入门到工程实战
opencv
计算机视觉
深度学习
图像处理
算法
OpenCV4.8 开发实战系列专栏之 21 - 图像卷积操作
窗口可以理解成一个指定大小的二维矩阵,里面有
预
gloomyfish
·
2025-02-05 10:08
OpenCV4.8
从入门到工程实战
计算机视觉
人工智能
opencv
深度学习
图像处理
【知识图谱增强】大模型应用架构:融合智能与数据的新纪元!
ChatGPT的外部搜索能力,使其不仅限于
预
训练的数据,而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用,通过外部知识的增强能够扩展大模型的能力,让其
大模型入门教程
·
2025-02-05 10:36
知识图谱
架构
人工智能
语言模型
大模型
llama
AI大模型
商用车电子电气架构与主动安全措施探讨
受不断提升的汽车复杂性和逐渐增加的整车电子控制器数量影响,供应商负责电子电气设计的传统方式逐渐被淘汰,
预
研发阶段电子电气架构设计开始引起业界高度重视。结合智能网联汽车特点,必须
汽车知识分享
·
2025-02-05 08:50
架构
汽车
DeepSeek R1赋能智能建造:施工安全风险
预
判系统全栈开发实战与创新解析
基于DeepSeekR1的智能施工安全风险
预
判系统构建与实战一、施工安全风险
预
判技术概述在建筑工程领域,安全风险
预
判是保障施工人员和财产安全的关键环节。
Coderabo
·
2025-02-04 20:55
DeepSeek
R1模型企业级应用
安全
AI大模型学习的七个阶段,学完你就是大模型大师!
预
训练、SFT、RLHF。第三阶段:编程基础与工具使用目标:掌握大
AGI大模型老王
·
2025-02-04 19:48
人工智能
学习
大模型
大模型学习
AI大模型
RAG
大模型教程
2025最新最全AI大模型系统学习路线
必备基础知识**数学基础:**深入理解线性代数、概率论和统计学、微
积分
等基础数学知识。**编程基础:**熟练掌握至少一种编程语言,推荐Python,因为
大模型老炮
·
2025-02-04 18:13
人工智能
学习
大模型
知识图谱
大模型入门
AI大模型
大模型学习
大模型文件格式GGUF格式
GGUF简介当前的大模型的参数规模较大,数以千亿的参数导致了它们的
预
训练结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
·
2025-02-04 18:36
人工智能大模型
【自然语言处理(NLP)】生成词向量:GloVe(Global Vectors for Word Representation)原理及应用
文章目录介绍GloVe介绍核心思想共现矩阵1.共现矩阵的定义2.共现概率矩阵的定义3.共现概率矩阵的意义4.共现概率矩阵的构建步骤5.共现概率矩阵的应用6.示例7.优缺点优点缺点**总结**目标函数训练过程使用
预
训练的
道友老李
·
2025-02-04 16:59
自然语言处理(NLP)
自然语言处理
人工智能
2025年最新最全的大模型学习路线规划,对于零基础入门到精通的学习者来说,可以遵循以下阶段进行
2025年最新最全的大模型学习路线规划,对于零基础入门到精通的学习者来说,可以遵循以下阶段进行:一、基础准备阶段数学基础:学习线性代数、微
积分
、概率论与数理统计等基础知识。
程序员辣条
·
2025-02-04 16:57
学习
大模型学习
AI产品经理
人工智能
LLama
大模型
大模型教程
ADC及DMA的使用原理和使用过程
建立模拟电路到数字电路的桥梁ADC主要用于传感器,传感器一般是利用电阻电容等测量外界信息的物理量,导致测量电路电压发生变化,产生模拟信号,二单片机只能读取数字信号,所以就需要我们把模拟信号转变为数字信号ADC的类型
积分
型
Zack Zhou
·
2025-02-04 15:18
linux
运维
服务器
DeepSeek的出现对全球GPT产业产生的冲击
特别是以GPT(GenerativePre-trainedTransformer)系列模型为代表的大规模
预
训练语言模型,已经在全球范围内引发了广泛关注和应用。
不要em0啦
·
2025-02-03 23:07
机器学习
gpt
A deep multimodal fusion method for personality traits prediction
研究方法模型架构:视觉特征提取:使用
预
训练模型ViT-B16和VGG16。音频特征提取:使用
预
训练模型VGGish。文本分析:使用
预
训练模型GloVe。
m0_59933522
·
2025-02-03 21:20
python
人工智能
机器学习
神经网络
深度学习
目标检测
计算机视觉
Qwen2.5-Max
Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型,基于混合专家(MoE)架构开发,拥有超过20万亿tokens的超大规模
预
训练数据。
百态老人
·
2025-02-03 20:18
笔记
大数据
人工智能
2025年即将到来,三大运营商大量
积分
即将过期
发送以下短信即可把
积分
兑换话费*中国移动:编辑短信HF发送到10658999*中国联通:编辑短信JFJF#Q发送到10010*中国电信:编辑短信JFDH(或DHHF)发送到10001
python机器学习ML
·
2025-02-03 20:47
python
005-《VTK用户指南》--第一部分-VTK简介--第2章-安装--(1)基础概念
在MicrosoftWindows上,您可以安装
预
构建的vtk.exe,并通过运行TCL脚本使用它。
darlingfresher
·
2025-02-03 15:33
VTK系统学习
c++
深度学习:基于MindNLP的RAG应用开发
与传统LLM的区别:传统LLM仅依赖
预
训练参数中的静态知
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
跟李沐学AI:视频生成类论文精读(Movie Gen、HunyuanVideo)
MovieGen:ACastofMediaFoundationModels简介MovieGen是Meta公司提出的一系列内容生成模型,包含了3.2.1
预
训练数据MovieGen采用大约100M的视频-文本对和
Landy_Jay
·
2025-02-03 13:16
人工智能
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在
预
训练新的大模型,在Llama2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
最小边际采样在分类任务中的应用
在一个多分类问题中,模型会对每个样本
预
ningaiiii
·
2025-02-03 11:57
机器学习与深度学习
分类
数据挖掘
人工智能
PID详解
在控制领域应该是应用最为广泛的算法了,在工业控制,汽车电子等诸多领域中运用下面我用一个例子和算法过程来讲解PID的概念PID:P比例控制:基本作用就是控制对象以线性的方式增加,在一个常量比例下,动态输出缺点:会产生稳态误差I
积分
控制
Mr.Fu!
·
2025-02-03 09:45
PID
stm32
单片机
mcu
51单片机
嵌入式硬件
什么是PID控制?PID控制的原理
PID代表比例(Proportional)、
积分
(Integral)和微分(Derivative),它结合了这三种控制方式来实现对系统的控制。
深圳市青牛科技实业有限公司
·
2025-02-03 08:08
顶源
科技
单片机
嵌入式硬件
开发语言
机器人
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模
预
训练模型框架,主要针对大规模Transformer架构模型的高效训练与推理。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
【TIMM应用】timm加载模型create_model,使用本地
预
训练模型
timm加载模型create_model使用本地
预
训练模型1.常规方式,从https://huggingface.co/上下载1-1.timm库中create_model函数的用法1.最简单的用法2.查看可以直接创建的
预
训练模型列表
pen-ai
·
2025-02-03 03:29
深度学习
python
深度学习
神经网络
卷积神经网络
什么是“知识蒸馏”
知识蒸馏是一种将大型
预
训练模型(教师模型)的知识转移到较小模型(学生模型)的技术。这种方法不仅能保留原有模型的性能,还能显著降低模型的复杂度和计算需求,使其更适合在资源受限的环境中部署。知识蒸馏
清风AI
·
2025-02-02 19:55
深度学习
人工智能
神经网络
python
conda
DeepSeek 使用的核心技术预测
1.大规模
预
训练模型架构Transformer变种与优化:基于Transformer架构进行改进,可能引入稀疏注意力机制(如Longform
eso1983
·
2025-02-02 18:22
人工智能
深度学习
机器学习
python
LLM - 大模型 ScallingLaws 的设计 100B
预
训练方案(PLM) 教程(5)
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/145356022免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
【llm对话系统】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将
预
训练大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【自然语言处理(NLP)】基于Transformer架构的
预
训练语言模型:BERT 训练之数据集处理、训练代码实现
文章目录介绍BERT训练之数据集处理BERT原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为
预
训练数据集创建
道友老李
·
2025-02-02 12:04
自然语言处理(NLP)
自然语言处理
transformer
c++中#define和const区别
例如:```cpp#defineN2+3//我们预想的N值是5,我们这样使用Ndoublea=N/2;//我们
预
朝朝暮暮Quake
·
2025-02-02 05:17
c++
开发语言
开源LLMs导览:工作原理、顶级LLM列表对比
2.1
预
训练2.2代币化2.3开源LLM的微调2.4输入编码2.5训练与优化2.6推理三、开源LLM对组织的好处3.1增强的数据安全和隐私3.2节约成本3.3减少供应商依赖性3.4代码透明度四、哪种LLM
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
【AI知识点】三种不同架构的大语言模型(LLMs)的区别
【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】在自然语言处理(NLP)中,
预
训练语言模型(LLMs,LargeLanguageModels)通常基于不同的架构,如仅编码器的模型(Encoder-only
AI完全体
·
2025-02-01 23:09
AI知识点
人工智能
语言模型
自然语言处理
机器学习
深度学习
注意力机制
自注意力机制
SARIMA介绍
SARIMA模型,即季节性自回归
积分
移动平均模型(SeasonalAutoregressiveIntegratedMovingAverageModel),是一种用于处理和预测具有明显季节性变化的时间序列数据的统计模型
能源革命
·
2025-02-01 21:27
技术
能源
算法
能源
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他