E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
记忆训练
【深度解析】DeepSeek-R1的五大隐藏提示词
LangChain系列文章目录01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块:四种
记忆
类型详解及应用场景全覆盖03-全面掌握LangChain
吴师兄大模型
·
2025-02-07 20:54
现代大模型技术与应用
deepseek
DeepSeek-R1
大模型
人工智能
prompt
提示词
LLM
毕业设计:基于卷积神经网络的鲜花花卉种类检测算法研究
目录前言课题背景和意义实现技术思路一、算法理论基础1.1卷积神经网络1.2目标检测算法二、数据集2.1数据集2.2数据扩充三、实验及结果分析3.1实验环境搭建3.2模型
训练
最后前言大四是整个大学期间最忙碌的时光
HaiLang_IT
·
2025-02-07 20:23
深度学习毕业设计
机器学习
毕业设计
目标检测
AI商业化:如何包装技术并找到客户需求?
一、引言在过去几年里,从GPT、Transformer到DeepSeek,以及分布式
训练
和微调技术的发展,为AI技术带来了质的飞跃。然而,光有先进的技术并不足以实现商业成功。如何将这些技术包装成易于
hjy1821
·
2025-02-07 17:34
AI
人工智能
深入浅出 DeepSeek-Coder-V2 是如何打破闭源模型封锁的
今天,我们就从模型架构、
训练
数据、强化学习优化三
fertiland
·
2025-02-07 17:33
人工智能
深度学习
传统AI算法工程师转型指南:如何成功切入大模型领域赛道“
通过这个项目了解到了文本的大致编解码流程,以及一些常见的文本预
训练
任务(mlm等等)。在做项目的过程中,为了节省
训练
成本,阅读了很多peft(参数高效微调)的文献,并且实践了lor
大模型玩家
·
2025-02-07 17:33
人工智能
算法
面试
ai
职场和发展
语言模型
agi
ubuntu22.04,瑞芯微RK3568部署YOLOv5(纯干货版)
目录1,
训练
自己的数据集转换为onnx2,onnx格式→rknn格式3,3588平台部署1,
训练
自己的数据集转换为onnx在Anaconda的yolov5,进入yolov5根目录,终端运行如下pythonmodels
今夕是何年,
·
2025-02-07 16:58
视觉算法部署
YOLO
人工智能
深度学习
深度搜索MoE:利用大规模预
训练
模型提升信息检索效能
深度搜索MoE:利用大规模预
训练
模型提升信息检索效能DeepSeek-MoE项目地址:https://gitcode.com/gh_mirrors/de/DeepSeek-MoE项目简介DeepSeek-MoE
杭律沛Meris
·
2025-02-07 15:20
100.5 AI量化面试题:在使用LSTM预测股票价格时,如何有效处理金融时间序列的非平稳性?
目录0.承前1.数据预处理1.1平稳性检验1.2数据转换2.特征工程2.1技术指标构建2.2时间特征提取3.LSTM模型设计3.1数据准备3.2模型架构4.
训练
与验证4.1时序交叉验证4.2滚动预测5.
AI量金术师
·
2025-02-07 14:45
金融资产组合模型进化论
人工智能
lstm
金融
python
机器学习
大数据
大语言模型原理基础与前沿 高效的MoE架构
大语言模型原理基础与前沿高效的MoE架构关键词:大语言模型,MoE架构,参数高效微调,分布式
训练
,模型压缩,推理加速1.背景介绍1.1问题的由来随着深度学习技术的飞速发展,大语言模型(LargeLanguageModels
AI架构设计之禅
·
2025-02-07 13:39
DeepSeek
R1
&
大数据AI人工智能
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
SRMT:一种融合共享
记忆
与稀疏注意力的多智能体强化学习框架
在人工智能(AI)和强化学习(RL)领域的发展进程中,长期
记忆
维持和决策优化一直是核心技术难点。传统强化学习模型在经验回溯方面存在局限性,这显著制约了其在复杂动态环境中的应用效果。
·
2025-02-07 13:28
基于深度学习的行人摔倒检测识别系统 —— 使用YOLOv5实现行人摔倒检测
目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型
训练
与优化4.1YOLOv5
2025年数学建模美赛
·
2025-02-07 13:34
深度学习
YOLO
人工智能
yolo
ui
当大模型遇上Spark:解锁大数据处理新姿势
大模型,即大规模机器学习模型,是利用海量数据和强大算力
训练
出来的“大参数”模型。其发展历程可谓是一部科技创新的传奇史。从20世纪中叶人工智能概念的提出,到2006年深度学习技术崭露
敏叔V587
·
2025-02-07 11:52
spark
大数据
分布式
基于langchain和gradio实现天气查询智能体,本地ollama大模型调实时天气api,前端输入即可自动返回天气
介绍:众所周知大模型
训练
数据都是用的历史数据,无法实时查询天气信息,因此使用本地ollama大模型调实时天气api接口的方式,大模型识别和理解你要查询的请求,然后调第三方天气api接口返回实时天气。
福小白
·
2025-02-07 10:48
langchain
前端
基于 DeepSeek-R1 模型微调(SFT)技术详解
目录引言1.1大模型时代与微调的重要性1.2本文目的与结构概述DeepSeek-R1模型基础2.1模型简介2.1.1模型架构2.1.2预
训练
数据与目标2.2模型特点与优势2.2.1语言理解与生成能力2.2.2
zhangjiaofa
·
2025-02-07 10:43
大模型
DeepSeek-R1
SFT
模型微调
idea2024新特性以及idea2024.1版本安装、激活
一、idea2024新特性1、行级别的代码补全IDEA现在可以根据代码的上下文分析,给我们提示一整行的代码,借助了大模型对数据的分析
训练
,同时确保了代码数据的安全性。
阿东知识库
·
2025-02-07 09:39
开发工具
intellij-idea
pycharm
性能优化
java
python
大模型元年:人工智能的“寒武纪大爆发”
一、从“专用”到“通用”:大模型开启AI新范式传统的人工智能模型往往是针对特定任务进行
训练
的“专用工具”,例如图像识别、语音识别等。而大模
小马过河R
·
2025-02-07 08:05
AI人工智能
人工智能
机器学习
深度学习
大模型生态开源工具整理
最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型
训练
LLaMA-Factory整体介绍LLaMA-Factory是一个开源的微调框架,为开发者提供简便高效的工具,以便在预
训练
模型基础上快速适应特定任务需求
miracletiger
·
2025-02-07 08:35
开源
python写接口调用模型_对YOLOv3模型调用时候的python接口详解
之前
训练
好的模型,在模型调用的时候,总是在lib=CDLL("/home/*****/*******/darknet/li
weixin_39835607
·
2025-02-07 07:28
python写接口调用模型
聚类算法与应用
3.1基本原理3.1.1树状结构的建立3.1.2聚合或分裂策略3.2应用场景3.2.1生物学中的基因表达数据聚类3.2.2文本数据的主题分类4.聚类算法的实践应用4.1数据准备与预处理4.2算法选择与模型
训练
theskylife
·
2025-02-07 06:16
数据挖掘
算法
聚类
机器学习
数据挖掘
人工智能
DeepSeek开源引擎引爆央国企AI革命:一场自主可控的“智能突围战“
然而现实却充满挑战——某能源集团AI模型
训练
耗时长达72小时,某金融机构因数据安全问题被迫放弃云端方案,某制造央企为适配国产硬件额外投入超千万...这些痛点直指三大困局:性能瓶颈:
Light60
·
2025-02-07 05:43
央国企
AI应用
产业篇
人工智能
DeepSeek
央国企AI革命
4.2 过拟合与欠拟合
4.2.1什么是过拟合与欠拟合过拟合:一个假设在
训练
数据上能够获得比其他假设更好的拟合,但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。
望云山190
·
2025-02-07 05:11
算法
人工智能
Python中的GRU模型
其中,一种叫做长短时
记忆
网络(LSTM)的模型在很多领域都表现出了优秀的性能,但是LSTM也存在着一些问题,例如计算资源消耗大、内存占用高等问题。
NoABug
·
2025-02-07 04:37
python
gru
tensorflow
tensorflow模型继续
训练
??
之前
训练
的模型没有收敛就结束了,再次
训练
,增加
训练
次数是不是就会收敛了?有时,网上的参考答案并不能解决问题,因为每个人的细节不同,总有些关键细节问题决定成败。
小李飞刀李寻欢
·
2025-02-07 04:35
python
speechdnn
tensorflow
模型恢复
继续训练
global_step
2025年工会考试真题附答案
·填空题:考察考生对工会知识、法律法规、劳动关系等方面的
记忆
和理解能力。例如,关于工会法、中国工会章程等知识点的填空题。·简答题
学视线
·
2025-02-07 03:28
其他
使用一个大语言模型对另一个大语言模型进行“调教”
以下是基于搜索结果整理的详细步骤和方法:1.准备工作安装必要的库•Transformers:用于加载和
训练
模型。•Datasets:用于处理数据集。
大霸王龙
·
2025-02-07 03:25
python
人工智能
python
Ollama安装部署deepseek
内置的模型下载llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大规模预
训练
语言模型
angel725
·
2025-02-07 02:53
llama
ai
【hot100】189轮转数组
一、思路简单思路,使用将原数组移动到新数组后,然后把新数组移回原数组进阶思路,使用数学特性,将数组整体反转,然后单独反转移动区间和剩余区间二、
记忆
1.以原数组为基准0移动到新数组和以新数组为基准0从原数组迁移两种思路和写法
鱼力舟
·
2025-02-07 01:13
HOT100
算法
数据结构
Koa学习笔记:Cookie和Session
(例子:web浏览器可以
记忆
用户的登录信息)当服务端setCookie之后下次会自动带上相应的cookie信息2.用户登录机制解析cookie机制如下图所示:用户第一次登录输入帐号密码,传到服务端服务端确认登录成功后返回
月半叫做胖
·
2025-02-07 01:40
Koa笔记
Cookie
Session
Koa
Stable Diffusion使用样例实践(二)
细节上可以多
训练
几次,得到满意的为准。
Allen-Steven
·
2025-02-07 00:38
SD
创作实践
stable
diffusion
ai
STM32进阶 存储器
存储器是用来存储程序代码和数据的部件,有了存储器计算机才具有
记忆
功能。二进制历史:电报员敲
雁过留声花欲落
·
2025-02-07 00:35
STM32
进阶
stm32
嵌入式硬件
单片机
DeepSeek R1和V3区别
DeepSeekR1和V3是深度求索(DeepSeek)推出的两款大模型,尽管基于相似的技术框架(如混合专家架构MoE),但在设计目标、
训练
方法、性能表现和应用场景上存在显著差异。
@Rocky
·
2025-02-06 23:02
大模型
语言模型
代码随想录算法
训练
营第二十八天| 回溯算法01
77.组合对着在回溯算法理论基础给出的代码模板,来做本题组合问题,大家就会发现写回溯算法套路。在回溯算法解决实际问题的过程中,大家会有各种疑问,先看视频介绍,基本可以解决大家的疑惑。本题关于剪枝操作是大家要理解的重点,因为后面很多回溯算法解决的题目,都是这个剪枝套路。题目链接/文章讲解:代码随想录视频讲解:带你学透回溯算法-组合问题(对应力扣题目:77.组合)|回溯法精讲!_哔哩哔哩_bilibi
Rachela_z
·
2025-02-06 23:02
算法
机器学习算法 —— 朴素贝叶斯
博客的简介(文章目录)目录朴素贝叶斯朴素贝叶斯的介绍朴素贝叶斯的优点朴素贝叶斯的缺点朴素贝叶斯的应用实战(贝叶斯分类)莺尾花数据库函数导入数据导入和分析模型
训练
模型预测原理简析模拟离散数据集朴素贝叶斯朴素贝叶斯的介绍朴素贝叶斯法
ZShiJ
·
2025-02-06 23:01
机器学习算法
机器学习
算法
分类
贝叶斯
[论文笔记] Deepseek技术报告
介绍了两代模型:DeepSeek-R1-Zero(纯RL,无SFT冷启动数据)和DeepSeek-R1(在RL前加入少量冷启动数据和多阶段
训练
流程,提升可读性及推理表现)。
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
深度学习篇---深度学习相关知识点&关键名词含义
文章目录前言第一部分:相关知识点一、基础铺垫层(必须掌握的核心基础)1.数学基础•线性代数•微积分•概率与统计2.编程基础3.机器学习基础二、深度学习核心层(神经网络与
训练
机制)1.神经网络基础2.激活函数
Ronin-Lotus
·
2025-02-06 21:21
深度学习篇
深度学习
人工智能
机器学习
pytorch
paddlepaddle
python
深度学习篇---深度学习中的超参数&张量转换&模型
训练
文章目录前言第一部分:深度学习中的超参数1.学习率(LearningRate)定义重要性常见设置2.批处理大小(BatchSize)定义重要性常见设置3.迭代次数(NumberofEpochs)定义重要性常见设置4.优化器(Optimizer)定义重要性常见设置5.损失函数(LossFunction)定义重要性常见设置6.正则化(Regularization)定义重要性常见设置7.网络架构(Net
Ronin-Lotus
·
2025-02-06 21:50
深度学习篇
深度学习
人工智能
paddlepaddle
pytorch
超参数
张量转换
模型训练
利用Docker简化机器学习应用程序的部署和可扩展性
传统方法往往需要帮助将ML模型操作化,原因包括
训练
和服务环境之间的差异或扩展的困难。Docker是一个旨在自动化应用程序部署、扩展和管理的开源平台,作为解决这些挑战的方法。所提出的方法将ML模型及其
荆州克莱
·
2025-02-06 20:44
面试题汇总与解析
spring
cloud
spring
boot
spring
技术
css3
LDA主题分析—情感分析案例
以下是一个针对投诉内容进行情感分析的完整案例,包含数据准备、模型
训练
、情感分析以及结果展示的过程。案例:投诉内容情感分析步骤1:数据准备首先,我们准备一份包含用户投诉内容的数据集。
rubyw
·
2025-02-06 20:41
机器学习
数据分析
python
机器学习
C++——虚函数/纯虚函数
前言提示:这里可以添加本文要记录的大概内容:在学习C++的过程中,对于虚函数的概念有一定的疑惑,因此写一篇文章帮助自己
记忆
和理解。提示:以下是本篇文章正文内容,下面案例可供参考一、虚函数是什么?
码,码点好
·
2025-02-06 19:09
c++
开发语言
T1:实现mnist手写数字识别
>-**本文为[365天深度学习
训练
营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg)中的学习记录博客**>-**原作者:[K同学啊](https
哈维羊
·
2025-02-06 19:33
neo4j
LLM知识蒸馏代码讲解及
训练
实验
LLM知识蒸馏代码讲解及
训练
实验知识蒸馏简单讲即使用大规模参数的模型对小规模参数模型进行蒸馏,且不是简单的只使用答案,是需要两个模型的logprob进行交互的,故两个模型的vocabsize必须是一样的
淡水,
·
2025-02-06 18:33
深度学习
pytorch
人工智能
nlp
python
知识蒸馏
深度学习学习笔记 --- 动量momentum
一、动量momentum的由来
训练
网络时,通常先对网络的初始值按照某种分布进行初始化,如:高斯分布。
杨鑫newlfe
·
2025-02-06 18:01
Machine
Learning
深度学习
动量
momentum
梯度下降
DeepSeek与OpenAI:谁是AI领域的更优选择?
一、成本与性价比1.
训练
成本DeepSeek在
训练
成本上的优势极为显著。其开发团队通过创
gs80140
·
2025-02-06 18:28
基础知识科谱
AI
人工智能
TensorFlow、把数字标签转化成onehot标签
在MNIST手写字数据集中,我们导入的数据和标签都是预先处理好的,但是在实际的
训练
中,数据和标签往往需要自己进行处理。以手写数字识别为例,我们需要将0-9共十个数字标签转化成onehot标签。
dg989385783
·
2025-02-06 18:58
【大模型LLM面试合集】
训练
数据_数据格式
对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。
X.AI666
·
2025-02-06 18:28
人工智能
big
data
大型推理模型 (LRM) 的比较 OpenAI DeepSeek R1 Gemini 2.0
分钟发布时间:2025-02-06近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】1.架构与
训练
技术
·
2025-02-06 17:20
人工智能
构建安全可靠的LLM应用架构
接下来,我们将详细解析数据处理模块、模型
训练
模块、应用部署模块和安全防护模块的设计与实现策略。本文将使用Mermaid流程图和Pyth
AI天才研究院
·
2025-02-06 16:15
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2
训练
一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预
训练
权重5.5从OpenAI加载预
训练
权重此前,我们使用一个由一本短篇小说集组成的有限数据集
训练
了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
弹性文件服务(SFS)的使用场景
华为云弹性文件服务(ScalableFileService,简称SFS)是一种高性能、高可用、弹性伸缩的文件存储服务,广泛应用于多种场景,包括高性能计算、媒体处理、企业办公、AI
训练
等。
九河云
·
2025-02-06 14:02
人工智能
华为云
服务器
Seed Edge- AGI(人工智能通用智能)长期研究计划
目标与定位核心目标是做比预
训练
和大模型迭代更长期、更基础的AGI前沿研究,为AI研究者提供更自由的探索空间和资源支持,探索AGI的新方法,推动通用智能的边界。支持措
自不量力的A同学
·
2025-02-06 13:29
人工智能
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他