E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
nlp预训练
使用支持向量机和朴素贝叶斯对文本分类
1.2SVC的用法及参数通过以下方式创建SVC对象并进行
训练
:fromsklearn.svmimport
SSeaflower
·
2025-02-03 09:10
支持向量机
分类
算法
机器学习
python
DeepSeek:开启智能搜索与AI发展的新纪元
一、DeepSeek简介DeepSeek由杭州深度求索人工智能基础技术研究有限公司推出,是一款集自然语言处理(
NLP
)、计算机视觉(CV)、强化
gs80140
·
2025-02-03 08:08
AI
人工智能
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模
预
训练
模型框架,主要针对大规模Transformer架构模型的高效
训练
与推理。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
tf.Keras (tf-1.15)使用记录4-model.fit方法及其callbacks参数
model.fit()方法是TensorFlowKeras中用于
训练
模型的核心方法。
普通攻击往后拉
·
2025-02-03 07:32
NN技巧
tf.keras
keras
人工智能
深度学习
Python机器学习实战:人脸识别技术的实现和挑战
Python机器学习实战:人脸识别技术的实现和挑战作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词:人脸识别技术,模型
训练
,多人识别,动态人脸检测,
AI天才研究院
·
2025-02-03 06:19
AI大模型企业级应用开发实战
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
谷歌Gemini1.5火速上线:MoE架构,100万上下文
Gemini1.5建立在谷歌基础模型开发和基础设施的研究与工程创新的基础上,包括通过新的专家混合(MoE)架构使Gemini1.5的
训练
和服务更加高效。
AI生成曾小健
·
2025-02-03 06:18
#
混合专家模型MOE
LLM大语言模型
人工智能
深度学习
pytorch
机器学习
python
代码随想录算法
训练
营Day38||完全背包问题、leetcode 518. 零钱兑换 II 、 377. 组合总和 Ⅳ 、70. 爬楼梯 (进阶)
一、完全背包问题相较于01背包,完全背包的显著特征是每个物品可以用无数次,遍历顺序也不需要为了保证每个物品只去一次而倒序遍历。#include#includeusingnamespacestd;intmain(){intN,V;cin>>N>>V;vectorweight(N+1,0);vectorvalue(N+1,0);for(inti=0;i>weight[i]>>value[i];}vec
jiegongzhu3z
·
2025-02-03 05:15
算法
leetcode
职场和发展
【 书生·浦语大模型实战营】学习笔记(三):“茴香豆” 搭建你的RAG 智能助理
AI学习星球推荐:GoAI的学习社区知识星球是一个致力于提供《机器学习|深度学习|CV|
NLP
|大模型|多模态|AIGC》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于前沿论文解读
GoAI
·
2025-02-03 05:10
自然语言处理NLP
深入浅出AI
深入浅出LLM
深度学习
LLM
人工智能
大模型
【TIMM应用】timm加载模型create_model,使用本地
预
训练
模型
timm加载模型create_model使用本地
预
训练
模型1.常规方式,从https://huggingface.co/上下载1-1.timm库中create_model函数的用法1.最简单的用法2.查看可以直接创建的
预
训练
模型列表
pen-ai
·
2025-02-03 03:29
深度学习
python
深度学习
神经网络
卷积神经网络
AI模型升级版0.02
根据您的需求,我将提供一个升级版的AI对话模型的实现代码,该模型可以在Windows上运行,并支持
训练
和微调。我们将使用HuggingFace的transformers库和torch库来实现这个目标。
pps-key
·
2025-02-03 02:51
python
AI写作
学习
gpt
VARGPT:将视觉理解与生成统一在一个模型中,北大推出支持混合模态输入与输出的多模态统一模型
技术原理:基于自回归框架,采用三阶段
训练
策略,
蚝油菜花
·
2025-02-03 02:18
每日
AI
项目与应用实例
人工智能
开源
【代码随想录
训练
营】【Day01】第一章|数组|数组理论基础|704.二分查找|27.移除元素
数组理论基础数组是在编程中非常常见的数据存储结构,主要有以下几个特点:数组的存储地址是一片连续的空间数组中存储的元素都是相同类型的修改数组中某一元素的值时,只能覆盖(重新赋值)更多有关数组的理论基础可查阅:《代码随想录》数组理论基础704.二分查找题目详细:LeetCode.704注意:二分查找对数据样本有明确的要求,即数组中的元素是有序的,所以在今后遇到类似于“在有序的数据样本中查找某一目标数据
蚝油菜花
·
2025-02-03 02:48
算法
leetcode
代码随想录
【代码随想录
训练
营】【Day03】第二章|链表|链表理论基础|203.移除链表元素|707.设计链表|206.反转链表
链表理论基础链表的结构类似于一串珠子,每一颗珠子就相当于链表上的一个节点;每一个节点则由数据域和指针域构成,数据域用于存放数据,指针域用于指向其它一个节点或空节点(链表尾部)。链表与数组的主要区别在于:数组是在内存中是连续分布的,但是链表在内存中不是连续分布的。数组在定义的时候,长度就是固定的,如果想改动数组的长度,就需要重新定义一个新的数组。链表的长度是不固定的,可以进行动态增删,适合数据量不固
蚝油菜花
·
2025-02-03 02:45
链表
数据结构
代码随想录
训练
营Day3|Leetcode 203.移除链表元素 Leetcode 707.设计链表 Leetcode 206.反转链表
编程语言:C#链表定义*publicclassListNode{*publicintval;*publicListNodenext;*publicListNode(intval=0,ListNodenext=null){*this.val=val;*this.next=next;*}*}Leetcode203.移除链表元素题目链接:203.移除链表元素-力扣(LeetCode)题意:删除链表中等于
?��??
·
2025-02-03 01:44
leetcode
链表
算法
DeepSeek-V2:强大、经济、高效的专家混合语言模型
//gitcode.com/gh_mirrors/de/DeepSeek-V2项目介绍DeepSeek-V2是一款强大的专家混合(Mixture-of-Experts,MoE)语言模型,以其经济高效的
训练
和推理能力著称
乌芬维Maisie
·
2025-02-03 01:12
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
目录1.各个模型架构2.
训练
方式3.模型参数与规模4.应用场景5.性能表现6.发布时间7.价格1.各个模型架构DeepSeek-R1:未明确有特殊架构说明,但属于推理模型,可能在Transformer架构基础上针对推理做了优化
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
强化学习中的关键模型与算法:从Actor-Critic到GRPO
在生成对抗网络中,生成器和判别器模型在整个
训练
过程中相互对抗。
·
2025-02-02 22:14
人工智能
从零开始大模型开发与微调:汉字拼音数据集处理
从零开始大模型开发与微调:汉字拼音数据集处理1.背景介绍1.1问题的由来在人工智能领域,自然语言处理(
NLP
)是一项基础且重要的研究方向。
AGI大模型与大数据研究院
·
2025-02-02 22:43
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
2024年开源数据集地址汇总包含最新最全数据集在这你可以找到任何想要数据集
目标检测数据集和图像分类数据集是计算机视觉领域的两大重要资源,它们为
训练
和评估各种视觉模型提供了关键的数据支持。目标检测数据集主要用于
训练
模型以识别和定位图像中的特定物体。
萌萌哒240
·
2025-02-02 21:10
深度学习
目标跟踪
人工智能
计算机视觉
穷人为什么生活的很艰难?
这关于你的体能天赋,长时间的体能
训练
,以及你的技巧设计,如配速,呼吸调整,跑步姿势,营养补给,心理调整,赛前
北纬文公子
·
2025-02-02 20:03
生活
职场和发展
赚钱思考
开发、
训练
、部署全链路深度解析!
人工智能(AI)技术的快速发展,使得企业在AI模型的开发、
训练
、部署和运维过程中面临前所未有的复杂性。
和老莫一起学AI
·
2025-02-02 19:58
人工智能
数据挖掘
学习
llama
ai
大模型
程序员
【Legged Gym】Legged Gym
训练
参数详解与自定义任务实现
LeggedGym
训练
参数详解与自定义任务实现在进行机器人强化学习
训练
时,LeggedGym提供了一套灵活的参数配置系统,以适应不同的
训练
需求和环境。
啵啵啵啵哲
·
2025-02-02 19:28
人工智能
什么是“知识蒸馏”
知识蒸馏是一种将大型
预
训练
模型(教师模型)的知识转移到较小模型(学生模型)的技术。这种方法不仅能保留原有模型的性能,还能显著降低模型的复杂度和计算需求,使其更适合在资源受限的环境中部署。知识蒸馏
清风AI
·
2025-02-02 19:55
深度学习
人工智能
神经网络
python
conda
isaac gym 和 legged gym 环境搭建记录
今天使用fanziqi大佬的rl_docker搭建了一个isaacgym下的四足机器人
训练
环境,成功运行leggedgym项目下的例子,记录一下搭建流程基础配置OperatingSystem:Ubuntu22.04.5LTSKernel
咋学都不累zgc
·
2025-02-02 19:24
ubuntu
DeepSeek 使用的核心技术预测
1.大规模
预
训练
模型架构Transformer变种与优化:基于Transformer架构进行改进,可能引入稀疏注意力机制(如Longform
eso1983
·
2025-02-02 18:22
人工智能
深度学习
机器学习
python
LLM - 大模型 ScallingLaws 的设计 100B
预
训练
方案(PLM) 教程(5)
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/145356022免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
TensorFlow 示例摄氏度到华氏度的转换(一)
1.数据准备与预处理2.构建模型3.编译模型4.
训练
模型5.评估模型6.模型应用与预测7.保存与加载模型8.完整代码1.数据准备与预处理你提供了摄氏度和华氏度的数据,并进行了标准化。
李建军
·
2025-02-02 17:42
TensorFlow
tensorflow
人工智能
python
【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划(Python代码实现)
本文目录如下:目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络
训练
5.航线规划四、研究挑战与展望
科研_G.E.M.
·
2025-02-02 16:36
python
pytorch
算法
监督学习、无监督学习和强化学习的特点和应用场景
以下是对这三种学习方法的详细对比和总结:监督学习(SupervisedLearning)特点:数据标注:
训练
数据包含明确的输入特征和对应的标签(目标输出)。
BugNest
·
2025-02-02 16:03
AI
学习
ai
机器学习
人工智能
AI在虚拟客户服务中的应用:提供24_7支持
AI在虚拟客户服务中的应用:提供24/7支持关键词:虚拟客服,自然语言处理(
NLP
),聊天机器人,对话系统,深度学习,用户支持,自动化1.背景介绍随着互联网和移动互联网的迅速发展,客户服务成为各大企业提升竞争力的重要环节
AI大模型应用之禅
·
2025-02-02 15:29
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
柳暗花明又一村:Seq2Seq编码器解码器架构
Seq2Seq,编码器-解码器,自然语言处理,机器翻译,文本生成,循环神经网络,长短期记忆网络1.背景介绍在人工智能领域,自然语言处理(
NLP
)始终是研究的热点之一。
AI大模型应用之禅
·
2025-02-02 15:29
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
Scikit-learn_聚类算法_K均值聚类
小批量是输入数据的子集,是每次
训练
迭代中的随机抽样。小批量大
飞Link
·
2025-02-02 15:26
Water
算法
机器学习
人工智能
使用 Python 的 LSTM 进行股市预测
三、下载数据3.1从Alphavantage获取数据3.1从Kaggle获取数据3.3数据探索3.4数据可视化四、将数据拆分为
训练
集和测试集五、数据标准化六、通过平均进行一步预测6.1标准平均值6.2指数移动平均线
无水先生
·
2025-02-02 14:51
数据分析
深度学习
人工智能综合
python
lstm
开发语言
什么是LLM?看这一篇就够了!
大语言模型介绍什么是大语言模型(LLM)通过海量文本
训练
的、能识别人类语言、执行语言类任务、拥有大量参数的模型,称之为大语言模型。GPT、LLaMA、M
Python程序员罗宾
·
2025-02-02 14:50
人工智能
语言模型
AIGC
自然语言处理
Scikit-learn提供了哪些机器学习算法以及如何使用Scikit-learn进行模型
训练
和评估
Scikit-learn库的使用一、Scikit-learn提供的机器学习算法Scikit-learn(通常简称为sklearn)是一个广泛使用的Python机器学习库,它提供了多种用于数据挖掘和数据分析的算法。Scikit-learn支持的机器学习算法可以大致分为以下几类:分类算法:支持向量机(SVM)随机森林(RandomForest)逻辑回归(LogisticRegression)朴素贝叶斯
Java资深爱好者
·
2025-02-02 14:20
机器学习
scikit-learn
算法
【llm对话系统】大模型 Llama 源码分析之并行
训练
方案
1.引言
训练
大型语言模型(LLM)需要巨大的计算资源和内存。为了高效地
训练
这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将
预
训练
大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【llm对话系统】大模型 Llama 源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(LLM)在自然语言处理(
NLP
)领域取得了巨大的成功。
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
【深度学习】因果推断与机器学习的高级实践 数学建模_问题根因 分析 机器学习
现阶段深度学习有三大特征:数据驱动:即数据
训练
,将数据输入到模型中进行
训练
;关联学习:模型基于给定
训练
数据集,进行关联学习;概率输出:即最后的输出,判断这个图片有“狗“的概率是多少。
2401_84239830
·
2025-02-02 13:41
程序员
深度学习
机器学习
数学建模
【自然语言处理(
NLP
)】基于Transformer架构的
预
训练
语言模型:BERT
训练
之数据集处理、
训练
代码实现
文章目录介绍BERT
训练
之数据集处理BERT原理及模型代码实现数据集处理导包加载数据生成下一句预测任务的数据从段落中获取nsp数据生成遮蔽语言模型任务的数据从token中获取mlm数据将文本转换为
预
训练
数据集创建
道友老李
·
2025-02-02 12:04
自然语言处理(NLP)
自然语言处理
transformer
【自然语言处理(
NLP
)】Word2Vec 原理及模型架构(Skip-Gram、CBOW)
文章目录介绍Word2Vec介绍Word2Vec的核心概念Word2Vec的优点Word2Vec的缺点Word2Vec的应用场景Word2Vec的实现工具总结Word2Vec数学推导过程1.CBOW模型的数学推导(1)输入表示(2)词向量矩阵(3)输出层(4)损失函数(5)参数更新2.Skip-Gram模型的数学推导(1)输入表示(2)词向量矩阵(3)输出层(4)损失函数(5)参数更新3.优化技巧
道友老李
·
2025-02-02 11:58
自然语言处理(NLP)
自然语言处理
word2vec
实现使用K210单片机进行猫脸检测,并在检测到猫脸覆盖屏幕50%以上时执行特定操作
要实现使用K210单片机进行猫脸检测,并在检测到猫脸覆盖屏幕50%以上时执行特定操作,以及通过WiFi上传图片到微信小程序,并在微信小程序中上传图片到开发板进行
训练
,可以按照以下步骤进行:1.硬件连接确保
max500600
·
2025-02-02 11:27
开发工具
嵌入式
单片机
嵌入式硬件
人工智能在药物研发中的应用 - 从靶点发现和化合物筛选:利用AI深度学习技术加速药物研发流程
案例包括数据预处理、模型
训练
、评估和优化等步骤,证明了AI在提高药物研发效率和准确性方面的潜力
AI_DL_CODE
·
2025-02-02 10:50
人工智能
深度学习
药物研发
deep
learning
PyTorch 官方文档 中文版本
文档来源https://pytorch.cadn.net.cn大多数机器学习工作流都涉及处理数据、创建模型、优化模型参数,并保存经过
训练
的模型。
圣心
·
2025-02-02 10:49
pytorch
机器学习
使用Transformer模型实现股票走势预测:深入解析和实操案例(基于Python和PyTorch)
通过实操案例,展示了如何使用Python和PyTorch进行模型构建、
训练
和评估,包括数据预处理和性能评价。结果证实Transformer模型能有效预测股价,但需注意过拟合和数据量问题。
AI_DL_CODE
·
2025-02-02 09:44
python
transformer
pytorch
股票预测
[250125] DeepSeek 发布开源大模型 R1,性能比肩 OpenAI o1 | 希捷推出高达 36TB 的硬盘
主要亮点:开源模型,MIT许可证:DeepSeek-R1遵循MITLicense,允许用户自由使用、修改、分发,甚至商用,并允许通过蒸馏技术基于R1
训练
其他模型。
x-cmd
·
2025-02-02 09:13
daily
blog
开源
deepseek
llm
openai
ai
硬件
存储
深度学习基因组学+机器学习单细胞分析,当下最火热研究方向!
深度学习已经被广泛应用于基因组学研究中,利用已知的
训练
集对数据的类型和应答结果进行预测,深度学习,可以进行预测和降维分析。
qwmb919
·
2025-02-02 07:25
人工智能
深度学习
机器学习
python
向量语义(Vector Semantics)与表征学习(Representation Learning)详解
传统的
NLP
方法(如基于规则的语言模型)需要人为定义单词的语义规则,而向量语义方法则通过分析单词在大量文本中的使用模式来学习其语义。
苏西月
·
2025-02-02 07:54
学习
人工智能
【llm对话系统】大模型 Llama、Qwen 和 ChatGLM 的网络结构和
训练
方法对比
它们都在Transformer架构的基础上进行了改进和优化,并在各种
NLP
任务上取得了优异的性能。本文将深入分析Llama、Qwen和ChatGLM的网络结构和
训练
方法,比较它们的异同以及各自的优势。
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
ChatGPT的150个角色提示场景实测(13)健身教练
我将为你提供一个希望通过体能
训练
变得更健康、更强壮、更健康的人所需要的所有信息,而你的职责是根据这个人目前的体能水平、目标和生活习惯,为其制定最佳计划。
earthzhang2021
·
2025-02-02 06:23
chatgpt
开发语言
人工智能
自然语言处理
产品经理
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他