E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
小游戏逻辑思维训练
LeetCode解决方案集:编程与面试技能提升
本文还有配套的精品资源,点击获取简介:LeetCode是一个编程
训练
平台,提供了大量编程题目,用于提升开发者的算法技能和面试准备。
徐子贡
·
2025-02-19 04:37
Python库 - transformers
它提供了大量的预
训练
模型,这些模型可以用于各种NLP任务,如文本分类、问答、翻译、摘要生成等。
司南锤
·
2025-02-19 03:28
PYTHON库
python机器学习
python
开发语言
conda更换环境版本(比如torch版本)
pytorch官网torch过往的版本创建新环境condacreate--namemyenvpython=3.8condaactivatemyenvconda虚拟环境中安装CUDA和CUDNN深度学习用显卡
训练
的时候
挨打且不服66
·
2025-02-19 03:57
python
python
流行编程语言全解析:优势、应用与短板
机器学习与人工智能:构建和
训练
模型。典型示例:OpenAI在很多人工智能项目中广泛使用Python,如GPT系列模型的研发。网络爬虫:轻松从网页
a小胡哦
·
2025-02-19 03:27
python
java
c++
c语言
javascript
swift
r语言
LLaMA系列大模型调研与整理-llama-alpaca-lora
alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词:大模型,LLaMA,Alpaca,Lora,Belle,模型
训练
AI大模型-大飞
·
2025-02-19 02:17
llama
AI大模型
AI
职场和发展
人工智能
deepseek和ChatGPT 4o比较
后
训练
+RL/RLHFDeepSeekR1等推理模型是在通用模型的基础上进行“特训”(后
训练
+SFT/RL/RLHF),使其不仅知道得多还用得好
调皮的芋头
·
2025-02-19 02:46
chatgpt
人工智能
采用分布式部署deepseek
分布式部署DeepSeek涉及使用多个计算节点来加速模型
训练
或提升推理效率。下面是一个基本的指南,帮助您了解如何进行分布式部署。
慧香一格
·
2025-02-19 02:14
AI
学习
分布式
deepseek
《Ollama 与 DeepSeek 整合应用入门指南》一、二、三章
无需网络连接的数据隐私保护跨平台架构设计:支持Windows/macOS/Linux全平台模型管理引擎:自动化处理模型依赖与版本控制1.2DeepSeek模型特性多模态处理能力:文本生成、代码理解、数学推理中文优化架构:针对中文语料的特殊
训练
策略模型家族图谱
Allen-Steven
·
2025-02-19 01:05
ollama
deepseek
【JAVA工程师从0开始学AI】,第四步:闭包与高阶函数——用Python的“魔法函数“重构Java思维
这里没有类的枷锁,函数既是武器又是盾牌,高阶函数组合出的"代码万花筒",正是AI数据处理、模型
训练
的核心密码。本文将用J
架构默片
·
2025-02-19 01:03
JAVA工程师从0开始学AI
人工智能
java
python
腾讯云大模型知识引擎×DeepSeek赋能文旅
其核心优势包括:动态知识更新:突破传统大模型预
训练
数据的时间
繁依Fanyi
·
2025-02-19 00:55
python
huggingface/pytorch-image-models
huggingface/pytorch-image-models1.使用技巧1.1.
训练
指令单卡:pythontrain.py--pretrained--input-size3224224--mean000
GarryLau
·
2025-02-19 00:23
ML&DL
pytorch
python
huggingface
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:46
人工智能
什么是Scaling Laws(缩放定律);DeepSeek的Scaling Laws
ScalingLaws(缩放定律)ScalingLaws(缩放定律)在人工智能尤其是深度学习领域具有重要意义,以下是相关介绍及示例:定义与内涵ScalingLaws主要描述了深度学习模型在规模(如模型参数数量、
训练
数据量
ZhangJiQun&MXP
·
2025-02-18 23:14
教学
2024大模型以及算力
2021
论文
人工智能
自然语言处理
神经网络
语言模型
深度学习
智能算力中心万卡GPU集群架构深度解析
超万卡集群缩短
训练
时间,加速迭代,助力市场趋势应对。在超万卡集群中,高效稳定地
训练
大模型面临双重挑战:确保集群算力最大化、网
科技互联人生
·
2025-02-18 23:13
科技
数码
人工智能
人工智能
gpu算力
硬件架构
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:12
pytorch
人工智能
python
如何
训练
LLM“思考”(像o1和DeepSeek-R1一样, 高级推理模型解析
2024年9月,OpenAI发布了它的o1模型,该模型基于大规模强化学习
训练
,赋予了它“高级推理”能力。不幸的是,他们是如何做到这一点的细节从未被公开披露。
果冻人工智能
·
2025-02-18 22:06
AI员工
人工智能
chatgpt
深度学习
商汤绝影端到端自动驾驶的迭代优化
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型
训练
,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展,自动驾驶汽车从科幻走进了现实。
AGI大模型与大数据研究院
·
2025-02-18 22:33
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
2. 从HuggingFace下载千问模型、数据、微调并运行
视频链接(1)3.从HuggingFace下载千问模型、数据、微调并运行(上)_哔哩哔哩_bilibili在本课程中,我们将带你下载并本地运行一个大模型,进行模型的微调
训练
等,视频播放量525、弹幕量0
ApiChain
·
2025-02-18 20:45
gpt
大模型
语言模型
人工智能
python
解剖DeepSeek四把刀,一场深到源码,大到行业,细到人心盛宴
他们公开的是经过蒸馏的“成品模型”,而非原始
训练
框架:就像给你组装好的乐高战舰,却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态,又
leluckys
·
2025-02-18 19:33
AI大模型
AI编程
SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别
和RLHF(基于人类反馈的强化学习)的区别STF(SupervisedFine-Tuning)和RLHF(ReinforcementLearningfromHumanFeedback)是两种不同的模型
训练
方法
钟小宇
·
2025-02-18 18:11
LLM
人工智能
语言模型
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码
2.2ELM的学习过程介绍ELM的学习算法和
训练
过程。三、半监督极限学习机(SS-ELM)3.1SS-ELM的提
默默科研仔
·
2025-02-18 18:09
粉丝福利
机器学习
人工智能
DeepSeek为什么超越了OpenAI
其中,技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预
训练
"架构,在特定领域的推理效率比OpenAI的GPT-4提升40%以上(根据2023年MLPerch基准测试)。
·
2025-02-18 17:19
deepseek
DeepSeek的
训练
与优化流程
DeepSeek的
训练
与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构:实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB,支持200+文件格式自动解析智能清洗流水线
程序猿000001号
·
2025-02-18 17:01
DeepSeek
训练
优化
机器学习基本篇
1基本概念机器学习,分为回归,分类,聚类,降维有监督学习回归,分类,有特征,有标签,进行
训练
,然后对新数据进行预测无监督学习聚类,降维。
胖胖的小肥猫
·
2025-02-18 16:51
机器学习
deepseek本地部署后做微调
训练
实现智能对话的一些建议
在本地部署大模型后,进行微调和
训练
以实现智能对话,通常需要按照以下步骤操作。以下是详细的指导内容:1.准备数据集在微调大模型之前,需要准备适合的
训练
数据集。
慧香一格
·
2025-02-18 14:34
AI
学习
deepseek
服务器
AI
机器学习和线性回归、softmax回归
分类——交叉熵样本属于“哪一类”的问题称为分类问题回归是
训练
一个回归函数来输出一个数值;分类是
训练
一个分
小名叫咸菜
·
2025-02-18 13:53
人工智能
线性回归
大模型AI应用安全与合规测试实战指南-模型层
核心痛点直击:黑盒失控:生成内容不可预测,传统规则引擎失效数据深渊:
训练
数据含敏感信息,清洗难度指数级上升合规迷宫:全球AI监
测试匠心:技能精进·职场跃迁·面试赢家
·
2025-02-18 12:13
人工智能
安全
AI赋能教育:深度解析大模型在教育场景中的应用与架构设计【无标题】
在这篇文章中,我们将基于一张完整的应用设计架构图,从应用场景到AI核心能力、
训练
标注平台、智能处理引擎以及业务数据,全方位剖析大模型如何助力教育行业实现突破,真正实现“AI赋能教育,重塑未来”。
和老莫一起学AI
·
2025-02-18 11:33
人工智能
语言模型
产品经理
ai
自然语言处理
大模型
程序员
算法
训练
Day01 Leetcode704.二分查找
0.学习资料来源题目链接:力扣https://leetcode.cn/problems/binary-search/文章讲解:代码随想录代码随想录PDF,代码随想录百度网盘,代码随想录知识星球,代码随想录八股文PDF,代码随想录刷题路线,代码随想录知识星球八股文https://programmercarl.com/0704.%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE.
weixin_47284299
·
2025-02-18 10:25
代码随想录训练营
算法
面试
职场和发展
python
数学建模基础
训练
-1:概念解析
文章目录数学建模基础
训练
-1:概念解析问题一:如何找到“概念”?问题二:如何全面理解概念的基础含义?问题三:如何深刻理解概念并作出创新点发掘?
MPCTHU
·
2025-02-18 09:44
数学建模
数学建模
InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载
InspireMusic不仅为研究者和开发者提供了丰富的音乐/歌曲/音频生成模型的
训练
和调优工具,还为他们配备了高效的模型,以便优化生成效果。
昨日之日2006
·
2025-02-18 09:12
ai语音
音视频
驾培行业转战无人机飞手执照培训的优缺点分析及技术详解
2.场地与设施优势:驾培场地通常较为宽敞,且部分场地可改造为无人机飞行
训练
场地,节省场地租赁成本。可利用现有设施进行无人机组装、调试和维修等实操培训。3.人力资源利用:驾培行业的
无人机技术圈
·
2025-02-18 05:03
无人机技术
无人机
DeepSeek对AI发展的范式革新与推动:研究报告
其核心技术突破包括:低算力消耗的模型
训练
通过蒸馏
训练
策略、动态模型剪枝和稀疏
训练
,DeepSeek将
训练
成本降至OpenAI同类模型的1/10,同时保持性能可比甚至超越。
芝士AI吃鱼
·
2025-02-18 05:57
DeepSeek
AI
OpenAI
LLM
强化学习原理与代码实战案例讲解
想象一下,你正在
训练
一只小狗学习坐下。你不会给它看成千上万张“坐下”的照片,而是会给它一些指令,比如“坐下”,如果它照
AI天才研究院
·
2025-02-18 05:53
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
OpenCV机器学习(1)人工神经网络 - 多层感知器类cv::ml::ANN_MLP
它提供了一种方式来创建和
训练
多层感知器模型,以解决分类、回归等
村北头的码农
·
2025-02-18 04:51
OpenCV
opencv
机器学习
人工智能
Pytorch实现mnist手写数字识别
>-**本文为[365天深度学习
训练
营]中的学习记录博客**>-**原作者:[K同学啊]**我的环境:语言环境:Python3.8编译器:JupyterLab深度学习环境:torch==1.12.1+cu113torchvision
Zn要学习
·
2025-02-18 04:49
python
《DeepSeek
训练
算法:开启高效学习的新大门》
DeepSeek作为其中的佼佼者,凭借其独特的
训练
算法和高效的学习能力,吸引了众多目光。今天,就让我们深入探究DeepSeek
训练
算法的独特之处,以及它是如何保证模型实现高效学习的。
·
2025-02-18 04:41
人工智能深度学习
DeepSeek推理模型架构以及DeepSeek爆火的原因
在
训练
过程中,DeepSeek广泛应用蒸馏技术,通过生成高质量数据和将大型模型的推理能力迁移至小型模型,大幅提升
训练
效率与模型性能。Deep
微学AI
·
2025-02-18 03:06
架构
LLM
deepseek
【LLM】大模型基础--大规模预
训练
语言模型的开源教程笔记
1.引言本文以DataWhale大模型开源教程为学习路线,进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列(token)的概率分布,可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看,LM(languagemodle)可以简单的分为:自回归模型非自回归模型特点逐字生成文本,每个词的生成都依赖于上文,关联性好一次性生成整个文本序列,不捕捉上文信息优点内容质量高生成速度快
Langchain
·
2025-02-18 02:00
笔记
人工智能
langchain
llama
大模型
产品经理
大模型基础
模型GPU->NPU(Ascend)迁移
训练
简述
目录一、迁移
训练
流程图解二、详细流程步骤1.模型
训练
与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移
训练
流程图解通过华为云的modelart进行运行环境选型北京四使用
終不似少年遊*
·
2025-02-18 01:12
深度学习
人工智能
迁移学习
GPU
NPU
华为云
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为?(附代码)...
第二章:怎么样
训练
weixin_39576066
·
2025-02-17 23:49
python
学习曲线函数
翻译Deep Learning and the Game of Go(14)第十二章 采用actor-critic方法的强化学习
本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和
训练
Keras的多输出神经网络如果你正在学习下围棋,最好的改进方法之一是让一个水平更高的棋手给你复盘。
idol_watch
·
2025-02-17 22:16
围棋与深度学习
【漫话机器学习系列】041.信息丢失(dropout)
信息丢失(Dropout)Dropout是一种广泛应用于神经网络
训练
中的正则化技术,旨在减少过拟合(overfitting),提高模型的泛化能力。
IT古董
·
2025-02-17 22:40
漫话机器学习系列专辑
机器学习
人工智能
深度学习
第二章:12.3 建立表现基准
在这个过程中,算法的性能可以通过
训练
误差和交叉验证误差来评估。误差定义
训练
误差(Jtrain):指算法在
训练
数据集上无法正确转录的音频片段的百分比。
望云山190
·
2025-02-17 22:40
基准性能水平
人工智能
机器学习
第二章:12.4 学习曲线
学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着
训练
数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现,以及模型是否过拟合或欠拟合。
望云山190
·
2025-02-17 22:05
深度学习
机器学习
人工智能
机器学习相关基础
2.日常生活中的机器学习:①称为RGB(由红色,绿色,蓝色组成),这种是欠拟合欠拟合和过拟合区别:•欠拟合(Underfitting):模型在
训练
数据上表现不佳,无法很好地捕捉数据中的规律。通
星辰瑞云
·
2025-02-17 20:55
机器学习
【DeepSeek】一文详解GRPO算法——为什么能减少大模型
训练
资源?
GRPO,一种新的强化学习方法,是DeepSeekR1使用到的
训练
方法。
FF-Studio
·
2025-02-17 20:19
DeepSeek
R1
算法
AIMv2:多模态自回归预
训练
的视觉新突破
AIMv2:多模态自回归预
训练
的视觉新突破阅读时长:19分钟发布时间:2025-02-17近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM
·
2025-02-17 20:28
人工智能
Audio-Visual Speech Enhancement(视听语音增强)领域近三年研究进展与国内团队及手机厂商动态分析
一、视听语音增强领域近三年研究进展多模态融合与模型轻量化多模态特征融合:中国科学技术大学团队提出通过引入超声舌头图像和唇部视频的联合建模,结合知识蒸馏技术,在
训练
阶段利用教师模型传递舌部运动知识,从而在推断时仅依赖唇部视频即可提升语音增强效果
AndrewHZ
·
2025-02-17 20:47
深度学习新浪潮
智能手机
算法
计算机视觉
硬件架构
硬件工程
智能硬件
Aerospike
文章来源:拉勾教育Java高薪
训练
营第3期Aerospike介绍Aerospike(简称AS)是一个分布式,可扩展的键值存储的NoSQL数据库。
小的~~
·
2025-02-17 17:22
nosql
Aerospike
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他