E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MOSS微调训练数据转换
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督
微调
(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
“我不喜欢Tensorflow,但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027),和大家简单地聊了一下关于如何在
训练
过程中有序地组织
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
具身智能
训练
新思路!将生成视频用于
训练
机器人
将生成视频用于
训练
具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散模型、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、
训练
成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
从零开始大模型开发与
微调
:Miniconda的下载与安装
从零开始大模型开发与
微调
:Miniconda的下载与安装1.背景介绍随着人工智能和机器学习技术的快速发展,大型语言模型(LargeLanguageModel,LLM)已经成为当前研究和应用的热点。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的模型评估技术,目的是通过将数据集分割为多个子集,反复
训练
和验证模型,以便更好地估计模型的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
【深度学习】常见模型-GPT(Generative Pre-trained Transformer,生成式预
训练
Transformer)
GPT(GenerativePre-trainedTransformer,生成式预
训练
Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令
微调
简介7.2为有监督的指令
微调
准备数据集7.3将数据整理成
训练
批次7.4为指令数据集创建数据加载器7.5加载预
训练
的大语言模型7.6在指令数据上对大语言模型进行
微调
7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
Halcon 维测量: 点云数据处理与断线拟合
点云图转深度图:点云图转深度图是将一个由三维点坐标组成的点云
数据转换
为二维深度图的过程。这对于后续的形状分析和特征提取等任务非常有用。
QfcaLinux
·
2025-02-13 14:04
点云
基于深度学习的半导体检测与预测算法研究(二)
本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法,介绍了常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)及其变体在半导体数据处理中的应用,分析了模型
训练
与优化的关键技术
埃菲尔铁塔_CV算法
·
2025-02-13 12:45
深度学习
人工智能
神经网络
opencv
计算机视觉
python
基于深度学习的半导体算法原理及应用
详细分析了这些算法处理半导体相关数据的机制,探讨了算法实现中的关键技术,如数据预处理、模型
训练
与优化等。通过实际案例展示
埃菲尔铁塔_CV算法
·
2025-02-13 12:44
算法
机器学习
人工智能
计算机视觉
深度学习
python
模型应用管理的成功之道:策略、工具与团队协作
●
训练
与验证:使用
训练
数据
训练
模型,并通过验证集评估模型性能。●超参数调优:通过交叉验证、网格搜索等方法优化模型超参数。2.模型部署●
·
2025-02-13 11:28
项目管理工具
深入剖析 Apache Shiro550 反序列化漏洞及复现
目录前言一、认识ApacheShiro二、反序列化漏洞:隐藏在
数据转换
中的风险三、Shiro550漏洞:会话管理中的致命缺陷四、漏洞危害:如多米诺骨牌般的连锁反应五、漏洞复现:揭开攻击的神秘面纱(一)准备工作
垚垚 Securify 前沿站
·
2025-02-13 11:07
十大漏洞
网络
安全
apache
web安全
系统安全
运维
使用 HuggingFace 库进行本地嵌入向量生成
嵌入向量能够将文本等高维
数据转换
为低维稠密向量,从而便于计算和分析。在本文中,我们将介绍如何使用HuggingFace库在本地生成嵌入向量,并演示相关代码。环境准备首先,我们需要安装一些必要的依赖库。
qq_37836323
·
2025-02-13 09:50
python
人工智能
开发语言
DeepSeek-V2 论文解读:混合专家架构的新突破
Economical,andEfficientMixture-of-ExpertsLanguageModel目录一、引言二、模型架构(一)多头部潜在注意力(MLA):重塑推理效率(二)DeepSeekMoE:经济高效的
训练
架构三
进一步有进一步的欢喜
·
2025-02-13 09:49
DeepSeek-V2
大模型
MoE
混合专家架构
Kivy教程大全之 使用 NumPy 和 Kivy 对 Android 设备进行图像分类
了解更多信息本教程的重点是构建一个调用预
训练
的ANN来对图像进行分类的Android应用程序。这里不深入讨论准备数据集、构建、
训练
和优化ANN的步骤。在本教程中将仅对它们进行简要讨论。
知识大胖
·
2025-02-13 08:48
Python源码大全
python
kivy
numpy
【人工智能】Python中的深度学习优化器:从SGD到Adam
解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界在深度学习模型的
训练
过程中,优化器起着至关重要的作用,它决定了模型的收敛速度以及最终的性能。
蒙娜丽宁
·
2025-02-13 08:13
Python杂谈
人工智能
人工智能
python
深度学习
线性回归、逻辑回归及SVM
可以简单的理解为:在给定
训练
样本点和已知的公式后,对于一个或多个未知参数,机器会自动枚举参数的所有可能取值(对于多个参数要枚举它们的不同组合),直到找到那个最符合样本点分布的参数(或参数组合)。
@迷途小书童
·
2025-02-13 07:38
机器学习
【AI】人工智能没那么神秘!
AI系统通常由算法、数据、模型和代码组成,其中代码用于实现算法,数据用于
训练
模型,最终形成智能决策能力。AI可以嵌入到应用程序中,但其本身是一个复杂的技术体系。AI为什么这么聪明?
仇辉攻防
·
2025-02-13 07:04
人工智能
ai
语言模型
自然语言处理
机器学习
深度学习
网络安全
大语言模型的分类及本地部署所需的硬件配置要求
简单来说,它就像一个“超级大脑”,能够处理各种语言任务,比如写文章、回答问题、翻译语言等;它通过
训练
大量的文本数据,学习语言的结构、语法、语义以及上下文关联,从而能够理解和生成与人类语言相似的文本。
Kelaru
·
2025-02-13 07:01
LLM
基础知识
语言模型
分类
人工智能
硅基流动多模型工作流应用平台,免费2000万Token来了
硅基流动是一家专注于大规模AI计算的技术公司,提供高性能LLM推理和
训练
解决方案,助力企业高效部署AI应用。目前注册可获的2000万Token,可以使用将近60种文字对话、语音、图像生成等主流大模型。
yuntianming3906
·
2025-02-13 05:53
经验分享
硅基流动开放模型
微调
(可使用赠送金额)
就这几天硅基流动上线了模型
微调
目前仅开放这两个模型,价格也在上面,最重要的是可以使用赠送的额度。网站链接:https://cloud.siliconflow.cn/i/wLHLnn22
2401_82750289
·
2025-02-13 04:16
人工智能
机器学习
语言模型
AnyPlace:学习机器人操作的泛化目标放置
为了解决这个问题,AnyPlace,一种完全基于合成数据
训练
的两阶段方法,能够预测现实世界任务中各种可行的放置姿势。其
硅谷秋水
·
2025-02-13 04:15
计算机视觉
大模型
智能体
机器人
机器学习
计算机视觉
人工智能
语言模型
深度学习
算法
训练
Day7| LeetCode454. 四数相加II(Map作哈希表);383.赎金信(数组作哈希表);15.三数之和(双指针);18.四数之和(双指针)
目录LeetCode454.四数相加1.思路2.代码实现3.复杂度分析4.思考Leetcode383.赎金信1.思路2.代码实现3.复杂度分析4.思考Leetcode15.三数之和方法一:双指针法1.思路2.代码实现3.复杂度分析4.思考Leetcode18.四数之和1.思路2.代码实现3.复杂度分析4.思考LeetCode454.四数相加链接:454.四数相加II-力扣(LeetCode)1.思
努力学习的牛宁西
·
2025-02-13 04:45
代码随想录训练营
算法
散列表
leetcode
代码随想录算法
训练
营Day07 | LeetCode454.四数相加II、LeetCode383.赎金信、LeetCode15.三数之和、LeetCode18.四数之和
LeetCode454.四数相加II题目链接:https://leetcode.cn/problems/4sum-ii/思路:想法是使用哈希表。定义一个哈希表unordered_map,遍历a数组与b数组,key存放a数组与b数组的元素之和,value存放a数组与b数组的元素之和出现的次数;再遍历c数组与d数组,在unordered_map中找0-(c+d),因为此时unordered_map中存
SuperYue37
·
2025-02-13 04:44
代码随想录
算法
哈希表
leetcode
【代码随想录
训练
营】Day7-哈希表
代码随想录Day7今日任务454.四数相加Ⅱ383.赎金信15.三数之和18.四数之和454.四数相加Ⅱ考点:哈希表链接:https://leetcode.cn/problems/4sum-ii/classSolution{publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMaprecord=newHash
Koffer-debug
·
2025-02-13 04:14
代码随想录训练营
leetcode
算法
哈希表
【python 机器学习】sklearn转换器与预估器
通俗介绍:学术解释:3.转换器与预估器的共同点4.转换器与预估器的区别5.使用`sklearn`中的转换器与预估器5.1示例:数据标准化(转换器)5.2示例:模型
训练
与预测(预估器)6.使用`Pipeline
人才程序员
·
2025-02-13 03:04
杂谈
python
机器学习
sklearn
人工智能
目标检测
深度学习
神经网络
畅游Diffusion数字人(16):由音乐驱动跳舞视频生成
目录贡献概述背景挑战贡献方法详解第一阶段:外观预
训练
第二阶段:动态触发视频生成
训练
细节贡献概述背景<
沉迷单车的追风少年
·
2025-02-13 02:59
数字人
Diffusion
Models与深度学习
人工智能
深度学习
视频生成
深度学习练手小例子——cifar10数据集分类问题
数据集被分为50,000张
训练
图像和10,000张测试图像。
☆cwlulu
·
2025-02-12 23:39
深度学习
分类
人工智能
excel里的函数技巧(持续更新中)
行转列在Excel中,行转列(将一行
数据转换
为一列,或者将一列
数据转换
为一行)是一项常见的操作。你可以使用转置功能轻松实现这一操作。=TRANSPOSE(数组)
出门喝奶茶
·
2025-02-12 23:38
excel
flink实时集成利器 - apache seatunnel - 核心架构详解
SeaTunnel(原名Waterdrop)是一个分布式、高性能、易扩展的数据集成平台,专注于大数据领域的数据同步、数据迁移和
数据转换
。
24k小善
·
2025-02-12 23:38
flink
apache
架构
win10 llamafactory模型
微调
相关① || Ollama运行
微调
模型
目录
微调
相关1.
微调
结果评估2.模型下载到本地导出转换,Ollama运行1.模型转换(非常好的教程!)
我的巨剑能轻松搅动潮汐
·
2025-02-12 22:31
llamafactory
语言模型
使用云计算开发AI项目,有哪些最佳实践?
使用云计算开发AI项目,可以让企业和开发者更高效地利用算力、存储和AI
训练
环境,避免高昂的硬件成本和运维压力。但如何高效、经济地利用云计算,打造一个稳定、安全、可扩展的AI项目呢?
云上的阿七
·
2025-02-12 22:01
云计算
人工智能
一文读懂RAG
架构数据准备阶段应用阶段:五、RAG分类基础RAG(NaiveRAG)缺点高级RAG(AdvancedRAG)模块化RAG(ModularRAG)六、RAG(检索增强生成)vsFine-Tuning(
微调
wangziling123456
·
2025-02-12 22:58
人工智能
深度学习
用Llama Factory单机多卡
微调
Qwen2.5时报torch.OutOfMemoryError: CUDA out of memory的解决办法
接着上一篇博客:在Ubuntu上用LlamaFactory命令行
微调
Qwen2.5的简单过程_llamafactory
微调
qwen2.5-CSDN博客如果需要
微调
比较大的模型,例如Qwen2.5-32B
蛐蛐蛐
·
2025-02-12 22:27
大模型
科研工具
Python技巧
llama
人工智能
大模型
学习系列二:常用目标检测的格式转换脚本文件txt,json等
常用目标检测的格式转换脚本文件txt,json等文章目录常用目标检测的格式转换脚本文件txt,json等前言一、json格式转yolo的txt格式二、yolov8的关键点labelme打的标签json格式转可
训练
的
小啊磊_Vv
·
2025-02-12 21:23
目标检测
YOLO
人工智能
计算机视觉
json
目标检测:yolo格式txt转换成COCO格式json
修改对应文件路径即可,其他根据txt或者希望生成的json做轻
微调
整#-*-coding:utf-8-*-importosimportjsonfromPILimportImagecoco_format_save_path
詹姆斯德
·
2025-02-12 21:49
格式转换
目标检测
YOLO
json
Laplace(拉普拉斯)平滑
平滑技术平滑技术是为了解决
训练
集的数据稀松问题。零概率问题,就是在计算实例的概率时,如果某个量x,在观察样本库(
训练
集)中没有出现过,会导致整个实例的概率结果是0。
郑万通
·
2025-02-12 20:45
机器学习
平滑技术
拉普拉斯平滑
机器学习
Laplace
17.推荐系统的在线学习与实时更新
推荐系统的在线学习与实时更新在线学习的概念在线学习(OnlineLearning)是一种机器学习方法,与传统的批量学习(BatchLearning)不同,在线学习模型能够在数据流到达时逐步更新,而不是在整个数据集上
训练
一次
郑万通
·
2025-02-12 20:15
推荐系统
Python中LSTM算法的实现与应用
接着,教程以Keras库为例,逐步演示了安装库、数据预处理、模型构建、编译、
训练
、评估和预测等步骤。深入讲解了在序列数据处理如自然语言和时间序列预测任务中的实际应用,并提供了实践案例,强
昊叔Crescdim
·
2025-02-12 19:01
100.16 AI量化面试题:监督学习技术在量化金融中的应用方案
目录0.承前1.解题思路1.1应用场景维度1.2技术实现维度1.3实践应用维度2.市场预测模型2.1趋势预测2.2模型
训练
与评估3.风险评估模型3.1信用风险评估4.投资组合优化4.1资产配置模型5.回答话术
AI量金术师
·
2025-02-12 18:28
金融资产组合模型进化论
人工智能
学习
金融
python
机器学习
DeepSeek计算机视觉(Computer Vision)基础与实践
DeepSeek提供了强大的工具和API,帮助我们高效地构建和
训练
计算机视觉模型。本文将详细介绍如何使用DeepSeek进行计算机视觉的基础与实践,并通过代码示例帮助你掌握这些技巧。
Evaporator Core
·
2025-02-12 18:27
#
DeepSeek快速入门
计算机视觉
计算机视觉
人工智能
上海站 | 2025 Seeed x LeRobot 具身智能黑客松报名开启!
SeeedxLeRobot具身智能黑客松现邀请所有对在机器人领域
训练
模仿学习策略,并实时进行推理部署感兴趣的人,共同创造具有影响力的创新解决方案。
·
2025-02-12 18:01
人工智能hackthon
提升语言模型性能的关键策略
标题:提升语言模型性能的关键策略文章信息摘要:提升语言模型性能的关键在于预
训练
数据的规模和质量、模型架构的优化以及模型与数据的平衡。单纯增加模型参数规模并不能持续带来性能提升,性能提升会逐渐趋于平缓。
XianxinMao
·
2025-02-12 18:25
语言模型
人工智能
自然语言处理
云原生周刊:DeepSeek 颠覆人工智能
它支持直接在本地计算机上运行多个预
训练
的语言模型,能够提供与云端类似的体验,但无需依赖外部服务器或网络连接。
KubeSphere 云原生
·
2025-02-12 18:54
k8s
容器平台
kubesphere
云计算
AI应用完整加载数据集配置神经网络配置
训练
信息
训练
模型与保存模型到本地------AI
packagecom.alatus.djl.web;importai.djl.Application;importai.djl.MalformedModelException;importai.djl.Model;importai.djl.basicdataset.cv.classification.ImageFolder;importai.djl.basicdataset.cv.classifi
旧约Alatus
·
2025-02-12 18:54
AI
软件架构设计
人工智能
stable
diffusion
chatgpt
AIGC
DALL·E
2
AI-native
bard
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他