E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理训练
idea2024新特性以及idea2024.1版本安装、激活
一、idea2024新特性1、行级别的代码补全IDEA现在可以根据代码的上下文分析,给我们提示一整行的代码,借助了大模型对数据的分析
训练
,同时确保了代码数据的安全性。
阿东知识库
·
2025-02-07 09:39
开发工具
intellij-idea
pycharm
性能优化
java
python
大模型元年:人工智能的“寒武纪大爆发”
一、从“专用”到“通用”:大模型开启AI新范式传统的人工智能模型往往是针对特定任务进行
训练
的“专用工具”,例如图像识别、语音识别等。而大模
小马过河R
·
2025-02-07 08:05
AI人工智能
人工智能
机器学习
深度学习
大模型生态开源工具整理
最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型
训练
LLaMA-Factory整体介绍LLaMA-Factory是一个开源的微调框架,为开发者提供简便高效的工具,以便在预
训练
模型基础上快速适应特定任务需求
miracletiger
·
2025-02-07 08:35
开源
Deep-Seek 开源项目教程
Deep-Seek不仅支持文本生成,还特别擅长数学、代码和
推理
任务。项目快速启动环境准备在开始之前,请确保您
毛炎宝Gardener
·
2025-02-07 08:34
python写接口调用模型_对YOLOv3模型调用时候的python接口详解
之前
训练
好的模型,在模型调用的时候,总是在lib=CDLL("/home/*****/*******/darknet/li
weixin_39835607
·
2025-02-07 07:28
python写接口调用模型
聚类算法与应用
3.1基本原理3.1.1树状结构的建立3.1.2聚合或分裂策略3.2应用场景3.2.1生物学中的基因表达数据聚类3.2.2文本数据的主题分类4.聚类算法的实践应用4.1数据准备与预处理4.2算法选择与模型
训练
theskylife
·
2025-02-07 06:16
数据挖掘
算法
聚类
机器学习
数据挖掘
人工智能
DeepSeek开源引擎引爆央国企AI革命:一场自主可控的“智能突围战“
然而现实却充满挑战——某能源集团AI模型
训练
耗时长达72小时,某金融机构因数据安全问题被迫放弃云端方案,某制造央企为适配国产硬件额外投入超千万...这些痛点直指三大困局:性能瓶颈:
Light60
·
2025-02-07 05:43
央国企
AI应用
产业篇
人工智能
DeepSeek
央国企AI革命
4.2 过拟合与欠拟合
4.2.1什么是过拟合与欠拟合过拟合:一个假设在
训练
数据上能够获得比其他假设更好的拟合,但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。
望云山190
·
2025-02-07 05:11
算法
人工智能
tensorflow模型继续
训练
??
之前
训练
的模型没有收敛就结束了,再次
训练
,增加
训练
次数是不是就会收敛了?有时,网上的参考答案并不能解决问题,因为每个人的细节不同,总有些关键细节问题决定成败。
小李飞刀李寻欢
·
2025-02-07 04:35
python
speechdnn
tensorflow
模型恢复
继续训练
global_step
使用一个大语言模型对另一个大语言模型进行“调教”
以下是基于搜索结果整理的详细步骤和方法:1.准备工作安装必要的库•Transformers:用于加载和
训练
模型。•Datasets:用于处理数据集。
大霸王龙
·
2025-02-07 03:25
python
人工智能
python
在本地运行DeepSeek Janus 系列,DeepSeek Janus 系列用于图像理解和生成的统一多模态 AI
DeepSeek的Janus系列是一种先进的开源多模态人工智能模型,它将图像理解、文本到图像生成和视觉语言
推理
统一到一个系统中。
知识大胖
·
2025-02-07 02:54
NVIDIA
GPU和大语言模型开发教程
人工智能
deepseek
Ollama安装部署deepseek
内置的模型下载llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大规模预
训练
语言模型
angel725
·
2025-02-07 02:53
llama
ai
使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署
使用DeepSeek-R1和Ollama构建RAG系统以进行本地部署我们将探讨如何使用DeepSeekR1(一种针对结构化任务优化的开源
推理
模型)和Ollama(一种用于在本地运行LLM的框架)构建功能齐全的
·
2025-02-07 02:10
人工智能
网易有道全面拥抱DeepSeek-R1,
推理
大模型加速个性化教学升级
1月20日,DeepSeek震撼发布DeepSeek-R1,这款
推理
大模型在数学、编程及逻辑
推理
等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无疑为科技界投下了一颗开年
·
2025-02-07 02:10
量子位
百度智能云上架DeepSeek R1/V3,上线首日超1.5万家客户调用
2月3日百度智能云宣布DeepSeek-R1和DeepSeek-V3模型上架百度智能云千帆平台,并宣布提供行业领先的超低
推理
价格。模型上线首日,已有超1.5万家客户通过千帆平台进行模型调用。
·
2025-02-07 01:37
量子位
Stable Diffusion使用样例实践(二)
细节上可以多
训练
几次,得到满意的为准。
Allen-Steven
·
2025-02-07 00:38
SD
创作实践
stable
diffusion
ai
DeepSeek R1和V3区别
DeepSeekR1和V3是深度求索(DeepSeek)推出的两款大模型,尽管基于相似的技术框架(如混合专家架构MoE),但在设计目标、
训练
方法、性能表现和应用场景上存在显著差异。
@Rocky
·
2025-02-06 23:02
大模型
语言模型
代码随想录算法
训练
营第二十八天| 回溯算法01
77.组合对着在回溯算法理论基础给出的代码模板,来做本题组合问题,大家就会发现写回溯算法套路。在回溯算法解决实际问题的过程中,大家会有各种疑问,先看视频介绍,基本可以解决大家的疑惑。本题关于剪枝操作是大家要理解的重点,因为后面很多回溯算法解决的题目,都是这个剪枝套路。题目链接/文章讲解:代码随想录视频讲解:带你学透回溯算法-组合问题(对应力扣题目:77.组合)|回溯法精讲!_哔哩哔哩_bilibi
Rachela_z
·
2025-02-06 23:02
算法
机器学习算法 —— 朴素贝叶斯
博客的简介(文章目录)目录朴素贝叶斯朴素贝叶斯的介绍朴素贝叶斯的优点朴素贝叶斯的缺点朴素贝叶斯的应用实战(贝叶斯分类)莺尾花数据库函数导入数据导入和分析模型
训练
模型预测原理简析模拟离散数据集朴素贝叶斯朴素贝叶斯的介绍朴素贝叶斯法
ZShiJ
·
2025-02-06 23:01
机器学习算法
机器学习
算法
分类
贝叶斯
模型蒸馏、量化、裁剪的概念和区别
然而,这些模型通常具有大量的参数和复杂的结构,导致模型体积庞大、计算资源消耗高和
推理
时间长。这些问题限制了深度学习模型在资源受限设备(如移动设备、嵌入式系统)上的应用。
我就是全世界
·
2025-02-06 22:24
AI
人工智能
[论文笔记] Deepseek技术报告
1.总体概述背景与目标报告聚焦于利用强化学习(RL)提升大型语言模型(LLMs)的
推理
能力,旨在探索在不依赖大规模监督微调(SFT)的情况下,模型如何自我进化并形成强大的
推理
能力。
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
深度学习篇---深度学习相关知识点&关键名词含义
文章目录前言第一部分:相关知识点一、基础铺垫层(必须掌握的核心基础)1.数学基础•线性代数•微积分•概率与统计2.编程基础3.机器学习基础二、深度学习核心层(神经网络与
训练
机制)1.神经网络基础2.激活函数
Ronin-Lotus
·
2025-02-06 21:21
深度学习篇
深度学习
人工智能
机器学习
pytorch
paddlepaddle
python
深度学习篇---深度学习中的超参数&张量转换&模型
训练
文章目录前言第一部分:深度学习中的超参数1.学习率(LearningRate)定义重要性常见设置2.批处理大小(BatchSize)定义重要性常见设置3.迭代次数(NumberofEpochs)定义重要性常见设置4.优化器(Optimizer)定义重要性常见设置5.损失函数(LossFunction)定义重要性常见设置6.正则化(Regularization)定义重要性常见设置7.网络架构(Net
Ronin-Lotus
·
2025-02-06 21:50
深度学习篇
深度学习
人工智能
paddlepaddle
pytorch
超参数
张量转换
模型训练
利用Docker简化机器学习应用程序的部署和可扩展性
传统方法往往需要帮助将ML模型操作化,原因包括
训练
和服务环境之间的差异或扩展的困难。Docker是一个旨在自动化应用程序部署、扩展和管理的开源平台,作为解决这些挑战的方法。所提出的方法将ML模型及其
荆州克莱
·
2025-02-06 20:44
面试题汇总与解析
spring
cloud
spring
boot
spring
技术
css3
LDA主题分析—情感分析案例
以下是一个针对投诉内容进行情感分析的完整案例,包含数据准备、模型
训练
、情感分析以及结果展示的过程。案例:投诉内容情感分析步骤1:数据准备首先,我们准备一份包含用户投诉内容的数据集。
rubyw
·
2025-02-06 20:41
机器学习
数据分析
python
机器学习
T1:实现mnist手写数字识别
>-**本文为[365天深度学习
训练
营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg)中的学习记录博客**>-**原作者:[K同学啊](https
哈维羊
·
2025-02-06 19:33
neo4j
LLM知识蒸馏代码讲解及
训练
实验
LLM知识蒸馏代码讲解及
训练
实验知识蒸馏简单讲即使用大规模参数的模型对小规模参数模型进行蒸馏,且不是简单的只使用答案,是需要两个模型的logprob进行交互的,故两个模型的vocabsize必须是一样的
淡水,
·
2025-02-06 18:33
深度学习
pytorch
人工智能
nlp
python
知识蒸馏
深度学习学习笔记 --- 动量momentum
一、动量momentum的由来
训练
网络时,通常先对网络的初始值按照某种分布进行初始化,如:高斯分布。
杨鑫newlfe
·
2025-02-06 18:01
Machine
Learning
深度学习
动量
momentum
梯度下降
DeepSeek与OpenAI:谁是AI领域的更优选择?
一、成本与性价比1.
训练
成本DeepSeek在
训练
成本上的优势极为显著。其开发团队通过创
gs80140
·
2025-02-06 18:28
基础知识科谱
AI
人工智能
TensorFlow、把数字标签转化成onehot标签
在MNIST手写字数据集中,我们导入的数据和标签都是预先处理好的,但是在实际的
训练
中,数据和标签往往需要自己进行处理。以手写数字识别为例,我们需要将0-9共十个数字标签转化成onehot标签。
dg989385783
·
2025-02-06 18:58
【大模型LLM面试合集】
训练
数据_数据格式
对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。
X.AI666
·
2025-02-06 18:28
人工智能
big
data
Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX,谁才是你的菜?
这下它终于坐不住了,发布了新
推理
模型系列o3-mini。这个模型不仅首次向免费用户开放,成本还比之前的o1系列降低了15倍。和GPT-4O、GPT模型家族不同,AI模型的“O”系列专注于
推理
任务。
·
2025-02-06 17:21
人工智能
大型
推理
模型 (LRM) 的比较 OpenAI DeepSeek R1 Gemini 2.0
大型
推理
模型(LRM)的比较OpenAIDeepSeekR1Gemini2.0阅读时长:25分钟发布时间:2025-02-06近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容
·
2025-02-06 17:20
人工智能
Deepseek-r1、o3-Mini 和 Qwen 2.5 MAX,谁才是你的菜?
这下它终于坐不住了,发布了新
推理
模型系列o3-mini。这个模型不仅首次向免费用户开放,成本还比之前的o1系列降低了15倍。和GPT-4O、GPT模型家族不同,AI模型的“O”系列专注于
推理
任务。
·
2025-02-06 17:11
人工智能
构建安全可靠的LLM应用架构
接下来,我们将详细解析数据处理模块、模型
训练
模块、应用部署模块和安全防护模块的设计与实现策略。本文将使用Mermaid流程图和Pyth
AI天才研究院
·
2025-02-06 16:15
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2
训练
一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预
训练
权重5.5从OpenAI加载预
训练
权重此前,我们使用一个由一本短篇小说集组成的有限数据集
训练
了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
DeepSeek 最新
推理
模型 R1-Lite:一场数学题的死胡同之旅
在人工智能技术的飞速发展中,
推理
模型成为了AI展现深度理解能力的重要工具。它们不仅能够处理复杂的自然语言任务,还能在某些领域表现出近似人类思维的
推理
能力。然而,即便是最先进的
推理
模型也并非无懈可击。
霍格沃兹测试开发学社测试人社区
·
2025-02-06 15:40
测试开发
软件测试
人工智能
弹性文件服务(SFS)的使用场景
华为云弹性文件服务(ScalableFileService,简称SFS)是一种高性能、高可用、弹性伸缩的文件存储服务,广泛应用于多种场景,包括高性能计算、媒体处理、企业办公、AI
训练
等。
九河云
·
2025-02-06 14:02
人工智能
华为云
服务器
Seed Edge- AGI(人工智能通用智能)长期研究计划
目标与定位核心目标是做比预
训练
和大模型迭代更长期、更基础的AGI前沿研究,为AI研究者提供更自由的探索空间和资源支持,探索AGI的新方法,推动通用智能的边界。支持措
自不量力的A同学
·
2025-02-06 13:29
人工智能
DeepSeek-R1真算得上开源吗?
OpenAIo1模型证明,当LLM在
推理
时,通过增加计算量进行类似
训练
后,它们在数学、编程和逻辑等
推理
任务上的表现显著提升。然而,OpenAI
推理
模型的
训练
方法一直是秘密。
·
2025-02-06 13:37
人工智能
基于YOLOv11的目标检测系统
在之前YOLO版本令人印象深刻的进步基础上,YOLO11在架构和
训练
方法上进行了重大改进,使其成为广泛的计算机视觉任务的多功能选择。
夜思、晨
·
2025-02-06 12:21
YOLO
目标检测
人工智能
使用Python和TensorFlow/Keras构建一个简单的CNN模型来识别手写数字
一个简单的图像识别项目代码示例,使用Python和TensorFlow/Keras库来
训练
一个基本的CNN模型,用于识别MNIST手写数字数据集,并将测试结果输出到HTML。
mosquito_lover1
·
2025-02-06 12:48
python
tensorflow
keras
【保姆级教程】YOLOv8_Seg实例分割:
训练
自己的数据集
一、YOLOV8环境准备1.1下载安装最新的YOLOv8代码仓库地址:https://github.com/ultralytics/ultralytics1.2配置环境pipinstall-rrequirements.txt-ihttps://pypi
BILLY BILLY
·
2025-02-06 12:47
YOLOv8系列
语义分割
YOLO
人工智能
Python模型上线pmml以及自定义函数转换(1)
1、常规转换-模型
训练
好之后立即转换importjoblibfromsklearn2pmmlimportPMMLPipeline,sklearn2pmml#保存模型python可读入defdump(clf
jin_tmac
·
2025-02-06 12:46
机器学习与数据挖掘
python
python
sklearn
yolov5 实例分割:从原理、构建数据集到
训练
部署
yolov5实例分割:从原理、构建数据集到
训练
部署1.模型介绍1.1YOLOv5结构1.2YOLOv5
推理
时间2.构建数据集2.1使用labelme标注数据集2.2生成coco格式label2.3coco
外卖猿
·
2025-02-06 12:15
AI实战
yolov5
实例分割
c++部署
opencv
自定义数据集
深度学习No module named ‘torchvision.transforms.functional_tensor‘问题解决
问题在进行深度学习
训练
过程中出现ModuleNotFoundError:Nomodulenamed'torchvision.transforms.functional_tensor'报错,多方查阅资料后得到了解决方案
winrisef
·
2025-02-06 11:44
YOLO
深度学习
人工智能
python
conda
【单层神经网络】基于MXNet的线性回归实现(底层实现)
写在前面刚开始先从普通的寻优算法开始,熟悉一下学习
训练
过程下面将使用梯度下降法寻优,但这大概只能是局部最优,它并不是一个十分优秀的寻优算法整体流程生成
训练
数据集(实际工程中,需要从实际对象身上采集数据)
辰尘_星启
·
2025-02-06 11:43
线性回归
mxnet
机器学习
人工智能
深度学习
神经网络
python
在 Python 中生成一个简单的类 GPT 软件?
本文将详细介绍实现这一目标的具体步骤,涵盖环境搭建、数据准备、模型选择、
训练
与
推理
等多个方面。二、环境搭建2.1安装Python首先要确保系统中安装了Python。建议使用Python3.7及以上版本
一只小灿灿
·
2025-02-06 10:37
Python
#
自然语言处理
python
gpt
开发语言
遗传算法与深度学习实战(33)——WGAN详解与实现
遗传算法与深度学习实战(33)——WGAN详解与实现0.前言1.
训练
生成对抗网络的挑战2.GAN优化问题2.1梯度消失2.2模式崩溃2.3无法收敛3WassersteinGAN3.1Wasserstein
盼小辉丶
·
2025-02-06 09:29
深度学习
人工智能
生成对抗网络
国家超算平台上线DeepSeek - R1系列模型:开启AI新征程
它用了强化学习
训练
,
推理
的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑
推理
这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他