E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
SOM模型
DeepSeek掘金——DeepSeek R1架构和训练过程图解
它目前在LLM领域很流行,并且表现优于开源和闭源
模型
。为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。事实上,我们将在整个博客
不二人生
·
2025-02-28 12:09
DeepSeek掘金指南
人工智能
大模型
大数据、云计算系统高级架构师课程学习路线图
大数据之Linux+大数据开发篇大数据的前景和意义也就不言而喻了,未来,大数据能够对大量、动态、能持续的数据,通过运用新系统、新工具、新
模型
的挖掘,从而获得具有洞察力和新价值的东西。
juan188
·
2025-02-28 12:09
大数据
大数据开发
程序员
spark
Linux
大数据学习
人工智能
数据分析
hadoop
大数据学习
大数据开发
大数据入门
大数据技术
大数据
java常见面试题:什么是NIO(New IO)?NIO和IO有什么区别?
NIO(NewIO)是一种同步非阻塞的I/O
模型
,是I/O多路复用的基础,已经被越来越多地应用到大型应用服务器,成为解决高并发与大量连接、I/O处理问题的有效方式。
广寒舞雪
·
2025-02-28 12:38
java
java
nio
开发语言
美畅物联丨物联网平台的标准化之路:物
模型
设计的创新及应用
随着物联网(IoT)技术以前所未有的迅猛之势蓬勃发展,海量的物联网终端与应用纷纷接入,这不可避免地引发了数据与应用层面的异构化难题,进而形成了复杂且多变的碎片化问题。物联网感知数据因其具备多源异构的显著特性,极大程度地增加了数据识别、精准解析以及深度挖掘的重重困难,致使不同物联网应用之间的数据共享仿佛筑起了高耸的壁垒,协同合作的推进也举步维艰。此外,鉴于设备制造商所遵循的生产标准各不相同,设备接入
畅联云平台
·
2025-02-28 12:08
物联网
Java I/O 与 NIO 核心区别及应用场景详解
一、核心概念对比特性传统I/O(BIO)NIO(NewI/O)
模型
同步阻塞
模型
同步非阻塞
模型
数据流方向单向流(InputStream/OutputStream)双向通道(Channel)数据操作单元基于字节
豪宇刘
·
2025-02-28 12:37
数据库
服务器
前端
深度学习进阶:构建多层神经网络
我们还会使用更复杂的分类任务来训练
模型
,并评估其性能。1.多层神经网络的结构在实际应用中,深度学习
模型
通常包含多个隐藏层,这种结构被称为深度神经网络(DNN)。多层神经网络能够学习更
孤寂大仙v
·
2025-02-28 12:37
深度学习
神经网络
人工智能
大
模型
调优方法:提示工程、RAGs 与微调对比
前言每一个搭建大语言
模型
应用的AI工程师都会面临一个难题,如何选择一个合适调优方法。就算是强大的预训练LLM也可能无法直接满足项目中的特定需求。
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
阿里云人工智能搜索是一种将高级人工智能功能与Elasticsearch工具相结合的解决方案,利用QwenLLM/DeepSeek-R1系列提供高级推理和分类
模型
。
·
2025-02-28 11:17
实现一个 RDMA 用户态驱动程序
写在前面随着DeepSeek的火爆,当众人将目光集中到
模型
优化时,底层网络通信基础设施的重要性往往容易被忽略。实际上,高性能、易维护、易定制的网络基础设施对于提升AI训练、推理的效率是至关重要的一环。
·
2025-02-28 11:17
transformer中seq_len参数的设置
在Transformer
模型
中,seq_len(序列长度)是一个关键的超参数,下面从不同方面详细介绍它的具体含义和作用:一、基本定义seq_len表示输入到Transformer
模型
中的序列所允许的最大长度
yuweififi
·
2025-02-28 10:49
transformer
深度学习
人工智能
pytorch基础 nn.embedding
这是许多NLP
模型
(包括Transformer)中的基本组件。
yuweififi
·
2025-02-28 10:49
pytorch
人工智能
nlp
pytorch基础-layernormal 与 batchnormal
nn.LayerNorm(层归一化)和nn.BatchNorm(批量归一化)是深度学习中常用的两种归一化方法,都有助于提高
模型
的训练效率和稳定性,但它们在归一化维度、应用场景、计算方式等方面存在明显区别
yuweififi
·
2025-02-28 10:49
pytorch
人工智能
python
通过TensorFlow实现简单深度学习
模型
(2)
前文我们已经实现了对每批数据的训练,下面继续实现一轮完整的训练。完整的训练循环一轮训练就是对训练数据的每个批量都重复上述训练步骤,而完整的训练循环就是重复多轮训练。deffit(model,images,labels,epochs,batch_size=128):forepoch_counterinrange(epochs):print(f"Epoch{epoch_counter}")batch_
yyc_audio
·
2025-02-28 10:47
人工智能
深度学习
python
机器学习
【AI+智造】基于阿里云Ubuntu24.04系统,使用Ollama部署开源DeepSeek
模型
并集成到企业微信
一、方案背景与架构设计1.技术选型背景DeepSeek
模型
:作为开源大
模型
,支持文本生成、智能问答等场景,适合企业知识库与自动化服务。
邹工转型手札
·
2025-02-28 10:46
Duodoo开源
Odoo18开源
企业信息化
制造
人工智能
数据分析
AI加速回归测试:如何用大
模型
预测哪些模块最容易出问题
为了提高回归测试的效率和精准性,AI,特别是大
模型
技术的引入,为回归测试的智能化提供了前所未有的机遇。通过大
模型
的预测能力,测试团队能够更加高效地识别
测试者家园
·
2025-02-28 09:46
人工智能
测试开发和测试
质量效能
人工智能
质量效能
软件测试
软件研发
大模型预测
回归测试
风险预测
讯飞星火 VS 文心一言:谁是中文大语言
模型
的TOP1?
在百度发布文心一言一个多月后,科大讯飞也发布了自己的大
模型
“讯飞星火大
模型
”。本篇博客就测评一下这两个在中文圈最受好评的大语言
模型
,顺便辅以ChatGPT为参考。
沉迷单车的追风少年
·
2025-02-28 09:44
深度学习-计算机视觉
人工智能
文心一言
讯飞星火
百度
科大讯飞
Pytorch使用手册—使用TACOTRON2进行文本到语音转换(专题二十四)
我们使用Tacotron2
模型
来完成这一步。3.时域转换最后一步是将谱图转换为波形。从谱图生成语音的过程也称为Vocder(声码器)。在本教程中,我们
AI专题精讲
·
2025-02-28 09:43
Pytorch入门到精通
pytorch
人工智能
python
Pytorch使用手册--将 PyTorch
模型
导出为 ONNX(专题二十六)
注意截至PyTorch2.1,ONNX导出器有两个版本。torch.onnx.dynamo_export是最新的(仍处于测试阶段)导出器,基于PyTorch2.0发布的TorchDynamo技术。torch.onnx.export基于TorchScript后端,自PyTorch1.2.0起可用。一、torch.onnx.dynamo_export使用在60分钟入门中,我们有机会从高层次上了解PyT
AI专题精讲
·
2025-02-28 09:13
Pytorch入门到精通
pytorch
人工智能
python
【有啥问啥】深入了解 FlashMLA:Hopper GPU 的高效 MLA 解码内核
深入了解FlashMLA:HopperGPU的高效MLA解码内核简介在人工智能(AI)领域,特别是大型语言
模型
(LLM)领域,对计算效率和速度的需求持续增长。
有啥问啥
·
2025-02-28 09:12
大模型
行业调研
科普
算法
语言模型
解释SQL和NoSQL数据库的区别,各自的适用场景是什么?
SQL与NoSQL数据库的深度对比及适用场景分析一、核心定义与数据
模型
差异1:SQL数据库结构化数据
模型
:基于关系型
模型
,数据以表格(行和列)形式存储,表之间通过外键建立关联。
破碎的天堂鸟
·
2025-02-28 09:10
学习教程
nosql
数据库
Transformer 代码剖析2 -
模型
训练 (pytorch实现)
一、
模型
初始化模块参考:项目代码1.1参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad
lczdyx
·
2025-02-28 09:38
Transformer代码剖析
transformer
pytorch
深度学习
人工智能
python
阿里巴巴DIN
模型
原理与Python实现
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测(CTR)的深度学习
模型
,特别针对电商场景中用户兴趣多样化和动态变化的特性设计。
eso1983
·
2025-02-28 09:08
python
开发语言
算法
推荐算法
Llama.cpp 服务器安装指南(使用 Docker,GPU 专用)
存储:15GB+可用空间(用于源码、镜像和
模型
文件)。网络:需要互联网连接以下载源码和依赖。软件:已安装并运行Docker。已安装NVIDIA
田猿笔记
·
2025-02-28 09:37
AI
高级应用
llama
服务器
docker
llama.cpp
类加载器详解1
回顾一下类加载过程开始介绍类加载器和双亲委派
模型
之前,简单回顾一下类加载过程。类加载过程:加载->连接->初始化。连接过程又可分为三步:验证->准备->解析。
2401_85327573
·
2025-02-28 08:05
java
开发语言
【产品经理修炼之道】-产品经理的警钟:当DeepSeek向传统工业软件发起挑战
本文深入探讨了以DeepSeek为代表的低成本AI
模型
如何对传统工业信息系统发起冲击,甚至引发了“软件大灭绝”的危机。
xiaoli8748_软件开发
·
2025-02-28 08:32
产品经理
【LangChain编程:从入门到实践】实现多模态代理
ZenandtheArtofComputerProgramming关键词:LangChain编程,多模态代理,自然语言处理,多媒体数据融合,复杂任务解决能力1.背景介绍1.1大背景与问题的提出随着人工智能技术的飞速发展,尤其是大
模型
在自然语言处理领域的突破
AI天才研究院
·
2025-02-28 08:29
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记
LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明,可以通过text-imagegenerator提取高质量的三维
模型
Im Bug
·
2025-02-28 07:24
3d
论文阅读
硅基流动免费
模型
API调用
推荐一个网站https://cloud.siliconflow.cn/i/wLHLnn22硅基流动,新用户送14块钱的付费额度,还有一系列可以免费调用的
模型
2401_82750289
·
2025-02-28 07:23
语言模型
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言
模型
(LLM)的推理能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
RabbitMQ系列(零)概要
消息队列(MessageQueue)是一种异步通信机制,允许分布式系统中的服务通过生产-消费
模型
传递数据。
yyueshen
·
2025-02-28 07:21
RabbitMQ
rabbitmq
分布式
消息队列
Day5 --- Flask-RESTful请求响应与SQLAlchemy基础
参数详解1.3处理请求案例2.返回响应2.1序列化数据:2.2返回JSON格式3.ORM与Flask-SQLAlchemy3.1ORM介绍ORM框架3.2Flask-SQLAlchemy扩展3.3定义
模型
类
laufing
·
2025-02-28 07:51
问题
flask
restful
python
用Python写一个商城系统
下面是一个简单的开发流程:数据
模型
设计:需要定义商品、订单、用户等数据
模型
,并且将它们存储在数据库中。用户模块:用户可以注册、登录、查看个人信息、修改密码等。
潮水岩
·
2025-02-28 07:50
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
让大语言
模型
(LLMs)既能说会道,又能逻辑严谨,是AI发展的下一座高峰。”开篇:语言
模型
的“逻辑盲区”近年来,大语言
模型
(LLMs)在自然语言处理(NLP)任务中取得了令人瞩目的成就。
步子哥
·
2025-02-28 07:19
人工智能
python画出roc曲线 auc计算逻辑_Python画ROC曲线和AUC值计算
AUC介绍AUC(AreaUnderCurve)是机器学习二分类
模型
中非常常用的评估指标,相比于F1-Score对项目的不平衡有更大的容忍性,
路过炊烟
·
2025-02-28 07:19
python画出roc曲线
auc计算逻辑
JavaScript BOM(浏览器对象
模型
)与 `setTimeout` 函数:控制浏览器行为的利器
文章目录JavaScriptBOM(浏览器对象
模型
)与`setTimeout`函数:控制浏览器行为的利器⏳什么是BOM?
人才程序员
·
2025-02-28 06:15
杂谈
javascript
开发语言
ecmascript
firefox
html5
jquery
safari
【Python-ML】SKlearn库性能指标ROC-AUC
*-coding:utf-8-*-'''Createdon2018年1月19日@author:Jason.F@summary:ROC(receiveroperatorcharacteristic,基于
模型
真正率和假正率等性能指标评估分类
模型
fjssharpsword
·
2025-02-28 06:44
Big
data
python专栏
Java内存与缓存
Java内存
模型
Java内存
模型
(JMM)定义了线程如何以及何时可以看到其他线程修改过的共享变量的值,并且规定了所有线程在读取或写入共享变量时必须遵循的一些规则。
C6666888
·
2025-02-28 06:12
java专栏
java
开发语言
【python 机器学习】sklearn ROC曲线与AUC指标
通俗介绍:学术解释:2.在`sklearn`中绘制ROC曲线与计算AUC2.1导入库和数据2.2加载数据集2.3训练
模型
2.4预测概率2.5计算FPR、TPR和AUC2.6绘制ROC曲线3.解析ROC曲线和
人才程序员
·
2025-02-28 06:11
杂谈
机器学习
python
sklearn
人工智能
深度学习
神经网络
目标检测
月之暗面改进并开源了 Muon 优化算法,对行业有哪些影响?
互联网各领域资料分享专区(不定期更新):Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大
模型
训练领域引发了广泛关注,其核心创新在于显著降低算力需求(相比AdamW减少48%的FLOPs
互联网之路.
·
2025-02-28 05:11
知识点
开源
算法
非关系型数据库和关系型数据库的区别
非关系型数据库(NoSQL)和关系型数据库(SQL)的主要区别体现在以下几个方面:数据
模型
:关系型数据库(SQL):数据以表格形式存储,数据行和列组成,每个表都有固定的模式(Schema)。
纠结哥_Shrek
·
2025-02-28 05:40
数据库
nosql
深度解析:大
模型
开源的真与假
目录大
模型
企业开闭源策略各异开源大
模型
的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大
模型
的定制许可证及其限制性条款商业公司对开源大
模型
的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战训练和推理过程的资源需求差异微调和衍生
模型
的技术实现及其局限性开源大
模型
在协作开发中的局限总结大
模型
的发展开启了
rs勿忘初心
·
2025-02-28 05:39
#
AI大模型
大模型
开源闭源对比
开源闭源区别
Python标准库之asyncio
asyncio的编程
模型
就是一个消息循环。我们从asyncio模块中直接获取一个EventLoop的引用,然后把需要执行的协程扔到EventLoop中执行,就实现了异步IO。
june_francis
·
2025-02-28 05:36
python库
python
使用Python或R语言重新拟合
模型
以下分别给出使用Python和R语言完成该任务的示例代码,假设我们有一个包含被试编号、实验条件和反应时的数据,并且要拟合一个线性回归
模型
。
pk_xz123456
·
2025-02-28 05:36
python
算法
python
r语言
开发语言
DeepSeek开源周第二弹:DeepEP如何用RDMA+FP8让MoE
模型
飞起来?
一、引言:MoE
模型
的通信瓶颈与DeepEP的诞生在混合专家(MoE)
模型
训练中,专家间的全对全(All-to-All)通信成为性能瓶颈。
曦紫沐
·
2025-02-28 04:03
大模型
deepseek
《AI 大
模型
ChatGPT 的传奇》
《AI大
模型
ChatGPT的传奇》——段方某世界100强企业大数据/AI总设计师教授北京大学博士后助理:1三6三二四61四五41AI大
模型
的概念和特点1.1什么是”大
模型
、多模态“?
武昌库里写JAVA
·
2025-02-28 04:33
面试题汇总与解析
课程设计
spring
boot
vue.js
算法
数据结构
利用DSPy优化LangChain RAG系统的实战指南
利用DSPy优化LangChainRAG系统的实战指南技术背景介绍DSPy是一个用于大语言
模型
(LLMs)的出色框架,它引入了一个自动编译器,能够教会
模型
如何执行你程序中的声明性步骤。
scaFHIO
·
2025-02-28 04:01
langchain
python
硅基流动api
s_content,u_content):token="sk-xxxxxxxxxxxxxxxxxxxxxxxx"deepseek_mode="deepseek-ai/DeepSeek-V2.5"#硅基流动内的
模型
Zswdhy
·
2025-02-28 04:30
python
大
模型
RAG优化之高可用向量数据库的“热更”难题与解决方案
在现代应用中,向量数据库被广泛用于图像搜索、推荐系统、语义搜索等场景。但与传统数据库不同,向量数据库的“热更”(即在不中断服务的情况下更新索引)是一个具有挑战性的问题。本文将深入探讨这一问题,对比主流向量数据库的热更方案,并给出Qdrant的代码示例。1.什么是向量数据库的“热更”?想象一下,你正在运营一个大型电商平台,用户可以上传图片搜索相似商品。你的商品库每天都在更新:新商品上架:需要将新商品
kakaZhui
·
2025-02-28 04:59
大模型应用案例之RAG
打造专属知识库bot
AIGC
chatgpt
人工智能
llama
数据库
GPT-4提示词冠军如何写 prompt:CO-STAR 框架、文本分段、系统提示
©上下文:为任务提供背景信息通过为大语言
模型
(LLM)提供详细的背景信息,可以帮助它精确理解讨论的具体场景,确保提供的反馈具有相关性。
天涯倦客的美丽人生
·
2025-02-28 04:58
prompt
数据库
使用LangChain与GPT4All
模型
进行交互
技术背景介绍近年来,开源
模型
和框架在AI技术领域迅猛发展。GPT4All是一个开源的对话机器人生态系统,旨在为用户提供干净的助手数据,包括代码、故事和对话。
bavDHAUO
·
2025-02-28 04:28
langchain
交互
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他