E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM训练
简洁明了:介绍大模型的基本概念(大模型和小模型、模型分类、发展历程、泛化和微调)
大模型与小模型的对比2、大模型相关概念区分2.1、基础模型(FoundationModel)2.2、超大模型(Ultra-largeModel)2.3、大语言模型(LargeLanguageModel,
LLM
周杰伦_Jay
·
2025-01-25 06:10
大模型LLMs
分类
数据挖掘
人工智能
机器学习
生成对抗网络
transformer
算法
如何控制主从架构的数据一致性?
视频号2023年度优秀创作者,互联网大厂P8技术专家,SpringCloudAlibaba微服务架构实战派(上下册)和RocketMQ消息中间件实战派(上下册)的作者,资深架构师,技术负责人,极客时间
训练
营讲师
架构随笔录
·
2025-01-25 06:39
分布式存储
大数据
架构
数据库
java
后端
中间件
stable diffusion webui电商基础模型
电商生成模型的产生主要有两个路子,1.
训练
微调;2.模型融合。下面这些是借鉴,帮助思考如何构建电商模型。
Kun Li
·
2025-01-25 05:06
多模态大语言模型
stable
diffusion
LLM
-1-chatglm-安装deepspeed报错
安装pipinstalldeepspeed报错Lookinginindexes:https://mirror.baidu.com/pypi/simpleCollectingdeepspeedUsingcachedhttps://mirror.baidu.com/pypi/packages/9f/64/4a3643f61b15dbfec1cab0172f4bdae1d45e1ab3cd73bb060
愚昧之山绝望之谷开悟之坡
·
2025-01-25 04:27
python
开发语言
python3+TensorFlow 2.x 基础学习(一)
2TensorFlow张量(Tensor)3、使用Keras构建神经网络模型3、1构建Sequential模型3、2编译模型1、Optimizer(优化器)2、Loss(损失函数)3、Metrics(评估指标)3、3
训练
模型
刀客123
·
2025-01-25 03:23
python学习
tensorflow
学习
人工智能
如何
训练
Stable Diffusion 模型
训练
StableDiffusion模型是一个复杂且资源密集的过程,通常需要大量的计算资源(如GPU或TPU)和时间。
俊偉
·
2025-01-25 00:59
AGI
stable
diffusion
扩散模型
训练
AI炼丹
Transformer大模型实战 BART模型的架构
禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming/TextGenWebUILLMTransformer大模型实战BART模型的架构1.背景介绍1.1问题的由来随着大规模预
训练
模型的兴起
AI天才研究院
·
2025-01-24 23:23
大数据AI人工智能
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
python鸢尾花数据集knn_【python+机器学习1】python 实现 KNN
也是一种懒惰学习算法,即开始
训练
仅仅是保存所有样本集的信息,直到测试样本到达才开始进行分类决策。
weixin_39629269
·
2025-01-24 21:40
python鸢尾花数据集knn
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(
LLM
)等安全领域应用的知识。
·
2025-01-24 20:41
aigc
从文字到思维:呆马GPT在人工智能领域的创新之旅
引言生成式预
训练
变换器(GenerativePre-trainedTransformer,简称GPT)领域是人工智能技术中的一大革新。
呆码科技
·
2025-01-24 20:28
gpt
人工智能
DeepSeek 公开新的模型权重
相比Llama3.1405B,
训练
时间大幅缩
数据分析能量站
·
2025-01-24 19:22
机器学习
人工智能
智源社区AI周刊:Hinton预测破解大脑机制时间;Gary Marcus批判追捧深度学习风潮;谷歌发布Imagen...
观点“我们会在未来的五年内破解这些(人脑的)程序......现有的一切人工智能,都是建立在与大脑高层次上所做的事情完全不同的基础上......假设有数十亿的参数,这些神经元间的权重在大量
训练
实例的基础上去调整
智源社区
·
2025-01-24 18:46
机器学习
人工智能
深度学习
编程语言
大数据
深度探索 DeepSeek-R1:国产大模型的AGI雏形与创新进展
近期,DeepSeek-R1这一模型的发布引起了广泛关注,它不仅标志着国产大模型在智能化上的一次重大突破,还提出了全新的
训练
方法,解决了过去依赖大量人类数据的问题。
微凉的衣柜
·
2025-01-24 18:14
科技头条
agi
人工智能
tensorlow中tensorboard可视化展示
训练
过程
importtensorflowastffromtensorflow.examples.tutorials.mnistimportinput_datamax_steps=1000#
训练
步数learning_rate
张登杰踩
·
2025-01-24 18:10
tensorflow
tensorboard
tensorflow
mnist
神经网络
# AI计算模式 神经网络模型 深度神经网络 多层感知机 卷积神经网络 循环神经网络 长短期记忆网络 图像识别、语音识别、自然语言 轻量化模型和模型压缩 大模型分布式并行
原先单CPU可进行模型的
训练
与推理,如今需要使用GPU、TPU等设备,并通过分布式并行的
EwenWanW
·
2025-01-24 16:59
AGI
人工智能
神经网络
dnn
LLaMA Pro是什么 相比于lora full freeze有什么区别 怎么使用
LLaMAPro是一种基于LLaMA架构改进的大型语言模型(
LLM
),旨在解决大模型微调中的知识遗忘问题。
Ven%
·
2025-01-24 16:58
简单说深度学习
深度学习基础动手
深度学习速通系列
llama
transformer
深度学习
人工智能
【vLLM 学习】使用 OpenVINO 安装
更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/由OpenVINO驱动的vLLM支持来自vLLM支持的模型列表中的所有
LLM
模型,并且可以在所有x86-64CPU上(至少需要
·
2025-01-24 16:08
fit_transform,fit,transform区别和作用
fit相对于整个代码而言,为后续API服务,用于从一个
训练
集中学习模型参数,包括归一化时要用到的均值,标准偏差。fit之后,可以调用各种API方法,transform是其中之一。
浊酒南街
·
2025-01-24 16:57
#
机器学习
深度学习
人工智能
AAAI2024论文解读|Memory-Efficient Reversible Spiking Neural Networks-water-merged
Memory-EfficientReversibleSpikingNeuralNetworks论文下载论文作者HongZhang,YuZhang内容简介本文提出了一种可逆脉冲神经网络(RevSNN),旨在降低脉冲神经网络(SNNs)在
训练
过程中对中间激活和膜电位的内
paixiaoxin
·
2025-01-24 16:22
文献阅读
论文合集
脉冲神经网络
可逆架构
内存效率
深度学习
训练优化
AAAI
深入详解神经网络的基础知识、工作原理以及应用【一】
目录引言1.神经网络基础1.1感知器模型1.2多层感知器(MLP)示例:2.前馈神经网络(FeedforwardNeuralNetworks,FFNN)2.1结构与特点2.2
训练
过程2.3优化方法3.卷积神经网络
猿享天开
·
2025-01-24 16:52
人工智能基础知识学习
深度学习
神经网络
人工智能
代码随想录算法
训练
营第 16 天(树4)| 513.找树左下角的值、112. 路径总和i ii、106.从中序与后序遍历序列构造二叉树
一、#513.找树左下角的值关键思路:这个题使用层序遍历(迭代法)更容易一些解法一:递归法先求出深度最大的一层,然后找这一层最左边的节点此题用前序后序中序都可以,因为没有对根节点有操作,只要保证先是左再是右就行classSolution{intmaxDepth=-1;//记录最大深度intres=0;//记录最大深度的值publicintfindBottomLeftValue(TreeNodero
去薯条搞点码头
·
2025-01-24 15:49
代码随想录
算法
视频行为分析系统,可做安全行为检测,比如周界入侵,打架
基于视频行为分析系统v4系列版本可以在不用考虑流媒体音视频开发,编解码开发,界面开发等情况下,只需要
训练
自己的模型,开发自己的行为算法插件,就可以轻松开发出任何你想要的安全行为检测,比如周界入侵,打架,
winxp-pic
·
2025-01-24 15:45
音视频
安全
【自然语言处理(NLP)】序列数据研究(创建序列数据、简单的MLP模型、预测结果分析)
文章目录介绍序列数据研究导包安装d2l创建序列数据创建模型开始
训练
预测多步预测结论个人主页:道友老李欢迎加入社区:道友老李的学习社区介绍自然语言处理(NaturalLanguageProcessing,
道友老李
·
2025-01-24 14:43
自然语言处理(NLP)
自然语言处理
人工智能
深度学习-94-大语言模型
LLM
之基于langchain的链Chain的基础应用和调用方式
文章目录1Chain链的分类1.1LCELChains(链构造器)1.2LegacyChains(遗留链)2链的基础应用2.1OllamaLLM2.2是否使用chain的对比2.2.1不使用Chain2.2.2使用Chain3链的调用方式3.1通过invoke方法【推荐】3.2通过predict方法3.3通过apply方法3.4通过generate方法4参考附录1Chain链的分类为开发更复杂的应
皮皮冰燃
·
2025-01-24 14:42
深度学习
深度学习
语言模型
langchain
原创提示词:中英法德四国翻译家
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-01-24 14:42
prompt实战应用案例
人工智能
AIGC
python调用tensorflow模型_python下tensorflow模型的导出
一基本流程1.python脚本中定义自己的模型,
训练
完成后将tensorflowgraph定位导出为protobuf的二进制文件或者文本文件(一个仅有tensor定义但是不含有权重参数的文件);2.python
weixin_39663602
·
2025-01-24 13:06
代码随想录算法
训练
营第十二天|栈与队列总结
栈里面的元素在内存中是连续分布的么?陷阱1:栈是容器适配器,底层容器使用不同的容器,导致栈内数据在内存中不一定是连续分布的。陷阱2:缺省情况下,默认底层容器是deque,那么deque在内存中的数据分布是什么样的呢?答案是:不连续的,下文也会提到deque。栈经典题目1.栈在系统中的应用,递归的实现是栈:每一次递归调用都会把函数的局部变量、参数值和返回地址等压入调用栈中2.括号匹配问题3.字符串去
Rachela_z
·
2025-01-24 13:04
开发语言
python
xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
它通过WebSocket或UDP协议与
LLM
、TTSAPI服务连接,实现实时语音交互功能,无需在设备上运行
LLM
,支持中文在内的多国语言、语音识别用户身份、自定义提示词和音色等功能,兼容多款ESP32开发板
小众AI
·
2025-01-24 13:02
AI开源
开源
人工智能
AI编程
LLM
幻觉(Hallucination)缓解技术综述与展望
LLMs中的幻觉问题(
LLM
幻觉:现象剖析、影响与应对策略)对其可靠性与实用性构成了严重威胁。
大模型之路
·
2025-01-24 13:30
大模型(LLM)
RAG
RAG
检索增强生成
LLM
LLM幻觉
Hallucination
基于Python和TensorFlow/Keras框架的大模型实战教程
目录目标准备工作步骤1:导入必要的库步骤2:加载和准备数据步骤3:构建模型步骤4:
训练
模型步骤5:评估模型步骤6:可视化
训练
过程步骤7:模型预测步骤8:模型保存与加载总结基于Python和TensorFlow
小蘑菇二号
·
2025-01-24 12:26
大模型
项目上线之后,出现过线上问题吗?怎么排查和解决的?
本文将通过
训练
营内部抽奖项目的问题案例——抽奖结果通知延迟和抽奖列表加载缓慢,讲清楚它们的解决方法和优化策略。回答思路这些问题都是在我负责的项目中出现过的,给我留下了深刻的印象。
·
2025-01-24 11:52
后端go面试问题
使用 Spring AI 调用本地 模型实现
1.准备PyTorch模型首先,我们需要
训练
并保存一个PyTorch模型。这里我们使用一个简单的神经网络模型作为示例
drebander
·
2025-01-24 08:26
AI
编程
spring
java
springAI
快速入门Volc Engine的MaaS
LLM
模型
在这篇文章中,我将为你详细介绍如何使用VolcEngine的MaaSLLM模型。我们将从安装库开始,然后深入到具体的代码实现,最后分析其应用场景及实践建议。技术背景介绍VolcEngine(火山引擎)提供了一个强大的MaaS(ModelasaService)平台,支持多种语言模型。这个平台旨在让开发者更容易地集成和使用先进的自然语言处理能力。通过VolcEngine,开发者可以轻松实现文本生成、文
azzxcvhj
·
2025-01-24 08:17
python
RELLM: 利用正则表达式进行结构化生成的
LLM
库
技术背景介绍人工智能语言模型(
LLM
)如GPT等,在生成文本时通常不限制输出格式。然而,在某些应用场景下,遵循特定的输出格式(如JSON
safHTEAHE
·
2025-01-24 06:07
正则表达式
python
自动驾驶中的虚实迁移学习:降低对真实世界数据的依赖
因此,如何降低对真实世界数据的依赖,提高自动驾驶系统的
训练
效率和安全性,成为一个亟待解决的关键问题。虚实迁移学习(Virtual-to-RealTransferLearning)作为一种新兴的机
AI架构设计之禅
·
2025-01-24 06:33
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
详细介绍 NVIDIA GeForce RTX 系列,各显卡配置参数(长期更新 - 2024.12)
主要面向游戏玩家和普通用户,同时也被广泛用于深度学习推理和
训练
等计算密集型任务。主要GPU产品有:50Series、40Series、30Series、20Series、10Series。
JiaWen技术圈
·
2025-01-24 06:02
人工智能
深度学习
机器学习
gpu算力
AIGC
人工智能
图形渲染
SQLDatabase Toolkit: 搭建基于SQL数据库的智能问答系统
此工具包在LangChain社区包中提供,支持多种大型语言模型(
LLM
)或聊天模型的集成。核心原理解析SQLDatabaseToolkit的核心功能包括查询执行、模式查找以及查询检查等。
azzxcvhj
·
2025-01-24 06:31
数据库
sql
jvm
python
自动检测和机器审核系统实现
目录一、自动检测和机器审核实现步骤1.文本预处理步骤细节:2.关键词检测步骤细节:3.情感分析与情境理解步骤细节:4.机器学习模型
训练
步骤细节:5.深度学习模型步骤细节:6.多模态审查步骤细节:7.用户行为分析与违规预测步骤细节
╰つ゛木槿
·
2025-01-24 05:55
java
easyui
javascript
python
java
自然语言处理
Agent评估【Langchain】
Agent评估【LangChain&LangSmith】简介LangChain提供了三种
LLM
-Agent的评估方案最终响应:评估代理的最终响应单步:单独评估任何代理步骤(例如,是否选择了适当的工具)轨迹
BBluster
·
2025-01-24 04:14
langchain
对本地部署的ChatGLM模型进行API调用
ChatGLM作为一个小参数模型,给予了我们在本地部署
LLM
的条件,接下来我将展示如何使用python对本地部署的ChatGLM模型进行API调用对于如何部署本地ChatGLM模型我们可以访问本地化部署大语言模型
BBluster
·
2025-01-24 04:44
LLM
python
开发语言
语言模型
【AIGC半月报】AIGC大模型启元:2024.07(上)
Step-2、Step-1.5V、Step-1X(阶跃星辰开源大模型)(4)InternVL2.0“书生·万象”(上海人工智能实验室)(5)CodeGeeX4-ALL-9B(智谱AI)(6)TTT(全新
LLM
LeeZhao@
·
2025-01-24 02:36
AIGC
人工智能
AI
Agent
【
LLM
】25.1.11 Arxiv
LLM
论文速递
Supervisionpoliciescanshapelong-termriskmanagementingeneral-purposeAImodels关键词:通用型人工智能,风险管理,监督政策,模拟框架PDF链接摘要:通用型人工智能(GPAI)模型,包括大型语言模型(
LLM
hinmer
·
2025-01-24 02:33
arxiv
LLM每日更新
chatgpt
gpt
人工智能
自然语言处理
ai
aigc
深度学习
大模型GUI系列论文阅读 DAY2续2:《使用指令微调基础模型的多模态网页导航》
在本研究中,我们探讨了基于视觉-语言基础模型的数据驱动离线
训练
方法,以改进网页代理的性能。
feifeikon
·
2025-01-24 02:33
论文阅读
Ollama 完整教程:本地
LLM
管理、WebUI 对话、PythonJava 客户端 API 应用
随着大语言模型(
LLM
)的普及和应用场景的广泛扩展,Ollama提供了一个强大的本地
LLM
管理工具,支持WebUI对话功能,同时还为Python和Java提供了灵活的客户端API。
web13765607643
·
2025-01-24 01:28
java
自学成才之路,DeepSeek R1 论文解读
以前
训练
AI模型,也差不多是这个套路,要先给AI“喂”大量的“习题”(监督数据
智识世界Intelligence
·
2025-01-24 01:24
神经网络
深度学习
自然语言处理
课程设计
学习方法
Python 如何使用 Bert 进行中文情感分析
BERT是一种基于Transformer架构的预
训练
模型,它能够
程序员徐师兄
·
2025-01-24 00:47
Python
入门专栏
python
bert
开发语言
情感分析
P1 Pytorch入门实战——Pytorch实现mnist手写数字识别
数据集中的数字图片是由250个不同职业的人纯手写绘制包含了70000张图片,其中60000张为
训练
数据,10000为测试数据,70000张图片均是28*28。
今天补充能量了吗
·
2025-01-23 23:44
pytorch
人工智能
python
深度学习
机器学习
Alluxio在数据索引和模型分发中的核心价值与应用
在当前的技术环境下,搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的
训练
。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息,进行模型
训练
和推理。
·
2025-01-23 22:34
人工智能大数据模型索引
智能体/Agent概念详解
这与大型语言模型(
LLM
)在像ChatGP
张少侠25
·
2025-01-23 22:02
人工智能
深入理解旋转位置编码(RoPE)及其在大型语言模型中的应用
RotaryEmbedding类设计2、apply_rotary_pos_emb函数3、demo_apply_rotary_pos_emb函数三、完整RoPE代码Demo前言随着自然语言处理(NLP)领域的快速发展,预
训练
的语言模型如
tangjunjun-owen
·
2025-01-23 21:00
语言模型-多模态大模型
语言模型
人工智能
自然语言处理
RoPE
旋转位置编码
上一页
29
30
31
32
33
34
35
36
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他