E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LeetCode刷题训练
Python+Spark地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
本系统基于大数据设计并实现成都地铁客流量分析系统,使用网络爬虫爬取并收集成都地铁客流量数据,运用机器学习和时间序列分析等方法,对客流量数据进行预处理和特征选择,构建客流量预测模型,利用历史数据对模型进行
训练
和优化
qq_79856539
·
2025-02-23 16:16
javaweb
大数据
python
spark
大语言模型
训练
数据集格式
1.SFT(有监督微调)的数据集格式对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落
香菜烤面包
·
2025-02-23 16:13
#
AI
大模型
语言模型
人工智能
深度学习
大模型
训练
&& 微调数据格式
对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。
comli_cn
·
2025-02-23 16:43
大模型笔记
人工智能
大模型
通俗理解Test time Scaling Law、RL Scaling Law和预
训练
Scaling Law
一、ScalingLaw解释1、预
训练
阶段的ScalingLaw(打地基阶段)通俗解释:就像建房子时,地基越大、材料越多、施工时间越长,房子就能盖得越高越稳。
老A的AI实验室
·
2025-02-23 16:12
#
【LLM】
人工智能
chatgpt
深度学习
LLM
agi
算法
RL
Python基础
训练
100题(带答案)
文末有彩蛋!!!Python3100例实例001:数字组合题目有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?程序分析遍历全部可能,把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri
乔代码嘚
·
2025-02-23 16:12
python
开发语言
算法
大语言模型:从开发到运行的深度解构
一、LLM开发
训练
的全流程解析1.数据工程的炼金术数据采集:构建涵盖网页文本(CommonCrawl)、书籍、论文、代码等领域的超大规模语料库,典型规模可达数十TB。
nbsaas-boot
·
2025-02-23 15:38
语言模型
人工智能
自然语言处理
GPT和BERT的异同
BidirectionalEncoderRepresentationsfromTransformers)都是基于Transformer架构的语言模型,但它们的设计理念、使用的Transformer部分、
训练
方式
彬彬侠
·
2025-02-23 15:04
自然语言处理
gpt
bert
Transformer
解码器
编码器
NLP
自然语言处理
探秘 DeepSeek-V3:低成本
训练
铸就的 AI 大模型传奇
在人工智能大模型的激烈竞争赛道上,DeepSeek-V3宛如一匹黑马,凭借其卓越的性能和令人惊叹的低
训练
成本,迅速吸引了全球AI领域的目光。
道亦无名
·
2025-02-23 15:34
人工智能
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly
关键词长度泛化位置编码数据格式核心结论1.实验结论:十进制加法任务上的长度泛化最佳组合:FIRE位置编码随机化位置编码反向数据格式索引提示(indexhints,辅助定位)2.在适当的配置下,Transformer模型可以泛化到
训练
序列长度的
Zhouqi_Hua
·
2025-02-23 14:30
大模型论文阅读
论文阅读
语言模型
自然语言处理
深度学习
笔记
基于Roboflow平台的数据集导出与YOLOv8目标检测
训练
实战
专栏订阅地址:https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Roboflow平台的数据集导出与YOLOv8目标检测
训练
实战1.什么是Roboflow
步入烟尘
·
2025-02-23 12:49
YOLO系列创新涨点超专栏
YOLO
目标检测
人工智能
Roboflow
YOLOv8
代码随想录
训练
营第二十三天| 39. 组合总和 40.组合总和II 131.分割回文串
39.组合总和题目链接/文章讲解:代码随想录视频讲解:带你学透回溯算法-组合总和(对应「leetcode」力扣题目:39.组合总和)|回溯法精讲!_哔哩哔哩_bilibili//组合问题要考虑是不是在一个集合里操作//最常见的就是递归回溯法//再考虑考虑剪枝classSolution{publicList>combinationSum(int[]candidates,inttarget){List
chengooooooo
·
2025-02-23 12:17
算法
DeepSeek引爆递归开发大爆炸!
DeepSeekR1的发布意味着AI的普及是必然的,因为它让人们能轻松创建新的推理数据集,并用这些数据
训练
强大的AI模型。
极道Jdon
·
2025-02-23 12:47
javascript
reactjs
人工智能
训练
师如何做图像数据标注,从情感分析和实体分析两个个场景分析
在人工智能
训练
中,图像情感分析和图像实体分析是两个重要的应用场景。高质量的图像数据标注对于
训练
情感识别模型和目标检测/语义分割模型至关重要。
小宝哥Code
·
2025-02-23 12:47
人工智能训练师
人工智能
TensorFlow 2 来
训练
一个线性回归模型
本节将通过一个简单的示例,带领大家了解如何使用TensorFlow2来
训练
一个线性回归模型。这个例子将帮助大家掌握如何从数据处理、模型构建、
训练
到评估等步骤,逐步实现一个基础的机器学习任务。
大数据张老师
·
2025-02-23 11:42
tensorflow
线性回归
人工智能
深度学习框架与边缘计算融合驱动医疗金融模型优化新路径
当前,TensorFlow、PyTorch等主流框架通过轻量化改造(如TensorFlowLite与PyTorchMobile)逐步适应边缘设备的资源限制,同时结合联邦学习技术构建分布式
训练
网络。
智能计算研究中心
·
2025-02-23 11:10
其他
边缘计算与联邦学习驱动医疗金融预测及模型可解释性技术突破
通过将计算资源下沉至终端设备,边缘计算有效缓解了传统中心化架构的延迟与带宽压力,而联邦学习则在保障数据隐私的前提下,实现了跨机构模型的分布式
训练
。
智能计算研究中心
·
2025-02-23 11:10
其他
人工智能学习框架
这些框架提供了强大的工具和库,使得开发者能够更高效地构建、
训练
和部署模型。目前市面上有许多流行的AI学习框架,每种框架都有其独特的特点和适用场景。
静默.\\
·
2025-02-23 10:36
人工智能
学习
NVIDIA A100 SXM4与NVIDIA A100 PCIe版本区别深度对比:架构、性能与场景解析
NVIDIAA100SXM4与PCIe版本深度对比:架构、性能与场景解析作为NVIDIAAmpere架构的旗舰级数据中心GPU,A100系列凭借强大的计算能力和显存带宽,已成为人工智能
训练
、高性能计算(
ASI人工智能
·
2025-02-23 09:55
人工智能
架构
机器人
AIGC
gpt
文心一言
palm
从环境搭建到数据
训练
全流程实战
DeepSeek作为国产优秀大模型,支持本地化部署和私有数据
训练
,可完美解决:数据不出内网:医疗/金融等敏感行业刚需垂直领域定制:用自有数据打造专属AI助手算力自由掌控:灵活调配GPU资源,成本可控本文将带你从零完成
菜鸟养成_记
·
2025-02-23 08:16
人工智能
想象一个AI保姆机器人使用场景分析
其所有输出均由
训练
数据与程序逻辑驱
风口猪炒股指标
·
2025-02-23 07:41
我的思想大火拼
人工智能
机器人
DeepSeek
深度思考
使用 ChatGPT 构建 YouTube 下载器的分步指南
只需按照本教程中的步骤操作......ChatGPT是OpenAI
训练
的大型语言模型,可以根据自然语言输入生成代码。
pxr007
·
2025-02-23 07:37
chatgpt
python
开发语言
深度学习之图像回归(二)
(一)主要是帮助迅速入门理清一个深度学习项目的逻辑这篇文章则主要注重在此基础上对于数据预处理和模型
训练
进行优化前者会通过涉及PCA主成分分析特征选择后者通过正则化数据预处理数据预处理的原因思路链未经过处理的原始数据存在一些问题
zhengyawen666
·
2025-02-23 05:52
深度学习
回归
数据挖掘
人工智能
文献阅读(part2)--Towards K-means-friendly spaces Simultaneous deep learning and clustering
AbstractIntroductionBackgroundandRelatedWorksProposedFormulationOptimizationProcedureInitializationviaLayer-wisePre-Training(通过分层预
训练
进行初始化
GUI Research Group
·
2025-02-23 02:33
机器学习
python
深度聚类
DeepSeek核心技术 MoE(混合专家模型)
在DeepSeek-V2的基础上,采用MLA(多头潜在注意力)和DeepSeekMoE进行高效的推理和经济的
训练
。
baiyi666_888
·
2025-02-23 01:22
ai
Python中常见库 PyTorch和Pydantic 讲解
它提供了丰富的工具和库,用于构建和
训练
各种深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)及其变体(如LSTM、GRU)、生成对抗网络(GAN)等。
爱丫爱
·
2025-02-22 23:40
python
pytorch
开发语言
麦萌《至尊红颜归来》技术架构拆解:从复仇算法到分布式攻防的终极博弈
对抗性
训练
框架:修罗门诱捕圈套可建模为GAN(生
短剧萌
·
2025-02-22 18:56
架构
重构
【深度学习】Adam优化器
和二阶矩估计(uncenteredvariance)的偏差1.2.4更新模型参数1.3Adam的简单理解2Adam优化算法怎么用2.1导入所需的库和模块2.2定义模型和损失函数2.3定义优化器2.4在
训练
循
九筠
·
2025-02-22 18:54
机器学习
深度学习
人工智能
word2vec之skip-gram算法原理
其他所有单词的概率(softmax输出也是11000)target是相近单词的one-hot形式2.Losstarget和output的矩阵的交叉熵最小or平方差最小3.NNet3.1隐层300个神经元,需要
训练
的权重矩阵大小是
cuixuange
·
2025-02-22 18:52
推荐算法
word2vec
skipgram
手写数字识别 neuralnet_mnist.py 代码解读 来自GPT
通过加载
训练
好的模型(sample_weight.pkl),它对MNIST测试集进行预测,并计算模型的准确率。接下来,我会逐步解析这段代码的主要部分。
阿崽meitoufa
·
2025-02-22 17:19
python
开发语言
神经网络
深度学习
gpt
C++:使用 SFML 创建强化学习迷宫场景
通过设计合适的环境,我们可以
训练
模型让其通过迷宫找到最优路径。本文将介绍如何使用C++和SFML库来创建一个迷宫场景,并为强化学习模型提供一个可视化的平台。
煤炭里de黑猫
·
2025-02-22 16:10
c++
开发语言
Python:实现 PyTorch 中
训练
自定义卷积神经网络模型(CNN)并导出模型为 ONNX 格式,同时使用 ONNX Runtime 进行推理
本文将介绍如何使用PyTorch
训练
一个简单的卷积神经网络(CNN)模型,并将
训练
好的模型导出为ONNX格式,之后使用ONNXRuntime在Python中加载并进行推理。
煤炭里de黑猫
·
2025-02-22 16:40
python
pytorch
cnn
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step
LLaVACoT:让视觉语言模型逐步推理摘要1引言2相关工作3提出的方法4后
训练
性能5推理时间缩放6最新VLMs的比较7结论摘要大型语言模型在推理能力方面取得了长足的进步,特别是通过推理时间缩放,如OpenAI
UnknownBody
·
2025-02-22 16:08
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
Python机器学习库之scikit-llm使用详解
概要Pythonscikit-llm库是一个用于机器学习的强大工具,它基于scikit-learn库并扩展了一些机器学习算法和功能,可以帮助开发者更轻松地进行机器学习模型的
训练
和评估。
Rocky006
·
2025-02-22 15:06
python
开发语言
用 Python + LLM 实现一个智能对话
这些模型被
训练
来理解和生成自然语言文本,能够执行多种自然语言处理(NLP)任务,如文本生成、翻译、摘要、问答等。所以LLM可以做以下事情:文本生成:LLM可以生成各种类型的文本,如新闻、文章、小说等。
AGI大模型学习
·
2025-02-22 15:04
python
开发语言
langchain
prompt
大模型
AI大模型
十月学习笔记
知识点什么是预
训练
模型预
训练
模型是一个通过大量数据上进行
训练
并被保存下来的网络。
木子不多余
·
2025-02-22 15:28
学习日志
学习
笔记
大语言模型基础
简介AI大模型是“人工智能预
训练
大模型”的简称,包含了“预
训练
”和“大模型”两层含义,二者结合产生了一种新的人工智能模式,即模型在大规模数据集上完成了预
训练
后无需微调,或仅需要少量数据的微调,就能直接支撑各类应用
MatrixSparse
·
2025-02-22 15:27
大模型
人工智能
语言模型
自然语言处理
人工智能
AI
训练
师团队管理运营思路
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-02-22 13:19
意图识别训练流程及规范
智能客服
AI项目管理
人工智能
AIGC
语言模型
自然语言处理
AIGC
训练
效率与模型优化的深入探讨
文章目录1.AIGC概述2.AIGC模型
训练
效率的重要性3.模型优化的概念与目标4.模型优化策略4.1学习率调节4.2模型架构选择4.3数据预处理与增强4.4正则化技术4.5量化与剪枝5.代码示例6.结论人工智能领域的发展
DARLING Zero two♡
·
2025-02-22 13:18
话题
AIGC
RepVGGBlock实现
这种方法可以在
训练
时使用复杂的多分支结构,在推理时将其简化为单一的卷积层,从而显著提高
武乐乐~
·
2025-02-22 13:45
论文复现
算法
深度学习
大模型微调
以下是在本地部署使用LLaMA-Factory导出的LoRA模型,并通过Ollama运行的步骤指南:1.准备工作已
训练
好的LoRA模型:确保通过LLaMA-Factory导出了LoRA适配器文件(通常是
猴的哥儿
·
2025-02-22 12:42
机器学习
深度学习
神经网络
知识图谱
个人开发
【Llama3:8b】手把手教你如何在本地部署 自己的 LLM大模型
训练
垂直定制化的大模型需要大量数据,而数据是公司的核心资产和基石。没有公司愿意将这些关键数据上传到外部服务器,这是公司的命脉所在。本地部
AI大模型..
·
2025-02-22 12:40
langchain
llama
人工智能
大模型
LLM
ai大模型
大模型部署
【大模型应用开发 动手做AI Agent】大模型就是Agent的大脑
然而,当前的AI模型大多依赖于大模型的预
训练
知识,这些模型虽然在通用知识获取上取得了显著进
杭州大厂Java程序媛
·
2025-02-22 12:39
DeepSeek
R1
&
AI人工智能与大数据
java
python
javascript
kotlin
golang
架构
人工智能
介绍 TensorFlow 的基本概念和使用场景。
TensorFlow是一个由Google开发的开源机器学习框架,旨在让开发者能够构建和
训练
各种深度学习模型。
AC使者
·
2025-02-22 10:57
github
sqlite
开发语言
自然语言处理
人工智能
训练
师如何做文本数据标注?
在人工智能
训练
中,文本数据标注是非常重要的一个环节。文本数据标注是对数据进行结构化、分类、分词、情感分析、命名实体识别(NER)等操作,为机器学习模型提供准确的输入。
小宝哥Code
·
2025-02-22 10:27
人工智能训练师
人工智能
LangChain-基础(prompts、序列化、流式输出、自定义输出)
LangChain-基础我们现在使用的大模型
训练
数据都是基于历史数据
训练
出来的,它们都无法处理一些实时性的问题或者一些在
训练
时为
训练
到的一些问题,解决这个问题有2种解决方案基于现有的大模型上进行微调,使得它能适应这些问题
JolyouLu
·
2025-02-22 10:55
AI
langchain
prompts
人工智能
Ai
Agent
python
DeepSeek 学习路线图
概率统计:理解贝叶斯理论和概率分布,用于模型
训练
和推理。微积分:了解优化算法中的梯度下降等概念。2.编程基础Python:掌握Python编程,这是深度学习和AI开发的主要语言
CarlowZJ
·
2025-02-22 09:14
学习
deepseek
如何评估代理IP服务对AI大模型
训练
的影响
2023年某头部AI公司的内部报告显示,在分布式
训练
场景下,因代理IP配置不当导致的算力浪费平均达15%。工程师们往往更关注GPU型号或算法优化,却容易忽略网络链路这个隐形变量。
·
2025-02-22 08:33
http
YOLOv11快速上手:如何在本地使用TorchServe部署目标检测模型
本文将详细介绍如何使用YOLOv11
训练
你的第一个目标检测模型,并通过TorchServe在本地进行部署,实现模型的快速推理。
SYC_MORE
·
2025-02-22 07:57
YOLOv11
系列教程:模型训练
优化与部署全攻略
TorchServe
YOLOv11教程
模型部署与推理
TorchServe应用
目标检测模型训练
YOLO模型导出
SD模型微调之LoRA
热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点
训练
过程预
训练
模型加载选择微调的层LoRA优化的层Cross-Attention(跨注意力)层
好评笔记
·
2025-02-22 06:22
补档
深度学习
计算机视觉
人工智能
面试
AIGC
SD
stable
diffusion
2024字节总监最新总结:240道算法
LeetCode刷题
笔记(大厂面试必备)
据了解很多大厂技术面试的要求是:技术要好,计算机基础扎实,熟练掌握算法和数据结构,语言不重要,熟练度很重要。每一轮技术面试都可能考代码,不只考算法,但一定会考算法。为什么大厂都在面试算法?============这里我们引入一位美团面试官的看法美团资深工程师Windy:通过算法面试题的考察,我希望候选人不光可以展示编程能力,还可以通过详细了解题目,展示自己的沟通能力和推演能力(如何构建题目的思路)
2401_84048179
·
2025-02-22 06:50
程序员
算法
leetcode
笔记
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他