E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预乘
理论一、大模型—概念
大模型全称是大型语言模型(LLM,LargeLanguageModel),这个“大”主要指模型结构容量大,结构中的参数多,用于
预
训练大模型的数据量大。一个大模型可以
伯牙碎琴
·
2025-02-16 20:31
大模型
自然语言处理
ai
一、大模型微调的前沿技术与应用
大模型微调的前沿技术与应用随着大规模
预
训练模型(如GPT、BERT、T5等)的广泛应用,大模型微调(Fine-Tuning,FT)成为了提升模型在特定任务中性能的关键技术。
伯牙碎琴
·
2025-02-16 20:31
大模型微调
人工智能
大模型
微调
Deepseek
大语言模型常用微调与基于SFT微调DeepSeek R1指南
概述大型语言模型(LLM,LargeLanguageModel)的微调(Fine-tuning)是指在一个
预
训练模型的基础上,使用特定领域或任务的数据对模型进行进一步训练,以使其在该领域或任务上表现更好
知来者逆
·
2025-02-16 16:08
LLM
深度学习
人工智能
自然语言处理
DeepSeek
SFT
微调
(15-3)DeepSeek混合专家模型初探:模型微调
3.4模型微调在本项目中,微调脚本文件finetune.py提供了一套全面的工具,用于对DeepSeek-MoE
预
训练语言模型进行微调。
码农三叔
·
2025-02-16 16:35
训练
RAG
多模态)
人工智能
Deekseep
深度学习
大模型
transformer
AI 大模型创业:如何利用市场优势?
这些大模型通过在大规模数据集上进行
预
训练,具备强大的泛化能力和适应性,能够广泛应用于自然语言处理(NLP)、计算机视觉(CV)、生成对抗网络(GAN)等多个领域。然而,
SuperAGI2025
·
2025-02-16 12:37
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
早报信息生成与推送系统
北京海关查获冷冻猪肚27.7千克-兑现承诺:周鸿祎抽奖送车活动首批送出20辆小鹏汽车月底再送20辆车-老人
乘
公交忘记下车站点,济南公交职工接力助其回家-东湖评论:进一步提振消
欣然~
·
2025-02-16 09:42
python
DeepSeek为什么超越了OpenAI
其中,技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域
预
训练"架构,在特定领域的推理效率比OpenAI的GPT-4提升40%以上(根据2023年MLPerch基准测试)。
·
2025-02-16 07:40
deepseek
深入解析LangChain:构建智能应用的全方位指南
随着语言模型,特别是大型
预
训练模型的兴起,开发者逐渐认识到这些模型不仅可以生成文本,还可以被用于处理复杂的对话、数据分析以及其他需要自然语言处理的任务。然而,这些模型的集成和实
AIGC大模型 吱屋猪
·
2025-02-16 05:12
langchain
语言模型
人工智能
自然语言处理
llama
百度
机器学习
人工智能之数学基础:线性空间
线性空间的直观理解线性空间可以看作是一个多维的“宇宙”,其中的“点”由向量表示,而“运动”则通过向量的加法和数
乘
来实现。
每天五分钟玩转人工智能
·
2025-02-16 04:00
机器学习深度学习之数学基础
人工智能
深度学习
线性代数
线性空间
神经网络
使用 YOLOv8 模型分析摄像头的图像
bashpipinstallultralytics2.编写Python代码以下是一个使用YOLOv8模型对摄像头图像进行分类的示例代码:importcv2fromultralyticsimportYOLO#加载
预
欣然~
·
2025-02-16 02:19
YOLO
LangChain开发【NL2SQL】应用(few-shot优化)
这篇文章来讲一下优化什么是few-shot使用这些少量的、调整后的样本对
预
训练模型进行微调其实就是给LLM少量示例关于few-shot的研究:https://medium.com/ubiai-nlp/step
向羿燃
·
2025-02-15 22:48
LangChain开发及生态
langchain
ai
人工智能
数据分析
1.5 企业级AI大模型四阶技术全景解析:从Prompt到Pre-training的进化路径
企业级AI大模型四阶技术全景解析:从Prompt到Pre-training的进化路径一、技术演进金字塔:四阶技术如何构建AI新范式▲
预
训练│(万亿参数基建)├─大模型微调│(领域知识注入)├─AI智能体
少林码僧
·
2025-02-15 21:08
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
人工智能
prompt
chatgpt
langchain
gpt
基于开源千文模型(如Qwen、ChatGLM等)实施如何进行动态蒸馏,详细说明操作步骤.
基于开源千文模型(如Qwen、ChatGLM等)实施如何进行动态蒸馏,详细说明操作步骤.1.动态蒸馏的核心思想动态蒸馏的目标是通过教师模型(通常是一个较大的
预
训练模型)的输出,指导学生模型(较小的模型)
墨者清风
·
2025-02-15 11:54
模型训练
人工智能技术发展
模型动态蒸馏
人工智能
深度学习
语言模型
【深度学习】YOLO-World: Real-Time Open-Vocabulary Object Detection,目标检测
2401.17270代码:https://github.com/AILab-CVC/YOLO-World文章目录摘要Introduction第2章相关工作2.1传统目标检测2.2开放词汇目标检测第3章方法3.1
预
训练公式
XD742971636
·
2025-02-15 09:07
深度学习机器学习
深度学习
YOLO
目标检测
利用Infinity Embeddings创建文本嵌入
核心原理解析InfinityEmbeddings利用强大的
预
训练模型,通过对输入的文本数据进行编码,生成具有语义意义的高维向量。这个过程不仅仅是简
qahaj
·
2025-02-15 03:16
python
仅用10张图片,AI就能学会识别万物?多模态小样本学习颠覆传统!
此外,CPE-CLIP和MMFL等方法通过利用
预
训练模型和冻结的大规模视觉语言模型,实现了跨会话的迁移学习和快速适应新样本。
沃恩智慧
·
2025-02-15 03:15
人工智能
深度学习
人工智能
学习
深度学习
数字孪生遭遇 “DeepSeek 之问”:谁在批量制造昂贵玩具?
“如果数字孪生不能
预
判设备故障,和3D动画有什么区别?”DeepSeek技术总监的犀利发问,揭开了行业的遮羞布。
wlsjdszls
·
2025-02-14 22:09
信息可视化
数据分析
人工智能
制造
大数据
数据挖掘
物联网
三角测量——用相机运动估计特征点的空间位置
(在单目相机模型中,深度被抹去了,因此若想建图需要求解‘z’)那么先对上式两侧左
乘
一个x2∧
徐行tag
·
2025-02-14 20:21
视觉SLAM
数码相机
人工智能
视觉SLAM
格拉姆角场(GAF)将一维序列转化为图像
二、步骤数据
预
处
开发小途
·
2025-02-14 14:09
图像处理
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行
预
训练的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式
预
训练模型(GPT),它通过大量文本数据训练,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
你对 Vue 项目进行哪些优化?
watch区分使用场景•v-for遍历必须为item添加key,且避免同时使用v-if•长列表性能优化•事件的销毁•图片资源懒加载•路由懒加载•第三方插件的按需引入•优化无限列表性能•服务端渲染SSRor
预
渲染第二个方面
LuckXinXin
·
2025-02-14 02:52
Vue
vue
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在深度学习和大规模
预
训练模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督
预
训练结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
DeepSeek使用手册,其中一份是清华大学出品
它既包含
预
训练大语言模型(如DeepSeek-R1系列),也提供配套工具链,助力开发者快速实现AI应用落地。二、De
cpa007
·
2025-02-13 20:45
云计算
IDC服务器初始化--PXE引导
PXE(PrebooteXecutionEnvironment,
预
启动执行环境)是一种网络启动技术。想象一
·
2025-02-13 20:42
运维
2.【线性代数】——矩阵消元
二矩阵消元1.消元法2.单行或者单列的矩阵乘法2.1单行矩阵乘法2.2单列矩阵乘法3.用矩阵记录消元过程(初等矩阵)【行的线性组合(数
乘
和加法)】3.1row2-3row1的矩阵描述3.2row3-2row2
sda42342342423
·
2025-02-13 19:37
math
线性代数
矩阵
从零开始大模型开发与微调:Miniconda的下载与安装
这些模型通过在海量文本数据上进行
预
训练,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【云原生技术】微服务架构中如何实现高效调用远程方法
微服务架构中如何实现高效调用远程方法1.使用轻量级通信协议2.异步和非阻塞调用3.负载均衡和服务发现4.缓存和数据
预
取5.异常处理和重试机制6.使用合适的技术栈和工具示例在微服务架构中,高效调用远程方法是至关重要的
阿寻寻
·
2025-02-13 18:28
云原生技术
云原生
架构
微服务
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能
预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能
预
训练LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
【深度学习】常见模型-GPT(Generative Pre-trained Transformer,生成式
预
训练 Transformer)
GPT(GenerativePre-trainedTransformer,生成式
预
训练Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能
预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能
预
训练LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令微调简介7.2为有监督的指令微调准备数据集7.3将数据整理成训练批次7.4为指令数据集创建数据加载器7.5加载
预
训练的大语言模型7.6在指令数据上对大语言模型进行微调7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
DeepSeek-V2 论文解读:混合专家架构的新突破
andEfficientMixture-of-ExpertsLanguageModel目录一、引言二、模型架构(一)多头部潜在注意力(MLA):重塑推理效率(二)DeepSeekMoE:经济高效的训练架构三、
预
训练
进一步有进一步的欢喜
·
2025-02-13 09:49
DeepSeek-V2
大模型
MoE
混合专家架构
Kivy教程大全之 使用 NumPy 和 Kivy 对 Android 设备进行图像分类
了解更多信息本教程的重点是构建一个调用
预
训练的ANN来对图像进行分类的Android应用程序。这里不深入讨论准备数据集、构建、训练和优化ANN的步骤。在本教程中将仅对它们进行简要讨论。
知识大胖
·
2025-02-13 08:48
Python源码大全
python
kivy
numpy
【python 机器学习】sklearn转换器与预估器
转换器与预估器的区别5.使用`sklearn`中的转换器与预估器5.1示例:数据标准化(转换器)5.2示例:模型训练与预测(预估器)6.使用`Pipeline`结合转换器与预估器7.总结sklearn转换器与
预
人才程序员
·
2025-02-13 03:04
杂谈
python
机器学习
sklearn
人工智能
目标检测
深度学习
神经网络
畅游Diffusion数字人(16):由音乐驱动跳舞视频生成
目录贡献概述背景挑战贡献方法详解第一阶段:外观
预
训练第二阶段:动态触发视频生成训练细节贡献概述背景<
沉迷单车的追风少年
·
2025-02-13 02:59
数字人
Diffusion
Models与深度学习
人工智能
深度学习
视频生成
前端架构思考,Vue or React?领域设计、文件结构、数据管理、主题替换
功能分开的设计,再通过setup做crud的分隔,整个页面维度的逻辑会特别清晰在路由和数据管理上有官方的解决方案,可以完全没有选择的压力框架本身做了很多的性能优化,如下静态提升,包括静态节点,静态属性
预
字符串化
程序员小英
·
2025-02-12 19:32
前端
架构
vue.js
提升语言模型性能的关键策略
标题:提升语言模型性能的关键策略文章信息摘要:提升语言模型性能的关键在于
预
训练数据的规模和质量、模型架构的优化以及模型与数据的平衡。单纯增加模型参数规模并不能持续带来性能提升,性能提升会逐渐趋于平缓。
XianxinMao
·
2025-02-12 18:25
语言模型
人工智能
自然语言处理
云原生周刊:DeepSeek 颠覆人工智能
它支持直接在本地计算机上运行多个
预
训练的语言模型,能够提供与云端类似的体验,但无需依赖外部服务器或网络连接。
KubeSphere 云原生
·
2025-02-12 18:54
k8s
容器平台
kubesphere
云计算
llama3简介与国内最快体验方式
Meta公司研发并推出了MetaLlama3系列大型语言模型(LLMs),该系列包括8B和70B参数量的
预
训练及指令调优生成文本模型。
weixin_40941102
·
2025-02-12 15:08
python
DeepSeek V3 两周使用总结
官方宣称:(1)基于自研的MoE模型和671B参数,在14.8Ttoken上进行了
预
训练;(2)多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405
AI生成曾小健
·
2025-02-12 11:12
LLM大语言模型
Deepseek原理与使用
人工智能
如何从零开始,训练AI大模型?零基础入门到精通,收藏这一篇就够了
但还有一个很直观的情况,随着
预
训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。例如,最新出的minicpm,微信内部评测效果也是非常棒的。
网络安全大白
·
2025-02-12 10:09
科技
程序员
大模型
人工智能
大模型
使用yolo11x进行物体分类
利用yolo11x进行物体识别一、物品分类代码说明模型加载:加载yolo11x.pt模型,如果这个模型在物体分类上表现不佳,可以考虑使用像yolov8n.pt这类通用的
预
训练模型。
欣然~
·
2025-02-12 10:35
分类
人工智能
深度学习
2025年毕设ssm牙科诊所app论文+源码
随着信息技术的发展,牙科诊所需要一个集用户管理、牙医资源分配、护牙知识普及、坐诊信息发布、治疗
预
啊诚计算机毕设
·
2025-02-12 06:39
课程设计
关于rabbitmq的prefetch机制
消息
预
取机制(PrefetchMechanism)是RabbitMQ中用于控制消息传递给消费者的一种机制。它定义了在一个信道上,消费者允许的最大未确认的消息数量。
Persistence is gold
·
2025-02-12 02:41
rabbitmq
分布式
预
训练语言模型:从BERT到GPT,NLP的新纪元
自然语言处理(NLP)在过去几年中经历了翻天覆地的变化,而这一变化的催化剂无疑是
预
训练语言模型(Pre-trainedLanguageModels,PLMs)的崛起。
Evaporator Core
·
2025-02-11 20:23
自然语言处理
人工智能
Python开发经验
自然语言处理
语言模型
bert
DeepSeek迁移学习与
预
训练模型应用
迁移学习是一种利用
预
训练模型的知识来加速新任务训练的技术。通过迁移学习,我们可以在数据量有限的情况下,快速构建高性能的模型。
Evaporator Core
·
2025-02-11 19:48
DeepSeek快速入门
人工智能
深度学习
迁移学习
机器学习
深度学习
Python 深度学习项目目录规范
demo或example文件夹layers自定义的层(如果有)self_loss.py比如自定义的loss层等logs日志文件夹weights/models模型权重文件夹utilspreprocessing
预
灰灰灰灰灰发
·
2025-02-11 19:15
python
DeepSeek Coder 填空任务在代码生成和补全中具体是如何实现的?
DeepSeekCoder在代码生成和补全中的实现主要依赖于其强大的
预
训练机制和特定的训练任务设计。
百态老人
·
2025-02-11 10:09
人工智能
大数据
笔记
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他