E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
低压侧MOSFET预驱动器
JVM篇——JVM调优实战,JVM调优参数汇总
什么是调优1、根据需求进行JVM规划和
预
调优2、优化运行JVM运行环境(慢、卡顿,一般都是通过单接口压测或者Skywalking进行全链路压测3、解决JVM运行过程中出现的各种问题,比如MemoryLeak
Be explorer
·
2025-02-07 12:02
JVM
jvm
服务器
运维
基于 DeepSeek-R1 模型微调(SFT)技术详解
目录引言1.1大模型时代与微调的重要性1.2本文目的与结构概述DeepSeek-R1模型基础2.1模型简介2.1.1模型架构2.1.2
预
训练数据与目标2.2模型特点与优势2.2.1语言理解与生成能力2.2.2
zhangjiaofa
·
2025-02-07 10:43
大模型
DeepSeek-R1
SFT
模型微调
完整的IM架构设计
从产品
侧
角度,衍生出多平台的同步转发、互踢及群组的需求。功能上需要提供消息指定路由转发、是否持久化、在线离线机制、心跳包、通知送达、授权验证等。
lanxingmo
·
2025-02-07 09:40
IM
大模型生态开源工具整理
最近一直在做大模型应用开发工作,总结下用到的一些开源工具1-模型训练LLaMA-Factory整体介绍LLaMA-Factory是一个开源的微调框架,为开发者提供简便高效的工具,以便在
预
训练模型基础上快速适应特定任务需求
miracletiger
·
2025-02-07 08:35
开源
MinIO
一、三种部署方式单节点单硬盘测试环境使用,不提供任何超出底层存储卷实现的额外可靠性或可用性(RAID、LVM等)单节点多硬盘提供了
驱动器
级别的可靠性以及故障转移、恢复功能,可以配置容忍损失高达一半所有
驱动器
的能力
*老工具人了*
·
2025-02-07 06:47
Kubernetes
kubernetes
Ollama安装部署deepseek
内置的模型下载llama3模型(亲测垃圾机房都可以跑起来)下载DeepSeek-V3模型运行模型搭建Web环境OllamaOllama是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大规模
预
训练语言模型
angel725
·
2025-02-07 02:53
llama
ai
LCD液晶段码屏
驱动器
段码驱动芯片VK1056B/C SOP24/ SSOP24 3线通讯接口
概述:VK1056是一个点阵式存储映射的LCD
驱动器
,可支持最大56点(14SEGx4COM)的LCD屏,也支持2COM和3COM的LCD屏。
·
2025-02-06 21:34
前端
数据安全入门浅析|晚安是一只小猫
1.定义2.数据安全和网络安全二、数据安全场景1.外部攻击2.内部失窃三、数据安全基础能力1.数据防泄漏(网络
侧
)2.数据脱敏3.数据库审计4.数据加解密总结前言随着互联网科技的迅猛发展,人类社会已经迎来了数据大爆炸时代
晚安是一只小猫
·
2025-02-06 18:00
网络
信息与通信
计算机网络
数据库
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2训练一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载
预
训练权重5.5从OpenAI加载
预
训练权重此前,我们使用一个由一本短篇小说集组成的有限数据集训练了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
Seed Edge- AGI(人工智能通用智能)长期研究计划
目标与定位核心目标是做比
预
训练和大模型迭代更长期、更基础的AGI前沿研究,为AI研究者提供更自由的探索空间和资源支持,探索AGI的新方法,推动通用智能的边界。支持措
自不量力的A同学
·
2025-02-06 13:29
人工智能
单片机+c语言+运算符,单片机C语言编程常用的运算符介绍
结合性规定为:自左至右,即运算对象两
侧
的算术符优先级相同时,先与左边的运算符号结合。关系运算符的优先级规定为:>、=、a>b内容来自单片机之家www.
weixin_39760434
·
2025-02-06 06:02
单片机+c语言+运算符
java使用react_基于JVM使用React.js和Spring Boot建立同构的Web应用
这是一个展示如何使用Java的SpringBoot实现
预
渲染前端MVC(MVC-frontend)的同构Web应用开源项目:winterbe/spring-react-example·GitHub所谓同构
tarv
·
2025-02-06 05:01
java使用react
宾馆民宿酒店住宿管理系统+小程序项目需求分析文档
主要包含功能有门店管理,门店地图,房间管理,住宿设置,房费管理(平日价,周末价,钟点房价格,节假日价格),房态管理(
预
CSDN专家-赖老师(软件之家)
·
2025-02-06 05:25
SpringBoot
java讲座
微信小程序
mybatis
uniapp
vue
springboot
redis
一次spark streaming 性能抖动问题解决和分析
上数据大致需要30s时间,但偶发出现超过30s的情况问题分析sparkstream是内存密集型的应用,一般出现延迟通常是因为以下两个原因:内存分配过程出现延迟,出现GC问题,通常是内存资源问题导致数据源
侧
录入数据出现卡顿现象从以往经验看
spring208208
·
2025-02-06 04:18
spark
大数据组件线上问题分析
spark
大数据
分布式
AIGC从入门到实战:基于大模型的人工智能应用的涌现和爆发
1.2大模型:AIGC的基石AIGC的核心驱动力在于大规模
预
训练模型(简称“大模型”)。这些模型拥
AI天才研究院
·
2025-02-06 01:00
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【Mamba之模型训练系列(四)】将 mamba 扩展到多模态大型语言模型,实现高效推理
将mamba扩展到多模态大型语言模型,实现高效推理背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干训练策略训练数据训练阶段
预
训练阶段多模态指令调整阶段微调策略训练细节训练策略的关键结论实验验证实验设置性能比较推理速度消融研究关键结论参考文献这篇文章介绍了一个名为
愷创作者
·
2025-02-06 00:45
Mamba及多模态模型训练系列
语言模型
人工智能
自然语言处理
数据加密软件科普行业小知识
2、磁盘
驱动器
加密锁:磁
安固软件的博客
·
2025-02-05 18:37
数据库
服务器
网络
PCIE之RIFFA框架接口时序
一个简单的结构框图如下:二、接口时序 使用RIFFA框架开发只用关注用户
侧
的数据接口时序,RIFFA模块可以自己完成TLP封包解包。
今天学fpga
·
2025-02-05 14:37
找工作用的FPGA
fpga开发
从零开始:用Qt开发一个功能强大的文本编辑器——WPS项目全解析
**两
侧
对齐**15.**加粗**16.**斜体**17.**下划线**18.**
誰能久伴不乏
·
2025-02-05 12:52
qt
wps
数据库
STM32单片机学习记录(11.10)
一、STM323.1-关于GPIO(GeneralPurposeInputOutput)通用输入输出口:1.整体结构:寄存器(特殊存储器,可完成输出电平与读取电平功能)+
驱动器
;2.输入电压超过高电平阈值
宣宣猪的小花园.
·
2025-02-05 12:47
STM32
stm32
无人机
嵌入式硬件
单片机
OpenCV4.8 开发实战系列专栏之 21 - 图像卷积操作
窗口可以理解成一个指定大小的二维矩阵,里面有
预
gloomyfish
·
2025-02-05 10:08
OpenCV4.8
从入门到工程实战
计算机视觉
人工智能
opencv
深度学习
图像处理
【知识图谱增强】大模型应用架构:融合智能与数据的新纪元!
ChatGPT的外部搜索能力,使其不仅限于
预
训练的数据,而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用,通过外部知识的增强能够扩展大模型的能力,让其
大模型入门教程
·
2025-02-05 10:36
知识图谱
架构
人工智能
语言模型
大模型
llama
AI大模型
商用车电子电气架构与主动安全措施探讨
受不断提升的汽车复杂性和逐渐增加的整车电子控制器数量影响,供应商负责电子电气设计的传统方式逐渐被淘汰,
预
研发阶段电子电气架构设计开始引起业界高度重视。结合智能网联汽车特点,必须
汽车知识分享
·
2025-02-05 08:50
架构
汽车
算法——快速排序
然后递归地对基准元素两
侧
的子数组进行划分和排序,最终完成整个数组的排序。
百锦再@新空间代码工作室
·
2025-02-05 04:53
算法大全-29
排序算法
算法
数据结构
基于python使用OpenCV和MediaPipe通过人体姿态检测实现对标准的仰卧起坐数量的计量(一)
Numpy项目总流程用户准备仰卧起坐的时候,可以打开摄像头对准自己(本报告为方便呈现,将导入外部有关仰卧起坐的视频体现监测过程,并截图体现效果)并运行程序,则可以实现实时监测仰卧起坐的状态,通过获取人体一
侧
(
Komorebi_777
·
2025-02-05 03:21
视觉学习
python
opencv
开发语言
【2024第一期CANN训练营】Ascend C算子开发基础篇
AscendC的特点C/C++原语编程编程模型屏蔽硬件差异类库API封装,兼顾易用与高效孪生调试,可在CPU
侧
模拟NPU
侧
的行为开发基本流程环境准备使用AscendC完成Add算子核函数开发;使用ICPU_RUN_KFCPU
小超编程
·
2025-02-05 03:45
c语言
java
算法
DeepSeek R1赋能智能建造:施工安全风险
预
判系统全栈开发实战与创新解析
基于DeepSeekR1的智能施工安全风险
预
判系统构建与实战一、施工安全风险
预
判技术概述在建筑工程领域,安全风险
预
判是保障施工人员和财产安全的关键环节。
Coderabo
·
2025-02-04 20:55
DeepSeek
R1模型企业级应用
安全
AI大模型学习的七个阶段,学完你就是大模型大师!
预
训练、SFT、RLHF。第三阶段:编程基础与工具使用目标:掌握大
AGI大模型老王
·
2025-02-04 19:48
人工智能
学习
大模型
大模型学习
AI大模型
RAG
大模型教程
大模型文件格式GGUF格式
GGUF简介当前的大模型的参数规模较大,数以千亿的参数导致了它们的
预
训练结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
·
2025-02-04 18:36
人工智能大模型
【自然语言处理(NLP)】生成词向量:GloVe(Global Vectors for Word Representation)原理及应用
文章目录介绍GloVe介绍核心思想共现矩阵1.共现矩阵的定义2.共现概率矩阵的定义3.共现概率矩阵的意义4.共现概率矩阵的构建步骤5.共现概率矩阵的应用6.示例7.优缺点优点缺点**总结**目标函数训练过程使用
预
训练的
道友老李
·
2025-02-04 16:59
自然语言处理(NLP)
自然语言处理
人工智能
全场景深度学习开源框架(MindSpore)
旨在实现不同计算平台(如云端、边缘端、端
侧
)和不同硬件(如CPU、GPU、Ascend等)之间的高效协同。
deepdata_cn
·
2025-02-04 11:41
人工智能
深度学习
开源
人工智能
Spark基本概念
负责运行组成Spark应用的任务,并将结果返回给
驱动器
进程它们通过自身的块管理器
javafanwk
·
2025-02-04 00:18
Spark
大数据
spark
架构
大数据
DeepSeek的出现对全球GPT产业产生的冲击
特别是以GPT(GenerativePre-trainedTransformer)系列模型为代表的大规模
预
训练语言模型,已经在全球范围内引发了广泛关注和应用。
不要em0啦
·
2025-02-03 23:07
机器学习
gpt
A deep multimodal fusion method for personality traits prediction
研究方法模型架构:视觉特征提取:使用
预
训练模型ViT-B16和VGG16。音频特征提取:使用
预
训练模型VGGish。文本分析:使用
预
训练模型GloVe。
m0_59933522
·
2025-02-03 21:20
python
人工智能
机器学习
神经网络
深度学习
目标检测
计算机视觉
Qwen2.5-Max
Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型,基于混合专家(MoE)架构开发,拥有超过20万亿tokens的超大规模
预
训练数据。
百态老人
·
2025-02-03 20:18
笔记
大数据
人工智能
burpsuite小米手机抓包_【图解】Android安全测试之BurpSuite抓包
准备素材安卓手机一枚WIFI上网BurpSuite一枚手机
侧
配置将PC与手机连入同一WIFI网络,查看PC
侧
IP地址,如IP地址为192.168.1.100打开手机(以华为Mate截图为例),设置->WLAN
希葛格的韩少君
·
2025-02-03 18:26
burpsuite小米手机抓包
005-《VTK用户指南》--第一部分-VTK简介--第2章-安装--(1)基础概念
在MicrosoftWindows上,您可以安装
预
构建的vtk.exe,并通过运行TCL脚本使用它。
darlingfresher
·
2025-02-03 15:33
VTK系统学习
c++
深度学习:基于MindNLP的RAG应用开发
与传统LLM的区别:传统LLM仅依赖
预
训练参数中的静态知
Landy_Jay
·
2025-02-03 13:47
深度学习
人工智能
跟李沐学AI:视频生成类论文精读(Movie Gen、HunyuanVideo)
MovieGen:ACastofMediaFoundationModels简介MovieGen是Meta公司提出的一系列内容生成模型,包含了3.2.1
预
训练数据MovieGen采用大约100M的视频-文本对和
Landy_Jay
·
2025-02-03 13:16
人工智能
Mixture of Experts(MoE)学习笔记
不过在这之后开源社区并没有对MoE架构进行很多的探索,更多的工作还是聚焦在
预
训练新的大模型,在Llama2或其他模型上做Fine-tune,以及扩展大模型的ContextLength。12月8号
南七小僧
·
2025-02-03 12:44
人工智能
网站开发
医疗器械研发
学习
笔记
人工智能
MoE
大模型
最小边际采样在分类任务中的应用
在一个多分类问题中,模型会对每个样本
预
ningaiiii
·
2025-02-03 11:57
机器学习与深度学习
分类
数据挖掘
人工智能
Megatron:深度学习中的高性能模型架构
Megatron:深度学习中的高性能模型架构Megatron是由NVIDIA推出的深度学习大规模
预
训练模型框架,主要针对大规模Transformer架构模型的高效训练与推理。
gs80140
·
2025-02-03 08:06
基础知识科谱
AI
机器学习
人工智能
第三篇:模型压缩与量化技术——DeepSeek如何在边缘
侧
突破“小而强”的算力困局
——从算法到芯片的全栈式优化实践随着AI应用向移动终端与物联网设备渗透,模型轻量化成为行业核心挑战。DeepSeek通过自研的“算法-编译-硬件”协同优化体系,在保持模型性能的前提下,实现参数量与能耗的指数级压缩。本文从技术原理、工程实现到落地应用,完整解析其全链路压缩技术体系。第一章算法层创新:结构化压缩与动态稀疏化1.1非均匀结构化剪枝技术DeepSeek提出**“敏感度感知通道剪枝”(SAC
python算法(魔法师版)
·
2025-02-03 05:43
数据挖掘
机器学习
人工智能
深度学习
神经网络
生成对抗网络
边缘计算
【TIMM应用】timm加载模型create_model,使用本地
预
训练模型
timm加载模型create_model使用本地
预
训练模型1.常规方式,从https://huggingface.co/上下载1-1.timm库中create_model函数的用法1.最简单的用法2.查看可以直接创建的
预
训练模型列表
pen-ai
·
2025-02-03 03:29
深度学习
python
深度学习
神经网络
卷积神经网络
什么是“知识蒸馏”
知识蒸馏是一种将大型
预
训练模型(教师模型)的知识转移到较小模型(学生模型)的技术。这种方法不仅能保留原有模型的性能,还能显著降低模型的复杂度和计算需求,使其更适合在资源受限的环境中部署。知识蒸馏
清风AI
·
2025-02-02 19:55
深度学习
人工智能
神经网络
python
conda
DeepSeek 使用的核心技术预测
1.大规模
预
训练模型架构Transformer变种与优化:基于Transformer架构进行改进,可能引入稀疏注意力机制(如Longform
eso1983
·
2025-02-02 18:22
人工智能
深度学习
机器学习
python
LLM - 大模型 ScallingLaws 的设计 100B
预
训练方案(PLM) 教程(5)
欢迎关注我的CSDN:https://spike.blog.csdn.net/本文地址:https://spike.blog.csdn.net/article/details/145356022免责声明:本文来源于个人知识与公开资料,仅用于学术交流,欢迎讨论,不支持转载。ScalingLaws(缩放法则)是大模型领域中,用于描述模型性能(Loss)与模型规模N、数据量D、计算资源C之间关系的经验规
ManonLegrand
·
2025-02-02 18:21
大模型
(LLM)
人工智能
LLM
ScalingLaws
100B
预训练
DeepNorm
EGS
答疑解惑:如何监控EMC unity存储系统磁盘重构rebuild进度
wechat:StorageExpert监控传统池中的
驱动器
存储服务专家StorageExpert
·
2025-02-02 18:49
EMC存储设备
EMC存储
存储维护
运维
unity
三相PWM整流器有限集模型预测电流控制Simulink仿真模型
本文目录如下:目录1概述2运行结果2.1模型2.2直流
侧
电压输出波形2.3交流
侧
电压、电流2.4脉冲信号3参考文献4Simulink仿真实现1概述三相PWM整流器有限集模型预测电流控制Simulink仿真模型
wlz249
·
2025-02-02 15:01
matlab
【llm对话系统】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将
预
训练大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他