E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU训练
数据标注工具及其对预
训练
模型性能的影响
1.背景介绍1.1预
训练
模型的崛起近年来,预
训练
模型(Pre-trainedModels)在自然语言处理(NLP)领域取得了显著的成功。
AGI大模型与大数据研究院
·
2025-03-15 10:00
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
数据标注质量对AI模型质量的影响分析
没有高质量的标注数据,就如同建造高楼大厦没有坚实的地基,AI模型就无法有效地学习和
训练
,最终的AI质量也就无从谈起。
训练
数据是AI模型
自由鬼
·
2025-03-15 10:30
行业发展
IT应用探讨
人工智能
机器学习
深度学习
AI
基于纯视觉的 GUI 代理的屏幕解析工具(OmniParser)
一、技术原理1.数据集构建:从流行网页和应用中提取数据,构建可交互图标检测数据集和图标描述数据集,为模型
训练
提供基础。
deepdata_cn
·
2025-03-15 09:51
应用软件
GUI
Anthropic 的模型
Anthropic的模型(特别是Claude系列)之所以在性能和推理能力上表现强劲,可以从技术设计、研究理念、
训练
方法以及应用优化等多个方面进行详细分析。
调皮的芋头
·
2025-03-15 06:50
深度学习
神经网络
机器学习
人工智能
RV1126笔记三十七:PaddleOCR检测模型
训练
PaddleOCR检测模型
训练
及验证测试1、准备数据集在PaddleOCR目录下新建文件夹:train_data,这个文件夹用于存放数据集的。
殷忆枫
·
2025-03-15 05:16
RV1126项目实战
笔记
构建centos7镜像调用外部
gpu
sudovi/etc/docker/daemon.json{"runtimes":{"nvidia":{"path":"/usr/bin/nvidia-container-runtime","runtimeArgs":[]}}}/*{"registry-mirrors":["https://9cpn8tt6.mirror.aliyuncs.com"]}{"runtimes":{"nvidia":{
周子青
·
2025-03-15 05:10
linux
无网络entos7报错ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found更新glibc
最近在尝试使用sklearn的升级版cuml,因为是一台没有连接互联网的
gpu
机器,所以构建cuml环境过程很坎坷,需要各种将各种whl包在线下载后上传到服务器中。
夏离
·
2025-03-15 05:40
网络
大语言模型微调和大语言模型应用的区别?
1.基本概念微调(Fine-tuning)定义:微调是指在预
训练
大语言模型的基础上,通过在特定领域或任务的数据上进一步
训练
,从而使模型在该特定任务上表现更优。
AI Echoes
·
2025-03-15 05:38
深度学习
人工智能
机器学习
大语言模型(LLMs)全面学习指南(非常详细)零基础入门到精通,收藏这一篇就够了
如下这份指南将涵盖LLMs的基础知识、
训练
过程、用例和未来趋势……一.WhatareLargeLanguage
网络安全大白
·
2025-03-15 04:38
科技
程序员
人工智能
语言模型
人工智能
自然语言处理
Centos安装
GPU
驱动,使用100元显卡玩转deepseek
步骤1:安装NVIDIA驱动程序1.1安装显卡驱动编译工具yuminstallgccmakekernel-devel1.2安装显卡驱动依赖包yuminstallvulkan-loader1.3下载驱动安装https://www.nvidia.cn/drivers/details/220730/chmodu+xNVIDIA-Linux-x86_64-550.54.15.run./NVIDIA-Lin
white.tie
·
2025-03-15 04:07
centos
linux
运维
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
训练
成本估计只有Llama3.1405B模型的11分之一,后者的效果还不如它。
AIBigModel
·
2025-03-15 04:06
人工智能
十分钟学会微调大语言模型
在之前的文章中,我分享了一些使用大语言模型开发应用的方法,也介绍了几个开源大语言模型的部署方式,有同学给我留言说想知道怎么
训练
自己的大语言模型,让它更贴合自己的业务场景。
喝不喝奶茶丫
·
2025-03-15 04:35
语言模型
人工智能
自然语言处理
大模型
大模型应用
AI大模型
微调
Gemma 3 发布:最强单
GPU
/TPU 可运行模型,性能超 Llama-405B!
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://rengongzhineng.io/GoogleDeepMind再次掀起AI界的狂潮,正式推出Gemma3——一款轻量级但性
新加坡内哥谈技术
·
2025-03-15 04:35
人工智能
自然语言处理
语言模型
深度学习
copilot
llama
大语言模型微调和大语言模型应用的区别?
1.定义与目标微调(Fine-tuning)目标:调整预
训练
模型(如GPT、LLaMA、PaLM)的参数,使其适应特定任务或领域。
AI Echoes
·
2025-03-15 04:34
人工智能
深度学习
机器学习
神经网络完成
训练
的详细过程
神经网络完成
训练
的详细过程一、神经网络的基本概念神经网络是一种模拟人脑神经系统的计算模型,由大量的神经元(节点)和它们之间的连接(权重)组成。
每天五分钟玩转人工智能
·
2025-03-15 04:34
神经网络
人工智能
深度学习
pytorch
机器学习
优化算法包括梯度下降法
DeepSeek开源:FlashMLA深度解析:Hopper架构上的大模型推理革命
2025年2月24日,DeepSeek以「开源周」首日发布的FlashMLA技术,重新定义了Hopper架构
GPU
在AI推理领域的性能极限。
花生糖@
·
2025-03-15 03:55
AIGC学习资料库
AI·未来
DeepSeek
实用集
开源
架构
FlashMLA
DeepSeek
技术
AI
AIGC
【JS性能优化黑魔法】从8秒到0.8秒的奇迹の逆袭(祖传代码大改造)—— 让老板跪下喊爸爸的极致优化指南
)=>{cartItems.forEach(item=>{item.style.top=`${Math.sin(Date.now())*10}px`;//持续触发回流});},16);//老司机优化(
GPU
vvvae1234
·
2025-03-15 01:08
github
pytorch实现cifar10多分类总结
它包含了10个不同类别,每个类别有6000张图像,其中5000张用于
训练
,1000张用于测试。这10个类别分别为:飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。
L_pyu
·
2025-03-15 00:31
人工智能
pytorch
分类
多分类—微调DistilBERT对生物医学文本进行实验方法多分类:Automated Text Mining of Experimental Methodologies from Biomedical
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper:https://arxiv.org/abs/2404.13779github:本文做的就是微调DistilBERT去做多分类任务,
训练
自己的数据集
小小帅AIGC
·
2025-03-14 23:56
information
extraction
人工智能
自然语言处理
语言模型
多分类
学术领域
生物医学
数据挖掘技术介绍
功能:根据已标记的
训练
数据,学习一个模型,用于预测新数据的类别。方法:决策树、支持向量机、神经网络、逻辑回归、
柒柒钏
·
2025-03-14 23:25
数据挖掘
数据挖掘
人工智能
图神经网络学习笔记—高级小批量处理(专题十四)
小批量(mini-batch)的创建对于让深度学习模型的
训练
扩展到海量数据至关重要。与逐条处理样本不同,小批量将一组样本组合成一个统一的表示形式,从而可以高效地并行处理。
AI专题精讲
·
2025-03-14 23:52
图神经网络入门到精通
人工智能
医学文本分析中的命名实体识别:从理论到实践
1.数据预处理数据预处理是医学命名实体识别系统的基础步骤,其质量直接影响模型的
训练
效果和最终性能。数据预处理主要包括医学文本的标注、清洗以及数据增强三个方面。
软件职业规划
·
2025-03-14 23:51
语言模型
unity
人工智能
Deepseek:物理神经网络PINN入门教程
一、物理信息网络(PINN)的概念与原理1.定义与来源物理信息网络(Physics-InformedNeuralNetworks,PINN)是一种将物理定律(如偏微分方程、守恒定律等)嵌入神经网络
训练
过程的深度学习方法
天一生水water
·
2025-03-14 23:50
神经网络
人工智能
深度学习
基于Transformer的医学文本分类:从BERT到BioBERT
Transformer模型,尤其是BERT及其变体,通过预
训练
和微调的方式,能够有效捕捉医学文本中的语义信息,为医学文本分类提供了强大的工具。本文将探讨Transfor
Evaporator Core
·
2025-03-14 23:17
人工智能
#
深度学习
#
DeepSeek快速入门
transformer
分类
bert
H100解锁生成式AI算力新纪元
内容概要英伟达H100
GPU
以Hopper架构为核心,重新定义了生成式AI的算力边界。
智能计算研究中心
·
2025-03-14 22:43
其他
Batch Normalization理解
来说输入的就是满足某一分布的特征矩阵,但对于Conv2而言输入的featuremap就不一定满足某一分布规律了(注意这里所说满足某一分布规律并不是指某一个featuremap的数据要满足分布规律,理论上是指整个
训练
zhimengxiang
·
2025-03-14 22:13
图像处理
人工智能
图像处理
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”,准确率90%+,pytorch复现
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊前言如果说最经典的神经网络,ResNet肯定是一个,从ResNet发布后,很多人做了修改,denseNet网络无疑是最成功的一个,它采用密集型连接
羊小猪~~
·
2025-03-14 22:08
深度学习
网络
pytorch
人工智能
python
机器学习
分类
云原生周刊:基于 KubeSphere LuBan 架构打造DeepSeek 插件
它提供与OpenAI兼容的API,支持在CPU和
GPU
上运行,并具备按需自动扩缩容的能力。KubeAI无需依赖Istio、Knative等其他系统,能够在几乎任何K8s集群中开箱即用。
·
2025-03-14 22:37
云计算
边缘计算Edge Computing
OverviewEdgecomputin
gpu
shesapplications,dataandcomputingpower(services)awayfromcentralizedpointstothelogicalextremesofanetwork.Edgecomputingtakesadvantageofmicroservicesarchitec
福梦
·
2025-03-14 22:07
IoT
从零到一:Transformer模型的原理与实战之旅
1.2自注意力机制的核心1.3Transformer的结构2.实战:构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型
训练
3.推理实战:完整示例与输出结果3.1
樽酒ﻬق
·
2025-03-14 21:06
AI
transformer
深度学习
人工智能
PyTorch 深度学习实战(13):Proximal Policy Optimization (PPO) 算法
一、PPO算法基础PPO是OpenAI提出的一种强化学习算法,旨在解决策略梯度方法中的
训练
不稳定问题。PPO通过
进取星辰
·
2025-03-14 19:47
PyTorch
深度学习实战
深度学习
pytorch
算法
HiPixel开源AI驱动的图像超分辨率的原生macOS 应用程序,使用 SwiftUI 构建并利用 Upscayl 强大的 AI 模型
二、软件特征具有SwiftUI界面的原生macOS应用程序使用AI模型进行高质量图像放大通过
GPU
加速实现快速处理支持各种图像格式用于自动处理新添加图像的文件夹监控现代、直观的用户界面三、为什么选择HiPixel
2301_78755287
·
2025-03-14 19:43
swiftui
ios
swift
人工智能
开源
图像处理
笔记:代码随想录算法
训练
营day39:LeetCode 198.打家劫舍,213.打家劫舍II,337.打家劫舍III
学习资料:代码随想录198.打家劫舍力扣题目链接思路:有点像贪心,是一个不断比较取最大路径的思路定义:偷到下标为i的这家,能偷到的最大值递推公式:选当前这家偷能得到的钱和不偷当前这家的钱作比较,选能偷到的最大金额。因为这个金额是逐一递推过来的,所以是能够代表最大值的。初始化:把第一家和第二家初始化,简单来说,因为递推公式需要i-1和i-2遍历顺序:顺着偷打印://五部曲//定义:dp[i]为偷到第
jingjingjing1111
·
2025-03-14 18:07
笔记
leetcode
算法
数据结构
动态规划
【大模型LLM面试合集】分布式
训练
_总结
数据并行不仅仅指对
训练
的数据并行操作,还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。
X.AI666
·
2025-03-14 17:28
大模型LLM面试合集
面试
分布式
人工智能
语言模型
2025年渗透测试面试题总结-阿里巴巴-阿里云安全(二面)(题目+回答)
目录阿里巴巴-阿里云安全二面一、职业方向与技术偏好1.安全研究vs安全研发的定位二、云安全与身份认证2.云上PKI与身份认证的关注方向三、项目实践与成果3.字节跳动
训练
营项目四、攻防技术深度解析4.SQL
独行soc
·
2025-03-14 17:25
2025年渗透测试面试指南
科技
安全
web安全
面试
职场和发展
红蓝攻防
阿里云
KNN算法实例_手写识别系统
数据集我们将使用MNIST数据集,它包含60000个
训练
样本和10000个测试样本。每个样本是一个28x28像素的灰度图像,表示0-9之间的手写数字。
V文宝
·
2025-03-14 16:47
机器学习
算法
芯片时钟树结构(H-tree,Fishbone,FlexH,Mesh等)的对比、应用实例及未来趋势
本文将深入解析H-tree、Fishbone、FlexHtree及Clockmesh四种主流时钟树结构的技术特性,结合服务器芯片、
GPU
及AI芯片的实战案例,并探讨主流EDA工具对CTS
赛卡
·
2025-03-14 16:46
人工智能
服务器
云计算
边缘计算
大模型高效优化技术全景解析:微调、量化、剪枝、梯度裁剪与蒸馏
Quantization)剪枝(Pruning)梯度裁剪(GradientClipping)知识蒸馏(KnowledgeDistillation)技术对比与协同策略总结与趋势1.微调(Fine-tuning)核心思想在预
训练
模型
时光旅人01号
·
2025-03-14 15:40
人工智能
剪枝
算法
深度学习
数据挖掘
人工智能
推理大模型:技术解析与未来趋势全景
ReasoningLLMs)是专门针对复杂多步推理任务优化的大型语言模型,具备以下核心特性:输出形式创新展示完整逻辑链条(如公式推导、多阶段分析)任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务
训练
方法升级融合强化学习
时光旅人01号
·
2025-03-14 15:10
深度学习
人工智能
python
pytorch
神经网络
LibreTranslate的本地部署与应用服务开发
最近在关注大模型预
训练
文章和应用服务开发,有时候需要借助翻译工具,使用起来都不太方便,就找了一下类似的常见语言的翻译方案,无意中看到一个开源翻译方案(即LibreTranslate),对于通用和计算机类内容的翻译效果还是不错的
一望无际的大草原
·
2025-03-14 15:08
高级数据应用
后端
人工智能
大模型
翻译
源码部署
【AI论文】TPDiff:时序金字塔视频扩散模型
基于这一洞见,我们提出了TPDiff,一个统一的框架,用于提高
训练
和推理效率。通过将扩散过程分为几个阶段,我们的框架在扩散过程中逐步增加帧率,仅在最后阶段采用全帧率,从而优化计算效率。
东临碣石82
·
2025-03-14 14:31
人工智能
算法
DeepSeek 面试题精选
以下是针对DeepSeek面试的精选问题及解答,涵盖技术原理、模型架构、
训练
方法和应用场景等方面,供面试准备参考:一、DeepSeek模型架构与技术原理1.请简述DeepSeek-V3模型的总体架构和主要创新点
CarlowZJ
·
2025-03-14 14:00
DeepSeek
30.代码随想录算法
训练
营第三十天|452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间
30.代码随想录算法
训练
营第三十天|452.用最少数量的箭引爆气球,435.无重叠区间,763.划分字母区间452.用最少数量的箭引爆气球-力扣(LeetCode)有一些球形气球贴在一堵用XY平面表示的墙面上
白鹭鸣鸣!
·
2025-03-14 14:00
算法
java
从LayerNorm到RMSNorm:深度学习归一化技术的进化!qwen2.5的技术。
(RootMeanSquare,RMS)来进行归一化,避免了传统归一化方法中均值和方差的计算1.LayerNorm(层归一化)LayerNorm(层归一化)是一种用于深度学习的归一化技术,主要用于稳定
训练
过程
KangkangLoveNLP
·
2025-03-14 13:29
qwen2.5
深度学习
人工智能
transformer
pytorch
自然语言处理
python
神经网络
十种处理权重矩阵的方法及数学公式
1.权重归一化(WeightNormalization)目的:通过分离权重向量的范数和方向来加速
训练
。
阳光明媚大男孩
·
2025-03-14 13:26
矩阵
机器学习
线性代数
【Agent实战】发票信息识别提取专家(AI +OCR技术结合ChatGPT4o能力+结构化prompt(CoT、One-shot等)+Knowledge - RAG+API工具Agent项目实践)
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-03-14 13:55
大模型落地探索及agent搭建
RAG技术应用探索
prompt实战应用案例
人工智能
ocr
prompt
AIGC
chatgpt
gpt
agi
【漫话机器学习系列】137.随机搜索(Randomized Search)
随机搜索(RandomizedSearch)详解在机器学习和深度学习的模型
训练
过程中,超参数调优(HyperparameterTuning)是至关重要的一环。
IT古董
·
2025-03-14 12:50
漫话机器学习系列专辑
机器学习
人工智能
医学人工智能影像诊断数据收集与整理
为了
训练
这些模型,需要大量的高质量标注数据。下面我会给出一个简单的示例流程,介绍如何收集、整理和准备医学影像数据集,并提供一些基础的Python代码示例。数据收集首先,你需要收集包含医学影像的数据集。
V搜xhliang0246
·
2025-03-14 12:18
人工智能
健康医疗
算法
GPU
底层优化的关键语言(深入解析PTX);PTX相比汇编语言的核心优势
PTX作为英伟达
GPU
的底层语言,既是性能优化的利器,也是打破生态垄断的突破口。其“类汇编”特性赋予开发者对硬件的极致控制权,但高昂的开发成本与生态依赖仍制约其普及。
AI-AIGC-7744423
·
2025-03-14 11:13
rust
开发语言
后端
英伟达的ptx是什么?ptx在接近汇编语言的层级运行?
它是CUDA编程模型中,主机代码与实际在
GPU
上执行的机器码之间的桥梁。开发者编写的CUDAC/C++等高级语言代码,在编译过程中
AI-AIGC-7744423
·
2025-03-14 11:43
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他