E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
并行CUDA
git 多分支管理
Git多分支管理是团队协作和复杂项目开发的核心实践,通过合理利用分支机制可以实现
并行
开发、版本控制和代码稳定性:一、分支管理基础概念与操作分支的创建与切换创建分支:使用gitbranch基于当前提交创建新分支
大丈夫在世当日食一鲲
·
2025-03-02 08:50
GIT
git
Qt 多线程误区:QThread 任务未正确执行及收尾回调未触发的原因分析
问题背景在开发Qt项目时,我们希望
并行
执行多个任务来提高效率,并在所有任务完成后进行收尾处理。为此,我们使用QThread来执行任务,并在QThread::finished事件触发时调用收尾函数。
丰年稻香
·
2025-03-02 07:14
QT
qt
前沿计组知识入门(二)
第2页:
并行
计算与编程硬件:多处理器多内存互连网络系统软件:
并行
操作系统用于表达和协调并发的编程构造应用软件:
并行
算法目标:利用硬件、系统和应用软件实现加速(速度提升):Tp=TspT_p=\frac{
tianyunlinger
·
2025-03-02 03:14
计组
人工智能
笔记
Datawhale 数学建模导论国赛B学习笔记
因此,在求解
并行
机调度问题上,贪心算法容易获得近似最优解的答案,更有
瓜瓜蛋
·
2025-03-02 02:06
数学建模
学习
笔记
计算机基础之操作系统——进程与线程管理(三)
多进程资源隔离性好、安全性高、支持
并行
,然而资源需求高、进程间通信复杂、上下文切换开销大;多线程轻量级、高度共享资源和数据、线程间通信简单、资源占用低、上下文切换开销小,然而隔离性差,容错性差。
查理养殖场
·
2025-03-02 02:04
计算机八股
服务器
linux
GaussDB 学习进阶路线-进阶篇:分布式架构、性能调优与高可用实战
本文将以生产环境为背景,深入剖析GaussDB的数据分片、
并行
计算、主备容灾、云原生集成等核心技术,结合实战配置与调优案例,助你解锁GaussDB的高阶技能,构建稳定高效的分布式数据库系统!
Jan123.
·
2025-03-02 00:55
gaussdb
学习
分布式
科技快讯 | DeepSeek宣布开源DeepGEMM;多个团队开发AI论文反识别技术;OpenAI GPT 4.5现身Android测试版,即将发布
该库采用
CUDA
编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP
最新科技快讯
·
2025-03-01 23:18
科技
NCCL学习笔记-拓扑和算法
集合通信数据
并行
:all-reduce或reduce-scatter和all-gather张量
并行
:all-reduce流水
并行
:点对点p2p序列
并行
:all-gather和reduce-scatter
MatsumotoChrikk
·
2025-03-01 22:35
NVIDIA
NCCL
学习
笔记
算法
【学习】电脑上有多个GPU,命令行指定GPU进行训练。
CUDA
_VISIBLE_DEVICES=1假设要使用第二个GPU进行训练。
CUDA
_VISIBLE_DEVICES=1pythontrain.py
超好的小白
·
2025-03-01 19:18
学习
人工智能
深度学习
【探商宝】DeepSeek开源周第四弹:双向流水
并行
与专家负载均衡技术解析
DeepSeek开源周第四日重磅发布的DualPipe双向流水
并行
算法与EPLB专家
并行
负载均衡器(ExpertParallelismLoadBalancer),为解决这些难题提供了创新方案。
探熵科技
·
2025-03-01 15:19
数据分析
人工智能
window11和Ubuntu20.04安装Nvidia驱动和
CUDA
的正确方法
双系统安装Win11Ubuntu20.04双系统安装解决ubuntu+win11双系统时间不一致问题Ubuntu:系统分区一、安装Nvidia驱动参考:Ubuntu20.04安装NVIDIA显卡驱动、
CUDA
qq_29128985
·
2025-03-01 07:20
linux
python
深度学习
Anaconda配置tensorflow-gpu教程
最近在入门tensorflow深度学习,配置环境吃了不少苦头,写个完整的教程首先得在自己主机上装
cuda
(我之前就是主机上没装
cuda
,只在虚拟环境里面装了,结果jupyter里面怎么调都识别不到GPU
rubisco214
·
2025-02-28 22:19
tensorflow
人工智能
python
Rust并发编程实践:10分钟入门系统级编程
摘要引言正文解析:一、Rust中的并发编程基础1.1线程1.2协程二、Rust并发编程的高级特性2.1通道2.2原子操作2.3锁三、实例展示:优化并发编程性能1.
并行
计算2.异步IO3.数据
并行
四、并发编程的挑战与最佳实践结论
m0_74824687
·
2025-02-28 19:00
面试
学习路线
阿里巴巴
rust
python
算法
第8章:流式海啸:数据重构
话音未落,整片海域突然被拉入
并行
流的漩涡。
PM简读馆
·
2025-02-28 19:29
Java之黄金罗盘
java
Java Stream 流笔记
流是什么常用API及使用与传统API对比总结1.Stream流是什么Stream是Java8引入的用于处理集合数据的抽象API,特点:声明式编程:关注"做什么"而非"怎么做"链式操作:支持流水线式操作组合
并行
处理
L_!!!
·
2025-02-28 16:34
java
java
笔记
Stable diffusion 3.5本地运行环境配置记录
condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-
cuda
寸先生的牛马庄园
·
2025-02-28 09:38
扩散模型
stable
diffusion
开目CAPP三维装配工艺设计在企业的应用价值
通过应用,主要实现了以下价值:提升产品上市速度在产品设计到产品交付的过程中,通过采用数字化预装配进行装配工艺规划,可以帮助企业通过装配过程的模拟分析尽早发现和解决问题,优化装配方案,为设计与工艺、制造的
并行
提供条件
开目软件
·
2025-02-28 07:54
开目CAPP
三维装配工艺设计
三维装配工艺设计应用价值
A100高效架构深度解析
在计算架构层面,第三代TensorCore通过引入细粒度结构化稀疏支持与新型数据格式,显著提升矩阵运算效率;多实例GPU(MIG)技术则通过物理级硬件隔离实现单卡多任务
并行
处理,为
智能计算研究中心
·
2025-02-28 02:14
其他
ZeRO分布式训练策略
ZeRO分布式训练策略详解一、核心设计原理ZeRO(ZeroRedundancyOptimizer)是微软提出的分布式训练优化框架,与传统数据
并行
方法不同,ZeRO通过将模型的参数、梯度和优化器状态分散到多个设备上
AIGC_ZY
·
2025-02-28 02:13
大模型
分布式
每日Attention学习24——Strip Convolution Block
ConnectivityAttentionNetworkforRoadExtractionFromSatelliteImagery模块名称StripConvolutionBlock(SCB)模块作用多方向条形特征提取模块结构模块特点类PSP设计,采用四个
并行
分支提取不同维度的信息相比于经典的横向
xiongxyowo
·
2025-02-27 22:08
划水
【Linux入门】正则三剑客:grep、sed和wak
sedsed编辑器的介绍sed流编辑器的工作过程解决sed命令处理大文件效率慢的问题解决方案一:使用`split`命令分割文件解决方案二:优化`sed`命令的使用解决方案三:使用更高效的工具解决方案四:
并行
处理总结
Karoku066
·
2025-02-27 20:46
linux
运维
服务器
bash
ssh
智算中心的核心硬件是什么?
当前主流的AI加速计算芯片包括:1、GPU(图形处理器)GPU是智算中心的算力担当,其强大的
并行
计算能力使其在深度学习领域大放异彩。GPU芯片
Imagination官方博客
·
2025-02-27 19:42
Spark之PySpark
PySpark使得Python开发者能够利用Spark强大的分布式计算能力,处理大数据集,并执行高效的
并行
计算。一、PySpark核心概念1.RDD(弹性分布
james二次元
·
2025-02-27 18:01
大数据
Spark
Python
PySpark
DeepEP:开源通信库的高效专家
并行
计算解决方案
摘要DeepEP是一个专为Mixture-of-Experts(MoE)和专家
并行
计算设计的开源通信库。它提供高效的all-to-all通信模式,支持GPU之间的高吞吐量和低延迟数据交换。
耶耶Norsea
·
2025-02-27 16:41
网络杂烩
人工智能
高效能计算与高速数据传输的完美结合:飞腾D2000处理器与复旦微双FPGA集成主板
它更适合那些需要高性能计算、FPGA
并行
处理或高速通信
国产化嵌入式平台解决方案
·
2025-02-27 15:10
fpga开发
linux
硬件工程
硬件架构
pcb工艺
嵌入式硬件
DeepSeek开源周合集
周一:FlashMLA,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家
并行
通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和推理填充的高吞吐量内核用于推理解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
oneAPI介绍
InteloneAPI的设计理念是提供统一的编程接口,让开发人员能够利用不同类型的处理器实现高效
并行
计算。InteloneAPI中有什么?
Cindy020506
·
2025-02-27 11:10
oneapi
人工智能
9. 【.NET 8 实战--孢子记账--从单体到微服务--转向微服务】--微服务基础工具与技术--Ocelot 网关--请求聚合
例如,移动端展示订单详情时,聚合层可
并行
调取用户、商品和物流服务的数据,整合后返回精简结果,避免客户端频繁发起请求。此外,聚合层还能处理数据裁
喵叔哟
·
2025-02-27 08:18
.NET
8
.net
微服务
架构
十六、uart(3)带FIFO缓存(普通fifo模式)
1、uart_tx.v/***@Author:X-Z*@Date:2023-02-0912:44:54*@Function:串口发送模块,将接收模块接收到的1帧10bit
并行
数据转换为10bit的串行数据并通过发送引脚
cmc1028
·
2025-02-27 07:45
FPGA代码
缓存
fpga开发
单片机
解读
CUDA
Compiler Driver NVCC - Ch.3
本篇文章了解
CUDA
源文件编译的整个workflow。
AliceWanderAI
·
2025-02-27 05:25
NVCC
NVCC
NVIDIA
CUDA
Compiler Driver NVCC
NVIDIA
CUDA
CompilerDriverNVCC4.2.8.23.`--list-gpu-code`(`-code-ls`)4.2.8.24.
Yongqiang Cheng
·
2025-02-27 05:23
NVIDIA
GPU
-
CUDA
-
cuDNN
NVIDIA
CUDA
Compiler
NVCC
LM_Funny-2-01 递推算法:从数学基础到跨学科应用
1.1形式化定义与公理化体系定理1.1(完备性条件)1.2高阶递推的特征分析案例:Gauss同余递推4第二章工程实现优化技术2.1内存压缩的革新方法滚动窗口策略分块存储技术2.2异构计算加速方案GPU
并行
递推量子计算原型第三章跨学科应用案例
王旭·wangxu_a
·
2025-02-27 01:25
算法
安装
CUDA
以及GPU版本的pytorch
于是搜索便知道了
CUDA
。下面给出一个自检的建议:检查
cuda
的版本是否适配自己的GPU。
lskkkkkkkkkkkk
·
2025-02-26 21:53
Python
pytorch
人工智能
python
高并发的“大BOSS”之详解:异步化、
并行
化
2019独角兽企业重金招聘Python工程师标准>>>高并发的大杀器:异步化同步和异步,阻塞和非阻塞同步和异步,阻塞和非阻塞,这几个词已经是老生常谈,但是还是有很多同学分不清楚,以为同步肯定就是阻塞,异步肯定就是非阻塞,其实他们并不是一回事。同步和异步关注的是结果消息的通信机制:同步:调用方需要主动等待结果的返回。异步:不需要主动等待结果的返回,而是通过其他手段,比如状态通知,回调函数等。阻塞和非
weixin_34210740
·
2025-02-26 19:39
测试
数据库
java
DeepSeep开源周,第三天:DeepGEMM是啥?
DeepGEMM通过算法优化、硬件指令集加速和
并行
计算技术,显著提升计算速度,适用于GPU、CPU等硬件平台。对开发者的用处性能提升优化计算密集型任务(如LLM训练/推理),降低延迟,提升吞吐量。
程序员差不多先生
·
2025-02-26 19:33
pytorch
下载
cuda
11.2+cudnn8.1+tensorflow-gpu2.5
安装
cuda
11.2和cudnn8.1要注意自己的版本,目前tensorflow-gpu2.5或最高版本tensorflow-gpu2.6只支持
cuda
11.2和cudnn8.1。
听微雨
·
2025-02-26 14:03
深度学习
tensorflow
人工智能
管道-过滤器、隐式调用、解释器架构风格对比
并行
阿湯哥
·
2025-02-26 12:45
架构
DL之IDE:深度学习环境安装之Tensorflow/tensorflow_gpu+
Cuda
+Cudnn(最清楚/最快捷)之详细攻略(图文教程)
DL之IDE:深度学习环境安装之Tensorflow/tensorflow_gpu+
Cuda
+Cudnn(最清楚/最快捷)之详细攻略(图文教程)导读本人在Win10下安装深度学习框架Tensorflow
一个处女座的程序猿
·
2025-02-26 11:43
精选(人工智能)-中级
深度学习
人工智能
tensorflow
FastSAM:高效图像分割算法详解与实战
其采用基于密度的空间聚类方法处理噪声和不规则形状,自适应策略调整聚类参数以增强泛化能力,并优化计算流程实现
并行
化处理以提升运行速度。FastSAM算法在医疗、自动驾驶等多个领域具有广泛应用前景。
阿qi 爱喝拿铁
·
2025-02-26 10:34
【AI论文】S*: 针对代码生成的测试时缩放方法
S在现有的
并行
缩放范式基础上引入了顺序缩放,以突破性能极限。此外,它还利用了一种新颖的选择机制,该机制能自适应地生成用于成对比较的区别性输入,并结合执行基础信息
东临碣石82
·
2025-02-26 05:58
人工智能
flash_attn安装
flash_attn安装1.
cuda
-nvcc安装https://anaconda.org/nvidia/
cuda
-nvcc2.torch安装#https://pytorch.org/#找到对应
cuda
壶小旭
·
2025-02-26 03:46
Python
Linux
python
【python】flash-attn安装
这个命令:确保使用正确的
CUDA
12.6工具链设置必要的
CUDA
环境变量包含了常见的GPU架构支持利用你的128核心进行
并行
编译#清理之前的安装proxychains4pipuninstall-yflash-attn
x66ccff
·
2025-02-26 03:43
python
开发语言
llama-cpp-python本地部署并使用gpu版本
使用带编译的命令安装llama库#首选GGML_
CUDA
后续LLAMA_CUBLAS将删除CMAKE_ARGS="-DGGML_
CUDA
=on"FORCE_CMAKE=1pipinstallllama-cpp-python
i__chen
·
2025-02-26 02:03
llama
python
开发语言
嵌入式软件架构设计分层思路
在正规的项目开发中,项目往往是
并行
开发的,也就是说硬件设计、底层软件设计、应用软件设计等是同步进行的。比如说在开发板上调试模块驱动,在其他平台上调试应用程序再移植到目前这个平台等。
轻松学C语言
·
2025-02-26 01:57
嵌入式
单片机
uboot
framework
qt
PyNvVideoCodec解码使用
解码视频生成器例子,支持解码视频和视频流try:importtimefromfunctoolsimportwrapsimportcv2importnumpyasnpimportpy
cuda
.driveras
cuda
importPyNvVideoCodecasnvcimportctypesasCimportosexceptImportErrorase
huomama
·
2025-02-25 22:11
python
PyNvVideoCodec
视频编解码
PaddleOCR环境搭建(记录)
需nvidia下载zlib包即C:\ProgramFiles\NVIDIAGPUComputingToolkit\
CUDA
\v1
江木27
·
2025-02-25 21:04
PaddleOCR
paddle
Linux LCD驱动开发
一、硬件准备与原理LCD接口类型RGB
并行
接口:需配置时序参数(HSYNC/VSYNC/DCLK)LVDS:差分信号传输,需设置通道映射MIPI-DSI:高速串行接口,需初始化CMD/VIDEO模式SPI
PM简读馆
·
2025-02-25 12:26
Linux嵌入式驱动开发
驱动开发
Miniconda配置——conda虚拟环境的日常使用
xMiniconda3-latest-Linux-x86_64.shbashMiniconda3-latest-Linux-x86_64.sh#记住更新PATH到~/.bashrc时选noConda、
CUDA
guikunchen
·
2025-02-25 06:13
Ubuntu环境配置
软件配置
RTX 3090图形处理巅峰性能解析
通过对比测试数据与工程原理分析,重点探讨24GBGDDR6X显存在8K分辨率场景下的带宽利用率,以及10496个
CUDA
核心在光线追踪与深度学习超采样(DLSS)任务中的动态负载分
智能计算研究中心
·
2025-02-25 03:26
其他
软考高级架构师/分析师论文【论面向服务架构设计及应用/SOA】
通过webservice技术,将认证功能封装为单点登录系统,提高复用,同时将任务管理、中间件等功能解耦拆分,提高了服务
并行
开发效率及可维护
saikey0379
·
2025-02-25 01:10
软考高级论文
系统架构设计师
系统分析师
计算机软件资格考试
soa
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他