E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU并行
GNU编译优化级别-O -O1 -O2 -O3
最近做一个算法的
GPU
加速,发现实际上使用gcc的-O3(最高级编译优化)选项,可以获得很高的加速比,我的程序里达到了3倍的样子,有时效果甚至比
GPU
加速好。因此小小学习了下GNU的编译优化。
hemmingway
·
2025-02-01 06:53
C++
Linux
【Unity 渲染插件】
GPU
Instancer 基于
GPU
实例化技术,旨在解决 Unity 中大量重复对象的渲染瓶颈问题,显著提升游戏性能
GPU
Instancer是一款专注于高性能渲染的Unity插件,基于
GPU
实例化技术,旨在解决Unity中大量重复对象的渲染瓶颈问题,显著提升游戏性能。
Unity游戏资源学习屋
·
2025-02-01 05:14
Unity插件
Kafka 如何实现高性能
多个生产者、消费者和节点可以同时
并行
工作,分担流量负载。分区机制:Kafka使用分区来分散负载,每个topic可以有多个分区,每个分区可以独立处理读写操作。
言之。
·
2025-02-01 02:49
架构
面试
kafka
分布式
Linux上快速压缩与解压缩(zip, tag.gz)
1.tar文件Pigz(pigzee)是一个用于压缩和解压缩.gz文件的
并行
实现工具,它能够利用多核处理器来加速基于gzip的压缩和解压过程。
Dinsanity
·
2025-02-01 00:31
linux
笔记本
linux
运维
服务器
A3C(Asynchronous Advantage Actor-Critic)算法
A3C是由GoogleDeepMind提出的,并在许多强化学习任务中表现出色,特别是那些复杂的、需要
并行
处理的环境。A3C主要解决了传统深度强化学习中的一些问题,如训练稳定性和数据效率问题。
C7211BA
·
2025-01-31 23:25
算法
【TVM教程】为 Mobile
GPU
自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
HyperAI超神经
·
2025-01-31 22:43
TVM
人工智能
机器学习
TVM
编程
编译器
GPU
CPU
渲染定义
渲染定义渲染管线也称渲染流水线,是显示芯片内部处理图形信号相互独立的
并行
的处理单位。一个流水线是一序列可以
并行
和按固定顺序进行的阶段。也就是说每个阶段都是从它的前一阶段输入,然后输出发给随后的阶段。
ccqq0507
·
2025-01-31 19:50
opengl
ui
YOLO系列之训练环境(
GPU
)搭建篇
YOLOv8专栏导航:点击此处跳转Pytorch环境配置(Windows)Anaconda安装此处下载安装即可⭐温馨提示:安装路径
w94ghz
·
2025-01-31 17:01
YOLO改进系列
YOLOv8改进系列
YOLO
深度学习
人工智能
python
目标检测
【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.18 逻辑运算引擎:数组条件判断的智能法则
1.18逻辑运算引擎:数组条件判断的智能法则1.18.1目录逻辑运算引擎:数组条件判断的智能法则引言短路逻辑的向量化替代方案复合条件表达式的优化编写掩码操作在图像分割中的应用多条件
并行
评估的性能测试总结参考文献
精通代码大仙
·
2025-01-31 14:11
numpy
python
numpy
python
开发语言
【思维导图】并发编程
并发和
并行
的区别并发是指多个任务交替执行。
并行
是指多个任务同时被执行。线程与进程的区别1、进程包含线程。2、线程之间可以共享数据,比如说java线程之间共享堆内存和方法区里的数据。
rainbow--
·
2025-01-31 10:02
java
并发编程
DeepSeek极端榨取硬件性能被曝光
DeepSeek的出现是否意味着前沿LLM开发不再需要大规模
GPU
集群?简单来说:不是的。
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
【deepseek】本地部署DeepSeek R1模型:使用Ollama打造个人AI助手
二、环境准备硬件要求
GPU
显存要求:7B模型:8-12GB显存14B模型:12GB以上显存32B模型:建议16GB以上显存建议使用NVIDIA显卡SSD硬盘空间:建议预留50GB以上软件要求安
大表哥汽车人
·
2025-01-31 06:23
人工智能
大语言模型学习笔记
人工智能
deepseek
oracle用hints调优,oracle性能优化之--hints
4)表之间的连接类型5)表之间的连接顺序6)语句的
并行
程度1、写HINT目的人为的改变SQL语句的执行计划2、HINT可以
顾汐漫
·
2025-01-31 01:18
oracle用hints调优
大sql如果不能加索引,还能怎么优化 —— hint学习
解决方案:这里便用hint的
并行
解决,新的sql【select/*+parallel(8)*/字段1,字
ckh_user
·
2025-01-31 01:43
数据库
sql
数据库
oracle
AVR单片机状态与编程
(3)熔丝位的配置可以通过
并行
方式、ISP串行方式和JTAG串行方式实现。(4)AVR芯片加密锁定后(LB2/LB1=1/0,0/0)不能通过任何方式
正义飞
·
2025-01-31 00:07
单片机
AVR
CUDA编程(一):
GPU
计算与CUDA编程简介
CUDA编程(一):
GPU
计算与CUDA编程简介
GPU
计算
GPU
硬件资源
GPU
软件资源
GPU
存储资源CUDA编程
GPU
计算NVIDIA公司发布的CUDA是建立在
GPU
上的一个通用
并行
计算平台和编程模型,
AI Player
·
2025-01-30 21:17
CUDA
人工智能
CUDA
NVIDIA
GPU
编程与CUDA
CUDA编程
并行
计算整体流程从主机端申请内存,把内存部分的内容拷贝到设备端在设备端的核函数计算从设备端拷贝到主机端,并且释放内存显存主机端:cpu设备端:
gpu
核函数:在
gpu
上运行的函数CUDA内存模型
Nice_cool.
·
2025-01-30 21:17
Cuda与TensorRT
c++
GPU
-CUDA编程学习(一)
\n");return0;}不难看出CUDA代码基本上和ANSIC代码一样,只是增加了一些关键字来利用数据
并行
性global相当于声明函数在设备中运行
☞北海北☜
·
2025-01-30 21:45
c++
消失的时间,都去哪里了
时间都去哪里了,对于主副业
并行
的职场人来说,时间是非常宝贵的,我恨不得一分钟掰成两半来花,一分钟当两分钟用。
小路哥v
·
2025-01-30 20:05
副业思考
经验分享
全面解析:HTML页面的加载全过程(六)--浏览器渲染之分层 - Layer
分层原因在生成布局树之后,渲染进程会将一些复杂的3D动画、滚动条、高z-index的元素生成图层,并生成图层树交给
GPU
加速渲染。页面设计复杂,并且交互效果多。
huazi99于老师
·
2025-01-30 18:21
html
前端
Apache TVM:开源深度学习编译器栈的领跑者
ApacheTVM:开源深度学习编译器栈的领跑者tvmOpendeeplearningcompilerstackforcpu,
gpu
andspecializedaccelerators项目地址:https
计攀建Eliza
·
2025-01-30 18:51
LoongServe论文解读:prefill/decode分离、弹性
并行
、零KV Cache迁移
LoongServe论文解读:prefill/decode分离、弹性
并行
、零KVCache迁移LoongServe:EfficientlyServingLong-contextLargeLanguageModelswithElasticSequenceParallelism
04290629
·
2025-01-30 18:13
LLM笔记
transformer
人工智能
算法
深度学习
vLLM源码之分离式架构
通过分离式架构,可以
并行
处理多个请求,避免不同请求在处理过程中的相互干扰,充分利用硬件资源,特别是在处理高并发请求时能显著提高系统
Bj陈默
·
2025-01-30 17:38
架构
spring mvc 创建restapi 笔记
RequestMapping("/spittles")publicclassSpittleController{//示例:使用@RequestBody接收JSON并自动转换为Spittle对象@PostMappin
gpu
blicSpittlesaveSpittle
weixin_42277889
·
2025-01-30 13:02
spring
mvc
笔记
为什么LabVIEW适合软硬件结合的项目?
其强大的硬件接口支持、实时数据采集能力、
并行
处理能力和直观的用户界面,使得它成为工业控制、仪器仪表、自动化测试等领域中软硬件系统集成的理想选择。
LabVIEW开发
·
2025-01-30 11:16
LabVIEW开发案例
LabVIEW开发案例
LLM系列(0):行业大模型落地服务在全业务场景的应用与探索【大模型智能问答、NL2SQL、文档智能分析智能生成、AI智能体决策等】
行业大模型场景落地是否一定需要大量的
GPU
算力,以及需要多少的算力才能满足落地需求?
GPU
算力主要消耗在两个地方,一是大
汀、人工智能
·
2025-01-30 10:41
LLM工业级落地实践
人工智能
自然语言处理
prompt
NL2DSL
NL2SQL
大模型
智能问答
为AI聊天工具添加一个知识系统 之77 详细设计之18 正则表达式 之5
先给出综述:开发时/运行时/生产时(三世归一化时间投影X-piece-scale,三代连坐时间
并行
升级换代)的三界标准化空间(位
一水鉴天
·
2025-01-30 10:07
人工语言
软件智能
智能制造
人工智能
正则表达式
Transformer架构的
GPU
并行
和之前的NLP算法
并行
有什么不同?
1.什么是
GPU
并行
计算?
GPU
并行
计算是一种利用图形处理单元(
GPU
)进行大规模
并行
数据处理的技术。
AI大模型学习不迷路
·
2025-01-30 07:49
transformer
自然语言处理
大模型
深度学习
NLP
LLM
大语言模型
Rust:高性能与安全
并行
的编程语言
引言在现代编程世界里,开发者面临的最大挑战之一就是如何平衡性能与安全性。在许多情况下,C/C++这样的系统级编程语言虽然性能强大,但其内存管理的复杂性导致了各种安全漏洞。为了解决这些问题,Rust作为一种新的系统级编程语言进入了人们的视野。Rust不仅保留了C/C++的高效性能,同时引入了强大的内存管理机制,确保了内存安全。今天的这篇博客将深入介绍Rust的核心特性,并探讨为什么Rust是未来高效
大梦百万秋
·
2025-01-30 06:11
知识学爆
python
开发语言
conda创建新虚拟环境——从无到有
自己租的
GPU
最近有点鱼的记忆,base配什么环境自己都忘了,所以自己开始学习如何创建并且配置一个新环境,当然这一切建立在andonate3安装完的前提下自己的配置:Linux系统,Xshell编译器创建环境
S.T.A.R.
·
2025-01-30 05:32
深度学习
tensorflow
anaconda
cuda 线程调度
硬件描述从硬件上看,一块显卡的最小单元是
GPU
核(或者叫做StreamProcessor),所有核心平均分配在多个SM中,而多个SM共同构成整块显卡的核心。
weiwei0319
·
2025-01-30 05:31
CUDA
并发编程
Mooncake:面向大语言模型服务的以 KVCache 为中心的架构
它还利用
GPU
集群未充分利用的CPU、DRAM和SSD资源来实现KVCache的分解缓存。
步子哥
·
2025-01-29 22:42
AGI通用人工智能
语言模型
架构
人工智能
Flutter学习案例分享-计数器小案例
Flutter框架基础概念简介Widget,Element和RenderObject类型虽然Widget是开发人员创建和管理的,但Flutter框架会
并行
构建和管理另外两棵树,称为元素树和渲染对象树。
Mr.L70517
·
2025-01-29 19:47
Flutter案例学习
flutter
学习
判断字符串能否转json
packagecom.jlit.ms
gPu
sh.utils;importorg.apache.commons.lang.StringUtils;importorg.json.JSONArray;importorg.json.JSONException
qq_26517369
·
2025-01-29 18:37
json
C#高级:常用的扩展方法大全
1.Strin
gpu
blicstaticclassStringExtensions{//////字符串转List(中逗英逗分隔)///publicstaticListSplitCommaToList(thisstringdata
我是苏苏
·
2025-01-29 18:07
C#高级
c#
windows
java
自建stgcn数据集并训练
1.安装st-gcn复现STGCNCPU版(ubuntu16.04+pytorch0.4.0+openpose+caffe)_Significance的博客-CSDN博客复现旧版STGCN
GPU
版(win10
青年夏日科技工作者
·
2025-01-29 18:31
AI编程
Transformer--概念、作用、原理、优缺点以及简单的示例代码
与传统的循环神经网络(RNN)和长短时记忆网络(LSTM)不同,Transformer完全摆脱了序列结构的依赖,可以
并行
处理数据,显著提高了训练效率和效果
Ambition_LAO
·
2025-01-29 17:23
transformer
深度学习
docker desktop使用ollama在
GPU
上运行deepseek r1大模型
二、拉取ollama镜像在powershell中运行如下命令,即可拉取最新版本的ollama镜像:dockerpullollama/ollama如果需要指定版本,可以用如下命令:#CPU或Nvidia
GPU
yimenren
·
2025-01-29 17:20
docker
容器
运维
云计算技术深度解析与代码使用案例
云计算技术特点云计算是网格计算、分布式计算、
并行
计算、效
我的运维人生
·
2025-01-29 17:19
云计算
运维开发
技术共享
cpu和
gpu
的区别
cpu和
gpu
的区别是cpu是电脑的中央处理器,在电脑中起着控制计算机运行的作用;
gpu
是一个附属型的处理器,主要处理计算机中与图形计算有关的工作,并将数据更好地呈现在显示器中。
sdsadwe
·
2025-01-29 14:03
cpu
cpu
CPU与
GPU
的区别
2.什么是
GPU
?
GPU
:英文全称GraphicProcessingUnit,中文翻译为“图形处理器”,又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作
dingkm666
·
2025-01-29 14:31
基础知识储备
cpu与gpu
cpu和
gpu
的区别,以及cpu和
gpu
中核的概念以及四种架构
1.什么是cpu个人理解cpu就是一个公司里面的技术骨干,但是不参与管理工作的人员,在计算机中cpu主要是用来处理一条条机器指令的,并且cpu的运算速度特别快,所以说周围还有几个秘书,就是给他提供资料或者存储资料的(寄存器),一般一个程序运行的流程就是操作系统从程序对应的pcb中将指令取出,交给cpu进行处理,cpu处理完毕以后将结果写回对应的存储单元(寄存器或者内存)。cpu的具体作用:1.指令
zhoudeng666
·
2025-01-29 13:28
架构
c++
linux
c语言
Writing an efficient Vulkan renderer
27Feb2020In2018,Iwroteanarticle“WritinganefficientVulkanrenderer”for
GPU
Zen2book,whichwaspublishedin2019
Night_Aurora
·
2025-01-29 12:10
Vulkan
渲染
vulkan
2020 更新 - 腾讯 Android 面试 (已拿到月薪22K offer)
举个简单例子——UI优化,可以从UI出现什么问题(卡顿不流畅),怎么查找问题(手机开发者权限>
GPU
过度绘制发现层级问题,TraceViewCPU使用情况分析),怎么解决问题(降低层级、自定义View绘图出现问题等
2401_86372526
·
2025-01-29 12:07
android
面试
职场和发展
基于Blackwell架构的
GPU
,用七十二个
GPU
拼接成性能强大的计算集群,其性能比上一代提升三倍,
GPU
已成为AI时代的基础设施,可实现各种大模型的训练
英伟达在2024年3月发布了基于Blackwell架构的
GPU
,这一新一代
GPU
在性能上相比上一代Hopper架构有显著提升。
百态老人
·
2025-01-29 08:03
架构
人工智能
Go-
并行
编程新手指南
Go
并行
编程新手指南在Go语言中,
并行
编程是充分利用多核CPU资源、提升程序性能的重要手段。它的核心概念包括goroutine和channel,这些特性使得Go在处理并发任务时表现出色。
jimiStephen
·
2025-01-29 05:32
golang
开发语言
后端
Toxoid Engine:下一代Web游戏引擎的先锋
ECS-basedgameenginewritteninRustwithscriptingsupportforC#,JavaScriptandRusttoRust(WASM),hot-reloading,Web
GPU
r
施刚爽
·
2025-01-29 05:32
Solon2 接口开发: 熟悉 Gateway
1、定义2个组件API_0@Component(tag="api")publicclassAPI_0{@Mappin
gpu
blicResultexec(){
组合缺一
·
2025-01-29 03:15
Solon
Java
Framework
gateway
java
solon
使用飞书群机器人监控服务器
GPU
使用率
目标:如果服务器
GPU
空置,可以及时推送消息到飞书群。其他类似的监控目标也可以修改代码实现。步骤:(1)首先在群聊设置加入机器人,复制webhook_url(2)在服务器后台运行如下代码。
sunrise_ccx
·
2025-01-28 21:24
服务器
飞书
基于 FPGA 的简易 OFDM 系统 Verilog 实现
通过利用多个正交子载波,OFDM将高速数据流分散到多个低速数据流上进行
并行
传输。FPGA提供了
并行
处理能力,是实现实时OFDM系统的理想平台。
鱼弦
·
2025-01-28 13:21
人工智能时代
fpga开发
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他