扫地的小何尚

最新NVIDIA Ada Lovelace架构和 RTX 40系列详解

Nvidia 的 Ada 架构和 GeForce RTX 40 系列显卡计划于 10 月 12 日开始到货，从 GeForce RTX 4090 和 RTX 4080 开始。这是 Nvidia Ampere 架构的两年后，考虑到放缓摩尔的“定律”，这是一个好消息，因为最好的显卡需要一些新的竞争。

我们知道 RTX 4090 何时发布。如果 Nvidia 遵循与过去类似的发布时间表，我们可以预期 RTX 40 系列的其余产品将在明年陆续推出。 RTX 4080 16GB 和 12GB 型号将于 11 月到货，但除此之外，情况有些模糊。 RTX 4070 可能会在 2023 年初上市，RTX 4060 和 4050 可能会在明年晚些时候上市。让我们从 Ada 系列 GPU 的规格和传闻规格的高级概述开始。

Graphics Card	RTX 4090	RTX 4080 16GB	RTX 4080 12GB
Architecture	AD102	AD103	AD104
Process Technology	TSMC 4N	TSMC 4N	TSMC 4N
Transistors (Billion)	76.3	45.9	35.8
Die size (mm^2)	608.4	378.6	294.5
SMs / CUs / Xe-Cores	128	76	60
GPU Cores (Shaders)	16384	9728	7680
Tensor Cores	512	304	240
Ray Tracing “Cores”	128	76	60
Boost Clock (MHz)	2520	2505	2610
VRAM Speed (Gbps)	21	22.4	21
VRAM (GB)	24	16	12
VRAM Bus Width	384	256	192
L2 Cache	72	64	48
ROPs	176	112	80
TMUs	512	304	240
TFLOPS FP32 (Boost)	82.6	48.7	40.1
TFLOPS FP16 (FP8)	661 (1321)	390 (780)	321 (641)
Bandwidth (GBps)	1008	717	504
TDP (watts)	450	320	285
Launch Date	Oct 2022	Nov 2022	Nov 2022
Launch Price	$1,599	$1,199	$899

他的前三张卡现在是官方的，规格完全准确。

当然，未来的 RTX 4090 Ti 顶部有足够的空间。请注意，最大二级缓存在 4090 上被削减（六个 12MB 块而不是六个 16MB 块），ROP 被削减了一点，Nvidia 肯定可以推高时钟和功率…和价格。 [叹气。]但是明年有更新时可能会出现。

我们确实知道 Nvidia 在 4090 和 4080 上的时钟速度达到了 2.5-2.6 GHz，我们预计 RTX 40 系列中的其他 GPU 上的时钟速度也类似。 Nvidia 还成功地将 RTX 4090 超频至 3.0GHz 及以上。我们暂时在未发布的 GPU 上估计了 2.6 GHz 的时钟速度。

英伟达还透露，发布的三款机型使用了三种不同的 GPU，这与之前的发布相比有很大的变化。 RTX 4090 使用显着缩减的 AD102 实现（89% 的内核，75% 的缓存）。同时，RTX 4080 16GB 使用“几乎完整”的 AD103 芯片（95% 的内核和所有缓存），而 RTX 4080 12GB 使用完全启用的 AD104 芯片。同样，我们可以期待每个 GPU 在某个时候收获或更完全启用的变体。

Nvidia 很可能会在所有 Ada GPU 上使用 TSMC 的 4N 工艺——“4nm Nvidia”，而且肯定会在 RTX 4090 和 4080 卡上使用。我们确定 AD102、AD103 和 AD104 以及 Hopper H100 都使用 TSMC 的 4N 节点，这是 TSMC 的 N5 节点的调整变体，已广泛用于其他芯片，也将用于 AMD 的 Zen 4 和 RDNA 3。我们不’认为三星不会有一个引人注目的替代方案，不需要对核心架构进行认真的重新设计，因此整个家族可能都在同一个节点上。

Nvidia 将在 AD102 GPU 上“做大”，它的尺寸和晶体管数量更接近 H100，而不是 GA102 接近 GA100。根据现有信息和一些剩余的谣言，Ada Lovelace 看起来是个怪物。它将包含比当前 Ampere GPU 更多的 SM 和相关内核，它将具有更高的 GPU 时钟，并且还将包含许多架构增强功能以进一步提高性能。 Nvidia 声称 RTX 4090 比即将推出的 RTX 3090 Ti 快 2 倍至 4 倍，但警告适用于这些基准。

Nvidia 的预览性能主要是 4K Ultra，这是需要牢记的。如果您当前运行的是更适中的处理器，而不是绝对最好的游戏 CPU 之一，即 Core i9-12900K 或 Ryzen 7 5800X3D，那么即使在 1440p 超分辨率下，您也很可能会受到 CPU 的限制。为了充分利用最快的 Ada GPU，可能需要进行更大的系统升级。

ADA 将大幅提升计算性能

随着高级概述的结束，让我们进入细节。与当前 Ampere 相比，Ada GPU 最显着的变化将是 SM 的数量。AD102 包含的 SM 可能比 GA102 多 71%。即使体系结构没有其他任何重大变化，我们也希望这会带来性能的巨大提升。

这不仅适用于图形，也适用于其他元素。尽管 Tensor core现在支持 FP8（具有稀疏性）以可能使 FP16 性能翻倍，但大多数计算与 Ampere 并没有改变。 RTX 4090 在 FP16 中具有高达 661 teraflops 的深度学习/AI 计算能力，在 FP8 中具有高达 1,321 teraflops 的能力——完全启用的 AD102 芯片可以在类似的时钟下达到 1.4 petaflops。

相比之下，RTX 3090 Ti 中的完整 GA102 最高约为 321 TFLOPS FP16（同样，使用 Nvidia 的稀疏特性）。这意味着 RTX 4090 根据核心数量和时钟速度提供了 107% 的理论增长。相同的理论性能提升也适用于着色器和光线追踪硬件，除了这些也在发生变化。

GPU shader cores将具有新的shader执行重排序 (SER) 功能，Nvidia 声称该功能可将总体性能提高 25%，并且可以将光线追踪操作提高多达 200%。不幸的是，对 SER 的支持将要求开发人员使用专有的 Nvidia 扩展，因此现有游戏不一定会受益。

同时，RT 内核在射线/三角形相交硬件上加倍投入，此外它们还有更多可用的新技巧。不透明度微贴图 (OMM) 引擎可显着加快对树叶、粒子和栅栏等透明表面的光线追踪。另一方面，置换微网格 (DMM) 引擎优化了边界体积层次 (BVH) 结构的生成，Nvidia 声称它可以将 BVH 的创建速度提高 10 倍，同时将 BVH 存储使用的内存减少 20 倍 (5%) .同样，这些要求开发人员利用新功能。

总之，这些架构增强应该使 Ada Lovelace GPU 能够提供巨大的性能飞跃。除非由开发人员来启用它们中的大多数，因此吸收可能会相当减少。

ADA LOVELACE ROPS

在某些情况下，Ada 的 ROP 数量会增加很多，尤其是顶级型号（目前）RTX 4090。与 Ampere 一样，Nvidia 将 ROP 与 GPC、图形处理集群联系起来，但其中一些仍然可以禁用。

AD102 有多达 144 个 SM，我们现在知道它使用 12 个 GPC，每个 GPC 有 12 个 SM。尽管 RTX 4090 上的最终数字是 11 个 GPC 和 176 个 ROP，但这最多产生 192 个 ROP。

RTX 4080 16GB 将有 7 个 GPC，就像 GA102 一样，但奇怪的是，其中两个 GPC 集群似乎只有 10 个 SM，而其他五个将有多达 12 个 SM。无论如何，所有七个都在 RTX 4080 16GB 上启用，它有 112 个 ROP。 RTX 4080 12GB 中的 AD104 使用 12 个 SM 的 5 个 GPC，具有 80 个 ROP。

暂且把剩下的三张牌作为最好的猜测。我们不确定将使用哪些 GPU，并且可能会在卡之间穿插其他型号（即 RTX 4060 Ti）。一旦其他 Ada GPU 接近发布，我们将在未来几个月内获得更多信息时填补空白。

内存系统：GDDR6X 再次运行

最近，美光宣布它拥有运行速度高达 24Gbps 的 GDDR6X 内存。最新的 RTX 3090 Ti 仅使用 21Gbps 内存，而 Nvidia 是目前唯一一家使用 GDDR6X 的公司。这立即引发了将使用 24Gbps GDDR6X 的问题，唯一合理的答案似乎是 Nvidia Ada。较低层的 GPU 更有可能坚持使用标准 GDDR6 而不是 GDDR6X，其最高速度为 18Gbps。

这代表了一个问题，因为 GPU 通常需要计算和带宽来按比例扩展以实现承诺的性能量。例如，RTX 3090 Ti 的计算量比 3090 多 12%，更高的时钟内存提供了 8% 的带宽。根据上面显示的计算细节，正在酝酿着巨大的脱节。 RTX 4090 的计算量大约是 RTX 3090 Ti 的两倍，但它提供相同的 1008 GB/s 带宽——最终的 RTX 4090 Ti 为 24Gbps，有人知道吗？

假设可以控制 GDDR6X 功耗，那么在较低层 GPU 上带宽增长的空间要大得多。当前的 RTX 3050 到 RTX 3070 都使用标准 GDDR6 内存，主频为 14-15Gbps。我们已经知道以 18Gbps 运行的 GDDR6 是可用的，因此具有 18Gbps GDDR6 的假设 RTX 4050 应该可以轻松跟上 GPU 计算能力的增长。如果 Nvidia 仍然需要更多带宽，它也可以将 GDDR6X 用于较低层的 GPU。

由于我们知道 RTX 4090 和 4080 卡的核心规格，我们只能得出结论，Nvidia 不需要大幅增加纯内存带宽，因为相反它将重新设计架构，类似于我们看到 AMD 对 RDNA 2 所做的比较到原始的 RDNA 架构。

ADA L2 缓存

一种减少对更多原始内存带宽需求的好方法是几十年来已知和使用的方法。在芯片上增加更多缓存，您会获得更多缓存命中，每次缓存命中意味着 GPU 不需要从 GDDR6/GDDR6X 内存中提取数据。大缓存对游戏性能特别有帮助。 AMD 的 Infinity Cache 允许 RDNA 2 芯片以更少的原始带宽完成更多工作，而 Nvidia Ada L2 缓存信息表明 Nvidia 采取了类似的方法。

AMD 在 Navi 21 GPU 上使用了高达 128MB 的大型 L3 缓存，Navi 22 为 96MB，Navi 23 为 32MB，Navi 24 仅为 16MB。令人惊讶的是，即使是较小的 16MB 缓存也能为内存子系统带来奇迹。我们并不认为 Radeon RX 6500 XT 总体上是一款出色的显卡，但它基本上可以赶上内存带宽几乎是两倍的显卡。

Ada 架构似乎将 8MB L2 缓存与每个 32 位内存控制器配对，或者每个 64 位控制器 16MB。这意味着具有 128 位内存接口的卡将获得 32MB 的总二级缓存，而 AD102 上的 384 位接口具有高达 96MB 的二级缓存。除此之外，还可以禁用部分二级缓存块，RTX 4090 只有 72MB 的二级缓存（12MB 的六个块而不是 16MB）。虽然在很多情况下这比 AMD 的 Infinity Cache 要小，但我们还不知道延迟或设计的其他方面。 L2 缓存的延迟往往低于 L3 缓存，因此稍小的 L2 肯定可以跟上更大但速度较慢的 L3 缓存，正如我们在 RDNA 2 GPU 中看到的那样，即使是 16MB 或 32MB 的无限缓存也有很大帮助。

如果我们以 AMD 的 RX 6700 XT 为例。与上一代 RX 5700 XT 相比，它的计算量增加了约 35%。与此同时，我们的 GPU 基准测试层次结构中的性能在 1440p 超分辨率下高出约 32%，因此整体性能与计算几乎一致。除此之外，6700 XT 拥有 192 位接口，带宽仅为 384 GB/s，比 RX 5700 XT 的 448 GB/s 低 14%。这意味着大型无限缓存使 AMD 的有效带宽至少提高了 50%。

假设 Nvidia 与 Ada 获得了类似的结果，而且情况似乎确实如此，即使没有更宽的内存接口，Ada GPU 仍然应该有足够的有效带宽。还值得一提的是，Nvidia 在过去架构中的内存压缩技术已被证明是有能力的，因此与 AMD 相比略小的缓存可能根本不重要。

RTX 40 系列获得 DLSS 3

RTX 4090 和 4080 的重大公告之一是 DLSS 3 即将推出……它仅适用于 RTX 40 系列显卡。 DLSS 1 和 DLSS 2 在 RTX 20 和 30 系列卡上都可以工作，并且也可以在 Ada GPU 上工作，而 DLSS 3 从根本上改变了算法中的一些东西，显然需要新的架构更新。

DLSS 3 算法的输入与以前大致相同，但现在有一个新的光流加速器 (OFA)，它似乎采用先前的帧并生成额外的运动矢量，然后可以输入光学多帧生成单元。这听起来有点像 VR 时代的异步空间扭曲 (ASW)，除了现在它被用于放大以从单个源帧生成两个帧。当然它是用人工智能增强的，所以它绝对不是反潜战，但从高层次来看，肯定有一些相似之处。

我们将不得不看看它在行动中的样子，但这确实提供了一些诱人的性能提升。双倍帧率？由于正在进行额外的计算工作，可能没有那么多，但 Nvidia 确实展示了描绘 63 fps 的 DLSS 2 和 101 FPS 的 DLSS 3 的幻灯片，性能提高了 73%。

DLSS 3 将需要 RTX 40 系列卡才能运行，至少在启用帧生成的情况下。这将是用户可以选择启用的额外设置；没有它，听起来好像仍然会使用核心 DLSS 2 算法，这样开发人员就可以有效地支持 RTX 40 系列以及之前的 RTX 系列卡。 Nvidia 还花时间插入其 Streamline API，它允许游戏开发人员轻松支持 DLSS 2、DLSS 3、Intel XeSS，甚至可能是 AMD FSR 2.0（如果有人创建插件）。

ADA 获得 AV1 编码

Nvidia 宣布 GeForce RTX 4090 和 GeForce RTX 4080 显卡将配备两个第八代 Nvidia Encoder (NVENC) 硬件单元。这些也将支持 AV1 编码。

据 Nvidia 称，AV1 编码将效率提高了 40%。这意味着任何支持编解码器的直播看起来都比当前的 H.264 流的比特率高 40%。当然，流媒体服务需要支持 AV1。

请注意，两个编码器可以在它们之间拆分工作，因此对于任何潜在的工作负载，编码性能都会有效地翻倍，即使 GPU 只编码单个流。视频编辑器可以从性能提升中受益，Nvidia 正在与 DaVinci Resolve、Voukoder 和 Jianying 合作以提供支持，预计将于 10 月推出。

GeForce Experience 和 ShadowPlay 也将使用新硬件，允许游戏玩家以 HDR 格式捕捉高达 8K 和 60 fps 的游戏画面。非常适合 0.01% 可以观看原生 8K 内容的人！（如果你构建它，它们就会来…）此外，NVENC 单元仍然可以处理 H.264、HEVC 和其他格式。

ADA 功耗

早期关于 Ada 的 600W 和更高 TBP（总板功率）的报道似乎大多没有根据，至少在已宣布的 Founders Edition 型号上是这样。 RTX 4090 与即将推出的 RTX 3090 Ti 具有相同的 450W TBP，而 RTX 4080 16GB 将其降至仅 320W，而 RTX 4080 12GB 具有 285W TBP。但是，这些是供参考的 Founders Edition 模型。

正如我们在 RTX 3090 Ti 和其他 Ampere GPU 中看到的那样，一些 AIB（附加板）合作伙伴非常乐意拥有更高的功耗来追求每一点的性能。高达 600W 的 RTX 4090 定制卡当然不是不可能的，未来的 RTX 4090 Ti 可能会推得更高。

这一切都可以追溯到丹纳德缩放的终结，以及摩尔定律的死亡。简而言之，，每一代，尺寸都可以缩小约 30%。这将总面积减少了 50%（长度和宽度都按比例缩放），电压下降了类似的 30%，电路延迟也将减少 30%。此外，频率将增加约 40%，总功耗将减少 50%。

如果这一切听起来好得令人难以置信，那是因为 Dennard 缩放在 2007 年左右有效地结束了。就像摩尔定律一样，它并没有完全失败，但收益变得不那么明显了。集成电路中的时钟速度仅从 2004 年 Pentium 4 Extreme Edition 的最高约 3.7GHz 增加到如今 Core i9-12900KS 的最高 5.5GHz。这仍然几乎增加了 50% 的频率，但它已经超过了六代（或更多，取决于您要如何计算）的流程节点改进。换句话说，如果 Dennard 缩放没有死，现代 CPU 的时钟频率将高达 28GHz。 RIP，丹纳德缩放，你会被想念的。

死亡的不仅仅是频率缩放，还有功率和电压缩放。如今，新的工艺节点可以提高晶体管密度，但需要平衡电压和频率。如果您想要一个速度快两倍的芯片，您可能需要使用几乎两倍的功率。或者，您可以构建更高效的芯片，但不会更快。 Nvidia 似乎在追求 Ada 的更高性能，尽管它并没有完全将效率问题抛诸脑后。

以 RTX 4080 12GB 为例。 Nvidia 至少暗示它将在性能上接近上一代 RTX 3090 Ti，同时减少 37% 的功耗。在某些情况下，例如 DLSS 3 和繁重的 RT 工作负载，它甚至可以在使用更少功率的同时将性能提高一倍。不过，我们将不得不看看这些卡片在各种游戏中是如何工作的。

Nginx与Tomcat：谁更适合你的服务器？当归1024 java 中间件 nginx nginx tomcat 服务器
nginx和Tomcat是两种不同类型的服务器软件，它们各有不同的用途和特点：基本定义nginx轻量级的HTTP服务器和反向代理服务器主要用于静态文件服务、负载均衡、反向代理TomcatJavaWeb应用服务器专门用于运行JavaWeb应用（JSP、Servlet）主要区别1.功能定位nginx：静态文件服务器反向代理服务器负载均衡器HTTP缓存服务器Tomcat：Java应用容器JSP/Serv
Beam2.61.0版本消费kafka重复问题排查隔壁寝室老吴 kafka linq 分布式
1.问题出现过程在测试环境测试flink的job的任务消费kafka的情况，通过往job任务发送一条消息，然后flinkwebui上消费出现了两条。然后通过重启JobManager和TaskManager后，任务从checkpoint恢复后就会出现重复消费。当任务不从checkpoint恢复的时候，任务不会出现重复消费的情况。由此可见是beam从checkpoint恢复的时候出现了重复消费的问题。
CBAP50技术手册】#47 Use Cases & Scenarios（用例与场景）：BA（业务分析师）让需求“活起来”的剧本写作术郭菁菁 BA 业务分析需求分析
把需求演绎成系统与用户的真实互动剧本。在一次项目需求评审会上，开发组沉默不语，业务方焦躁不安。写在文档里的需求，似乎谁都“看懂了”，但又好像“谁都没真正理解”。直到我用一组UseCases&Scenarios把冷冰冰的需求变成了一场场“用户剧本”，大家才终于“看见”了系统该如何运作，沟通顿时顺畅了。UseCases和Scenarios，就像是BA的“剧作笔”——把抽象需求，演绎成生动细节。什么是U
Anaconda插件开发 lyh1344 数据库开发
开发环境准备安装Anaconda或Miniconda，确保conda命令可用。推荐使用Python3.7及以上版本。创建独立的开发环境以避免依赖冲突：condacreate-nplugin_devpython=3.8condaactivateplugin_dev插件结构设计Anaconda插件通常采用Python包的标准结构。核心文件包括__init__.py和setup.py。典型目录结构如下：
Node.js 全局对象 froginwe11 开发语言
Node.js全局对象引言Node.js作为一种流行的JavaScript运行环境，以其高性能、轻量级和跨平台的特点，被广泛应用于服务器端编程、网络应用开发等领域。在Node.js中，全局对象是一个重要的概念，它为开发者提供了一系列内置的全局变量和方法，使得编程变得更加便捷。本文将详细介绍Node.js的全局对象，帮助开发者更好地理解和运用它们。Node.js全局对象概述Node.js的全局对象指
Python3 数字(Number) froginwe11 开发语言
Python3数字(Number)引言在编程语言中，数字是构成程序的基础元素之一。Python3作为一种高级编程语言，提供了丰富的数字类型和操作方法。本文将详细介绍Python3中的数字类型，包括整数、浮点数、复数等，并探讨它们的特性和应用。整数（Integer）整数是Python3中最基本的数据类型之一，用于表示没有小数部分的数值。在Python3中，整数类型没有大小限制，可以表示任意大小的整数
技术调研：时序数据库（一） myskybeyond 时序数据库时序数据库数据库
选择时序数据库时，选择当下主流的解决方案。目前主流的开源解决方案有InfluxDB、TDengine和TimescaleDB。下文从多个维度对比分析，最终根据需求做出选型决策。1.核心架构与设计理念数据库架构特点核心优势InfluxDB-专为时序数据设计的分布式数据库-基于时间线（TimeSeries）模型-开源版（OSS）与商业版（Cloud/Enterprise）功能差异大高写入吞吐量、原生支
Ruby 字符串（String） froginwe11 开发语言
Ruby字符串（String）引言在编程语言中，字符串是处理文本数据的基础。Ruby作为一种动态、面向对象的语言，提供了丰富的字符串处理功能。本文将详细介绍Ruby中的字符串（String）类型，包括其基本用法、操作方法以及高级特性。字符串的基本概念在Ruby中，字符串是由一系列字符组成的序列。这些字符可以是字母、数字、标点符号等。字符串是不可变的，这意味着一旦创建，其内容就不能被修改。创建字符串
初中学习机推荐：从功能、内容到用户体验的深度解析资讯分享周 ux 人工智能
在教育信息化持续深化的背景下,初中阶段的学习辅助设备正逐步成为家长和学生关注的重点。尤其在“双减”政策推动下,传统补习班的作用被削弱,越来越多家庭开始依赖智能学习工具来提升学习效率和自主性。其中,初中学习机因其集视频课程、AI辅导、错题整理、学习反馈等多功能于一体,成为当前市场热度最高的教育硬件之一。本文将围绕市场上主流的几款初中学习机进行客观分析,重点介绍简单一百、学而思、科大讯飞、作业帮四款产
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
4.链表入门 ArtoriasSZ 算法链表数据结构 go 后端算法
单双链表及其反转-堆栈诠释值引用：函数调用得到原值的拷贝，函数实际使用的变量与原变量解耦。引用传递：函数调用拷贝原指针得到一个新指针，该指针和原指针指向同一个内存区域。反转单链表题干：给你单链表的头节点head，请你反转链表，并返回反转后的链表。使用双指针法，使用head进行遍历，pre指向head前一个节点，next指向head后一个节点。在每轮，首先得到head的下一个节点（为了在断掉这个节点
别再为通信发愁！机床厂PROFIBUS DP转EtherNet/IP网关应用指南，低成本实现智能升级 JIANGHONGZN PROFIBUS DP 工业通讯协议网关 ETHERNET/IP
在现代机床制造工厂中，设备间的无缝通信是实现高效、柔性生产的关键。西门子PLC（如S7-300/1500系列）作为核心控制器广泛采用PROFIBUSDP现场总线，而高端机器人系统（如FANUC、KUKA）则普遍支持EtherNet/IP协议。在这类异构网络共存的环境中，协议转换网关成为打通数据壁垒的核心枢纽。网关的核心作用与工作流程角色定位：网关作为“翻译官”，部署在西门子PLC（PROFIBUS
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
Nginx服务部署与配置月堂 nginx 运维
目录HTTPS访问配置（又称自签名）1、SSL简介2、HTTPS工作流程（重要）3、自留签名证书location配置作用匹配规则匹配优先级rewrite配置HTTPS访问配置（又称自签名）1、SSL简介SSL(SecureSocketsLayer）安全套接层。是由Netscape（网景）公司于1990年开发，用于保障WordWideWeb（WWW）通讯的安全。主要任务是提供私密性，信息完整性和身份
高可用与低成本兼得：全面解析 TDengine 时序数据库双活与双副本 TDengine （老段） TDengine 案例分析时序数据库 tdengine 大数据涛思数据数据库物联网 iot
在现代数据管理中，企业对于可靠性、可用性和成本的平衡有着多样化的需求。为此，TDengine在3.3.0.0版本中推出了两种不同的企业级解决方案：双活方案和基于仲裁者的双副本方案，以满足不同应用场景下的特殊需求。本文将详细探讨这两种方案的适用场景、技术特点及其最佳实践，让大家深入了解这两大方案如何帮助企业在高效可靠的数据存储和管理中取得成功。TDengine双副本（+仲裁者）为了满足部分客户在保证
009 【入门】单双链表及其反转-堆栈诠释要天天开心啊算法专栏算法链表
链表与堆栈系统详解|[数据结构]-[中级]-[通用]一、基础概念与内存模型1.按值传递vs按引用传递|[Java]-[基础]-[内存]//[典型错误示例]-Java中的引用传递陷阱voidmodify(Nodenode){node=node.next;//[警告]错误！仅修改局部引用的指向，不影响原始链表}//[正确做法]-通过引用修改对象内部状态voidrealModify(Nodenode){
PROFIBUS DP转EtherNet/IP网关：精密医疗器械粘合密封的质量守护者 JIANGHONGZN PROFIBUS ETHERNET/IP DP 协议网关工业通讯机器人
在医疗器械制造领域，精密部件（如输液器接头、植入体密封壳）的粘合与密封工艺对可靠性和一致性要求近乎苛刻。这类工艺通常由高速、高精度的涂胶机器人执行，而其精准动作离不开与核心控制系统（如西门子PLC）的无缝数据交互。当产线中同时存在西门子PROFIBUSDP网络与支持EtherNet/IP的机器人时，专用协议转换网关便成为确保“数据血液”畅通的关键设备。网关的核心角色：协议翻译与无缝桥接此类网关设备
GitHub Actions 的深度解析与概念介绍青草地溪水旁 linux 环境配置开发管理 github linux ubuntu docker
GitHubActions核心定义GitActions是GitHub原生提供的自动化工作流引擎，允许开发者在代码仓库中直接创建、测试、部署代码。其本质是通过事件驱动（Event-Driven）的自动化管道，将软件开发中的重复任务抽象为可编排的流程。架构核心四要素工作流（Workflow）仓库中的自动化流程蓝图（.yml文件）存储在.github/workflows目录单仓库可包含多个独立工作流事件
【数据结构】顺序表 nanguochenchuan 数据结构数据结构
一，顺序表1.顺序表的定义顺序表是一种线性表的数据结构，它的数据元素按照一定次序依次存储在计算机存储器中，使用连续的存储空间来存储。顺序表中每个数据元素的位置都有一个序号，这个序号也称为元素在顺序表中的下标。顺序表的特点是：元素的逻辑顺序与物理顺序相同，支持随机访问，插入和删除元素的时间复杂度为O(n)，查找元素的时间复杂度为O(1)。2.优点与不足优点是访问速度快，因为它的元素在内存中是连续存储
【linux】yum工具篇 nanguochenchuan Linux操作系统 linux 运维服务器
Yum工具概述Yum（YellowdogUpdaterModified）是RedHat系列Linux发行版（如CentOS、Fedora）中最核心的软件包管理工具，它基于RPM包管理系统构建，通过自动解决依赖关系极大简化了软件管理流程。与直接使用rpm命令相比，Yum能自动处理软件包依赖，让系统管理员从"依赖地狱"中解脱出来。Yum工作原理深度解析Yum的工作流程可分为四个关键阶段：仓库配置读取：
Linux命令行基础：常用命令与技巧 m0_73843831 chrome 前端 Linux 命令行常用命文件操作权限管理
1.Linux命令行概述Linux命令行（也称为终端或Shell）是Linux操作系统中与用户交互的文本界面。通过命令行，用户可以执行各种任务，如文件管理、进程控制、系统配置等。相比图形用户界面（GUI），命令行具有更高的效率和灵活性，尤其适用于服务器管理和自动化任务。本文将涵盖以下内容：常用命令文件与目录操作权限管理进程管理命令行技巧2.常用命令2.1文件与目录操作ls功能：列出当前目录下的文件
拼多多商品详情API接口：社交电商的得力助手 lovelin+vI7809804594 图搜索算法算法人工智能爬虫 API
在"人找货"向"货找人"的范式转移中，拼多多凭借社交裂变模式重塑中国电商格局。其商品详情API接口作为连接6.8亿消费者与1500万商家的数字纽带，日均调用量突破100亿次，支撑着秒杀、拼团、砍价等特色玩法。这一技术工具不仅是数据通道，更是社交电商生态的神经中枢，驱动着用户增长、流量分发和交易转化的全链路优化。一、技术解码：商品详情API的架构设计与核心能力高并发架构体系分片存储策略：采用TIDB
【第15章】亿级电商平台订单系统-高可用架构设计 cherry5230 亿级流量架构设计与落地系统架构分布式架构中间件
1-1本章导学课程概述核心内容：订单系统高可用架构设计项目背景：年交易额200亿的B2B电商平台订单系统本章学习路径高可用概念解析设计原则学习七大架构设计方法论项目实战应用一、高可用核心概念定义与价值解析系统可靠性标准指标二、设计原则体系冗余设计故障自动转移服务降级策略监控预警机制三、七大高可用设计方法论<
Linux tcp_info：监控TCP连接的秘密武器 CodeWithMe 网络 linux tcp/ip
深入解析Linuxtcp_info：TCP状态的实时监控利器在开发和运维网络服务时，我们常常遇到这些问题：我的TCP连接为什么速度慢？是发生了重传，还是窗口太小？拥塞控制到底有没有生效？这些问题的答案，其实隐藏在内核的tcp_info结构中。本文将详细介绍：tcp_info是什么，怎么用？各字段含义和实际用途在调优TCP服务中的应用实践一、什么是tcp_info？tcp_info是Linux内核中
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
ZYNQ无DMA的四路HP总线极限性能探索芯作者 D1：ZYNQ设计 fpga开发硬件工程智能硬件
深入挖掘AXIHP总线的直接传输潜力，突破传统DMA的性能瓶颈一、HP总线：ZYNQ系统的"高速公路"在XilinxZYNQ架构中，HP（HighPerformance）总线是连接PS（处理器系统）和PL（可编程逻辑）的关键通道。传统方案依赖DMA控制器进行数据传输，但当我们需要超低延迟或确定性响应时，无DMA的直接CPU控制成为更优选择。本文将揭示如何通过四路HP总线实现惊人的24GB/s理论带
智力题——5L的桶和3L的桶如何装4L的水酒醉梦醒算法数据结构 java 5升水和3升水图论 bfs 状态压缩
文章目录智力题——5L的桶和3L的桶如何装4L的水问题描述直观分析问题建模问题解决智力题——5L的桶和3L的桶如何装4L的水问题描述有一个5L的桶A和一个3L的桶B以及无限量的水，如何让5L的桶装4L的水。支持操作：加水，倒水，A倒入B，B倒入A，除此之外不再支持其他操作，例如做记号或者借助其他工具直观分析直观分析就是利用我们的直观思维在草纸上不停的模拟这些操作，这个很不好说，对于简单问题你可能可
JavaScript中的函数柯里化（Currying）：从概念到实战 coding随想 JavaScript javascript ecmascript 开发语言前端
JavaScript中的函数柯里化（Currying）：从概念到实战在JavaScript开发中，函数式编程（FunctionalProgramming）逐渐成为一种主流思想。而函数柯里化（Currying），正是这一思想中的核心技巧之一。它不仅能提升代码的复用性和灵活性，还能帮助我们构建更优雅、更模块化的解决方案。本文将带你从零开始，深入理解柯里化的原理、实现方式及实际应用场景。一、什么是函数柯
Linux命令行操作基础 EnigmaCoder Linux linux 运维服务器
目录前言目录结构✍️语法格式操作技巧Tab补全光标操作基础命令登录和电源管理命令⚙️login⚙️last⚙️exit⚙️shutdown⚙️halt⚙️reboot文件命令⚙️浏览目录类命令pwdcdls⚙️浏览文件类命令catmorelessheadtail⚙️目录操作类命令mkdirrmdir⚙️文件操作类命令mvrmtouchfindgziptar⚙️cp前言大家好！我是EnigmaCod
Sonatype Nexus3安装配置及使用無法複制 nexus
1、简介SonatypeNexusRepositoryManager是一款强大的仓库管理工具，用于存储、管理和发布软件组件。它能够支持多种格式的仓库，如Maven、npm、Docker等。在企业开发中，私有Maven仓库常用于存储自定义依赖和发布组件，确保代码安全性和内部共享。本文将从服务器环境搭建、Nexus安装与配置、仓库创建、依赖上传，再到Maven项目中使用私有仓库的全过程，帮助你掌握如何
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

最新NVIDIA Ada Lovelace架构 和 RTX 40系列详解

最新NVIDIA Ada Lovelace架构 和 RTX 40系列详解

ADA 将大幅提升计算性能

ADA LOVELACE ROPS

内存系统：GDDR6X 再次运行

ADA L2 缓存

RTX 40 系列获得 DLSS 3

ADA 获得 AV1 编码

ADA 功耗

你可能感兴趣的:(最新NVIDIA Ada Lovelace架构 和 RTX 40系列详解)

最新NVIDIA Ada Lovelace架构和 RTX 40系列详解

最新NVIDIA Ada Lovelace架构和 RTX 40系列详解

你可能感兴趣的:(最新NVIDIA Ada Lovelace架构和 RTX 40系列详解)