weixin_33777877

[ZZ] Maxwell 架构

　　http://digi.163.com/14/0218/23/9LDCTFON00162DSP.html

【IT168 评测】随着一句“娘娘，封神啦（宝鸡口音）”，中国的观众迅速认识到了两个极其出彩的相声演员。如果说关键词是引发关注的最大因素，那么提到“GeForce”，各位想到的又是什么？

相信不少读者第一次真正认识到NVIDIA（以下简称NV）这个公司还是从一款叫GeForce 256的显卡开始，当年逆天的性能让不少DIY玩家彻底跪倒在NV的的“石榴裙”之下不愿爬起。虽说这么多年过去了，NV的产品越来越多，但是GeForce 256的作为第一款GeForce产品，不仅为NV，也为业界带来了一场“绿色”革命！

1999年GeForce 256发布至今已经15年了，15年的沉淀又带来了什么，GeForce系列的茁壮发展，架构的不断改进和革新，一切都恍如昨日。而今天，一款从Fermi就被期待的架构，终于揭开了神秘的面纱，那就是今天的主角——全新Maxwell架构的产品GTX 750以及GTX 750 Ti！

至于为什么这么多人都在期待Maxwell架构的产品，下面的架构分析和回顾会为各位一一揭晓。

Fermi架构解析回顾

1、SP、SM

从高层次上看，Fermi和GT200结构形似，并无太大不同，但往深处看就会发现绝大部分都已经进化。最核心的流处理器(Streaming Processor/SP)现在不但数量大增，还有了个新名字CUDA核心(CUDA Core)，由此即可看出NVIDIA的转型之意，不过我们暂时还是继续沿用流处理器的说法。

所有流处理器现在都符合IEEE 754-2008浮点算法(Cypress也是如此)和完整的32位整数算法，而后者在过去只是模拟的，事实上仅能计算24-bit整数乘法；同时引入的还有积和熔加运算(Fused Multiply-Add/FMA)，每循环操作数单精度512个、双精度256个。所有一切都符合业界标准，计算结果不会产生意外偏差。

双精度浮点(FP64)性能大大提升，峰值执行率可以达到单精度浮点(FP32)的1/2，而过去只有1/8，AMD现在也不过1/5，比如Radeon HD 5870分别为单精度2.72TFlops、双精度544GFlops。由于最终核心频率未定，所以暂时还不清楚Fermi的具体浮点运算能力(双精度预计可达624GFlops)。

G80/GT200都是8个流处理器构成一组SM(Streaming Multiprocessor)，Fermi增加到了32个，最多16组，少于GT200的30组，但流处理器总量从240个增至512个，是G80的整整四倍。除了流处理器，每组SM还有4个特殊功能单元(Special Function UnitSFU)，用于执行抽象数学和插值计算，G80/GT200均为2个。同时MUL已被删掉，所以不会再有单/双指令执行计算率了。

至于SM之上的纹理处理器群(Texture Processor Cluster/TPC)，NVIDIA暂时没有披露具体组成方式，而且ROP单元、纹理/像素填充率等其它图形指标也未公布。

2、缓存

GT200的每组SM都有16KB共享内存，由其中8个SP使用。注意它们不是缓存(cache)，而是软件管理的内存(memory)，可以写入、读取数据。为了满足应用程序和通用计算的需要，Fermi引入了真正的缓存，每组SM拥有64KB可配置内存(合计1MB)，可分成16KB共享内存加48KB一级缓存，或者48KB共享内存加16KB一级缓存，可灵活满足不同类型程序的需要。

GT200的每组TPC还有一个一级纹理缓存，不过当GPU出于计算模式的时候就没什么用了，故而Fermi并未在这方面进行增强。整个芯片拥有一个容量768KB的共享二级缓存，执行原子内存操作(AMO)的时候比GT200快5-20倍。

3、效率

CPU和GPU执行的都是被称作线程的指令流。高端CPU现在每次最多只能执行8个线程(Intel Core i7)，而GPU的并行计算能力就强大多了：G80 12288个、GT200 30720个、Fermi 24576个。

为什么Fermi还不如GT200多？因为NVIDIA发现计算的瓶颈在于共享内存大小，而不是线程数，所以前者从16KB翻两番达到64KB，后者则减少了20%，不过依然是G80的两倍，而且每32个线程构成一组“Warp”。

在G80和GT200上，每个时钟周期只有一半Warp被送至SM，换言之SM需要两个循环才能完整执行32个线程；同时SM分配逻辑和执行硬件紧密联系在一起，向SFU发送线程的时候整个SM都必须等待这些线程执行完毕，严重影响整体效率。

Fermi解决了这个问题，在每个SM前端都有两个Warp调度器和两个独立分配单元，并且和SM其它部分完全独立，均可在一个时钟循环里选择发送一半Warp，而且这些线程可以来自不同的Warp。分配单元和执行硬件之间有一个完整的交叉开关(Crossbar)，每个单元都可以像SM内的任何单元分配线程(不过存在一些限制)。

这种线程架构也不是没有缺点，就是要求Warp的每个线程都必须同时执行同样的指令，否则会有部分单元空闲。每组SM每个循环内可以执行的不同操作数：FP32 32个、FP64 16个、INT 32个、SFU 4个、LD/ST 16个。

4、并行内核(Parallel Kernel)

在GPU编程术语中，内核是运行在GPU硬件上的一个功能或小程序。G80/GT200整个芯片每次只能执行一个内核，容易造成SM单元闲置。这在图形运算中不是问题，通用计算上就不行了。Fermi的全局分配逻辑则可以向整个系统发送多个并行内核，不然SP数量翻一番还多，更容易浪费。

应用程序在GPU和CUDA模式之间的切换时间也快得多了，NVIDIA宣称是GT200的10倍。外部连接亦有改进，Fermi现在支持和CPU之间的并行传输，而之前都是串行的。

5、ECC支持

AMD Cypress可以检测内存总线上的错误，却不能修正，而NVIDIA Fermi的寄存器文件、一级缓存、二级缓存、DRAM全部完整支持ECC错误校验，这同样是为Tesla准备的，之前我们也提到过。很多客户此前就是因为Tesla没有ECC才拒绝采纳，因为他们的安装量非常庞大，必须有ECC。

6、统一64-bit内存寻址

以前的架构里多种不同载入指令，取决于内存类型：本地(每线程)、共享(每组线程)、全局(每内核)。这就和指针造成了麻烦，程序员不得不费劲清理。Fermi统一了寻址空间，简化为一种指令，内存地址取决于存储位置：最低位是本地，然后是共享，剩下的是全局。这种统一寻址空间是支持C++的必需前提。

GT80/GT200的寻址空间都是32-bit的，最多搭配4GB GDDR3显存，而Fermi一举支持64-bit寻址，即使实际寻址只有40-bit，支持显存容量最多也可达惊人的1TB，目前实际配置最多6GB GDDR5——仍是Tesla。

7、新的指令集架构(ISA)

下边对开发人员来说是非常酷的：NVIDIA宣布了一个名为“Nexus”的插件，可以在Visual Studio里执行CUDA代码的硬件调试，相当于把GPU当成CPU看待，难度大大降低。Fermi的指令集架构大大扩充，支持DX11和OpenCL义不容辞，C++前边也已经说过，现在又多了Visual Studio，当然还有C、Fortran、OpenGL 3.1/3.2。

Kepler架构解析回顾

Kepler GK110 性能卓越，效率极高

Kepler GK110 由 71 亿个晶体管组成，不仅速度最快，而且还是有史以来架构最复杂的微处理器。GK110 新加了许多注重计算性能创新功能，目的是要成为英伟达 Tesla和HPC市场上的并行处理动力站。

Kepler GK110 会提供超过每秒 1 万亿次双精度浮点计算的吞吐量，DGEMM 效率大于80%，而之前的 Fermi 架构的效率是 60 65%。除了大大提高的性能之外，Kepler 架构在电源效率方面有 3 次巨大的飞跃，使 Fermi 的性能/功率比提高了 3 倍。

Kepler GK110 的以下新功能提高 GPU 的利用率，简化了并行程序设计，并有助于 GPU 在各种计算环境中部署，无论是从个人工作站还是到超级计算机：

Dynamic Parallelism

能够让 GPU 在无需 CPU 介入的情况下，通过专用加速硬件路径为自己创造新的工作，对结果同步，并控制这项工作的调度。这种灵活性是为了适应程序执行过程中并行的数量和形式，编程人员可以处理更多的各种并行工作，更有效的将 GPU 用为计算用途。此功能允许结构较简单，一但较复杂的任务方便有效地运行，能使较大部分的应用程序在整个 GPU 上运行。此外，程序能够更容易的创建，CPU 能为其他任务释放。

Hyper-Q

Hyper - Q 允许多个 CPU 核同时在单一 GPU 上启动工作，从而大大提高了GPU 的利用率并削减了 CPU 空闲时间。Hyper Q 增加了主机和 Kepler GK110 GPU 之间的连接总数（工作队列），允许 32 个并发、硬件管理的连接（与 Fermi 相比，Fermi 只允许单个连接）。Hyper - Q 是一种灵活的解决方案，允许来自多个 CUDA 流、多个消息传递接口（MPI）进程，甚至是进程内多个线程的单独连接。以前遇到跨任务虚假串行化的应用程序，限制了 GPU 的利用率，而现在无需改变任何现有代码性能就能大幅度提升。

Grid Management Unit

使 Dynamic Parallelism 能够使用先进、灵活的 GRID 管理和调度控制系统。新 GK110 Grid Management Unit (GMU) 管理并按优先顺序在 GPU上执行的 Grid。GMU 可以暂停新 GRID 和等待队列的调度，并能中止 GRID，直到其能够执行时为止，这为 Dynamic Parallelism 这样的强大运行提供了灵活性。GMU 确保CPU 和 GPU 产生的工作负载得到妥善的管理和调度。

NVIDIA GPUDirect

能够使单个计算机内的 GPU 或位于网络内不同服务器内的 GPU 直接交换数据，无需进入 CPU 系统内存。GPUDirect 中的 RDMA 功能允许第三方设备，例如 SSD、NIC、和 IB 适配器，直接访问相同系统内多个 GPU 上的内存，大大降低 MPI 从 GPU 内存发送/接收信息的延迟。还降低了系统内存带宽的要求并释放其他 CUDA 任务使用的 GPU DMA 引擎。Kepler GK110 还支持其他的GPUDirect 功能，包括 Peer to Peer 和 GPUDirect for Video。

Kepler 架构概述

Kepler GK110 专为英伟达 Tesla打造，其目标是成为世界上并行计算性能最高的微处理器。GK110 不仅大大超过由 Fermi 提供的原始计算能力，而且非常节能，显著减少电力消耗，同时产生的热量更少。

完整 Kepler GK110 实施包括 15 SMX 单元和六个 64 位内存控制器。不同的产品将使用GK110 不同的配置。例如，某些产品可能部署 13 或 14 个 SMX。在下面进一步讨论的该架构的主要功能，包括：

新 SMX 处理器架构

增强的内存子系统，在每个层次提供额外的缓存能力，更多的带宽，且完全进行了重新设计，DRAM I/O 实施的速度大大加快。

贯穿整个设计的硬件支持使其具有新的编程模型功能

Kepler GK110 支持新 CUDA Compute Capability 3.5。

Kepler 架构的一个主要设计目标是提高电源效率。设计 Kepler 时，英伟达工程师应用从 Fermi中积累的经验，以更好地优化 Kepler 、实现高效运行。台积电的 28nm 制造工艺在降低功耗方面起着重要的作用，但许多 GPU 架构需要修改，以进一步降低功耗，同时保持出色的性能。

Kepler 每一个硬件设备都经过设计和擦洗，以提供卓越的性能/功率比。出色性能/功率比的最佳案例是 Kepler GK110 新流式多处理器 (SMX) 中的设计，与最近 Kepler GK104 引入的 SMX 单元的许多方面类似，但计算算法包括更多双精度单位。

流式多处理器 (SMX) 架构

Kepler GK110 的新 SMX 引入几个架构创新，使其不仅成为有史以来最强大的多处理器，而且更具编程性，更节能。 SMX: 192 个单精度 CUDA 核、64 个双精度单元、32 个特殊功能单元 (SFU) 和 32 个加载/存储单元 (LD/ST)。

SMX 处理核架构

每个 Kepler GK110 SMX 单元具有 192 单精度CUDA 核，每个核完全由浮点和整数算术逻辑单元组成。Kepler 完全保留 Fermi 引入的 IEEE 754-2008 标准的单精度和双精度算术，包括积和熔加 (FMA) 运算。

Kepler GK110 SMX 的设计目标之一是大大提高 GPU 的双精度性能，因为双精度算术是许多HPC 应用的核心。Kepler GK110 的 SMX 还保留了特殊功能单元 (SFU) 以达到和上一代 GPU 类似的快速超越运算，所提供的 SFU 数量是 Fermi GF110 SM 的 8 倍。

与 GK104 SMX 单元类似，GK110 SMX 单元内的核使用主 GPU 频率而不是 2 倍的着色频率。2x 着色频率在 G80 Tesla 架构的 GPU 中引入，并用于之后所有的 Tesla 和 Fermi 架构的GPU。在更高时钟频率上运行执行单元使芯片使用较少量的执行单元达到特定目标的吞吐量，这实质上是一个面积优化，但速度更快的内核的时钟逻辑更耗电。对于 Kepler，我们的首要任务是的性能/功率比。虽然我们做了很多面积和功耗方面的优化，但是我们更倾向优化功耗，甚至以增加面积成本为代价使大量处理核在能耗少、低 GPU 频率情况下运行。

Quad Warp Scheduler

SMX 以 32 个并行线程为一组的形式调度进程，这 32 个并行线程叫做 Warp。而每个 SMX 中拥有四组 Warp Scheduler 和八组 Instruction Dispatch 单元，允许四个 Warp 同时发出执行。Kepler 的 Quad Warp Scheduler 选择四个 Warp，在每个循环中可以指派每 Warp 2 个独立的指令。与 Fermi 不同，Fermi 不允许双精度指令和部分其他指令配对，而 Kepler GK110 允许双精度指令和其他特定没有注册文件读取的指令配对例如加载/存储指令、纹理指令以及一些整数型指令。

每个 Kepler SMX 包含 4 组 Warp Scheduler，每组 Warp Scheduler 包含两组 Instruction Dispatch 单元。单个 Warp Scheduler 单元如上所示。其中包括：

a) 记录长延迟操作（纹理和加载）的寄存器

b) Warp 内调度决定（例如在合格的候选 Warp 中挑选出最佳 Warp 运行）

c) 线程块级调度（例如，GigaThread 引擎）

然而，Fermi 的 scheduler 还包含复杂的硬件以防止数据在其本身数学数据路径中的弊端。多端口寄存器记录板会纪录任何没有有效数据的寄存器，依赖检查块针对记录板分析多个完全解码的 Warp指令中寄存器的使用情况过，确定哪个有资格发出。

对于 Kepler，我们认识到这一信息是确定性的（数学管道延迟是不变量），因此，编译器可以提前确定指令何时准备发出，并在指令中提供此信息。这样一来，我们就可以用硬件块替换几个复杂、耗电的块，其中硬件块提取出之前确定的延迟信息并将其用于在 Warp 间调度阶段屏蔽Warp，使其失去资格。

新 ISA 编码：每个线程 255 个寄存器

可由线程访问的寄存器的数量在 GK110 中已经翻了两番，允许线程最多访问 255 个寄存器。由于增加了每个线程可用的寄存器数量，Fermi 中承受很大寄存器压力或泄露行为的代码的速度能大大的提高。典型的例子是在 QUDA 库中使用 CUDA 执行格点 QCD（量子色动力学）计算。基于 QUDA fp64 的算法由于能够让每个线程使用更多寄存器并减少的本地内存泄漏，所以其性能提高了 5.3 倍。

Shuffle 指令

为了进一步提高性能，Kepler 采用 Shuffle 指令，它允许线程在 Warp 中共享数据。此前，Warp 内线程之间的数据共享需要存储和加载操作以通过共享内存传递数据。使用 Shuffle 指令，Warp 可以读取来自Warp 内其他线程中任意排列的值。Shuffle 支持任意索引引用（即任何线程读取任何其他线程）。有用的 Shuffle 子集包括下一线程（由固定量弥补抵消）和 Warp 中线程间 XOR “蝴蝶”式排列，也称为 CUDA 性。

Shuffle 性能优于共享内存，因此存储和加载操作能够一步完成。Shuffle 也可以减少每个线程块所需共享内存的数量，因为数据在 Warp 级交换也不需要放置在共享内存中。在 FFT 的情况下，需要共享一个 Warp 内的数据，通过使用 Shuffle 获得 6％的性能增益。

纹理改进

GPU 的专用硬件纹理单元对于需要取样或过滤图像数据的计算机程序来说是宝贵的资源。Kepler中的纹理吞吐量与 Fermi 相比有明显提高，每个 SMX 单元包含 16 纹理过滤单元，对比 FermiGF110 SM 提高了 4 倍。

此外，Kepler 改变了管理纹理状态的方法。在 Fermi 时代，为让 GPU 引用纹理，必须在固定大小绑定表中分配“槽”才能启动 Grid。表中槽数量最终限制程序一次可以读取多少个独特的纹理。最终，在 Fermi 中限制程序仅可以同时访问 128 纹理。

Kepler 中有无绑定纹理，不需要额外步骤：纹理状态已保存为内存中的对象，硬件按需获取这些状态对象，绑定表过时。这有效地消除了计算程序引用独特纹理数量的任何限制。相反，程序可以在任何时间映射纹理和通纹理处理周围，因为他们将任何其他指针

Kepler 内存子系统 L1、L2、ECC

Kepler 的内存层次结构与 Fermi 类似。Kepler 架构支持统一内存加载和存储的请求路径，每个SMX 多处理器有一个 L1 缓存。Kepler GK110 还使编译器指示为只读数据增设一个新的缓存，如下所述。

Kepler GK110 设计的初衷就是利用卓越的电源效率达到最大化计算性能和吞吐量。该架构有很多创新，如 SMX、Dynamic Parallelism 和 Hyper Q 使混合计算大大简化和加快了编程，适用于更广泛的应用。Kepler GK110 GPU 将用于许多系统，从工作站到超级计算机，解决 HPC 中最严峻的挑战。

回顾了前面两代架构之后，我们现在就来看一下Maxwell带来的改变。

NVIDIA全新的RM

其实，Maxwell并没有全面革新的技术改进，而是在之前Fermi和Kepler的基础上做了很多的改进而得来的，所以，如果看到全架构图，你会发现有改变，但不是翻天覆地的，因为不需要这样的革新，就能做到性能的进步，这就是NVIDIA的力量！

GM107架构图

Maxwell在流式多处理器方面采用了一种全新设计，可大幅提高每瓦特性能和每单位面积的性能。虽然KeplerSMX设计在这一代产品中已经相当高效，但是随着它的发展，NVIDIA的GPU架构师显然找到了让架构效率再一次重大飞跃的方法。

MaxwellSM设计实现证明了这一点，控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条数等方面的改进以及其它诸多增强之处让Maxwell SM(亦称“SMM”)能够在效率上远超Kepler SMX。全新的Maxwell SM架构能够在GM107中把SM的数量增至五个(GK107中仅有两个)，而芯片面积仅增加25%。

Maxwell SM架构图

GM 107 GPU包含一个GPC、五个Maxwell流式多处理器(SMM)以及两个64位显存控制器(共128位)。这就是这一芯片的完整实现形式，每组SMM单元又由4个小单元组成，每组32个CUDA核心，TMU单元又降低到8个，位宽维持128bit，因此CUDA核心总数为640个，纹理单元40个，ROP单元为16个，与GeForce GTX 750Ti中的芯片配置相同。

通过对比GK107和GM107 SM总数的相关指标可发现，GM107有五个SM，而前者只有两个。GM107的峰值纹理性能比前者高25%，CUDA核心数量多1.7倍，着色器性能大约高2.3倍。

全新的G-SYNC同步技术

全新的G-SYNC同步技术核心重点

G-SYNC的出现让这种情况彻底改观，本质上说G-SYNC可以从根源上杜绝撕裂和卡顿，因为G-SYNC是在显示器中加入一个芯片，让显示器听从显卡的命令确定实时的刷新频率。简而言之就是显卡渲染出一帧，显示器就刷新一帧。这样做的好处是无论场景渲染变化如何大，显卡帧数如何波动，只要保持在一定的水平之上，我们看到的都是连贯平滑的图像。

NVIDIA显卡技术全览

本次的首发我们收到了公版卡以及其他厂商送来的非公版显卡，首先，还是带大家一起来看下公版卡的情况！

GTX750系列的定位

GTX 750 Ti

NVIDIA GTX750Ti核心代号GM107-400，采用最新的Maxwell架构，拥有640个CUDA处理器，功耗仅为60W，显卡采用P2010公版PCB，配备了5CM的风扇及全铝散热器。

GTX750Ti配备了2GB/128Bit GDDR5显存颗粒，主频为1020MHz，支持GPU Boost 2.0技术，可以根据实时功耗与温度智能超频，显存频率为5500MHz。

输出接口则是配备了双DVI+mini HDMI的组合，完全可以满足主流用户的需求。

除了原厂卡之外，作为AIC厂商也纷纷在第一时间推出了相应的产品，其中包括了微星、索泰这样的大厂！

微星

影驰

七彩虹

介绍完各款显卡，就让我们来实战，看下R9 290X显卡的表现如何!首先，还是介绍一下本次测试的测试平台。本次此时我们选择了常规的测试平台，各方面信息请看下表：

硬件平台信息
It168 显卡测试平台信息
CPU	Intel Core i7 4770K 4C8T OC=4.2GHz
主板	MSI Z87 XPOWER（Z87芯片组）
内存	Kingston DDR3-1600 4GB*2
显卡	HD7770 1000/4500 GTX650Ti 928/5400 R7 260X 1100/6500 HD7850 860/4800 GTX650Ti BOOST 980/6008 GTX660 980/6008 HD7870 1000/4800 R9 270X 1050/5600 HD7950 800/5000 GTX660Ti 915/6008 GTX760 980/6008 GTX750 1020/6008 GTX750Ti 1020/6008
硬盘	Kingston V300 240GB
电源	Antec 1000W
软件平台信息
系统软件	Windows 7 64bit with sp1 NVIDIA 334.69 Beta AMD Catalyst 14.1 beta
测试软件	3DMark 3DMark11 GPU-Z 0.7.3 Unigine Valley MSI Afterburner 《古墓丽影9》《孤岛危机3》《孤岛惊魂3》《战地3》《失落星球2》《狙击精英2》《地铁 2033》《异形VS铁血战士》《光荣使命》

测试过程主要是以游戏实测为主，另外采用了几个比较常用的软件，3DMark，CPU-Z，也包括了超频工作可能用到的MSI Afterburner等软件。

测试说明

测试项目方面，我们加入了不少近期推出的DX11测试软件，例如3DMARK、Heaven 4.0以及Valley 1.0。而游戏方面若游戏有自带或者第三方Benchamark软件则使用，若没有的则使用FRAPS监查帧数变化最平均值，务求尽量获得最准确的数据;由于测试对象为旗舰级显卡，我们直接采用1920*1200高分辨率进行性能测试，所以部分要求强度相对较低的游戏，开启4xAA或者8xAA全屏抗锯齿的方式进行测试。

帧数与游戏流畅度的关系
vga.it168.com
< 30 FPS	非常有限的流畅度
30-40 FPS	平均值刚好达标的流畅度
40-60 FPS	较好的流畅度
> 60 FPS	最佳的流畅度

关于FPS：

衡量一块显卡的性能我们通常都会用到FPS这个单位，帧数这个数字越大代表着显卡的每秒渲染能力越强，数值越高代表着用户在游戏中将获得体验效果越流畅。

通常一个游戏的FPS数值是通过测试数值求平均值获得，这样的测试通常可以展现真实游戏中场景与体验的一个预先录制片段。这个录制的片段将会被应用在每款测试的显卡上，测试的前提是每款显卡都采用相同的画质设置，这样才能保证获得客观真实的测试结果。

*假如一款显卡在测试中平均帧数低于30FPS，那就意味着无法顺畅的玩该款游戏。 *达到大约30～40FPS左右，我们将可以较为流畅的运行游戏，当然也会有片刻停顿的状况。总的来说，还是能够获得较好的游戏享受。在这个分辨率下获得匹配的最佳分辨率。 *当一款显卡的平均帧数可以达到或者超越60FPS，那就是说我们可以放心地享受游戏带来的快感，并且打开所有可以打开的画质设置。 *超越100FPS的显卡?或许这是一款怪兽级的显卡有或者是在一款相当老的游戏才会遇到的情况。

既然针对平台不同，测试项目自然也相去甚远。三大平台除了PC追求极致性能外，笔记本和平板都受限于电池和移动因素，性能不是很高，因此之前的3Dmark11虽然有三档可选，依然不能准确衡量移动设备的真实性能。

而这次Futuremark为移动平台量身定做了专有测试方案，新一代3DMark三个场景的画面精细程度以及对配置的要求可谓天差地别。Fire Strike、Cloud Gate、Ice Storm三大场景，他们分别对应当前最热门的三大类型的电脑——台式电脑、笔记本电脑和平板电脑。

时至今日依然没有任何一个测试软件或者游戏能够取代3DMark在游戏玩家心目中的地位，因为3DMark的魅力就在于它所带来的不仅仅是惊艳的画面，更重要的是向广大玩家提供了一种权威、系统、公正的衡量显卡性能的方式。

3DMark 11的特色与亮点：

1、原生支持DirectX 11：基于原生DX11引擎，全面使用DX11 API的所有新特性，包括曲面细分、计算着色器、多线程。

2、原生支持64bit，保留32bit：原生64位编译程序，独立的32位、64位可执行文件，并支持兼容模式。

3、全新测试场景：总计六个测试场景，包括四个图形测试(其实是两个场景)、一个物理测试、一个综合测试，全面衡量GPU、CPU性能。

4、抛弃PhysX，使用Bullet物理引擎：抛弃封闭的NVIDIA PhysX而改用开源的Bullet专业物理库，支持碰撞检测、刚体、软体，根据ZLib授权协议而免费使用。

对于现代显卡测试而言，除了3DMark之外必不可少的项目就是来自俄罗斯的Unigine Heaven(天堂)，尤以其高负载、高压榨而知名。现在，新一代3DMark发布之后，Unigine也奉上了全新的显卡测试程序“Valley”(山谷)。

Valley正是Heaven的开发团队一手打造的，可以在最大程度上榨干GPU显卡资源。这次场景来到了一个优美空灵的山谷，群山环绕，郁郁葱葱，白雪皑皑，旭日初升，而且拥有极致的细节，每一片花瓣、每一株小草都清晰可见。

Unigine Valley分为基础版、高级版、专业版三个版本，其中基础版免费，支持测试预设、自定义设置、GPU监视、交互模式，不支持循环测试(也就是拷机模式)、命令行、CSV报告，对于普通用户和一般评测足够用了。

《孤岛危机3》支持大量的高端图形选项以及高分辨率材质。在游戏中，PC玩家将能看到一系列的选项，包括了游戏效果、物品细节、粒子系统、后置处理、着色器、阴影、水体、各向异性过滤、材质分辨率、动态模糊以及自然光。技术主管Marco Corbetta表示之所以《孤岛危机2》并不包含这么多的选项，是因为开发主机板的开发组实在是搞的太慢了。

Square Enix证实了旗下经典作品《古墓丽影》系列将推出全新作品，官方表示，这次他们将带领玩家回到劳拉最初的探险中，完整体验她成为一名伟大冒险家的精采过程。《古墓丽影9》将讲述劳拉的首次冒险之旅，主角劳拉·克劳馥的年龄被设定在21岁，那时的她还只是一名刚出茅庐的新人，经验欠缺。随着游戏剧情的发展，玩家将与劳拉共同成长，获得新的武器和道具并习得新技能。在冒险的小岛上，玩家可以在营地对道具进行组合，有些特定区域就需要特定道具和技能才能通过。岛上的各个营地之间可以快捷传送，玩家无需长途跋涉。而除了劳拉外还将有其他角色出现在岛上。

回顾以往的作品，劳拉的标志自然是双枪，此次这部讲述劳拉初次的生存冒险，将会采用弓箭作为劳拉的标志武器。在濒临日本的海域的一座小岛，劳拉除了面对神秘的宗教威胁，还要面对如何生存，譬如拿起弓箭，射杀小动物以觅食，谁说劳拉不是一个谋杀者呢?可为了生存，弱肉强食只是为了能够生存。

由EA DICE工作室开发的《战地3》采用了最新的“寒霜2”引擎，完美支持DirectX 11，并且拥有强大的物理效果，最大的亮点还是光照系统，其渲染的场景已近乎乱真的地步，视觉效果堪称绝赞。游戏还支持即时昼夜系统，为玩家营造一个亲临现场的真实环境。

寒霜2引擎最大的特点便是支持大规模的破坏效果。由于考虑到游戏的画面表现以及开发成本，DICE放弃了以只支持DX9的WINDOWS XP操作系统。另外由于该引擎基于DX11研发，向下兼容DX10，因而游戏只能运行于WINDOWS VISTA以上的的操作系统。

《战地3》采用了ANT引擎制作人物的动作效果。在此之前，ANT引擎已在EA Sports旗下的《FIFA》等游戏中得到应用，不过在FPS游戏中使用尚属首次。相较于Havok等物理引擎，用ANT引擎可以花费较少的精力制作出逼真的效果。举例来说，战士在下蹲时会先低头俯身、放低枪口，而不是像以前的游戏那样头、身、枪如木偶般同时发生位移。此外，ANT引擎也可以让电脑AI的行动更加合理。但这款大作目前并不能良好的兼容120Hz3D以及红蓝3D模式。

游戏介绍：《地铁2033》(Metro 2033)是俄罗斯工作室4A Games开发的一款新作，也是DX11游戏的新成员。该游戏的核心引擎是号称自主全新研发的4A Engine，支持当今几乎所有画质技术，比如高分辨率纹理、GPU PhysX物理加速、硬件曲面细分、形态学抗锯齿(MLAA)、并行计算景深、屏幕环境光遮蔽(SSAO)、次表面散射、视差贴图、物体动态模糊等等。

画面设置：《地铁2033》虽然支持PhysX，但对CPU软件加速支持的也很好，因此使用A卡玩游戏时并不会因PhysX效果而拖累性能。该游戏由于加入了太多的尖端技术导致要求非常BT，以至于我们都不敢开启抗锯齿进行测试，只是将游戏内置的效果调至最高。游戏自带Benchmark，这段画战斗场景并不是很宏大，但已经让高端显卡不堪重负了。

测试说明：如果说是CRYSIS发动了DX10时代的显卡危机，那地铁2033无疑是DX11时代的显卡杀手!地铁2033几乎支持当时可以采用的所有新技术，在画面雕琢上大肆铺张，全然不顾显卡们的感受，和CRYSIS如出一辙。然而CRYSIS靠着特效的堆积和不错的优化，其惊艳绝伦的画面和DX9C游戏拉开了距离，终究赚足了眼球;而地铁则没有这么好运了，画面固然不差，BUG却是很多，招来了大量的非议。

《Aliens vs. Predator》同时登陆PC、X360和PS3，其中PC版因为支持DX11里的细分曲面(Tessellation)、高清环境光遮蔽(HDAO)、计算着色器后期处理、真实阴影等技术而备受关注，是AMD大力推行的游戏之一，但是这样的主题难免让本作有很多不和谐的地方，暴力血腥场面必然不会少!发行商世嘉在2009年11月就曾明志，表示不会为了通过审查而放弃电子娱乐产品发行商的责任，因为游戏要维持“异形大战铁血战士”这一中心主题，无论画面、玩法还是故事线都不能偏离。

画面设置AVP原始版本并不支持AA，但升级至1.1版本之后，MSAA选项出现在了DX11增强特效当中，当然还支持Tessellation、HDAO、DirectCompute等招牌。该游戏要求不算太高，所以笔者直接将特效调至最高进行测试。

《狙击精英》是2005年Reblion推出的一款以二战为背景的狙击游戏作品，一经推出后就获得英国独立游戏开发者协会的“最佳PC/主机游戏”大奖，《狙击精英V2》则是这款作品的续作，据游戏开发商称续作继续秉承了游戏潜入类狙击的风格，较初代来说更加注重枪击后的真实感，“我们保证，新游戏将是最真实的二战狙击类游戏。不仅仅在武器弹道上，还有在开枪之前那种紧张的气氛，都会很真实的表现出来。”Rebellion的首席执行官杰森·科林斯雷(Jason Kingsley)如是说。

游戏的画面在整体上相当的不错，无论是从整体的质感，还是画面的流畅性看都达到了很高的水准，在光源的处理上也非常的到位。同时，游戏依旧延续了初代精益求精的场景设计的理念，比如城市巷战地图中的断壁残垣以及黑烟冲天、山洞地图中充满着神秘气息的导弹基地等都给笔者留下了深刻的印像。

在互联网时代的今天，网络日益融入人们的生活，爱网、用网成为时尚，上网络玩游戏成为青年喜爱的娱乐方式之一。军事游戏在国外一些军队已发展多年、形成体系，并广泛应用于教育、训练。我军军事游戏目前尚处于起步阶段，基层部队日常娱乐多以小型益智类棋牌游戏为主，形式和功能都比较单一。

一些部队开展网上军事游戏对抗，使用的也大都是国外军事游戏的汉化版，游戏内容和体现的价值理念、军事思想，与我军有很大差异，长期使用不利于部队教育训练，甚至可能误导官兵。新研发的军事游戏《光荣使命》拥有完全自主知识产权，填补了我军军事游戏的空白。

《孤岛惊魂3》继承着《孤岛惊魂》系列的纯种血统，融合了系列前作的所有优点，并有着新鲜的创作路线，无论是《孤岛惊魂》系列的老玩家还是新近加入的新手，都可以享受到它宏大的故事。”

在《孤岛惊魂3》中，玩家将会扮演Jason Brody。在这个没有法律、暴力才是真王道的原始天堂中，玩家将决定整个故事的发展。玩家所作出的选择，包括与谁战斗、与谁结盟都会影响到剧情。在游戏中，玩家扮演的Jason Brody将在这个人性已经泯灭了的孤岛上杀出一条血路。

接下来我们来看一下这两款显卡的待机及满载的温度和功耗如何!

从上面的测试不难看出，全新架构下的GTX750系列，不仅功耗控制的很好，而且温度也很低，让人对未来GM系列的核心的表现非常期待。

下面我们来看一下GTX750超频后的表现，虽然公版卡没有外接6pin供电口，但是由于本身的功耗很低，因此，简单的超频也能满足PCI-E接口的供电需求！

到这里，本次的测试也告一段落了，如果说公版卡并没有发挥出Maxwell架构的完全之处，那么我们似乎多了一个期待非公版显卡的表现的理由了，更不用说未来强大的GM110芯片了。从整体上来看，Maxwell带来的能效比确实有大幅的提升，实在是让人欣喜。

我们要看到的是目前的GTX750系列依旧采用28nm工艺来制造，如果说完整版的GM110核心能到20nm制程，想必性能又会有大幅飞升，对于未来的发展，总是让人很期待。

截至到发稿时，我们接到消息，GTX 750Ti的NVIDIA官方定价为人民币999元，而GTX750定价为799元，这样的价格以消费者的角度来说，似乎并没有到神器的地步，不过作为全新架构的产品上市，价格虚高是业界一贯的作风，如果笔者没有预料错误的话，相信在几个月内会有所下调，那时候非公版产品也全面上市并铺货，到时候一定会成为新一代入门级游戏利器的。

再来说一下另一个情况，那就是在GTX750系列发布、上市之前，AMD悄悄的发布的R7 265，这款显卡可以看成是HD7850的马甲版，至于AMD如此做的原因除了是统一产品命名之外，更多是应该还是感到了来自NV的压力，未来的竞争将会更加激烈。

最后，出来性能之外，GTX750系列的功耗也成为了很多消费者关注的重点，特别是网吧业主，一块节电而性能又不错的产品相信将来也会成为不少网吧的标配，再配合NV独家的GFE软件，游戏玩家应该会更加享受未来的体验，那就和笔者一同起来更多新产品的带来吧。

转载于:https://www.cnblogs.com/kylegui/p/3847727.html

你可能感兴趣的:([ZZ] Maxwell 架构)

如何保证前端价格与后端最终价格一致：机制、架构与实践 nbsaas-boot 状态模式
在一个价格复杂、优惠叠加、规则动态的系统中，“前端展示价格”和“后端结算价格”出现不一致的情况，是非常常见且影响巨大的问题。这不仅会造成客户投诉、信任下降，还可能引发退款损失、财务对账错误、法务风险。本文系统性探讨：如何设计机制，保证前端价格≈后端最终成交价格，做到一致、安全、可溯源。一、典型场景与问题场景产生的风险客户看到是89.9元，提交订单后变成99.9元用户信任受损，投诉率高前端使用旧规则
【GitHub开源项目实战】Agent-Zero 多模态 Agent 框架的架构实现与实战落地观熵 GitHub开源项目实战 github 开源架构
开源项目实战解析：Agent-Zero多模态Agent框架的架构实现与实战落地关键词：Agent-Zero、LLMAgent、多模态融合、LangGraph、结构化对话、函数调用、RAG、真实场景实战、开源项目分析摘要：Agent-Zero是一个以LangGraph为核心构建的多模态智能体框架，专注于大语言模型（LLMs）驱动下的多模态Agent系统实现，具备高度模块化、支持结构化对话状态流转、工
Happy-LLM 第二章 Transformer HalukiSan transformer 深度学习人工智能
Transform架构图片来自[Happy-llm](happy-llm/docs/chapter2/第二章Transformer架构.mdatmain·datawhalechina/happy-llm)，若加载不出来，请开梯子注意力机制前馈神经网络每一层的神经元都与上下两层的每一个神经元完全连接数据在其中只向前流动，用于处理静态的数据，进行图像识别或者分类，但是该网络没有记忆能力，数据在它里面没
Eureka和Nacos都可以作为注册中心,它们之间的区别怀揣小梦想 eureka 中间件分布式服务发现微服务
在微服务架构中，由于服务实例数量多、位置动态变化，需要一套机制来管理服务的位置信息，也就是注册中心。Nacos与Eureka有相同点，也有不同之处，可以从以下几点来描述：接口方式对比实例类型对比健康检测对比服务发现对比1.接口方式对比Nacos与Eureka都对外暴露了Rest风格的API接口，用来实现服务注册、发现等功能Eureka的RESTAPI设计#服务注册POST/eureka/apps/
happy-llm 第二章 Transformer架构 weixin_38374194 transformer 深度学习人工智能学习
文章目录一、注意力机制核心解析1.1注意力机制的本质与核心变量1.2注意力机制的数学推导1.3注意力机制的变种实现1.3.1自注意力（Self-Attention）1.3.2掩码自注意力（MaskedSelf-Attention）1.3.3多头注意力（Multi-HeadAttention）二、Encoder-Decoder架构详解2.1Seq2Seq任务与架构设计2.2核心组件解析2.2.1前馈
创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】程序员Gloria YOLOv8 YOLO 目标跟踪人工智能目标检测
文章目录创新引入HAttention模块：提升YOLOv8小目标检测精度【YOLOv8】引言1.YOLOv8模型概述1.1YOLOv8架构1.2YOLOv8小目标检测的挑战2.HAttention模块：原理与设计2.1HAttention模块的动机2.2HAttention模块的结构3.HAttention模块在YOLOv8中的应用3.1引入HAttention模块3.2YOLOv8架构修改3.3
【无线通信】面向多天线用户的网络辅助全双工无蜂窝大规模MIMO研究 hans汉斯论文荐读网络机器人大数据学习方法人工智能数据挖掘 github
导读：基于网络辅助全双工技术无蜂窝大规模多输入多输出(multipleinputmultipleoutput,MIMO)系统是目前无线通信领域的关键技术之一。然而，现有的研究都假设采用完美硬件配置的单天线用户设备发送和接收信号，这种架构限制了系统整体性能的进一步提升。鉴于此，本文针对网络辅助全双工无蜂窝大规模MIMO环境中的多天线用户通信展开研究。利用现有的加性量化噪声模型，推导了低精度模数转换器
亿级流量架构：Envoy+Quarkus超高性能网关实战 Star_Sea_77 云原生与DevOps工程实践架构 junit java 云原生开发语言
亿级流量架构：Envoy+Quarkus超高性能网关实战摘要本文针对高并发场景下传统网关的性能瓶颈（如SpringCloudGatewayQPS不足1.5万、Nginx+Lua内存占用高），提出基于Envoy+Quarkus的超高性能网关方案。通过实测对比，该方案在4核8G环境下实现6.3万QPS（是SpringCloudGateway的5.25倍），P99延迟仅9ms（降低81%），内存占用21
YOLOv11深度解析：Ultralytics新一代目标检测架构创新与实战指南芯作者 D2:YOLO YOLO 神经网络计算机视觉
2024年Ultralytics重磅推出YOLOv11**：在精度与速度的平衡木上再进一步，参数减少22%，推理速度提升2%，多任务支持全面升级！一、YOLOv11核心创新：轻量化与注意力机制的完美融合YOLOv11并非颠覆性重构，而是通过模块级优化实现“少参数、高精度、快推理”的目标。其三大创新点如下：1.1C3k2模块：动态卷积核的灵活设计取代YOLOv8的C2f模块，C3k2通过参数c3k动
ASP.NET MVC 与 ASP.NET Core MVC：架构演进与技术对比
在当今数字化时代，构建高效、可扩展且易于维护的Web应用程序已成为开发人员的核心任务之一。ASP.NETMVC和ASP.NETCoreMVC作为微软在Web开发领域的两大重要框架，为开发者提供了强大的工具来实现这一目标。然而，随着技术的不断演进，这两个框架在设计理念、架构、性能以及生态系统等方面存在着显著差异。对于开发者来说，理解它们之间的区别至关重要，这不仅有助于选择适合项目的框架，还能提升开发
React应用中的受保护路由与Flux架构息相吹受保护路由重定向机制 Flux架构单向数据流 Backbone模型
背景简介React.js因其组件化和声明式的编程范式受到了前端开发者的广泛喜爱。然而，对于大型应用来说，仅仅依赖React.js是不够的，特别是在状态管理和数据流方面。本文将结合书籍内容，探讨如何在React应用中实现受保护路由和如何采用Flux架构简化应用的状态管理。受保护路由的实现与重定向机制在React应用中，受保护路由是一种常见的需求，它确保未经授权的用户无法访问需要认证的页面。例如，如果
flux介绍 tqs_12345 java 架构 react.js
Flux是一种前端应用开发架构，由Facebook的一群工程师提出，主要用于管理数据流。Flux的核心思想是利用单向数据流和逻辑单向流来解决MVC架构中状态混乱、数据流管理混乱的问题。Flux应用由三个主要部分组成：Dispatcher、Store和View。Dispatcher是应用的调度中心，负责接收并分发Action。Store负责存储应用状态，同时响应事件并更新数据。View则负责订阅来自
Softhub软件下载站实战开发（十三）：软件管理前端分片上传实现叹一曲当时只道是寻常前端 golang
文章目录Softhub软件下载站实战开发（十三）：软件管理前端分片上传实现前言前端分片上传架构设计️核心组件实现1.上传资源组件(`uploadResource.vue`)2.分片上传逻辑实现3.资源管理组件(`editResource.vue`)文件大小格式化组件大整数处理方案总结Softhub软件下载站实战开发（十三）：软件管理前端分片上传实现前言在之前文章中，我们实现了软件分片上传的后端接口
在Unity WebView中运行React应用的解决方案马特说 UNITY REACT unity react.js 游戏引擎
在UnityWebView中运行React应用的解决方案概述本文档详细介绍了如何在Unity应用中通过WebView加载React应用，并解决在Android平台上常见的路径和网络问题。目录项目架构React项目打包Unity本地服务器配置Android平台特殊处理路径映射问题解决网络权限配置完整实现步骤常见问题排查项目架构该项目采用以下架构：Unity应用：主应用程序，包含游戏逻辑和UIWebV
Apipost 签约中原消费金融：共建企业级 API 全链路协作平台，推动接口管理与测试智能化升级 Apipost的同学们 Apipost合作案例 Apipost私有化部署 Apipost AI Apipost合作行业 Apipost金融客户 Apipost合作案例 Apipost AI Apipost API开发企业级开发
随着企业数字化转型的不断深化，API正在从技术细节演变为业务协作的核心枢纽。特别是在金融行业，微服务架构、系统联动、合规要求等多重因素交织下，接口数量激增、管理复杂度提升、质量保障难度加大。近日，Apipost与中原消费金融正式签署合作协议，基于API全生命周期协同平台，协助其构建规范化、自动化、智能化的一体化接口管理与测试体系。一、合作背景：业务高速扩张下的API挑战：场景的复杂性，催生平台化诉
C#实战分享--爬虫的基础原理及实现
关注我，持续分享逻辑思维&管理思维；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；有意找工作的同学，请参考博主的原创：《面试官心得--面试前应该如何准备》，《面试官心得--面试时如何进行自我介绍》《做好面试准备，迎接2024金三银四》。推荐热榜内容：《架构实战--以海量存储系统讲解热门话题：分布式概念》-------------------------------------正文----
大模型的MoE架构解析：从理论到应用的系统探讨不秃头de程序猿开发语言转行人工智能 ai 大模型程序员学习
MixtureofExperts（专家混合）架构正在重新定义大语言模型的发展轨迹。这种革命性的架构通过条件计算实现了万亿参数规模的模型，同时保持与千亿参数密集模型相当的计算成本。从GPT-4的1.8万亿参数到DeepSeek-V3的671亿参数，MoE架构已成为当前AI领域最重要的技术突破之一。MoE的核心洞察在于"不是所有的模型容量都需要同时激活"——通过让不同的专家网络处理不同类型的输入，实现
【微信小程序】小程序的双线程架构，为什么要设计成双线程的，双线程之间如何通信我有一棵树小程序微信小程序
在开始学习之前，建议看一下官方文档逻辑层和渲染层微信小程序是双线程的，有渲染层和逻辑层两个执行环境，渲染层负责页面的渲染和样式，逻辑层负责小程序的逻辑和数据处理。渲染线程：渲染层使用了WebView负责渲染界面，包括解析wxml，wxss，样式计算，布局排版和绘制试图等操作。一个页面是一个WebView，所以渲染层会有多个webview逻辑线程：基于有JsCore运行js脚本，负责处理业务逻辑和数
小程序的「双线程模型」 TE-茶叶蛋小程序开发小程序
文章目录前言一、双线程模型结构概览二、逻辑层（AppService）示例：️三、渲染层（WebView）示例（WXML）：四、通信机制（Native层桥接）⚙️通信方式：底层实现方式：五、为什么这么设计？缺点与限制总结结构图✅实践建议扩展小程序双线程模型的**进阶架构扩展**一、支持WebWorker的多线程能力（逻辑层并发能力增强）✅使用示例：⚠️注意：二、沙箱机制强化（增强渲染安全）三、小程序
核心骨架: 小程序双线程架构风铃喵游从零搭建小程序框架架构小程序架构前端
本节简介从本小节开始，我们将实现小程序架构的核心逻辑:双线程架构，开始之前我们先简单介绍下双线程架构以及选择双线程架构的原因;小程序在渲染过程中，将逻辑代码的执行和页面逻辑的渲染分割开，各自独立在一个线程内运行，及小程序的双线程运行架构;采用双线程运行的小程序的优势主要有:JS逻辑的独立运行不会影响UI的渲染，性能更优安全性:JS逻辑独立运行，避免利用一些浏览器api操作DOM，执行动态脚本等，方
TzdInjectorNTQQ：基于内存注入的QQ NT客户端扩展框架解析 tzdwindows_7 Electron深度实践 Windows逆向安全 JavaScript引擎 java 逆向 qqnt qq TzdInjectorNTQQ c++Electron
TzdInjectorNTQQ：基于内存注入的QQNT客户端扩展框架解析项目地址：https://github.com/tzdwindows/TzdInjectorNTQQ许可协议：GNULesserGeneralPublicLicensev3.0适用场景：Electron应用逆向工程、客户端扩展开发、JavaScript运行时研究项目背景与核心价值QQNT是基于Electron架构的新一代跨平台
全素山药开发指南：从防痒处理到高可用食谱架构 109702008 杂谈人工智能
摘要：本文系统性解析山药的化学特性（黏液蛋白/皂苷致痒机制）及全素场景下的烹饪解决方案，提供6种高内聚低耦合的食谱实现，附完整防氧化与黏液控制技术方案。一、核心问题分析：山药处理中的“痛点”致痒物质皂角素+植物碱→刺激皮肤神经末梢解决方案（5种设计模式）：graphLRA[防痒方案]-->B[物理隔离-手套]A-->C[化学中和-醋/油涂层]A-->D[热力破坏-蒸煮预处理]氧化发黑酚类物质+氧气
Electron 进程间通信（IPC）深度优化指南 vvilkin的学习备忘 Electron electron javascript 前端
Electron是一个强大的跨平台桌面应用开发框架，它结合了Chromium和Node.js，允许开发者使用Web技术构建高性能的桌面应用。然而，Electron的架构决定了它必须频繁地在主进程（MainProcess）和渲染进程（RendererProcess）之间进行通信（IPC,Inter-ProcessCommunication）。如果IPC通信设计不当，可能会导致应用卡顿、响应延迟，甚至
车载软件架构 --- OEM企业文化与软件的冲突汽车电子实验室电子电器架构开发流程 OEM怎么掌握软件开发能力 ZEVonUDS-J1979 车载通信网络槪述汽车 HPC软件架构
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
TM56M152A 十速工业级32位闪存MCU控制器芯片外设接口+硬件加密引擎
TM56M152A（十速科技）产品解析与推广文案一、产品定位TM56M152A是十速科技（TenxTechnology）推出的工业级32位ARMCortex-M0微控制器，主打高性价比实时控制，集成丰富外设接口和硬件加密引擎，适用于智能家居、工业HMI、电机控制等场景。二、核心功能与参数特性参数/性能内核架构ARMCortex-M0@48MHz，1.25DMIPS/MHz存储配置64KBFlash
《Java修仙传：从凡胎到码帝》第四章：设计模式破万法
【万变不离其宗】“需求万变，架构永恒。”“单例镇心魔，策略应万变，装饰扩乾坤。”“此乃设计模式三昧真火。”——函数峰禁地《设计模式真解·总纲》第一回：需求风暴“根据最新需求，贵宗的功法体系需要做以下调整…”李需求的声音不大，却让整个青云宗鸦雀无声。她手中玉简不断延伸，转眼间已铺满半个广场。韩小码瞪大眼睛看着那些浮在空中的需求：支持动态功法切换（需零延迟）递归分身术要增加冷却进度条全面改用Pytho
SpringBoot电商项目实战：从零搭建百万级架构
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot电商项目实战：从
企业级云原生平台的演进路径与治理框架
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注一、背景：从“项目型IT”到“平台型能力”的战略转型企业在数字化进程中正面临从“项目交付”向“平台支撑”的深层转型。传统项目型IT架构以“一次性交付”为目标，缺乏后续演进能力，而平台化思维强调“能力复用、持续运营、面向组织协同”，使得云原生平台不仅成为基础设施的新形态，更是企业核心竞争力的构建载体。云原生带来的不仅仅是技术革命，更是组织边界、协作
AI代码生成与测试体系建设的关键要素
关键词：AI代码生成、自动化测试、软件质量保障、持续集成、智能测试文章目录1.引言：AI编程时代的"双刃剑"2.AI代码生成的核心组件2.1智能代码生成引擎2.2上下文理解与意图识别2.3代码质量评估机制3.测试体系的四大支柱3.1自动化测试生成3.2智能测试用例设计3.3代码覆盖率分析3.4性能与安全测试4.系统架构设计要点4.1整体架构蓝图4.2数据流与处理管道4.3反馈循环机制5.质量保障与
AIOps助力AI研发平台的自我优化能力构建 TechVision大咖圈人工智能 AIOps 能力构建
关键词：AIOps在AI研发平台中的自我优化能力构建适用读者：AI平台架构师、研发效能团队、智能运维工程师阅读时长：约8分钟目录什么是AIOps？AI研发平台的挑战AIOps如何赋能AI研发平台自我优化能力的核心构建要素架构图与流程示意最佳实践案例写在最后什么是AIOps？AIOps，全称ArtificialIntelligenceforITOperations。别害怕这个“高大上”的名词，其实它
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class