zhengmeifu

NVIDIA Tegra3，高通S4 MSM8960，三星Exynos4【新一代手机处理器大比拼】

你一定很厌烦Android平台上无穷无尽的硬件大战，但我们很遗憾的告诉你：在谷歌对Android发展方向作出战略性调整之前，硬件规格是评价Android设备好坏的重要标准，甚至是唯一标准。看看那些历代些热销的Android手机型号：Droid 2、Galaxy II、One X、Galaxy S III，它们无不具备同时代手机中领先的硬件规格。即便是iPhone和iPad，为了实现一流的体验，也配备了地球上最庞大的嵌入式GPU。可以这么说：一台硬件规格强悍的手机不一定是好的Android手机，但一台好的Android手机，必然是一台硬件规格强悍的手机。

如今时间已经过去整整一年，面对市面上那些眼花缭乱的新品，我们再次拿出了一份新的评析，帮助大家擦亮双眼，更好的识别Android手机硬件。

由于德州仪器没有参与今年的旗舰SoC之争，因此这一轮的竞争对手只有骁龙S4、Tegra3、Exynos4 Quad三款，不过它们之间的理念和技术差异却大大超过以往，体现了厂家之间鲜明而迥异的风格和特点。按照惯例，我们依然先单独介绍每一个SoC处理器，接着结合性能测试进行技术横评，最后展望未来发展。如果你对自己的技术水平没有信心，也不要紧，看个热闹就行，你来我往的手机处理器军备竞赛还是挺有乐趣的。

Part.1 三款处理器的今生前世

四核先锋——nVIDIA Tegra3

nVIDIA的策略一向是以快制胜。早在去年年底，Tegra3就已经走入了实际产品，今年第一批搭配四核处理器的手机也采用了这颗芯片。Tegra3的架构与Tegra2相比改动并不大，只是将CPU子系统从双核Cortex A9增加到了四核Cortex A9，集成的GPU也依是较老的GeForce ULP系列，不过像素处理、光栅化等组件进行了增强。内存方面，Tegra3并没有做出改动，依然只支持单通道LPDDR2，虽然引入了DDR3支持，但对于手机而言这样的支持实际意义并不大。

作为台积电最大的合作伙伴之一，nVIDIA很清楚台积电在28nm工艺上的进度，因此选择了使用较为保守的40nm工艺。为了抵消这个的影响，nVIDIA引入了一个非常有意思的设计，那就是我们所知道的“4+1架构”。这方面之前已有介绍，这里就不再重复了，没有看过的同学可以点这里。

Tegra2由于存在缺少NEON协处理器这个明显的缺点而在双核时代竞争力大减，Tegra3没有再犯同样的错误。但这并不意味着Tegra3没有缺点。由于主核和伴核共享同一片1MB的二级缓存，而两者的频率之间最多可以差到3倍，因此Tegra3的二级缓存被设计为按照一个固定的时间返回核心所请求的数据——对于主核而言，二级缓存的等待周期会多一些，而对于伴核而言则少一些。这样的设计可以简化硬件复杂度，但不可避免的会让二级缓存工作在一个比较“慢”的状态（尤其是对主核心而言），进而影响整体性能。而实际上由于伴核的工作条件比较受限，并不是随时随地都可以切换，因此很多时候Tegra3也不得不以高功耗的主核心去应付低负载，也许会对功耗产生负面影响，这些问题在后面的测试中我们会尝试去观察解析。

架构为王——高通骁龙S4 MSM8960

虽然有所规划，但高通首先拿出的却不是四核产品，而是双核的MSM8960。不过千万不要觉得这一代高通又跪了，实际上MSM8960可能是这一代中最为先进的产品。除去28nm工艺之外，它还采用了新的Krait核心。与上一代Scorpion类似，Krait同样也是高通在ARM v7-A指令集上自行发展的核心设计，就像ARM官方以Cortex A命名的核心设计一样。值得一提的是，在很多场合下，很多人都觉得Krait是和Cortex A15同级的产品，这个说法是不准确的，这在后面我们会单独拿出来详细解释。

言归正传，自行设计处理器的好处就是灵活，不需要跟着ARM的脚步走。所以高通的策略就是隔代升级，每一次设计一个比ARM官方这一代强一点、比下一代弱一点的核心，然后ARM升级两次，自己升级一次——Krait核心面对Cortex A9核心就如同当年Scorpion核心面对Cortex A8一样，是具备一定优势的，而面对Cortex A15核心则处于劣势。作为私有核心IP的设计者，高通不愿意也不需要研发那么多种核心实现，因此这样的思路是合适、也可以节约很多成本。

MSM8960的GPU比较令人失望，因为它只是将上一代S3的GPU简单超频50%而来，除此以外并没有任何改变。当然这里并不是说超频这种方法不好——后面可以看到另外一家厂商也采用了同样的策略，主要是因为S3的3D性能本身就不是很强，因此仅仅简单超频的结果就是S4的3D性能依然比较弱。当然高通也知道这点，因此计划推出搭载了全新架构Adreno300的S4 Pro，只是这个产品将何时用于手机还是未知数。

其它方面，MSM8960都是中规中矩，双通道LPDDR2内存、1MB二级缓存，1080p多媒体支持，外加高通高集成度解决方案（这其中自然也包括备受争议的高通音频Codec），尤其是作为现阶段唯一的LTE实现方案，因此很容易理解为什么众多厂家选择在中高端产品上纷纷应用这颗处理器。

稳扎稳打——三星Exynos4 Quad

最后登场的Exynos4 Quad和之前的两位比起来就显得朴素多了：除去额外的两个核心、增加的一个图像信号处理器（据说性能和功能都很烂）、HDMI接口提升至1.4版以及视频硬件解码上的些许改善以外，和上一代双核“猎户座”Exynos 4 Dual 45nm可以说是毫无差别。但是即便如此，三星依然可以对这款产品底气十足，原因之一是上一代Exynos 4 Dual 45nm在规格和性能上已经足够优秀，而更重要的是，Exynos4 Quad的杀手锏是先进的工艺。

相对于高通对于自家产品工艺宣传方面的高调，三星在这方面相对要低调一些，很多人知道高通S4芯片组是采用28nm工艺制造，但实际上三星采用的工艺更加先进——32nm HKMG。可能很多人会觉得费解，为什么32nm要比28nm工艺先进？这里我们暂时卖个关子，后面的文章中会详细介绍这方面的细节。

之前我们提到了，除了高通以外，还有厂家在新产品上采用了超频大法，那就是三星。Exynos4 Quad集成的GPU依然是Mali400 MP4，虽然并不是传言中的Mali T604，但由于新工艺的引入，三星将它的工作频率直接提升了到原来的两倍，在性能也几乎翻倍的同时基本维持了功耗的不变。至于其它方面的特性，因为实在是乏善可陈，这里就不重复了。

OK，到此为之新一代旗舰平台的三位成员就介绍完毕了。可以看出这三个厂家的产品的确具备了完全不同的风格和倾向，那么到底谁是这个时代的最强者呢？

Part.2 庖丁解牛——三款处理器技术浅析

第一回合：半导体工艺制程

在高集成度的半导体微处理器行业中，半导体工艺制程可能是除去设计以外最重要的因素。高通、三星、NV三家公司分别选择了三种不同的工艺：Tegra3采用了台积电“40nm Fast G”，MSM8960采用了台积电“28nm LP”，Exynos 4 Quad则采用了三星自家的“32nm LP HKMG”。这些工艺的代号可能会让你眼花缭乱，但实际上它们才是理解工艺细节的关键。我先来好好了解一下半导体工艺的相关基础细节。

线宽可能是半导体工艺中最直观的一个参数，例如28nm、45nm，但这也可能是最具欺骗性的参数。大家都可能认为数字越小越先进，但实际情况远没有这么简单。

目前的半导体行业中存在两种类型的企业，一种是以Intel、三星为代表的拥有自主制造能力的企业，另一种则是以nVIDIA、高通为代表的Fabless，即设计代工型企业。对于后者而言，芯片的制造往往交给诸如台积电、意法半导体等代工厂负责。最近10年来，每一代逻辑芯片工艺的线宽基本上都是以70%的比例不断降低，就Intel为例，近几年我们熟悉的有 90nm、65nm、45nm、32nm和最新的22nm。由于这些企业的工厂主要为自用，工艺参数往往只是用于辅助宣传，但对于台积电而言，由于它的业务是代工，因此有可能是出于宣传自己工艺的角度，台积电自130nm节点开始，每一代工艺的线宽都要比Intel小一点——分别是 80nm、65nm、40nm、28nm和20nm。这样的确会营造一种更加先进的感觉，但实际上可能只是商业策略居多，就本质而言大家依然是同一代工艺。

Tegra3所采用的40nm工艺是属于45nm一代的节点，而Exynos 4 Quad和MSM8960采用的32/28nm则是最新一代的节点，后两者之间不存在谁更先进的区别。那么为何nVIDIA要采用上一代工艺呢？原因相信在最近的新闻中大家都能明白——那就是产能。

由于nVIDIA长期以来和台积电在最先进工艺领域深入合作（NV的PC显卡基本全由台积电代工，这些产品可比手机处理器复杂多了），因此NV很清楚台积电28nm工艺的进度比预期要慢得多。为了保证Tegra3不会被影响，NV依然选择了上一代的40nm工艺。这自然会付出功耗和性能的代价，但这也让nVIDIA可以提前对手接近半年推出自己的产品，占得市场先机——华硕Transformer、谷歌Nexus 7、HTC One X，LG 擎天 4X，第一批上市的四核心Android设备用的全是Tegra3，为何？答案是：只有Tegra3一块芯片可用，其它根本还没生产出来。

台积电28nm工艺原本计划在2011年9月量产，而一直到今天，它还只进入早期量产阶段，产能预计要到年底才能勉强达到供需平衡，高通自然也深受其害。当然，功耗的代价也是nVIDIA必须付出的，否则也不会有4+1架构的出现。

好了，你已经明白“线宽”这个参数的区别，让我们接着来看线宽后面的参数，如上图中提到的“Fast”和“Low power”。

大体来说，一代线宽下都会有三个工艺方向：高性能型、通用型、低功耗型。高性能型工艺功耗大、漏电大，但是可以让芯片工作在极高的频率下，获取最大的性能；低功耗型工艺功耗低、漏电小，但芯片的最高工作频率会受到明显限制，通用型则介于两者之间。同样的线宽，不同的工艺方向，差别甚至可以达到数倍之多，因此只谈论线宽是没有意义的。在这一代的旗舰平台中，高通和三星的芯片均采用了低功耗型即LP工艺，唯独nVIDIA因为设计了LP工艺制造的伴核，从而使用通用型即Fast G 工艺制造剩下的部分以追求更低的满负荷功耗。

方向之外，一个节点的工艺还有很多其他的技术细节。我们注意到开头的工艺介绍中，Exynos 4 Quad的工艺介绍中有HKMG字样，这四个字母就代表着工艺技术细节，它指高介电常数金属栅极，英文为High-K Metal Gate，缩写为HKMG。这是一个非常先进但也非常复杂的技术，这里就不介绍具体细节了，大体而言，HKMG就是利用高介电常数的金属氧化物（例如氧化铪或者氧化铝）代替二氧化硅作为栅极绝缘层，提高栅极对电子的容纳能力与对沟道的控制力，进而降低漏电，更重要的是降低高频率下的功耗。根据三星提供的数据， HKMG相对于SiON/Poly-Si工艺在同样的延迟（即频率）下漏电最多可以降低到十分之一，而同样的漏电下频率最多可以提升40％。Exynos 4 Quad也正是借助这样的先进工艺，在核心数翻倍的情况下，整体功耗依然降低了20%。

而高通在MSM8960上的选择就相对保守。虽然台积电也拥有28nm HPL HKMG工艺，但高通选择的却是基于SiON/Poly-Si的28nm LP工艺。这一方面是因为HKMG会抬高制造成本，更重要的是台积电的28nm HPL HKMG工艺产量太低且延期太久，迫使高通不得不选择较为早量产的28nm LP——这自然会对MSM8960的功耗带来一定负面的影响。因此综合来看，这一代平台中工艺最为先进的是三星Exynos 4 Quad，其次是高通MSM8960，再次是Tegra3。当然，Tegra3也达到了自己的目的——它的发布时间已经抢占先机，成功进驻了一大批设备。

第二回合：基础架构——骁龙S4真的是A15吗？

前文中我们曾提到，骁龙S4所采用的核心是自行研发的，高通表示这颗处理器的基础架构要远比Cortex A9先进，那么，它算不算ARM新一代架构Cortex A15呢？为了解释这个问题，首先我们要来看一下所谓核心的概念。

首先要明确的是，ARM所谓的Cortex A架构并非只有一个执行核心，它是一套完整的处理子系统，包含核心、内存管理单元、协处理器、多核心协同控制器、总线控制器、缓存控制器等等在内，而执行核心仅仅是其中的一个部分而已。看过很多介绍文章的读者应该知道，Krait核心拥有3指令并发、全乱序执行等“类似于A15”的设计参数，但这仅仅是处理核心上的某些共同之处而已，实际上它们之间有着很大的区别。

我们用Cortex A9作为例子，带领大家粗略了解一下处理器的架构：

处理器的工作过程是拾取指令->解码指令->分派给执行机构->进行运算->把结果写回内存->拾取下一条指令。可以看到，指令从左下角的预取（Prefetch Stage）级进入到上方的解码（Decode Stage）级，经过必要的处理（Register Rename）后，进入乱序指令分发（Dispatch）级，送给各个执行（ALU/NEON）器，最后进入乱序写回（Write back）部分。这一条路径，就是所谓的指令流水线，也就是下面这张图。

Cortex A9的指令解码器（图中De）具备单周期解码两个指令的能力，而乱序指令分派器（图中Iss）具备3+1个端口，也就是说每个时钟周期最多可以分派4个指令，而执行单元部有两个通用执行器（其中一个支持并发执行一个硬件乘法）、一个访存器和命名为“Compute Engine”的运算协处理器，也就是我们知道的VFP和NEON。

Cortex A15的执行管线相对于Cortex A9而言得到了比较大的强化，取指宽度从Cortex A9的64bit提升到了128bit，而且单周期解码能力增加到了三个指令。这是我们最常提到的提升，但这其实并不是最大的改变，最大的改变有两点，这里先看分派器和执行器。与Cortex A9的3+1分派不同，Cortex A15的分派器具备8指令分派能力，相较A9而言提升了一倍有余，执行器不仅4组对应的扩充到了8组，还额外增加了分支跳转单元和硬件乘除法单元。在Cortex A9上，VFP和NEON公用一个分派端口，而在Cortex A15上它们各自拥有自己的分派端口，这可以有效缓解指令冲突问题。

相对而言Krait的资料比较缺乏，目前只知道单周期解码能力为3、指令分派能力为4、执行单元一共有7个，其它方面则不得而知，很可能缺少的就是分支单元。从规格而言，Krait的执行核心部分介于Cortex A9和A15之间，如果从指令分派角度来看，Krait更像是增强版Cortex A9，高通给出的3.3DMIPS/MHz的理论运算数据也说明了这一点。当然这只是理论运算能力，实际表现和很多其它因素也有关系，后面我们会分析。

协处理器方面，Krait采用的NEON协处理器拥有128bit的SIMD宽度，这要比Cortex A9处理器的64bit SIMD来的更宽，与Cortex A15同级。浮点协处理器方面也是如此，搭配的是Cortex A15的VFPv4，性能方面大约两倍于Cortex A9的VFPv3。但是这并不意味着Krait等同于Cortex A15，事实上Cortex A15第二个重大的改变就在这里。

上图就是Cortex A9的浮点运算单元。它的内部实现了管线化架构设计，拥有自己独立的指令队列和指令分派，但是每个周期只能分派一个指令。虽然图上没有画出来，但是VFP/NEON指令的具体解码在Cortex A9中是在浮点运算单元中实现的，因此相对于其他的执行管线而言，独立性显得比较明显。

到了Cortex A15，浮点运算单元被以其他运算器相同的运作方式整合到了处理器的主管线中，具体而言，就是VFP和NEON的指令解码和其它类型的指令一样是在前端直接实现，无需自行解码，运作架构也和其他执行器相同。此外，VFP和NEON运算器内部实现了双指令发射，可以同时执行两条SIMD指令，四个融合MAC运算，甚至还具备了乱序执行能力。我们都知道乱序执行对性能的贡献，因此可以看出，Cortex A15在这方面的改进也是非常巨大的。而根据现有的资料，高通S4并没有引入这些复杂的设计，因此与Cortex A15有着相当大的差距。最后我们用一张图来简单比较一下Cortex A9、Krait和Cortex A15的执行管线：

除去执行管线的增强，Cortex A15的二级缓存也进行了大幅度的升级。在Cortex A9上，ARM设计了多核心共享式二级缓存，但这个缓存是通过外部总线访问的。

可以看到，两颗Cortex A9处理器通过标记为PL310的二级缓存控制器连接到1MB的缓存上。PL310的内部结构如下：

结合之前的架构图，我们就可以推测，PL310提供的两个AMBA3 AXI 64bit接口，一个会用来进行指令拾取，而另一个则用户访问二级缓存。

在Cortex A15上，ARM将二级缓存控制器直接整合进了A15多核心控制器SCU中，与所有的核心构成了一个紧密耦合的整体。

不但如此，Cortex A15的二级缓存架构还针对多核心访问设计了4个独立的TAG队列，将多核心控制器整合进L2系统并支持直接的CPU到CPU数据传输，这一切都是为了极大提升多核心下并发访问缓存的性能。Intel曾经说过Cortex A9糟糕的二级缓存性能限制了它的性能，很明显，ARM决心在Cortex A15上改进这个缺陷。

至于高通S4平台，根据目前的资料，虽然Krait已经淘汰了S3平台上每个核心私有缓存的设计，但是并没有达到Cortex A15的高度，实际上采用的应该是类似于Cortex A9的缓存架构。

到这里大家应该就明白了，认为Krait是类似于Cortex A15架构的说法是不准确的。事实上，骁龙S4的“Krait”架构是一个相对上代Scorpion而言执行核心经过强化、配备了Cortex A15级协处理器、采用了类似Cortex A9存储架构的处理子系统，整体而言介于Cortex A9和A15之间，看作是“增强版A9”而不是A15级设计比较恰当。

第三回合：多核心构成方式——胶水 vs 胶水

关注高通的读者应该都知道，高通的移动处理器采用的都是所谓的异步架构，高通自始至终对外将异步架构宣传为一个先进的技术，而大家则把它戏称为“胶水”。抛开其中的戏虐调侃之意，异步多核究竟能不能被称为“胶水”呢？三款处理器多核心结构有何优劣或者不同？本次我们打算用一个浅显易懂的例子来解释异步多核心。

如果我们把智能手机系统看作一个银行的营业厅，处理器就是窗口和窗口后面坐着的客服人员，而指令就是排队的人。如果一个营业厅只有一个窗口和一位客服人员，可以简单理解为营业厅是“单核”的——如果业务过多的话，这个客服人员就会忙不过来，也就是说这个单核的手机就会变得很卡。

在这种情况下，银行可以增加一些客服人员与窗口，来提升处理能力，这就是所谓的“多核心”。

此时有两种选择，第一是在唯一的窗口后面增加一名客服人员，而另一种选择则是额外开启一个新窗口，并再配备一名客服人员。在计算机系统内，前一种方案就对应异步架构，而后一种方法则对应同步架构。

银行客服人员可以看作是“运算能力”，而银行窗口则代表着“吞吐能力”。异步架构的本质是维持同样的吞吐能力，提高运算能力，而同步架构则会同时提升这两者。

自然的，前者要付出的代价比后者低，因为不需要额外再设计一个窗口，但缺点也显而易见：如果客户办理的都是非常简单的业务例如存款取款，那么整个营业厅的工作效率最终会受制于窗口的数量（一个）而不是客服人员的数量（两个）。在这种情况下，拥有两个窗口的营业厅可以获得接近两倍的处理能力，而用有两个客服人员的窗口则不会有太多的提升。当然，如果客户办理的都是诸如购买保险这类复杂业务，那么一个窗口拥有两个客服人员就可以较好的提升营业厅的处理能力，但在目前的手机应用环境下，这样的情况是比较少的。因此，异步架构总体而言相对同步架构而言性能损失比较明显。

理论上，异步架构的好处是设计简单、实现方便，缺点是性能低、吞吐量差。我们可以考虑极端的情况，假设在一个窗口后安排四名甚至八名客服人员，这个窗口是绝不可能获得四倍或是八倍与单人的工作效率，因此异步架构只有在高强度运算密集型的体系中才会得到应用，而在民用领域，以Pentium D为代表的异步架构处理器在2006年后基本就被淘汰了，目前只有ATOM还在采用这样的设计。

虽然异步架构通过合适的任务分发机制可以让多个核心运行在不同的频率下——例如某个核心负载较小，就可以让其运行在更低的频率下，高通声称这最多可以节约40%的功耗。但是，如果要获得明显的功耗优势，这两个核心的频率和负载就要有足够大的差异，在这样的情况下，由于其中一个核心负载非常小，同步架构也可以选择关闭这颗核心。因此异步架构的省电特性未必能反映到实际使用中，而且随着硬件升级浪潮下核心数量的增加，异步架构所带来的性能损失会越来越大。很不幸的是，高通骁龙S4，也就是MSM8960依然选择了异步架构，甚至高通未来规划中的四核Krait产品（如APQ8064）也将继续沿用异步架构，这不得不说是一个遗憾。

至于Exynos 4 Quad和Tegra3，它们因为基于Cortex A9设计，因此采用的都是同步架构。虽然理论上同步架构的吞吐不是问题，但实际中依然会受到很多因素的影响，比如存储系统带宽，准确说是PL310这根数据总线。

之前我们提到了，由于PL310只提供了两个64bit的AMBA3 AXI接口，因此众多核心只能通过一个64bit的AMBA3 AXI接口访问二级缓存。另一个接口则用于CPU取指，宽度也仅仅只有64bit。由于AMBA3总线的设计特性，这种设计的并发性会相当差，导致CPU会长时间处于等待状态，从这个角度而言，四核心Cortex A9的确不是一个很好的设计，因为它同样会遇到吞吐量的瓶颈——S4的瓶颈是吞吐量，而A9的瓶颈是存储系统带宽。这个问题对于Tegra3而言会更加严重，因为Tegra3为了实现“4+1架构”，二级缓存的工作速度大约只有正常速度的一半，这无疑会进一步削减多核心时的系统性能。

所以说，不论是MSM8960、Tegra3还是Exynos 4 Quad，其多核心架构都有缺陷，第一代四核手机处理器，大家都不完美。相对而言，至少在缓存方面，Exynos 4 Quad要好于MSM8960，而Tegra3再一次为它“只求最快问世”策略付出了一定的代价。

第四回合：内存——最容易被忽视的细节

内存是一个极易被忽视的重要环节，智能手机的CPU和GPU都要从主内存中存取数据，随着屏幕尺寸的步步提升，智能手机内存容量、带宽的压力与日俱增。自从进入Cortex A9以来，绝大部分主流的手机SoC处理器均引入了双通道内存的设计。

只有两个例外，其中一个是Tegra2，另外一个则是MSM8x60。这两颗SoC均只支持单通道内存，因此带宽方面有一定的缺陷，也最终导致了性能的不理想。那么在新一代的旗舰平台中，大家都选择了双通道吗？答案依然是否定的，因为Tegra3再一次成为了例外。

但是不要急着先骂nVIDIA，因为他们的解决方案简单粗暴而又有效——Tegra3直接提升了内存的运行频率，照样可以实现较高的带宽。

根据官方提供的资料，高通的MSM8960支持双通道LPDDR2内存，但它的内存频率仅仅运行在等效533MHz下，也就是说MSM8960的内存系统实际上是双通道LPDDR2 533。通过计算可以得到，这样的内存系统，带宽约为4.2GB/s。

Tegra3虽然仅支持单通道LPDDR2内存，但等效频率高达1066MHz，因此它的带宽同样也是4.2GB/s，而且由于频率的提升，Tegra3的内存访问延迟要大大低于MSM8960，具体的数字可能会在30～40%左右。这是一个非常有趣的结果，单通道的性能反而比双通道更加优胜。当然，NV这样的提升牺牲了功耗，就像双核1GHz的处理器功耗要低于单核2GHz一样。

至于Exynos 4 Quad，它的内存子系统是双通道LPDDR2 800MHz，因此拥有最大的带宽——6.4GB/s，延迟则比Tegra3略高。究竟带宽和延迟在实际应用中谁更重要是一个很难直接给出的结论，在后面的测试中我们会想办法去寻找由这点带来的差异。但是不论如何，MSM8960的内存子系统相对而言都是最弱的，Tegra3和Exynos 4 Quad可以说是各有优劣。考虑到未来高通的四核Krait产品依然将沿用这样的内存规格，过小的带宽和过大的延迟可能会成为制约高通产品发挥性能的一大桎梏。

第五回合：功耗——谁是好男人

在之前的工艺对比一节中，我们知道Exynos 4 Quad、Tegra3、MSM8960三款旗舰平台采用了三种不同的工艺，因此自然也会产生不同的功耗。目前智能手机的功耗越来越大，一天数次充电已经成为了常态，因此谁的功耗最低，有可能谁就将会在这一轮的旗舰大战中占据有利位置。Tegra3包含别具一格的伴核，MSM8960拥有目前代工领域最小的线宽，Exynos 4 Quad则有最先进的HKMG加持，究竟鹿死谁手，下面我们来详细分析。

nVIDIA在Tegra3的白皮书中给出了功耗对比，Tegra 3的整个CPU部分工作在1GHz频率下的功耗大约是1.26W，而Tegra3的实际产品运行频率是1.5GHz，这个频率下的功耗nVIDIA并没有提供，我们只能根据经验来预估。由于Fast G工艺的漏电比例较大，因此Tegra3在1.5GHz下的功耗可能是在2.5W左右。考虑到Tegra3的几乎整颗芯片都用的是40nm Fast G工艺制造，因此也可以猜测在其它通用硬件上，Tegra3的功耗会相对大一些。

当然，Tegra3有一个LP工艺制造的伴核。但是这个伴核更多是用于在待机时避免Fast G工艺的高漏电而设计的，对于正常使用的贡献并不大。

GPU方面，由于完全没有任何可以参考的资料，所以Tegra3的GPU究竟功耗多少，只能从实际使用续航中加以猜测。根据我们的实际测试，Tegra3手机的续航时间都不会太长，我们推测Tegra3的GPU功耗应当在1W左右，也就是说整颗Tegra3芯片在CPU和GPU满载的时候，功耗大约在3.5W左右（该数字并非官方提供，仅供参考）。

其次是Exynos 4 Quad。到目前为止三星依然没有公布Exynos 4 Quad的详细资料，但我们知道同样工艺的双核版Exynos 4 Dual 32nm的信息。

在图上可以看出，1.5GHz的双核Exynos 4 Dual 32nm的CPU部分功耗大约是在1W左右，每颗核心大约500mW。而Exynos 4 Quad的工作频率为1.4GHz，因此估计的功耗大约会是430mW，也就是说四核心的总功耗在1.7W左右，相对于Tegra3而言大约低了30%。

猎户座的GPU部分功耗图中也有所体现，45nm工艺下，运行频率为266MHz的Mali400 MP4的功耗大约是105mW，由于Exynos 4 Quad的GPU运行频率大约是400MHz，因此经过估算功耗大约在160mW左右。至此，Exynos 4 Quad的CPU+GPU最大总功耗就可以计算出来了，大约是在1.9W左右。

最后是MSM8960。相对于前两者的频繁估计不同，由于高通提供了MSM8960的开发平台，因此各项功耗都可以轻松直接测量。

借用其它媒体的结果，虽然功耗随着频率和负载的波动变化很大，但当工作在1.5GHz时，Krait CPU功耗大约是在700～750mW，因此总功耗这里取1.4W。这个数字在这一代的旗舰平台中是最低的（当然单颗核心功耗不是最低的），也就是说MSM8960在纯CPU的任务下是最省电的。

但是令人惊讶的是，MSM8960的GPU功耗高的难以置信，最高达到了1.6W，平均而言也有1.1W左右——几乎是Exynos 4 Quad的七倍。受到GPU拖累，MSM8960的CPU+GPU总功耗还是突破了2W大关，大约在2.5W左右。Android 4.0以后的系统中对于GPU的使用会非常频繁，这也许会对MSM8960的功耗带来一定的影响。

在之前的工艺分析中，我们提到过，高通没有选择最先进的28nm HPL HKMG工艺，可能会对产品的功耗表现产生一定的负面影响，在这里我们可能已经看到了结果，拥有HKMG技术加持的Exynos 4 Quad在三大旗舰平台的功耗里是最小的，其次是MSM8960，Tegra3由于伴核的存在，实际使用中的功耗比较难以估测，但如果是极限情况下则明显不容乐观。毫无疑问，最容易让手机变成好男人的是Tegra3。

Part.3 三国演义：实测数据对比分析

看完了理论分析对比，相信大家也都累了。三颗处理器究竟孰优孰劣，还得经过实际测试才能知晓。我们整理了Anandtech、gsmarena等数家国外权威媒体的测试成绩，并尝试通过分析结果来验证一下理论分析的结论。在未来，我们还会亲自对这三个平台进行性能测试，以追求更加全面的结果。

需要注意的是，因为各种原因，有些测试程序的参考价值有限，如Neocore、Nenamark v1和Vellamo。对于这类测试，我们决定直接忽略。

首先我们来看一些理论性能测试，作为对比，我们在图表里加入了1.2GHz的Exynos 4210与1.5GHz的MSM8260。Linpack是最近出厂率比较高的测试之一，靠求解线性方程组来测试系统的浮点运算能力。

双核的MSM8960在这个测试中取得了压倒性的领先，超过其它两款四核对手，这主要是缘于Krait的浮点协处理器为VFPv4，而A9和Scorpion只有VFPv3。浮点运算性能在现阶段的实际应用中体现的较少，因此这项测试的实际意义可能更多是体现在未来。比较有趣的是，Exynos 4 Quad的单线程性能不如Exynos 4210，这也许就是受到了带宽问题的影响。

接下来是几乎逢评测必测试的兔子跑分。这是一个综合测试项目，我们先来看总分，再慢慢分析。

Exynos 4 Quad是三大平台里分数最高的，其次是Tegra3，再次是MSM8960。双核和四核在这里体现出了差距，但是我们还需要来仔细看一下单项得分。

内存的结果比较有趣，看起来兔子跑分的内存测试会消耗很多的CPU性能，这导致拥有同样内存配置的Exynos 4210得分只有Exynos 4 Quad的一半都不到。而若只看新一代平台，即可发现Exynos 4 Quad依靠最大的带宽还是取得了最高的成绩，而MSM8960的低分也许是受到了延迟的影响，也许是因为CPU核心较少，成绩有些不成比例。整数部分的差距体现的是双核和四核的差距，虽然Krait拥有架构的优势，但这并不足以抵消核心数量的差距，和Exynos 4210相比，骁龙S4同频性能仅仅提升了6%，浮点甚至倒退了（兔子跑分的浮点部分并没有使用VFP加速，因此性能和整数是挂钩的，参考意义不大）。

而2D和3D由于测试强度过低，因此在目前的顶级平台上大家的分数均受制于屏幕刷新率，无法拉开差距。至于其它项目，对于总分的贡献很少。所以说，兔子跑分虽然设计上是一个全面的测试软件，但在旗舰平台上，基本总分只取决于内存和整数性能，参考意义大大下降。虽然网站很热衷于用它来进行测试，不得不说的是兔子跑分并不是一个好的测试软件。MSM8960在这个测试中的成绩并不理想。

CF-Bench也是一个理论性能测试软件。这里我们也来对比一下测试成绩。

再一次，核心数量显示出了决定性的作用，但是MSM8960的Java性能要好于其它两款四核平台，相对于前一代Scorpion而言更是有超过两倍的飞跃。这个结果比较出乎意料，也许是因为Krait引入的额外执行器在起作用，不论如何，这样的结果意味着在纯Java的应用中高通MSM8960会有较大的优势，甚至要比四核A9更好。

Quadrant测试向来是热门测试之一，我们也来对比一下，这里收集的是支持多核心的V2版，由于总分受IO影响过大，我们只看CPU和内存。

Quadrant V2的结果显得相当难以理解，S4的内存性能有些异乎寻常的高，这或许是因为Quadrant大体上是一个测试Java性能的程序，内存测试结果受到了S4超高的Java效率影响，变成了虚拟机访存效率测试而不是真正的内存测试。

看过了这些理论性能测试，我们下面来看一下实际环境模拟的测试。首先采集的是Smartphone Benchmark 2012中反映CPU性能额Productivity项。

虽然MSM8960有新架构的优势，但是由于核心数量少，性能依然赶不上四核Cortex A9。

浏览器测试也是实际应用中很常见的项目，我们先看看Sunspider。

时间越短越好，不过从双核A9、双核Krait到四核A9，差距并不大。因为SunSpider测试的成绩主要受到浏览器JS引擎的影响，与系统层面的优化关系密切，因此差距不大是可以理解的。

接下来是BrowserMark。

BrowserMark的结果可以说是一枝独秀，除了Exynos 4 Quad以外，其它平台基本处于同一水平，有趣的是不论Tegra3还是MSM8960，都不如上一代的Exynos 4210，这说明三星在软件上针对浏览器进行的单独优化效果是远超其他厂家的。

接下来我们看看3D性能。首先登场的自然是大名鼎鼎的GLBenchmark。Egypt场景使用了大量的Shader，尤其是Pixel Shader，比较看重GPU进行像素处理的能力。为了避免分辨率的影响，我们采集的是720p Offscreen的数据。

不出意料，Exynos 4 Quad再次夺得第一，MSM8960则不幸垫底。考虑到GPU功耗，这个结果实在是显得相当杯具。当然像素性能一向不是高通的强项，因此我们换一个测试。

Basemark ES2.0 Taiji是一个比较注重定点处理能力的测试，这个测试的结果又如何呢？

测试统一在800×480分辨率下进行。虽然依然落后于Exynos 4 Quad，但MSM8960在这个测试中进步明显，超过了Tegra3。不过Exynos 4 Quad似乎已经跑到了屏幕刷新率上限（成绩为58.9FPS），所以实际性能有可能不止于此。

最后我们来看看Nenamark V2。这也是一个比较注重顶点性能的测试。

在新一代SoC面前，Nenamark2也败下阵来，MSM8960和Exynos 4 Quad都跑到了屏幕刷新率的上限。考虑到它们的GPU均为上一代超频50％而来，因此应该还是Exynos 4 Quad占有上风。

能耗比和同频性能的初步探究

和以往测试性能不同，由于存在两种架构和两种核心数，所以这次我们尝试更加深入一点，去计算了一下三大旗舰平台在不同项目中的能耗比。除了Linpack以外，我们假定在测试中各个平台的功耗均处于最大，数据采用之前的结果。MSM8260的功耗之前并未提及，根据估测应当在650毫瓦左右。下面先来比较一下CPU部分的性能功耗比，这里用MSM8960的性能作为单位1。

接下来比较GPU部分。

可以看到，Exynos 4 Quad的能耗比在四个产品中是一枝独秀的，这应当主要是32nm HKMG工艺的功劳。而MSM8960的能耗比虽然位居第二，但是和Exynos 4 Quad有着不小的差距，这意味着在未来将要推出的四核心Krait产品，如何权衡功耗和性能会成为一个麻烦的事情。

GPU则对高通而言相当不妙。Tegra3由于采用的是落后的40nm工艺，能耗比不理想是可以理解的，但S4已经采用了28nm工艺（虽然工艺细节比较落后），再考虑到架构上的巨大优势，不仅能耗比大幅落后，连性能都是如此，这样的结果很难令人接受。

【表格S0】

很快，高通将会发布新一代的Adreno300系列GPU，宣称性能最高将达现有的四倍，实际泄露出的测试成绩则比Exynos 4 Quad高了大约15％，几乎达到Adreno225的两倍。但如果高通无法提升自己GPU的能耗比，只是一味的去“堆”运算单元，即便最终可以获得强大的性能，这样的提升也会变得毫无意义，毕竟便携设备靠电池供电，不可能无限制的允许功耗的增大。

能耗比之后，我们再来看看同频性能。由于和四核产品对比同频性能比较困难，因此这里我们用MSM8960与Exynos 4210进行对比。

从结果可以看出，骁龙S4的Krait核心在整体的执行性能方面和Cortex A9互有胜负，并不像很多文章中所说，“远超Cortex A9，与Cortex A15同级”。领先较多的三项中，Linpack源于Krait更高版本的VFP处理器，真正有实际意义的是Java性能，这点可能会在实际使用中带来很大的区别。总体而言，Krait与Cortex A9的关系更多类似于“基本持平”而并不是“远远甩开”。这个结果对高通而言可能有些沮丧，毕竟高通奉行的是两年一升级的策略，骁龙S4在自己生命周期的起始阶段无法彻底击败上一代架构的对手，随着下一代产品的陆续上市，Krait核心届时会变得更加被动。

结论与展望：骁龙S4——起大早，赶晚集？

看到这里，相信现在大家已经对三位选手有了足够的了解。骁龙S4确实是一颗优秀的处理器，高通的策略很明显——循序渐进，隔代升级。高通自行开发的处理器升级时间点和ARM是错开的——ARM拿出Cortex A8，高通就有骁龙S3 A8改进版；ARM拿出Cortex A9，高通就有骁龙S4 A9改进版。

通过架构换代的时间差，高通赢得了针对Cortex A9的优势，但这个优势并并没有太好的发挥出来，因为台积电工艺的问题，骁龙S4问世要比预定时间晚，而且它对普通A9处理器的优势要比想象的小，也许我们把它形容为“弥补了骁龙S3的劣势”更加准确一些。

只要使用最先进的工艺，现阶段的四核Cortex A9处理器（如Exynos 4 Quad）依然可以达到与之相当甚至更佳的性能。

MSM8960的实际表现比较令人惋惜。其实高通本来可以在能耗比上表现得更好，只是放弃采用HKMG技术的决定令工艺的优势大打折扣。骁龙S4虽然在工艺和架构上都进行了升级，能耗比的提升依然比不过单纯更换了新工艺的Cortex A9核心。

能耗比决定了一颗芯片的适用范围，以及它未来可能的发展方向和代价。MSM8960相对于Exynos 4 Quad平均能耗比低了大约40％，这意味着高通要实现相同的性能需要额外付出40％的功耗。如果三星愿意达到与高通同样的功耗，就可以实现更强的性能，可以说，拥有能耗比优势，就拥有了产品策略的主动权。

而这点在GPU上体现的更加明显。可以说，高通如果不能以五倍以上的幅度去提升Adreno系列GPU的能耗比，在未来高端手机竞争中将很有可能处于下风，因为游戏永远是硬件发展的最大推动力。事实也是如此，MSM8960虽然在日常使用中的确非常省电，但是在游戏中的发热却相当的大，APQ8064实现了超过两倍于现有的性能，如果需要消耗超过两倍于现有的功耗，那么对于最终产品而言，这款GPU无疑会成为一场灾难。我们看到APQ8064的官方开发套件第一次以平板的形式提供，高通对其的定位也是平板，这也从另一个方面说明了这颗芯片功耗可能不是太理想。

最后，不得不承认的是，Tegra3在这一轮竞争中综合表现确实与两位对手有一定差距，最大的遗憾就是落后工艺带来的巨大功耗。但是对于nVIDIA而言，Tegra3已经完成了它的历史使命，作为第一款问世的四核SoC，Tegra3牺牲了能耗换取的时间和价格优势已经让它成为了目前市场上最普遍的四核产品，从这点来看，我们似乎也不能过多的责怪它。

Tegra3的综合性能与骁龙S4表现互有胜负，只要厂家针对散热处理到位，这颗处理器在大尺寸手机或者平板上依然具备强大的竞争力。毕竟Tegra3的杀手锏是价格——不论是Exynos 4 Quad，还是MSM8960，或是即将问世的APQ8064，都不可能成为199美元级设备的核心，而Tegra3能。

无论如何，骁龙S4的处境都有些尴尬——半代架构换代积累的时间优势几乎被台积电不争气的工艺进度浪费殆尽，A9/A15混合结构带来的性能优势，又被对手加倍处理核心、使用最先进工艺等手段轻易抵消，属于典型的起了个大早，赶了个晚集。

尾声：螳螂捕蝉黄雀在后

谈到手机处理器，有一个巨大的影响因素我们永远无法忽视，那就是ARM本身。经过数年磨砺，ARM架构早已控制了智能手机市场大半江山，作为规则制定者，ARM的一举一动都将对市场产生强大影响。

不论是四核心Tegra3、猎户座，还是架构领先的骁龙S4，它们都将在半年后迎来强劲的挑战，那就是ARM全新一代移动处理器架构Cortex A15。根据目前零散的实际测试性能以及理论分析，Cortex A15不论是相对于Cortex A9还是Krait的提升都将非常明显，德州仪器（TI）的演示中甚至出现了单项测试中同频性能Cortex A15超越Cortex A9接近8倍的恐怖结果。

【OMAP5演示视频】

虽然现阶段Cortex A15的功耗暂时无法用于手机产品，但ARM已经宣布了一项名为big.LITTLE的技术，即用Cortex A15搭配低功耗处理器Cortex A7的方式，让程序和系统可以无缝的在两颗核心中切换，并利用Cortex A15的高性能与Cortex A7的高能源效率实现功耗和性能的平衡。

这个技术与Tegra3上采用的“4+1架构”很像，但是整合程度要深入的多，效果和适用范围自然也会大大提升。就目前的资料，下一代产品上，nVIDIA会继续开发自家的vSMP技术，而OMAP5已经确认整合的是Cortex M4而非A7，因此三星可能成为第一个将big.LITTLE技术带进现实的厂商。而高通则会比较头痛，因为骁龙S4已经出招完毕，而对手的绝招——Cortex A15还未到来。骁龙S4不仅要在明年继续作为当家花旦去面对Cortex A15的狂轰滥炸，甚至靠牺牲性能换来的功耗降低在big.LITTLE的面前也可能会黯然失色。

2012年注定是一个过渡之年，虽然三星、高通、nVIDIA都在今年拿出了新的旗舰SoC，但真正的大戏尚未上演。根据时间规划，nVIDIA将在2013年初推出基于Cortex A15的新一代SoC——Tegra4，而德州仪器公司在放弃了整个2012年后，也将在2012年底到2013年初推出基于Cortex A15的OMAP5产品线。至于三星，早在今年二季度就已经量产了世界上第一款Cortex A15处理器，即Exynos 5 Dual，在2012年底到2013年初这段时间很有可能会推出第二代Cortex A15 SoC。

ARM公司将Cortex A15称为“ARM架构有史以来最大的一次飞跃”，那些追求极致性能的用户可以暂时捂住自己的钱包，等到A15时代到来后再做决定。而对于实用主义者而言，现今的四核猎户座、Tegra3、骁龙S4都是不错的选择——最出彩的四核猎户座成本最高，综合表现较差的Tegra3却拥有无可比拟的价格优势，骁龙S4则刚好夹在中间，它们之间的胜负，将更多的取决于实际产品。

这个结果对于高通而言是难以接受的。很快，高通将推出新一代骁龙S4 Pro处理器APQ8064，它的四核心结构相当于把两个骁龙S4拼到了一起，集成的显示芯片也更新为Adreno 320，高通的意图很明显——用这块处理器竖立绝对性能优势，与NV、三星的四核A9产品划清界限。

你可能感兴趣的:(智能手机,arm架构)

飞思卡尔陀螺仪全面应用资料包坚持坚持那些年
本文还有配套的精品资源，点击获取简介：飞思卡尔陀螺仪基于MEMS技术，适用于角度和角速度测量，广泛应用于航姿参考系统、无人机、虚拟现实、智能手机等。该资料包汇集了中英文资料，涵盖飞思卡尔陀螺仪的工作原理、性能参数、接口通信协议和应用示例，旨在为用户提供一站式学习资源。本资料还介绍了ENC-03型号陀螺仪的特点，包括高精度测量、宽温度范围适用性、低功耗设计、快速响应能力和内置自检功能。通过学习这些资
中国MEMS产业尚处于起步阶段面临多方面挑战 weixin_34232617 嵌入式
目前全球MEMS市场规模已经逼近150亿美元，随着MEMS在可穿戴设备、VR/AR等消费类产品中应用渗透率高速增长的影响，美国MEMS市场实现平稳增长；欧洲MEMS市场也在汽车工业的带动下保持活力；亚太MEMS市场在智能手机、平板电脑、可穿戴设备等电子产品产量大幅提高的带动下，规模进一步扩大。相比之下，中国MEMS产业尚处于起步阶段，与连续三年高增长的市场不相匹配。旺盛的市场需求与相对薄弱的产业形
车载诊断架构 --- 诊断功能开发流程汽车电子实验室电子电器架构开发流程车载电子电气架构架构电子电气架构 ECU刷写与busoff原则电气电子架构开发的应对策略开发语言
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
车载软件架构---汽车电子软件 A-B分区汽车电子实验室车载电子电气架构电子电器架构开发流程汽车网络人工智能电子电器架构架构 A/B Bank AB分区
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：屏蔽力是信息过载时代一个人的特殊竞争力，任何消耗你的人和事，多看一眼都是你的不对。非必要不费力证明自己，无利益不试图说服别人，是精神上的节能减排。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的热情和定力。时间不知不觉中，快
第一部分：MySQL 基础与核心架构（第二节：存储引擎深度解析之 MySQL存储引擎选择策略） jarenyVO Mysql mysql 架构数据库
第一部分：MySQL基础与核心架构（第二节：存储引擎深度解析之MySQL存储引擎选择策略）文章目录第一部分：MySQL基础与核心架构（第二节：存储引擎深度解析之MySQL存储引擎选择策略）MySQL存储引擎选择策略深度解析一、存储引擎选择决策框架1.核心决策维度2.关键评估指标矩阵二、典型业务场景引擎选择策略1.电商系统2.内容管理系统3.金融系统三、性能与一致性权衡策略1.CAP理论应用2.读写
【RAG专题】如何选择合适的RAG架构？星际棋手人工智能
选择适合的RAG架构需结合自身业务需求、数据特点、性能要求等因素综合判断，以下是关键考量维度及对应架构选择建议：1.按数据规模与类型选择•小规模、单一类型数据（如纯文本文档库）：适合基础单阶段检索架构（检索模块+生成模块）。◦检索：用轻量级嵌入模型（如BGE-base、all-MiniLM）+简单向量数据库（如FAISS）。◦生成：搭配中小型LLM（如Llama2-7B、Mistral），无需复杂
2020-6-9晚间日记 Miss亚姐聊职业生涯成长
今天是什么日子起床：07:20就寝：23:00天气：晴心情：太阳任务清单今日完成的任务，最重要的三件事：1.组织架构调整拟定3.整理档案室+找档案4.解约函5.在职证明6.职级调整7.新建岗位+发录用8.入职办理学习·信息·阅读《跟汪涵学说话之道》阅读中～健康·饮食·锻炼早餐：燕麦片➕两片面包中餐：带饭晚餐：麦片➕酸奶工作·思考客户思维就是，怎么给对方呈现对方最容易理解，以及对方怎么最简单操作可以
汽车ECU控制器通信架构汽车电子实验室车载通信架构汽车架构汽车ECU控制器通信架构 web安全电子电气架构分布式
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
Python爬虫【四十七章】异步爬虫与K8S弹性伸缩：构建百万级并发数据采集引擎程序员_CLUB Python入门到进阶 kubernetes python 爬虫
目录一、背景与行业痛点二、核心技术架构解析2.1异步爬虫引擎设计2.2K8S弹性伸缩架构三、生产环境实践数据3.1性能基准测试3.2成本优化效果四、高级优化技巧4.1协程级熔断降级4.2预测式扩容五、总结Python爬虫相关文章（推荐）一、背景与行业痛点在数字经济时代，企业每天需要处理TB级结构化数据。某头部金融风控平台曾面临以下挑战：数据时效性：需实时采集10万+新闻源，传统爬虫系统延迟超12小
第一部分：MySQL 基础与核心架构（第二节：存储引擎深度解析之 InnoDB 架构与核心特性） jarenyVO Mysql mysql 架构数据库
第一部分：MySQL基础与核心架构（第二节：存储引擎深度解析之InnoDB架构与核心特性）文章目录第一部分：MySQL基础与核心架构（第二节：存储引擎深度解析之InnoDB架构与核心特性）一、InnoDB架构概述1.内存结构2.磁盘结构二、核心特性深度解析1.事务支持(ACID)2.多版本并发控制(MVCC)3.锁机制4.缓冲池优化5.双写缓冲区(DoubleWriteBuffer)三、关键性能优
SFBT（焦点解决法）改变你与孩子（十四）夏日凉凉
21天是一个人的养习惯养成期，心理学家研究发现，有意识的让自己执行新的想法，只要坚持21天就会对习惯产生影响，进而形成新的行为模式。SFBT就是焦点解决法，使用焦点解决法改变你与孩子之间的关系。第十四天，目标架构，帮助孩子找到方向找到灯塔-设定目标目标犹如灯塔般重要，若是没有目标，人就如迷失方向，随意飘荡，没有方向的谈话也不容易有成效。目标是咨询对象的目标，孩子想要的目标，不是助人者父母想要的目标
第1章：微服务架构概述 liangxh2010 架构微服务云原生
1.1传统单体架构vs微服务架构文字讲解在软件开发的早期阶段，单体架构（MonolithicArchitecture）是最主流的架构模式。在这种模式下，一个大型应用程序的所有功能模块（如用户界面、业务逻辑、数据访问层）都被打包在一个独立的单元中，通常是一个WAR或JAR文件。单体架构的优点：开发简单：所有代码都在一个项目中，易于管理和调试。部署直接：只需将单个应用包部署到服务器即可。单体架构的缺点
“AI多模态视频解析引擎：毫秒级智能解构视听内容，生成结构化语义图谱。“
产品介绍在数字化浪潮席卷全球的当下，视频数据以前所未有的速度爆发式增长，社交媒体、安防监控、交通管理等各个领域每天都在产生海量视频信息。这些视频数据如同蕴藏丰富宝藏的深海，蕴含着巨大价值，但如何高效挖掘其中关键信息，成为横亘在各行业面前的一道难题。多模态视频结构化系统，正是为解决这一痛点而生，凭借其强大的功能、前沿的技术和创新的架构，成为视频数据处理领域的革新者与引领者。一、核心功能详解（一）音频
推客系统”小程序全链路开发指南：从技术架构到爆发增长的核心方法论
一、行业背景与产品定位1.1社交电商的3大趋势流量去中心化：微信生态贡献超60%的社交电商GMV（2023年数据）推客经济崛起：头部平台超30%订单来自用户分享（如拼多多、京东芬香）小程序技术成熟：微信官方插件（如物流助手、分账系统）降低开发门槛1.2为什么选择小程序？天然裂变场景：微信社交关系链+即用即走体验成本优势：对比APP开发成本降低70%，迭代周期缩短50%商业化闭环：从获客→支付→售后
分销系统开发：从架构设计到核心功能实现全解析 ywyy6798 推客分销系统分销系统分销系统开发短剧分销系统聚合分销系统聚合分销系统开发系统开发
一、分销系统概述与市场价值分销系统作为现代电商生态的重要组成部分，已成为企业拓展销售渠道、实现裂变增长的关键工具。根据最新市场研究数据，2023年全球分销电商市场规模已达到1.2万亿美元，预计未来五年将保持18.7%的年复合增长率。1.1分销系统的商业价值分销系统的核心价值体现在三个维度：渠道拓展：通过多级分销网络快速覆盖目标市场成本优化：相比传统广告投放，分销模式具有更高的ROI（平均可达1:5
中原焦点团队焦点初级32期梁怡2021年12月26日坚持分享第39天怡_96d8
SFBT来说,开放式问句的运用乃使咨询师更能聚焦在当事人的参照架构之上，并能在回应当事人的关键用字下，试图从当事人身上引出相关细节，而扩大当事人的知觉领域。举例来说,咨询师不会用“是的……但是”(yes...but...)来回应当事人，而会以“是的……而且”(yesand-)的概念来连接当事人与自己语言的关系。更为可贵的是，当咨询师由衷地、好奇地使用开放式问句询问当事人时，咨询师已经将控制权和责任
【python】向AWS Dynamodb中插入数据
一、背景AWSDynamodb数据库在架构中起到的作用是配置数据库，s3上buckect_a-->bucket_b-->bucket_c对应着层与层之间的关系，总所周知，Dynamobd是非关系型数据库，数据插入的格式是键值对形式的二、代码importboto3importjsonimportpandasaspdAWS_ACCESS_KEY_ID=''AWS_SECRET_ACCESS_KEY='
大型网站技术架构演进与性能优化(四) 全球化下的网站演进：全球部署方案我是索隆系统架构性能优化系统架构性能优化
四、全球化下的网站演进：全球部署方案全球化部署需要解决以下几个问题：第一，业务核心单元的梳理。这些核心单元必须可以裁剪或添加。第二，核心单元必须可以快速部署到国防的机房，最好能够一键部署，即首先要实现单元化部署。第三，实现全球数据连通。第四，处于研发效率的考虑，部署在全球的业务系统要有良好的定制型和扩展性。1、国际化的背景国际化一般有两种类型：一种是进口业务，像天猫国际和全球购；一种是出口业务，像
Vue.js 全面解析：构建现代前端应用的渐进式框架斯~内克 vue知识点前端 vue.js
一、Vue.js的核心价值与演进1.1前端框架的变革与Vue的定位根据2024年StateofJS调查报告，Vue.js以82%的开发者满意度稳居前端框架前三甲。其核心优势体现在：渐进式架构：可从轻量级视图层扩展至全栈解决方案响应式系统：基于Proxy的精准依赖追踪（Vue3）组合式API：代码复用率提升60%以上生态系统：覆盖SSR、状态管理、移动端等20+场景1.2版本演进里程碑版本发布时间里
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
转行网络安全门槛高吗？网络安全零基础入门到精通，收藏这篇就够了 leah126 网络安全安全
在当前就业形势下，不少朋友面临转行的困境。网络安全作为一个热门领域，自然也吸引了许多人的目光。本文将就转行网络安全这一话题，提供一些切实可行的建议。网络安全行业概况网络安全涵盖了从基础的脚本编写到高级的漏洞研究等多个层面。该领域包括但不限于：渗透测试、漏洞评估、恶意软件分析、入侵检测、信息安全管理等。这些内容的复杂性不一，从基础的安全监控到复杂的安全架构设计都涉及其中。这就意味着，尽管有些领域可能
碰一碰发视频源码搭建：支持OEM 18538162800于音视频
在短视频交互场景日益丰富的当下，“碰一碰发视频”作为一种创新的近距离内容分享模式，正逐渐成为社交、营销、线下互动等场景的新载体。相较于标准化解决方案，定制化开发能让源码更好地适配特定业务场景，实现功能、性能与体验的精准匹配。本文将从技术架构、开发流程、核心定制方向等维度，详解碰一碰发视频源码搭建的定制化开发要点，为开发者提供实践参考。一、定制化开发的核心价值：从“能用”到“好用”碰一碰发视频的核心
全球化短剧平台全栈技术架构白皮书：多区域部署、智能分发与沉浸式体验的完整解决方案 ywyy6798 推客系统短剧小程序海外短剧短剧分销海外短剧系统开发短剧系统开发
一、全球化基础架构深度设计全球网络基础设施构建采用多活数据中心部署模式，在北美（弗吉尼亚）、欧洲（法兰克福）、亚太（新加坡）建立三大核心枢纽节点构建混合CDN网络，整合AWSCloudFront、Akamai、Fastly等主流CDN服务商，同时接入当地优质运营商CDN部署边缘计算节点网络，在全球200+边缘位置部署轻量级计算单元，实现用户请求的就近处理建立智能流量调度系统，基于实时网络状况监测数
聚合cps+cpa分销系统开发实战：覆盖多领域的CPS+CPA双模式技术架构解析
引言在数字经济时代，聚合分销系统通过整合CPS（按销售分成）与CPA（按行动付费）双模式，为短剧、小说、外卖、电商、网盘、APP拉新等领域提供了高效的商业变现解决方案。本文结合微服务架构、中台化设计及实战案例，深度解析该系统的技术实现与架构设计。系统架构设计微服务与中台化双引擎采用SpringCloudAlibaba框架构建分布式微服务架构，将系统拆分为8大核心服务：mermaidgraphTDA
微信推客系统小程序开发上线全攻略：从源码部署到社交裂变运营 v_qutudy 推客系统开发推客小程序
一、前言：为什么选择微信推客系统？在社交电商的浪潮中，微信推客系统凭借"自用省钱、分享赚钱"的裂变模式，成为商家低成本获客的利器。本文将深度解析如何从零开发一套支持独立部署的推客小程序，涵盖技术架构、源码解析、部署实战及运营策略，助力开发者快速搭建高转化率的社交电商系统。二、技术架构设计：打造稳定可扩展的推客系统1.整体架构分层前后端分离架构前端：采用Taro跨端框架开发微信小程序端，适配多端展示
淘宝商城四面（附架构面试专题）及B2C商城架构项目实战分享！风平浪静如码
一面主要问题如下（主要注重基础，问得很深很广，压力面试）：首先自我介绍数据结构算法的基本问题，如排序算法，二叉树遍历，后序遍历非递归，图的最短路径问题对一个数组进行绝对值排序的算法java中hashmap的底层实现java中垃圾回收机制GC原理等介绍自己的项目，数据库中用到的数据结构数据模型，死锁的概念（问的应该是数据库的死锁），如何避免死锁?乐观锁和悲观锁?一致性hash算法项目中业务对象的关联
软考热门科目全套学习资料启航挨踢软考资料整理笔记
软考热门科目学习资料免费分享，包括：系统集成项目工程师、数据库系统工程师、软件设计师、信息系统项目管理师、系统架构师等科目的教材、视频教程、历年真题，需要的小伙伴自取。资料来自互联网整理，如有侵权，请联系删除！通过百度网盘分享的文件：（软考中级）信息系统管理工程师链接:https://pan.baidu.com/s/1mCdZSIJHIDcd8g1TY3rAag?pwd=ywxd提取码:ywxd通
Animal Farm（13）云手a
Napoleonwasalarge，ratherfierce【adj.凶猛的；猛烈的；暴躁的】-lookingBerkshireboar，theonlyBerkshireonthefarm，notmuchofatalker，butwithareputation【n.名声，名誉；声望】forgettinghisownway.Snowballwasamorevivacious【】adj.活泼的；快活的
2.27叶武滨《时间管理》复盘欣欣然的关欣
我的收获：一，一事一日一生的视角没有反思的人生不值得过。反思需要有层次：1.对一件事反思，把想法转化成行动，通过三个问题。收集，分类，筛选，执行。先有意义再有条理。2.对一天的反思，日程与清单的架构。富兰克林晚十早五。日历的事必须做到，情景按周完成，要事优先的原则。3.对一生的反思。高空跑道。自下而上，运用4D原则。一生的纬度六个问句：我要做什么？我要的结果是什么？我的角色和职责是什么？我长期的目
Doris实战——拈花云科的数据中台实践吵吵叭火大数据 #Doris 数据仓库大数据
目录前言一、业务背景二、数据中台1.0—Lambda三、新架构的设计目标四、数据中台2.0—ApacheDoris4.1新架构数据流转4.2新架构收益五、新架构的落地实践5.1模型选择5.1.1Unique模型5.1.2Aggregate模型5.2资源管理5.3批量建表5.4计算实现5.4.1实时计算5.4.2准实时计算通过JavaUDF生成增量/全量数据基于Doris的大表优化DorisBork
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite