pizi0475

NVLink技术及影响解析

1繁华的背面

最新GPU架构Pascal，能自己开上舞台的Audi A7，超过700名与会专家学者及技术人员，近百场学术会议和科研分享，连续两晚的happy hour、酒会和GTC Party……在一片喧嚣和欢乐当中，2014年度的GTC大会降下了帷幕。对于GPU及并行运算相关领域的技术人员和科研工作者来说，GTC大会带给他们的也许是获得技术信息的满足感和充实的幸福，但对于普通的玩家和GPU爱好者而言，今年的GTC大会似乎有那么点……“不务正业”……

对于显卡爱好者而言，每年的GTC大会最期待的便是老黄那“饱含重料”的开幕式keynote，NVIDIA即将发布的各种新品，都将在keynote当中悉数登场。但除了多少有些遥远的Pascal架构之外，核弹元勋今年的keynote看上去都和桌面GPU关系不大。老黄花大力气铺陈的各种技术规范和标准，好像都是些超算啊工业啊科学研究啊之类的领域才会用到的东西，很难快速的引起GPU爱好者的共鸣。用我一位朋友的原话来形容，这届GTC“毫无新意，讲的都是些不着边际的事”。

难道是NVIDIA变了么？会不会是毫无压力的竞争态势让NVIDIA变得松懈和慵懒，进而失去了在GPU领域创新和开拓的动力呢？

看似不着边际的老黄Keynote——“CUDA EVERYWHERE”

我们曾经说过，相对于“NVIDIA正在做什么”，我们更应该关注“NVIDIA为什么要这样做”以及“NVIDIA即将做什么”。无论GTC的喧嚣还是“毫无新意”，甚至是老黄keynote的“不着边际”，背后所隐藏的真相才是需要被挖掘的。那么在今天的文字当中，就让我们一起来重新审视一下这届GTC大会的技术细节，看一看隐藏在“不着边际”背后的真相吧。

2西线无战事？

● 西线无战事？

平心而论，“毫无新意”这种描述似乎也不是完全有错，因为除了朦胧的Pascal架构之外，GTC2014技术大会乍看之下好像跟GPU没有任何直接的关联。莫名的不实感以及当前明显不对称的图形市场竞争环境，让大部分爱好者看待本届GTC大会的眼光中都带上了浓浓的“西线无战事”的意味——好一幅歌舞升平的景象啊，不仅没有新品，连新架构都是那么的云里雾里，难道是因为竞争对手的不给力，让NVIDIA放松了在图形领域和GPU架构层面的努力了么？

不如这样，让我们先回顾一下本届GTC大会上NVIDIA所公布的各项新技术和新的解决方案吧。

老黄现场展示的Pascal架构原型

GTC2014大会最重要组成部分便是开幕式的keynote，在这场主题为CUDA EVERYWHERE的Keynote分享当中，黄仁勋先生为与会者带来了包括NVLink、3D memory、Pascal架构、IRAY VCA、JETSON TK1、Erista GPU、基于Tegra的驾驶员辅助系统，还有新一代单卡双芯卡皇Titan Z。黄仁勋先生在现场展示了大量实物，其中就包括了Pascal架构产品的原型。

JETSON TK1为移动领域带来了CUDA解决方案

如果按照技术关联度划分，技术又可以被划分成三大部分，即GPU相关的NVLink、3D memory、Pascal架构和Titan Z，与运算及云渲染架构相关的集群解决方案IRAY VCA，以及与移动智能平台及SoC领域相关的JETSON TK1、Erista GPU和基于Tegra的驾驶员辅助系统。近2个小时的Keynote被几乎等分成了上述三个部分，彼此的比例是相当的。

密集云渲染解决方案IRAY VCA

如此一来，今年的GTC大会是不是“毫无新意”就应该算是一目了然了——NVIDIA仍旧在传统的GPU领域铺陈了不少于1/3的篇幅，用以介绍最新技术以及最新的图形/运算架构细节，这一比例与往届并未有明显不同，而且也完全可以说明NVIDIA的业务划分模式，那就是以桌面GPU架构技术为核心，向外分别辐射至大型化的HPC/工业高性能并行运算/大规模集群渲染平台以及小型化的移动智能/车载SoC平台。老黄并没有倦怠，NVIDIA也没有因为竞争环境的改变以及压力的松懈而停止对GPU技术及架构进步的推动。

那究竟是什么，让关注GTC大会的爱好者有了“毫无新意”的不实感呢？

由Tegra K1驱动的无人驾驶系统（点击查看原图）

一方面，老黄本次的Keynote内容衔接的确实不太理想，放在GPU架构后面的关于超级计算机集群逻辑能力训练的内容技术倾向过强而且名头太大，这部分内容用浓厚的技术和哲学色彩成功的达到了喧宾夺主的歪楼作用，与会者大多沉浸在人工智能及逻辑学相关的激烈思考当中，进而有意无意的忽略了之前关于GPU架构及技术的内容。另一方面，这届GTC大会上公布的最重要的新技术——NVLink以及3D memory，尤其是NVLink并没有得到进一步的深度解析，所有与会者都需要一番思考，才会发现这项技术背后的深意，以及它对未来GPU，乃至整个NVIDIA发展所带来的影响。

那么，究竟什么是NVLink？

3NVLink到底link了谁

● NVLink到底link了谁

在解析NVLink技术之前，简明的总览介绍是必须的。简单来说，这是一个能够在GPU-GPU以及GPU-CPU之间实现高速大带宽直连通讯的快速互联机制。

NVLink基于点对点传输形式，编程模式与PCIE总线相同，作为基本传输单元出现的“block”(区块)包含八条通道，每条通道20Gbps，每个block合计带宽20GB/s，这一带宽数值已经大大超出了PCIE 3.0的水平。不仅如此，多个block还可以组合在一起来达到提供更高带宽或者连接更多设备的目的。

NVLink技术

NVLink采用了中间接口(mezzanine connector)设计，这种接口多见于扩展子卡领域，著名的GeForce 7950 GX2以及GeForce GTX 295的两张PCB也是如此组装在一起的。这种接口能够提供更强的供电能力，但缺点是接口形式与PCIE不兼容，必须针对需求单独设计。这种不兼容还带来了一个麻烦，初期NVLink的部分指令和通讯过程仍旧要依赖PCIE，所以设计者必须在两者之间设计必要的联系机制。

NVLink的受众相当广泛，不仅可以依据不同需求完成GPU-GPU节点内部的高速互联，同时还能在GPU-CPU甚至CPU-CPU之间形成高速互联。它既可以像PCIE，也可以像QPI。所有多GPU并行工作的场合，无论是价值数亿美元的Tesla超级计算机集群还是桌面的SLI都将会从中获得更高的并行通讯带宽。与CPU直连的特性让其成为了未来沟通Denver和GPU架构，充当NV异构计算架构内部高速总线的备选互联方案。另外，它还能够在其他基于NVIDIA GPU+第三方CPU的异构并行计算架构当中充当互联方案。从作用上来看，它确实有取代PCIE总线的意味。

NVLink也可以作用于多GPU之间

NVLink的出现其实颇为令人玩味，因为NVIDIA本身是PCI-SIG的成员之一，PCIE总线虽然近年来确实受人诟病，但其32G的双向带宽在满足现有硬件及常规应用的需求时似乎并不困难。究竟是什么因素促使NVIDIA在此时放下手中的工作，尽心尽力的去开发一款高速互联解决方案呢？

来自NVIDIA自身的现实需求是NVLink出现的原因之一。早在2011年，NVIDIA便在CUDA4.0当中加入了GPUDirect2.0、Unified Virtual Addressing（CUDA UVA）以及Unified Memory Pool的概念，CUDA UVA允许多个GPU节点之间在一定程度上合并并共享彼此的显存空间，同时允许GPU直接访问并利用系统内存空间，这一系列操作都是通过PCIE总线来完成的。当某个GPU节点在应用中出现本地显存空间不足时（题外话：实际上单节点本地内存不足的现象在GPU大规模并行计算中相当常见，而且已经成了困扰并行化进程的一大瓶颈，亦即“存储墙”，无论NVIDIA的Tesla还是Intel的PHI都未能“免俗”，而包括3D memory技术在内的一系列堆叠式显存应用的出现，也有相当的应对该问题的意味。存储墙问题相对复杂，在此不多赘述。），它可以利用GPUDirect2.0特性，透过PCIE总线来使用和操作其他节点的显存以及系统主存。显而易见的，根据短板原则，即便此时系统主存还有其他节点显存的带宽能够达到几百乃至数千GB，该节点能够获得的有效带宽也依旧只能是PCIE总线带宽。越来越频繁的跨节点操作所催生的通信带宽需求，让NVIDIA有了开发NVLink来应对跨节点内存操作以及存储墙问题的需求。

受制于PCIE总线带宽的CUDA UVA

翻越存储墙并不是催生NVLink的全部理由，强大的外部压力和竞争态势同样是NVLink诞生的重要诱因。这一强大的外部压力，来自Intel。

4蓝色的阴影

● 蓝色的阴影

尽管老黄嘴上一直不肯承认，但对于目前的NVIDIA而言，眼前最大的对手已不再是昔日里硅谷斗士领导下的红色劲旅，而是一直高高在上的“另一位蓝色巨人”——Intel。两者的战场，也已经从单纯的HPC整体解决方案领域蔓延到了高性能并行计算节点层面。

Intel一直没有停止在逻辑结构层面的研发

随着大数据以及智慧城市概念的日趋火热，超大规模并行计算能力正日益受到各方的重视，甚至连五角大楼都跑来用EXA狠狠的刷了一把存在感。这是一个总量无法估算的庞大领域，其中所能够产生的资源和利润空间诱惑是任何一家半导体芯片供应商都无法抗拒的。当前HPC领域的需求大多集中在大规模并行计算层面，而Intel在该领域的竞争力，显然是毋庸置疑的。它不仅拥有完整的独立CPU以及CPU+GPU异构架构解决方案，其最新推出的PHI计算卡更是表现出了强悍的理论性能和实际效率。除此之外，Intel对HPC领域的投入也十分巨大，大量基于大规模并行计算的研究项目，背后都有Intel的身影。

IVY Town采用的新结构Ringbus

无独有偶，Intel也在积极改进自己的高速逻辑互联机制，在最新的ISSCC以及IEEE2014上，Intel详细展示了新一代ringbus技术。新的Ringbus改变了vring在多核心之间的布置和互联形式，通过路径优化达到了用最少的ring覆盖最多核心，并让数据在ring之间快速跳转的目的。这种新的Ringbus改善了多核心数据共享的延迟情况，提升了多核心并行运算时的整体任务效率，如果被应用在新一代PHI计算卡当中，将会使其运算效率得到进一步提升。

两种可能的新Ringbus互联模式（图片源自后藤弘茂先生）

与NVIDIA相比，尽管Intel也同样会面对来自存储墙的压力，但更为优秀的MC设计能力以及无图形负担等众多优势让其能够更为轻松的扩展PHI的本地内存容量，事实上Intel也确实正在做着这样的事，PHI多达8GB的本地显存在容量上是明显超过Tesla方案的。再加上Intel“天生”对PCIE总线的深入了解以及其所带来的优化可能，对于Intel而言，来自PCIE总线带宽的压力并没有NVIDIA那么紧迫和明显。它只需要做好运算效率的提升以及编程环境的改善，便可以让下一代计算卡解决方案保持良好的竞争力。

如适当应用新型Ringbus，新一代PHI的效率将进一步提升

显而易见，这样的竞争环境对于希望在HPC领域有一番作为的NVIDIA是不利并且压力巨大的。它不仅缺乏作为HPC基础的通用处理器节点解决方案，同时还受制于PCIE总线的困扰，如果不寻求一个突破口，无论EXA还是其他大规模高性能并行计算，NVIDIA的竞争力都将会受到影响。

要继续增强自身的竞争力，要在HPC领域承受来自Intel的，尤其是PHI的冲击，要解决包括存储墙在内的一系列问题，NVLink便是在这样的需求背景下诞生并于本届GTC大会上来到大家面前的。问题是这一技术要如何来增强NVIDIA的竞争力呢？我们已经解析过了，NVIDIA需要依赖其他通用CPU节点，而NVLink是一款能够沟通GPU以及CPU节点的互联机制，所以它背后所link的CPU节点，正是可以帮助NVIDIA填补处理器这一重要环节缺失的靠山。这位靠山，就是原教旨的蓝色巨人，IBM。

5合纵还是连横？

● 合纵还是连横

Intel，NVIDIA和IBM，这三位在HPC领域的态势以及彼此的关系其实是相当微妙的。它们不仅彼此竞争，同时也彼此依赖。

NVIDIA的新盟友——IBM

Intel曾经是传统意义上的CPU节点方案供应者，在并行计算兴起以及传统CPU节点的规模拓展遇到瓶颈之后，Intel凭借PHI完成了华丽的转身，眼下的Intel拥有完整的CPU节点、GPU节点异构解决方案。但由于缺乏生态环境的支持以及完全放弃了MMX/XMM/YMM等常规指令集，尽管拥有相对简便的软件平移和开发环境，可是PHI计算卡依旧缺乏业界的接纳。PHI计算卡出现之后一年时间里瞬间飙升但又马上归于沉寂的被关注度和装机总量，就是这种现状的最好说明。在这种情况下，Intel更多地还是要与NVIDIA的Tesla进行配合，共同打造满足客户需求的HPC解决方案。

IBM的处境更加尴尬，它曾经是HPC领域无可撼动的王者，基于Power架构的超级计算机集群代表了HPC领域运算效率的最高水平，同时也仍旧是Top500前列的常客，但IBM面前的瓶颈是非常明显的。尽管实际效率要明显高于异构方案，但纯CPU方案的痼疾，诸如难以释放规模、性能功耗比较低以及成本更高等缺点正在困扰着IBM，基于单纯CPU解决方案的超级计算机集群正变得稀少，在当前的HPC业界，能够更轻松的拓展规模，同时拥有良好性能功耗比的CPU+GPU异构解决方案是更受欢迎的，而暂时无法独立提供异构解决方案的IBM处境无疑是困难的。2014年第一季度利润同比下滑21%，应该已经或多或少的反映出了IBM当前的境遇。

基于Power7的超算虽然效率超高，但代价不菲

NVIDIA一直都是异构并行计算的忠实支持者，同时也已经凭借经营多年的CUDA生态体系建立了属于自己的GPU异构并行计算生态圈，这一生态圈的稳固度相当高，已经达到了足以暂时屏退Intel攻势的程度。但是NVIDIA的问题同样明显，那就是它只能提供GPU解决方案。无论是赖以完成调度管理工作的CPU节点，还是沟通异构架构的高速数据总线，NVIDIA都是不具备的。所以在当前的HPC业界，NVIDIA必须与其他CPU及高速总线供应商达成合作才能生存。

很明显，以三足鼎立之势而言，NVIDIA处在可以联合Intel与IBM当中的某一方的位置上，摆在NVIDIA面前的是一道合纵还是连横的选择题。而且就目前看来，这道选择题似乎并不难做——如果选择Intel，NVIDIA虽然可以在短期内避免同Intel“翻脸”并维持现有的相对稳定安逸的竞争环境，但无论PHI的威胁还是PCIE总线的限制显然都将会在IBM日渐式微之后被Intel当作反攻的利器。所以对于当前的NVIDIA来说，联合IBM共同对抗Intel，利用一切机会跳脱出能够被Intel制衡的环境，并且在保持必要独立性的前提下维持三足鼎立的相对均势，是当前环境下最理想的选择。而NVLink，就是这个选择的结果。

NVIDIA的异构解决方案离不开通用处理器

所以，我们看到了能够连接其他CPU节点的NVLink，同时看到的还有背后蓝色巨人的身影——IBM全程参与了NVLink的开发过程，并在GTC大会的同时以官方声明的方式宣布下一代Power架构将加入NVLink的支持，这也是NVIDIA加入OpenPower联盟以来最重要的一次实际行动。与蓝色巨人的联合，其实才是本届GTC大会最重要的猛料。

现在，您还会觉得NV已经西线无战事，整个GTC大会只说了一些“毫无新意”的东西么？

6再看无战事的西线

● 再看无战事的西线

NVLink技术无论对NVIDIA还是对IBM而言，都将产生相当深远的影响。它不仅改变了HPC领域原本三家各自为战的局面，同时也深远的影响了NVIDIA和IBM。

对于IBM而言，NVLink的出现为其打开了一扇快速且相对便捷的通往异构计算架构的大门。NVLink带来的NVIDIA GPU架构不仅让IBM无需投入大规模的资源进行新的GPU并行架构研发，而且还拥有了提供异构计算架构解决方案的能力。打通异构架构的联系不仅为IBM提供了一片更为广阔的市场和利润空间，Power架构的进入也为异构并行方案带来了更为高效的管理机制，这无论对于受困于CPU单线作战的IBM，还是受困于有效运算效率难以提升的异构并行运算界而言而言，无疑都是相当有利的前景。

有了NVLink，Power架构也有了异构计算的条件

对于NVIDIA来说，与IBM的合作为自己带来了更多可能性。它既可以以更深入的形式获得Intel之外的更为高效的通用处理器节点支持，又可以收获一条PCIE之外的全新的GPU高速互联机制，这在很大程度上减轻了NVIDIA对Intel的依赖性，同时增加了它的竞争筹码。在此基础上，聪明的NVIDIA也并没有彻底摒弃对PCIE总线的支持，NVLink与PCIE总线想通的编程模式以及部分共用的指令，都显示了NVIDIA试图平衡竞争态势，并在其中保持更多自由和弹性的意图。

突破CUDA生态环境的“包围”是Intel亟待努力的方向之一

Intel的处境同样发生了相应的变化，当自己的两个最重要对手联合在一起之后，先前Intel对IBM所拥有的CPU+GPU异构计算架构的优势将不再明显，NVIDIA对它的依赖也进一步减轻，在自己所面临的软件及开发生态环境相对欠缺的问题没有得到改善之前，Intel所面临的来自正面的竞争压力无疑将会变得更大。一个对手的能力有了提升，另一个对自己还有依赖的潜在对手现在也不在那么依赖自己，Intel的压力是可想而知的。可以预见，Intel势必会在未来继续加大自己在HPC领域的投入，推出更强大的PHI后续产品的同时开发更多更新且更有竞争力的技术。

AMD的状态也许真的让西线处在无战事的状态下，但很明显的，NVLink为我们带来了另一条战线的火药味。

7关联性问题

● 关联性问题

看到这里，也许您会认为我们今天所进行的还是一次“不着边际”的思考过程。在铺着了数千字的篇幅之后，GTC大会上所呈现的我们认为最重要的技术，好像还是一团跟桌面GPU以及显卡没什么直观联系的“阳春白雪”。“老黄这不还是因为AMD不给力而变得懈怠，变得不重视GPU和显卡了么？”

其实不然，NVLink技术以及整个NVIDIA的发展核心，其实依旧是与GPU以及显卡息息相关的。

NVLink与PCIE总线对比

首先，NVLink技术并不是一个“HPC only”的高端技术，它完全可以被用来强化现有的图形应用场景，其所带来的更大的GPU之间与CPU的互联带宽可以让SLI场合，尤其是多卡SLI以及单卡多芯场合从中获益。NVIDIA未来的单卡双芯卡皇，将有可能优先以NVLink作为卡上双芯通讯机制，先通过NVLink完成双芯通讯，然后再汇总至PCIE总线，会是未来单卡双芯解决方案的一个理想选择。

单显卡游戏应用目前对总线带宽的敏感程度虽然不及多卡，但随着更大尺寸材质的应用以及运算量的攀升，为桌面GPU提供更大带宽总线的需求迟早会出现，NVLink显然是理想的选择。不过话分两头，如何在桌面推广NVLink技术，或者尽可能的将其同当前的PCIE总线结合在一起，是这一切实现的基础。

集成NVLink技术的Pascal架构

接下来，NVLink技术对NVIDIA接下来的GPU架构同样有着重要的价值。异构结构和Project Denver是NVIDIA GPU架构发展的两个重要节点，NVLink的出现为两者的结合带来了一种新的互联选择。如果NVIDIA能够提供高于现有Xbar方案的带宽/晶体管比例，那么NVLink在GPU内部充当ALU团簇同LOC之间的互联总线，将会是一个相当不错的选择。

NVLink同样可以为Tegra提供帮助

最后，NVLink还为NVIDIA的Tegra以及移动GPU带来了更多可能性，无论是ARM还是Denver处理器，都将可以通过NVLink连接到新一代架构移动GPU上。NVIDIA对自有总线的优化，无疑将会进一步提升未来Tegra处理器的效率和竞争力。

随着完整版Maxwell架构的临近以及Pascal架构的公布，NVIDIA正式进入单GPU异构结构的步伐正在加快。NVLink技术的出现，无疑给NVIDIA未来的GPU架构及显卡产品带来了更多可能。

8绿色的未来

● 绿色的未来

至此，您还会觉得老黄在GTC2014上的表现是因为西线无战事而导致的不务正业么？NVIDIA并没有因为竞争环境的松懈而跟着松懈。也许AMD确实已经无法在对NVIDIA的GPU架构研发施加有效的压力，但技术的进步依旧在NVIDIA内部不断的出现着。

并未“不务正业”的GTC2014

诚然，也许催生这些进步的动力并非直接来自桌面及图形领域的需求，但来自HPC及大规模并行计算领域的推动同样可以有效的促进NVIDIA推进技术的前行。运算和图形本就是一家，DirectX 11出现之后，两者间原本无奈的界限已经变得模糊，而且还将在未来变得更加模糊。图形操作和运算将越来越多的建立在大规模并行化运算的基础之上，图形就是运算，运算就是图形。以并行运算为基础进行的技术进步，将会越来越直接且方便的为显卡进步带来好处。

原教旨的并行化计算

其实不用提什么API和操作，只要我们以稍微宏观一些的眼光去看待现有的超级计算机集群，将其中的每一颗CPU及每一块计算卡都看做是一个点，就会很方便的发现它们与单颗GPU之间的相似性。大量计算节点的并行多任务处理过程，与大量ALU的并行多线程处理在数学模型上存在很多等价的部分，针对大规模并行计算架构进行的开发，是不可能对早已基于大规模并行架构进行设计的GPU产生不了影响的。

值得期待的Pascal

无论进步的动力源自何处，NVIDIA继续推动GPU架构及相关技术进步的努力应该都不会停止。不断提升GPU架构的性能功耗比以及绝对性能，在未来相当长一段时间内都将成为NVIDIA的核心任务。NVLink技术所带来的更大规模的带宽以及更高效的节点通讯能力显然有助于这一目标的实现，而且还能改变HPC及其他领域的一系列竞争格局的变化。这样富有积极意义的技术出现在GTC技术大会当中，我想应该可以被当做NVIDIA“诚意”的表现了。

同样值得期待的NVIDIA

NVLink等本届GTC大会上释出的技术，大多会在Maxwell之后的Pascal架构当中正式来到众人的面前。没有展示更多完整版Maxwell架构的细节是本届GTC大会的一大遗憾，但技术的进步以及未来业界格局的变化仍然给我们带来了许多新的希望。大家稍安勿躁，让我们一起期待这些进步和变化的到来吧。

作为视觉计算的龙头公司——NVIDIA，每年都会举办盛大的GTC盛会，但在盛会之后我们进入了深深的思考，这样的技术、那样的产品，有着怎样的意义？且听本文作者为你一一道来。

林光楠

你可能感兴趣的:(技术理论,其它文章,硬件相关,GPU)

Blender 云渲染高效流程：渲染 101 集群加速实战渲染101专业云渲染 blender houdini 分布式服务器 maya
一、核心优势：适配Blender全场景需求✅全渲染器深度兼容Cycles（CPU/GPU模式）：云端4090显卡渲染速度比本地快12倍，支持8K分辨率+16K纹理无压力Eevee实时渲染：集群同步输出预览动画，帧间延迟控制在0.5秒内，迭代效率提升300%插件无缝衔接：自动适配GeoNodes节点树、Hair粒子系统，流体模拟缓存文件完整同步✅效率与成本双突破二、5步上云流程（新手友好版）文件预处
【科研绘图系列】R语言绘制配对散点图连线柱状图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制配对散点图连线柱状图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
【科研绘图系列】R语言绘制柱状散点连线图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制柱状散点连线图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
PyTorch的基础概念和复杂模型的基本使用香蕉可乐荷包蛋 AI大模型项目中的使用 pytorch 人工智能 python
文章目录一、PyTorch基础概念二、复杂模型的学习使用一、PyTorch基础概念张量（Tensor）操作：张量是PyTorch中的基本数据结构，类似于NumPy的数组，但支持GPU加速常见操作包括创建张量、张量运算、索引、切片等importtorch#创建张量x=torch.randn(3,4)y=torch.zeros(3,4)#张量运算z=x+y自动求导（Autograd）：PyTorch的
python3.9安装tensorflow-gpu 2.6.0和torch-gpu版本各依赖包的版本对应关系
首先使用的cuDNN（8.1）、CUDA（11.2）、tensorflow-gpu（2.6.0）、python（3.9）之间对应版本Window环境下安装pytorch下载地址tensorflow官网CUDA下载官网cuDNN下载官网注意：cuDNN需要注册absl-py0.15.0astunparse1.6.3cachetools5.3.2certifi2023.7.22charset-norm
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
Docker build ollama longze_7 ollama docker
dockerrun-d--gpus=all-vollama:/root/.ollama-p11434:11434--networkbridge--nameollamaollama/ollama
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
统一内存架构的可行性与科学性恣艺架构
1.统一内存架构的技术定义与演进1.1核心概念与实现机制苹果的统一内存架构（UMA）通过将内存直接集成于SoC（系统级芯片），使CPU、GPU、神经引擎等计算单元共享同一物理内存池。其关键技术包括：内存池化与动态分配：内存控制器实时调配资源，消除传统架构中CPU/GPU间的数据复制开销。硅中介层互联：计算单元与内存通过硅中介层（SiliconInterposer）直连，提供800GB/s的超高带宽
内存泄漏系列专题分析之二十九：高通相机CamX--Android通用GPU内存分配和释放原理一起搞IT吧内存泄漏和内存占用拆解系列专题数码相机 android 图像处理
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：内存泄漏系列专题分析之二十九：高通相机CamX--Android通用GPU内存分配和释放原理目录一、背景二、：Android通用GPU内存分配和释放原理2.1：用户态GPU内存分配2.2：内核态GPU内存分配2.3：kgslioctlgpumemalloc分析2.4：gpumemallocentry分析2.5：内核态GP
QuACK：用纯 Python 把 H100 推到“光速” 吴脑的键客人工智能 python 开发语言 gpu算力
FlashAttention的共同作者TriDao与普林斯顿大学的两位博士生最近联合推出了一个名为QuACK的新内核库。这一创新的内核库引起了广泛关注，尤其是在高性能计算领域。QuACK的开发背景QuACK的开发完全基于Python和CuTe-DSL，令人瞩目的是，它不涉及任何CUDAC++代码。这一设计理念打破了传统的编程框架，使得开发者能够在更友好的环境中进行高效的GPU编程。性能优势在强大的
基于AutoCut实现在文档中按照片段剪辑视频 Mr数据杨 Python 音频技术音视频
本项目致力于通过构建一个具备深度学习支持的多功能视频处理环境，为用户提供高效、智能的视频编辑和字幕生成工具。依托Anaconda环境管理工具和PyTorch的GPU加速能力，用户能够迅速搭建一个符合项目需求的Python环境。结合FunClip的源代码以及相关插件的安装和配置，用户可充分利用项目所支持的图像、音频识别功能，并以极少的配置便获得理想的视频裁剪效果。项目的核心在于简化深度学习项目的环境
常用显卡命令 Mr.小海 Linux linux 机器学习人工智能深度学习服务器
常用显卡命令1.查看显卡基本信息lspci|grep-invidia2.查看显卡驱动版本不更新：nvidia-smi-a每秒更新：watch-n1nvidia-smi3.查看gpu使用情况nvidia-smi4.动态查看gpu使用情况watch-n1nvidia-smi5.查看谁正在使用GPUpsaux|grep30856.打开系统监视器，快捷键：winctrl+alt+del：gnome-sys
阿里云产品介绍
阿里云产品相关计算：云服务器ECS、云虚拟机、GPU云服务器网络：负载均衡SLB、弹性公网IP、专有网络VPC、CDN（CDN通过将内容缓存到全球分布的多个边缘节点（EdgeNodes）上，使用户可以从离自己最近的节点获取内容，从而减少网络延迟，提升访问速度）存储：块存储EBS（ElasticBlockStorage）、对象存储OSS（ObjectStorageService）、文件存储NAS数据
第 20 课时：GPU 管理和 Device Plugin 工作机制（车漾）阿里云云原生 CNCF X 阿里巴巴云原生技术公开课阿里云 Kubernetes CNCF 专家团队 CNCF 专家团队 CNCF 专家团队 Kubernetes
本文将主要分享以下几个方面的内容：需求来源GPU的容器化Kubernetes的GPU管理工作原理课后思考与实践需求来源2016年，随着AlphaGo的走红和TensorFlow项目的异军突起，一场名为AI的技术革命迅速从学术圈蔓延到了工业界，所谓AI革命从此拉开了帷幕。经过三年的发展，AI有了许许多多的落地场景，包括智能客服、人脸识别、机器翻译、以图搜图等功能。其实机器学习或者说是人工智能，并不是
Docker 与 GPU 训练 wydxry docker 容器运维
以下是Docker与GPU训练相关的核心命令和操作指南，涵盖容器启动、资源监控和调试技巧：1.启用GPU支持的Docker安装NVIDIA容器工具包（必须步骤）#添加源并安装distribution=$(./etc/os-release;echo$ID$VERSION_ID)\&&curl-s-Lhttps://nvidia.github.io/nvidia-docker/gpgkey|sudoa
2025-04-22| Docker: --privileged参数详解
在Docker中，--privileged是一个运行容器时的标志，它赋予容器特权模式，大幅提升容器对宿主机资源的访问权限。以下是--privileged的作用和相关细节：作用完全访问宿主机的设备：容器可以访问宿主机的所有设备（如/dev下的设备文件，包括GPU、USB设备等）。例如，容器可以直接操作宿主机的磁盘、分区或硬件设备。绕过权限限制：容器内的进程以接近宿主机root用户的权限运行，忽略许多
Android 异构计算与 OpenCL/CUDA/OpenVX 的协同方式实战解析观熵国产 NPU ×Android 推理优化 android 人工智能
Android异构计算与OpenCL/CUDA/OpenVX的协同方式实战解析关键词Android异构计算、OpenCL、CUDA、OpenVX、GPU加速、NPU调度、HSA架构、神经网络推理、计算图编排、SoC协同处理、AI芯片编程摘要随着国产SoC平台持续迭代，Android系统中异构计算模式已从传统CPU+GPU并行计算，扩展到集成NPU、DSP、ISP等多核单元的复杂协同体系。在AI推理
AI大模型训练的云原生实践：如何用Kubernetes指挥千卡集群？
当你的团队还在手动拼装显卡集群时，聪明人早已教会Kubernetes自动调度千卡。就像交响乐团需要指挥家，万级GPU需要云原生调度艺术。深夜的机房，硬件工程师老张盯着监控屏上跳动的红色警报——手工组装的千卡集群再次因单点故障崩溃。而隔壁团队通过Kubernetes调度的百卡集群，训练效率竟高出他们47%。这不是魔法，而是云原生调度的降维打击。一、千卡训练：为什么传统方法行不通？想象指挥没有乐谱的千
【科研绘图系列】R语言绘制分组直方图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制分组直方图加载R包library(ggplot2)library(ggpubr)rm(list=ls())options(stringsAsFactors=F)</
探索OpenCV 3.2源码：计算机视觉的架构与实现轩辕姐姐
本文还有配套的精品资源，点击获取简介：OpenCV是一个全面的计算机视觉库，提供广泛的功能如图像处理、对象检测和深度学习支持。OpenCV3.2版本包含了改进的深度学习和GPU加速特性，以及丰富的示例程序。本压缩包文件提供了完整的OpenCV3.2源代码，对于深入学习计算机视觉算法和库实现机制十分宝贵。源码的模块化设计、C++接口、算法实现、多平台支持和性能优化等方面的深入理解，都将有助于开发者的
GPU网络运维一行代码通万物网络运维 GPU
一、GPU网络架构与核心技术GPU集群网络需适配分布式训练中“多节点数据同步”（如all-reduce、broadcast）的高频、大流量需求，主流技术方案及特点如下：网络技术核心优势适用场景运维重点InfiniBand低延迟（~1us）、高带宽（400Gb/s）、原生RDMA支持超大规模集群（≥1000节点）、千亿参数模型训练子网管理、固件兼容性、链路健康RoCE（RDMAoverConverg
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
Qt/C++音视频开发22-通用GPU显示 feiyangqingyun Qt/C++音视频开发 Qt视频监控 Qt音视频 Qt硬解码
一、前言采用GPU来绘制实时视频一直以来都是个难点，如果是安防行业的做视频监控开发这块的人员，这个坎必须迈过去，本人一直从事的是安防行业的电子围栏这个相当小众的细分市场的开发，视频监控这块仅仅是周边技术玩一玩探讨一下，关于GPU绘制这块着实走了不少的弯路。之前用ffmpeg解码的时候，已经做了硬解码的处理，比如支持qsv、dxva2、d3d11va等方式进行硬解码处理，但是当时解码出来以后，还是重
『大模型笔记』Geoffrey Hinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！ AI大模型前沿研究大模型笔记大模型人工智能 Hinton llya 大语言模型多模态大脑工作方式
GeoffreyHinton对Al研究人才选拔的直觉，未来影响及技术展望的深入见解！文章目录一.整个访谈内容1.1.起点：理解大脑的工作方式以及隐藏层命名的由来1.2.谈Ilya：他有很好的直觉1.3.预测下一个词也需要推理1.4.模型能从语言中学到很多，但从多模态中学习会更容易1.5.关于认知的三种观点1.6.黄仁勋送了我一块GPU1.7.数字系统有人类无法比拟的优势1.8.需要得到重视的快速权
UGUI 性能优化系列：第三篇——渲染与像素填充率优化吉良吉影NeKoSuKi 性能优化 unity 游戏引擎 c#开发语言
在UnityUGUI性能优化之旅中，我们已经学习了基础的资源管理和Canvas与UI元素的管理。现在，我们将把目光转向更深层次的渲染层面，特别是如何优化像素填充率（PixelFillRate）。在这个环节中，Overdraw（过度绘制）是一个我们必须理解和解决的关键问题，因为它直接关系到GPU的工作效率。一、Overdraw（过度绘制）的危害与检测1.什么是Overdraw？为什么会影响性能？想象
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
如何在 Linux 上安装 RTX 5090 / 5080 /5070 Ti / 5070 驱动程序 — 详细指南知识大胖 NVIDIA GPU和大语言模型开发教程 linux 运维服务器
简介为了获得最佳性能，您需要在Linux上运行5090/5080/5070Ti/5070或其他50系列GPU（或Windows上的WSL）。这篇文章将包含有关如何操作的详细指南。主线内核和驱动程序怪癖之旅Nvidia50系列GPU拥有最新的Nvidia技术。但是，新硬件需要一些新软件或更新，这需要一些耐心。如果您在这里，您可能会遇到Ubuntu默认设置的障碍。不要害怕！我最近自己摸索了这个迷宫，结
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少