chirnson

深入数据库索引背后算法及数据结构

1.索引的本质

MySQL官方对索引的定义为：索引（Index）是帮助MySQL高效获取数据的数据结构。提取句子主干，就可以得到索引的本质：索引是数据结构。

我们知道，数据库查询是数据库的最主要功能之一。我们都希望查询数据的速度能尽可能的快，因此数据库系统的设计者会从查询算法的角度进行优化。最基本的查询算法当然是顺序查找（linear search），这种复杂度为O(n)的算法在数据量很大时显然是糟糕的，好在计算机科学的发展提供了很多更优秀的查找算法，例如二分查找（binary search）、二叉树查找（binary tree search）等。如果稍微分析一下会发现，每种查找算法都只能应用于特定的数据结构之上，例如二分查找要求被检索数据有序，而二叉树查找只能应用于二叉查找树上，但是数据本身的组织结构不可能完全满足各种数据结构（例如，理论上不可能同时将两列都按顺序进行组织），所以，在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法。这种数据结构，就是索引。

看一个例子：

图1

图1展示了一种可能的索引方式。左边是数据表，一共有两列七条记录，最左边的是数据记录的物理地址（注意逻辑上相邻的记录在磁盘上也并不是一定物理相邻的）。为了加快Col2的查找，可以维护一个右边所示的二叉查找树，每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针，这样就可以运用二叉查找在O(log2n)的复杂度内获取到相应数据。

虽然这是一个货真价实的索引，但是实际的数据库系统几乎没有使用二叉查找树或其进化品种红黑树（red-black tree）实现的，原因会在下文介绍。

2. B-Tree索引的相关概念

目前大部分数据库系统及文件系统都采用B-Tree或其变种B+Tree作为索引结构，在本文的下一节会结合存储器原理及计算机存取原理讨论为什么B-Tree和B+Tree在被如此广泛用于索引，这一节先单纯从数据结构角度描述它们。

索引与表一样，也属于段（segment）的一种。里面存放了用户的数据，跟表一样需要占用磁盘空间。只不过，在索引里的数据存放形式与表里的数据存放形式非常的不一样。在理解索引时，可以想象一本书，其中书的内容就相当于表里的数据，而书前面的目录就相当于该表的索引。同时，通常情况下，索引所占用的磁盘空间要比表要小的多，其主要作用是为了加快对数据的搜索速度，也可以用来保证数据的唯一性。但是，索引作为一种可选的数据结构，你可以选择为某个表里的创建索引，也可以不创建。这是因为一旦创建了索引，就意味着mysql对表进行DML（包括INSERT、UPDATE、DELETE）时，必须处理额外的工作量（也就是对索引结构的维护）以及存储方面的开销。所以创建索引时，需要考虑创建索引所带来的查询性能方面的提高，与引起的额外的开销相比，是否值得。 从物理上说，索引通常可以分为：分区和非分区索引、常规B树索引、位图（bitmap）索引、翻转（reverse）索引等。其中，B树索引属于最常见的索引，由于我们的这篇文章主要就是对B树索引所做的探讨，因此下面只要说到索引，都是指B树索引。

B树索引是一个典型的树结构，其包含的组件主要是：

1)      叶子节点（Leaf node）：包含条目直接指向表里的数据行。
2)      分支节点（Branch node）：包含的条目指向索引里其他的分支节点或者是叶子节点。
3)      根节点（Root node）：一个B树索引只有一个根节点，它实际就是位于树的最顶端的分支节点。

可以用下图一来描述B树索引的结构。其中，B表示分支节点，而L表示叶子节点。

对于分支节点块（包括根节点块）来说，其所包含的索引条目都是按照顺序排列的（缺省是升序排列，也可以在创建索引时指定为降序排列）。每个索引条目（也可以叫做每条记录）都具有两个字段。第一个字段表示当前该分支节点块下面所链接的索引块中所包含的最小键值；第二个字段为四个字节，表示所链接的索引块的地址，该地址指向下面一个索引块。在一个分支节点块中所能容纳的记录行数由数据块大小以及索引键值的长度决定。比如从上图一可以看到，对于根节点块来说，包含三条记录，分别为（0 B1）、（500 B2）、（1000 B3），它们指向三个分支节点块。其中的0、500和1000分别表示这三个分支节点块所链接的键值的最小值。而B1、B2和B3则表示所指向的三个分支节点块的地址。
对于叶子节点块来说，其所包含的索引条目与分支节点一样，都是按照顺序排列的（缺省是升序排列，也可以在创建索引时指定为降序排列）。每个索引条目（也可以叫做每条记录）也具有两个字段。第一个字段表示索引的键值，对于单列索引来说是一个值；而对于多列索引来说则是多个值组合在一起的。第二个字段表示键值所对应的记录行的ROWID，该ROWID是记录行在表里的物理地址。如果索引是创建在非分区表上或者索引是分区表上的本地索引的话，则该ROWID占用6个字节；如果索引是创建在分区表上的全局索引的话，则该ROWID占用10个字节。

知道这些信息以后，我们可以举个例子来说明如何估算每个索引能够包含多少条目，以及对于表来说，所产生的索引大约多大。对于每个索引块来说，缺省的PCTFREE为10％，也就是说最多只能使用其中的90％。同时9i以后，这90％中也不可能用尽，只能使用其中的87％左右。也就是说，8KB的数据块中能够实际用来存放索引数据的空间大约为6488（8192×90％×88％）个字节。假设我们有一个非分区表，表名为warecountd，其数据行数为130万行。该表中有一个列，列名为goodid，其类型char（8），那么也就是说该goodid的长度为固定值：8。同时在该列上创建了一个B树索引。在叶子节点中，每个索引条目都会在数据块中占一行空间。每一行用2到3个字节作为行头，行头用来存放标记以及锁定类型等信息。同时，在第一个表示索引的键值的字段中，每一个索引列都有1个字节表示数据长度，后面则是该列具体的值。那么对于本例来说，在叶子节点中的一行所包含的数据大致如下图二所示：

从上图可以看到，在本例的叶子节点中，一个索引条目占18个字节。同时我们知道8KB的数据块中真正可以用来存放索引条目的空间为6488字节，那么在本例中，一个数据块中大约可以放360（6488/18）个索引条目。而对于我们表中的130万条记录来说，则需要大约3611（1300000/360）个叶子节点块。

而对于分支节点里的一个条目（一行）来说，由于它只需保存所链接的其他索引块的地址即可，而不需要保存具体的数据行在哪里，因此它所占用的空间要比叶子节点要少。分支节点的一行中所存放的所链接的最小键值所需空间与上面所描述的叶子节点相同；而存放的索引块的地址只需要4个字节，比叶子节点中所存放的ROWID少了2个字节，少的这2个字节也就是ROWID中用来描述在数据块中的行号所需的空间。因此，本例中在分支节点中的一行所包含的数据大致如下图三所示：

从上图可以看到，在本例的分支节点中，一个索引条目占16个字节。根据上面叶子节点相同的方式，我们可以知道一个分支索引块可以存放大约405（6488/16）个索引条目。而对于我们所需要的3611个叶子节点来说，则总共需要大约9个分支索引块。

这样，我们就知道了我们的这个索引有2层，第一层为1个根节点，第二层为9个分支节点，而叶子节点数为3611个，所指向的表的行数为1300000行。但是要注意，在oracle的索引中，层级号是倒过来的，也就是说假设某个索引有N层，则根节点的层级号为N，而根节点下一层的分支节点的层级号为N-1，依此类推。对本例来说，9个分支节点所在的层级号为1，而根节点所在的层级号为2。

3. 为什么使用B-Tree ?

上文说过，红黑树等数据结构也可以用来实现索引，但是文件系统及数据库系统普遍采用B-/+Tree作为索引结构，这一节将结合计算机组成原理相关知识讨论B-/+Tree作为索引的理论基础。

一般来说，索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储的磁盘上。这样的话，索引查找过程中就要产生磁盘I/O消耗，相对于内存存取，I/O存取的消耗要高几个数量级，所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘I/O操作次数的渐进复杂度。换句话说，索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。下面先介绍内存和磁盘存取原理，然后再结合这些原理分析B-/+Tree作为索引的效率。

主存存取原理

目前计算机使用的主存基本都是随机读写存储器（RAM），现代RAM的结构和存取原理比较复杂，这里本文抛却具体差别，抽象出一个十分简单的存取模型来说明RAM的工作原理。

图5

从抽象角度看，主存是一系列的存储单元组成的矩阵，每个存储单元存储固定大小的数据。每个存储单元有唯一的地址，现代主存的编址规则比较复杂，这里将其简化成一个二维地址：通过一个行地址和一个列地址可以唯一定位到一个存储单元。图5展示了一个4 x 4的主存模型。

主存的存取过程如下：

当系统需要读取主存时，则将地址信号放到地址总线上传给主存，主存读到地址信号后，解析信号并定位到指定存储单元，然后将此存储单元数据放到数据总线上，供其它部件读取。

写主存的过程类似，系统将要写入单元地址和数据分别放在地址总线和数据总线上，主存读取两个总线的内容，做相应的写操作。

这里可以看出，主存存取的时间仅与存取次数呈线性关系，因为不存在机械操作，两次存取的数据的“距离”不会对时间有任何影响，例如，先取A0再取A1和先取A0再取D3的时间消耗是一样的。

磁盘存取原理

上文说过，索引一般以文件形式存储在磁盘上，索引检索需要磁盘I/O操作。与主存不同，磁盘I/O存在机械运动耗费，因此磁盘I/O的时间消耗是巨大的。

图6是磁盘的整体结构示意图。

图6

一个磁盘由大小相同且同轴的圆形盘片组成，磁盘可以转动（各个磁盘必须同步转动）。在磁盘的一侧有磁头支架，磁头支架固定了一组磁头，每个磁头负责存取一个磁盘的内容。磁头不能转动，但是可以沿磁盘半径方向运动（实际是斜切向运动），每个磁头同一时刻也必须是同轴的，即从正上方向下看，所有磁头任何时候都是重叠的（不过目前已经有多磁头独立技术，可不受此限制）。

图7是磁盘结构的示意图。

图7

盘片被划分成一系列同心环，圆心是盘片中心，每个同心环叫做一个磁道，所有半径相同的磁道组成一个柱面。磁道被沿半径线划分成一个个小的段，每个段叫做一个扇区，每个扇区是磁盘的最小存储单元。为了简单起见，我们下面假设磁盘只有一个盘片和一个磁头。

当需要从磁盘读取数据时，系统会将数据逻辑地址传给磁盘，磁盘的控制电路按照寻址逻辑将逻辑地址翻译成物理地址，即确定要读的数据在哪个磁道，哪个扇区。为了读取这个扇区的数据，需要将磁头放到这个扇区上方，为了实现这一点，磁头需要移动对准相应磁道，这个过程叫做寻道，所耗费时间叫做寻道时间，然后磁盘旋转将目标扇区旋转到磁头下，这个过程耗费的时间叫做旋转时间。

局部性原理与磁盘预读

由于存储介质的特性，磁盘本身存取就比主存慢很多，再加上机械运动耗费，磁盘的存取速度往往是主存的几百分分之一，因此为了提高效率，要尽量减少磁盘I/O。为了达到这个目的，磁盘往往不是严格按需读取，而是每次都会预读，即使只需要一个字节，磁盘也会从这个位置开始，顺序向后读取一定长度的数据放入内存。这样做的理论依据是计算机科学中著名的局部性原理：

当一个数据被用到时，其附近的数据也通常会马上被使用。

程序运行期间所需要的数据通常比较集中。

由于磁盘顺序读取的效率很高（不需要寻道时间，只需很少的旋转时间），因此对于具有局部性的程序来说，预读可以提高I/O效率。

预读的长度一般为页（page）的整倍数。页是计算机管理存储器的逻辑块，硬件及操作系统往往将主存和磁盘存储区分割为连续的大小相等的块，每个存储块称为一页（在许多操作系统中，页得大小通常为4k），主存和磁盘以页为单位交换数据。当程序要读取的数据不在主存中时，会触发一个缺页异常，此时系统会向磁盘发出读盘信号，磁盘会找到数据的起始位置并向后连续读取一页或几页载入内存中，然后异常返回，程序继续运行。

B-/+Tree索引的性能分析

到这里终于可以分析B-/+Tree索引的性能了。

上文说过一般使用磁盘I/O次数评价索引结构的优劣。先从B-Tree分析，根据B-Tree的定义，可知检索一次最多需要访问h个节点。数据库系统的设计者巧妙利用了磁盘预读原理，将一个节点的大小设为等于一个页，这样每个节点只需要一次I/O就可以完全载入。为了达到这个目的，在实际实现B-Tree还需要使用如下技巧：

每次新建节点时，直接申请一个页的空间，这样就保证一个节点物理上也存储在一个页里，加之计算机存储分配都是按页对齐的，就实现了一个node只需一次I/O。

B-Tree中一次检索最多需要h-1次I/O（根节点常驻内存），渐进复杂度为O(h)=O(logdN)。一般实际应用中，出度d是非常大的数字，通常超过100，因此h非常小（通常不超过3）。

综上所述，用B-Tree作为索引结构效率是非常高的。

而红黑树这种结构，h明显要深的多。由于逻辑上很近的节点（父子）物理上可能很远，无法利用局部性，所以红黑树的I/O渐进复杂度也为O(h)，效率明显比B-Tree差很多。

上文还说过，B+Tree更适合外存索引，原因和内节点出度d有关。从上面分析可以看到，d越大索引的性能越好，而出度的上限取决于节点内key和data的大小：

dmax=floor(pagesize/(keysize+datasize+pointsize))
floor表示向下取整。由于B+Tree内节点去掉了data域，因此可以拥有更大的出度，拥有更好的性能。

4. 什么时候使用B+树索引

并不是在所有的查询条件下出现的列都需要添加索引。对于什么时候添加B+树索引，我的经验是访问表中很少一部分时，使用B+树索引才有意义。对于性别字段，地区字段，类型字段，它们可取值的范围很小，即低选着性。如：
select * from student WHERE sex = 'M'
对于性别，可取值的范围只有'M','F'。对上述SQL语句得到的结果可能是该表的50%的数据，这时添加B+树索引时完全没有必要的。相反，如果某个字段的取值范围很广，几乎没有重复，即高选择性，即此时使用B+树索引时做合适的，例如姓名字段，基本上在一个应用中都不允许重名的出现。
因此，当访问高选择性字段并从表中取出很少一部分时，对这个字段添加B+树索引是非常有必要的。但是如果出现了访问字段是高选择性的，但是取出的行数据占用表中大部分的数据时，这时MySQL数据库就不会使用B+树索引了

附：
http://blog.codinglabs.org/articles/theory-of-mysql-index.html

深入探究前端性能优化：从理论到实践 lozhyf 学习工作面试前端性能优化
一、引言在当今数字化时代，用户对于网页的加载速度和响应性能有着极高的要求。前端性能不仅直接影响用户体验，还与业务指标息息相关，如转化率、用户留存率等。因此，掌握前端性能优化技术成为了前端开发者必备的技能。本文将深入探讨前端性能优化的多个方面，并提供实际可操作的优化技巧。二、前端性能优化的关键指标（一）加载时间这是最直观的指标，指从用户请求网页到页面完全加载并可交互的时间。加载时间过长会导致用户流失
功能测试常用方法概述机器视觉小小测试员功能测试
功能测试常用方法概述一、功能测试简介功能测试，亦称黑盒测试，其核心目标是验证软件功能是否按照需求规格说明书的要求准确运行，即确保软件各功能模块均能正常运作。在测试过程中，测试人员无需深入了解软件内部结构，仅依据需求规格说明书来设计测试用例，重点检验功能的正确性，涵盖输入数据、预期结果、界面操作、业务流程等多个方面。二、测试方法概述测试方法是在软件开发过程中用于验证和确认软件产品质量的一系列技术和策
DeepSeek 近况大揭秘：市场、技术与合作的多面剖析 InfiniteSea1019 ai
最近，AI领域的DeepSeek可谓是赚足了眼球，无论是在资本市场，还是在技术创新和行业应用方面，都有着令人瞩目的表现。今天，就让我们一起来深入了解一下DeepSeek的最新动态。DeepSeek概念股：分化与澄清并存在股票市场上，DeepSeek概念股曾一路高歌猛进，不过近期开始出现分化迹象。据Choice数据显示，2月12日，DeepSeek概念股中，青云科技、创业黑马、新致软件等70余股上涨
Web3 的虚实融合之路：从虚拟交互到元宇宙构建 dingzd95 web3 web3 交互
在这个数字技术日新月异的时代，我们正站在Web3的门槛上，见证着互联网的又一次革命。Web3不仅仅是技术的迭代，它代表了一种全新的交互方式和价值创造模式。本文将探讨Web3如何推动虚拟交互的发展，并最终实现元宇宙的构建，揭示这一技术演进背后的关键理念与现实意义。Web3：去中心化的新交互方式Web3，即第三代互联网，是一个去中心化、用户主权、数据自主的网络环境。它依托于区块链、分布式存储等技术，实
企业数字化转型：私有化部署办公软件的精选推荐
在数字化办公日益盛行的今天，企业对数据安全、定制化需求及成本控制的要求日益提高，私有化部署成为众多企业的首选。私有化部署不仅能够有效保障企业数据的安全性，还能根据企业的实际业务流程进行深度定制，提升工作效率。同时，在长期使用中，私有化部署在成本控制上可能更具优势。本文将深入探讨适用于私有化部署的办公软件，为企业决策者提供一份精选指南。一、私有化部署办公软件的重要性数据安全数据是企业的核心资产，私有
《哪吒》的成功之道：影视创作项目管理的“核心技巧”
《哪吒》票房神话背后：揭秘影视创作项目管理的“乾坤圈”——从“手工作坊”到工业化体系，一部爆款的诞生逻辑[]()一、50亿票房背后的“不可能任务”2025年春节档，《哪吒之魔童闹海》以95.1亿元票房刷新影史纪录，成为首个登顶全球动画票房榜的国产电影1。然而，鲜为人知的是，这部现象级作品背后，是一场“逆天改命”的极限挑战——4000人团队：制作规模是第一部的2-3倍，涉及160余家外包公司9；19
【专题】2025中国消费者的转型报告汇总以精准战略驱动新常态PDF解读（附原数据表）数据挖掘深度学习人工智能算法
原文链接：https://tecdat.cn/?p=39932在当下复杂多变的商业环境中，中国消费者市场正经历着深刻的变革。经济增长模式的转变、宏观经济环境的不确定性，都在重塑着消费者的行为与偏好。深入理解这些变化，对于企业制定精准有效的市场策略、把握增长机遇至关重要。本报告汇总洞察基于文末403份消费者行业研究报告的数据，报告合集已分享在交流群，阅读原文进群和500+行业人士共同交流和成长。运用
解锁Rust：融合多语言特性的编程利器老猿讲编程 Rust rust 开发语言
如果你曾为理解Rust的特性或它们之间的协同工作原理而苦恼，那么这篇文章正是为你准备的。Rust拥有许多令人惊叹的特性，但这些特性并非Rust所独有。实际上，Rust巧妙地借鉴了众多其他语言的优秀特性，并将它们融合成了一个完美的整体。深入了解Rust这些重要特性的来源以及它是如何在此基础上进行拓展的，对于有效运用Rust至关重要。接下来，我们将深入探讨Rust那些广受欢迎的特性，看看C++、Has
DeepSeek使用手册，其中一份是清华大学出品 cpa007 云计算
自娶，。https://pan.quark.cn/s/d174471b17c0深入了解DeepSeek：从技术到应用一、DeepSeek是什么？DeepSeek（深度求索）是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台，专注于提供高效易用的AI模型训练与推理能力。它既包含预训练大语言模型（如DeepSeek-R1系列），也提供配套工具链，助力开发者快速实现AI应用落地。二、De
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
C语言控制语句：掌握编程的“指挥棒” 晚风る C语言 c语言
在编程的世界里，代码的执行流程就像一场精心编排的舞蹈，而控制语句则是这场舞蹈的指挥棒。C语言提供了多种控制语句，帮助我们灵活地控制程序的执行路径。今天，就让我们深入探索这些强大的工具，包括条件判断语句、循环执行语句和转向语句，让它们成为你编程中的得力助手。一、条件判断语句：分岔路口的抉择1.1if语句if语句是最基本的条件判断语句，它根据条件的真假来决定是否执行某段代码。它的语法结构如下：cif(
智慧供热管理系统提高居民用热的智能化 waiwulianwang 方案开发供热管理
到冬季，大量的供热企业被用户室内温度不易采集的问题困扰着,虽然很多供热企业通过采用气候补偿控制等技术手段有效地减少了能源浪费,但是用户室内温度通常还是会随着室外温度的波动而发生较大变化.在供热品质不佳现象的背后依然隐藏着巨大的能源浪费.而且也造成了不同位置不同楼层温度不均问题，同时让热用户产生了极大的不满。于是，“智慧供热”这个概念被推出来了。智慧供热的最终目标是把政府、企业、用户都“串联”到一起
Langchain.js与ScriptEcho：推动AI文本生成与前端开发的创新 2401_89747417 langchain javascript 人工智能前端
引言在当今快速发展的科技领域，AI文本生成和前端开发的结合正成为一个重要的趋势。Langchain.js作为一个强大的工具，正在为开发者提供前所未有的便利。Langchain.js不仅连接了多个大型语言模型，还通过其灵活的架构，帮助开发者简化了AI应用的开发流程。同时，ScriptEcho作为一款创新的前端开发工具，正通过自动化功能提升开发效率。本文将深入探讨Langchain.js的核心概念及其
C语言——指针进阶应用 Hello_O. c语言开发语言
引言在掌握了指针的基础知识后，我们可以进一步探索指针在C语言中的高级应用。指针的灵活性和强大功能使其在复杂数据结构、函数指针、动态内存管理等领域大放异彩。本文将深入探讨指针的进阶用法，包括多级指针、函数指针、指针数组、动态内存分配的高级技巧，以及如何避免常见的指针陷阱。通过实际代码示例，帮助你从“会用指针”进阶到“精通指针”。一、多级指针1.二级指针二级指针是指向指针的指针，常用于动态分配二维数组
本地缓存与分布式缓存的区别及实现详解星辰@Sea 系统架构缓存缓存分布式
在现代软件架构设计中，缓存技术的应用极为广泛，尤其是在需要频繁读取数据并且读取速度要求极高的场景下。缓存可以显著提高系统的响应速度，降低数据库的压力，从而提升用户体验。本文将详细介绍本地缓存与分布式缓存的区别，并深入探讨本地缓存的实现方式及其扩展概念——近端缓存。1.什么是本地缓存？本地缓存指的是存储在应用程序本地内存中的缓存数据。它是最直接的缓存形式，通常用于存储应用程序运行过程中频繁访问的数据
【性能优化】C++ 编码规范之性能优化篇泡沫o0 软件编码规范性能优化 c++系统架构开发语言 linux 嵌入式 c++11
目录标题第一章:引言第二章:背景和标准对比2.1Qt规范概览2.2微软规范概览2.3谷歌规范概览2.4综合对比表格2.5对比规范在特定方面的异同第三章:详细分析3.1深入分析3.2规范的优缺点及其对项目的潜在影响第四章:项目定制规范4.1项目需求4.2根据不同的需求来参考不同的规范结语第一章:引言在当今的高性能计算和资源密集型应用中，C++性能优化已成为开发者不可忽视的关键环节。随着项目规模的增长
C++进阶篇：从高手到大师杨胜增 c++开发语言
C++进阶篇：从高手到大师如果你已经掌握了C++的基础知识并开始写出一些较为复杂的程序，接下来该是深入挖掘C++高级特性的时候了。从内存管理的细节到多线程编程，从模板的深度到STL的运用，这篇文章将带你深入C++的核心，帮助你成为C++的真正高手。目录C++内存管理的艺术手动内存管理与智能指针内存泄漏与RAIIC++中的模板编程模板的基本使用高级模板技术：SFINAE与变参模板C++的多线程与并发
DeepSeek 实现原理探析 rockmelodies 人工智能 ai deepseek 深度学习
DeepSeek实现原理探析引言DeepSeek是一种基于深度学习的智能搜索技术，它通过结合自然语言处理（NLP）、信息检索（IR）和机器学习（ML）等多领域的技术，旨在提供更加精准、智能的搜索结果。本文将深入探讨DeepSeek的实现原理，分析其核心技术及其在实际应用中的表现。一、DeepSeek的核心技术自然语言处理（NLP）词嵌入（WordEmbedding）：DeepSeek使用如Word
Django REST Framework：如何获取序列化后的ID AI航海家(Ethan) python Django 后端框架 django python 后端
DjangoRESTFramework：如何获取序列化后的ID嗨，小伙伴们！今天我们来聊一聊DjangoRESTFramework（简称DRF）中一个非常常见的操作：如何获取序列化后的ID。对于那些刚入门的朋友们，这一操作是非常基础但也至关重要的哦！让我们一起深入了解一下吧！什么是DjangoRESTFramework？首先，对于新手来说，我们先来快速了解一下什么是DjangoRESTFramew
Django视图与URLs路由详解 m0_74824802 面试学习路线阿里巴巴 django 数据库 sqlite
在DjangoWeb框架中，视图（Views）和URLs路由（URLrouting）是Web应用开发的核心概念。它们共同负责将用户的请求映射到相应的Python函数，并返回适当的响应。本篇博客将深入探讨Django的视图和URLs路由系统，提供实际的代码示例和操作指导，确保读者能够具体而实际地了解如何使用这些功能来构建健壮的Web应用。目录Django视图与URLs路由详解一、理解Django视图
位图的深入解析：从数据结构到图像处理与C++实现 Exhausted、机器学习计算机视觉人工智能图像处理 c++算法数据结构开发语言
在学习优选算法课程的时候，博主学习位运算了解到位运算的这个概念，之前没有接触过，就查找了相关的资料，丰富一下自身，当作课外知识来了解一下。位图（Bitmap）是一种用于表示图像的数据结构，它将图像分解为像素的二维网格，每个像素的颜色值存储在一个矩阵中。位图广泛应用于计算机图形学、图像处理和计算机视觉等领域。目录1.位图的基本概念1.1像素1.2分辨率1.3颜色深度2.位图的存储格式2.1BMP格式
halcon opencv C++环境配置 | halcon opencv |C++互转opencv和Halcon图像变量(非常详细)|(msvc2015/17)(143) 虚假程序设计 opencv c++人工智能
这是本人第一次正儿八经非调侃的态度写C相关的东西;VS的C++每次环境不好配置就让人望而却步;而python的优势在于环境几乎只需要pipinstallxxx;C#多数情况下nuget点点点在添加引用就能愉快的玩耍;而pyC#背后竟然是xxx;有一被分层包养的感觉;而C/CPP头文件程序链接文件(动态|静态)动态链接库这都啥??掌握pythonnetctypes咯咯咯嘎嘎嘎%$#@#$%&^*(&
手把手教你Linux内核编译：从零开始编写深度Linux C/C++全栈开发操作系统 linux 内存管理内核编译
在计算机技术的广袤星空中，Linux内核宛如一颗最为璀璨而神秘的巨星，散发着无尽的魅力与诱惑。它是操作系统的心脏，掌控着计算机系统的一切核心资源与底层运作。如今，我们即将踏上一场激动人心的冒险之旅——一步步解锁Linux内核，开启从零开始的编程征程。一、简介Linux内核作为操作系统的核心，其魅力在于多方面。首先，它负责资源管理和设备驱动等重要任务。学习Linux内核编程，能够让开发者深入了解操作
深入理解 Qt 信号与槽机制：原理、用法与优势 @hdd Qt qt
一、信号与槽的概念在Qt编程中，信号与槽机制是实现对象间通信的核心工具。信号：本质上是一种特殊的成员函数声明，它不包含函数体，仅用于通知其他对象某一事件的发生。例如，当用户点击界面上的按钮时，按钮对象就会发出clicked信号，告知系统“按钮被点击了”这一事件。槽：用于响应信号的普通成员函数。它与普通C++函数类似，可以有参数，也能被重载，并且可以定义在类的public、protected或pri
Struts2 命令执行漏洞 S2-045 复现：深入剖析与实战演练垚垚 Securify 前沿站十大漏洞网络系统安全 web安全 struts 安全计算机网络后端
目录前言一、漏洞原理：框架解析缺陷引发的安全危机二、复现环境搭建：搭建模拟战场，重现漏洞场景三、复现步骤：步步为营，揭开漏洞利用的面纱四、漏洞危害与修复建议：正视漏洞危害，筑牢安全防线前言在当今网络安全形势日益严峻的大环境下，Web应用框架的安全问题始终是信息安全领域关注的焦点。Struts2作为一款广泛应用于JavaWeb开发的开源框架，其安全性直接关系到众多Web应用的稳定运行。今天，我们将深
【16. 深入理解 C++ 字符串】涛ing C++基础 c++开发语言 c语言 ubuntu linux vim visual studio
本章目录:前言C风格字符串声明与初始化输出结果常用函数示例输出结果C++的`string`类核心特性示例输出结果常用成员函数示例：复杂操作输出结果`sizeof`vs`strlen`示例输出结果总结前言C++提供了两种主要的字符串表示形式：C风格字符串和C++的string类。本文将从两者的概念、用法以及各自的特性入手，详细解读它们的应用场景，并通过创新示例和读者常见疑问为你提供深入的理解。C风格
2021-03-01-深入浅出解析jsp 热爱Java的程序猿后端 jsp servlet java
来历servlet的缺点导致jsp的产生JSP全称是JavaServerPagesjsp=html+js+Java+Tag用法servlet只负责响应请求产生数据，并把数据通过转发技术带给jsp，数据的显示交给jsp来做在长期的软件实践中，人们逐渐把servlet作为web应用中的控制器组件来使用，而把JSP技术作为数据显示模板来使用原理所有的jsp最后都编译成servlet,编译后的路径一般在t
基于深度学习的半导体算法原理及应用埃菲尔铁塔_CV算法算法机器学习人工智能计算机视觉深度学习 python
摘要随着半导体产业的持续发展，深度学习技术在该领域的应用日益广泛且深入。本文全面阐述了基于深度学习的半导体算法原理，涵盖卷积神经网络（CNN）、循环神经网络（RNN）及其变体长短时记忆网络（LSTM）和门控循环单元（GRU）等在半导体制造过程监测、缺陷检测、性能预测等方面的应用。详细分析了这些算法处理半导体相关数据的机制，探讨了算法实现中的关键技术，如数据预处理、模型训练与优化等。通过实际案例展示
4、《Spring Boot 中的依赖管理》 wolf犭良 SpringBoot spring boot 后端 java
SpringBoot中的依赖管理摘要在SpringBoot项目开发的过程中，依赖管理是一项极为关键的工作，它直接关系到项目的稳定性、性能以及开发效率。本文将深入剖析Maven和Gradle这两种主流构建工具在SpringBoot项目中的依赖管理方式，详细介绍如何精准地引入依赖、巧妙地排除不必要的依赖，以及高效地处理版本冲突，帮助开发者牢牢掌控项目依赖，为项目的顺利推进筑牢根基。一、Maven在Sp
【深入探索-deepseek】高等数学与AI的因果关系我的青春不太冷人工智能机器学习数学
目录数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数2.微积分3.概率论与统计二、自然语言处理领域三、语音识别领域四、数学在AI不同领域应用的逻辑图五、参考资料数学在AI不同领域的应用区别一、计算机视觉领域1.线性代数图像变换：想象我们有一张二维图片，图片里有个点，它的位置用坐标((x,y))表示。现在我们想把这个点绕着图片的原点（就像把纸钉在墙上，以钉子的位置为中心）逆时针旋转一定角度
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

深入数据库索引背后算法及数据结构

1.索引的本质

2. B-Tree索引的相关概念

3. 为什么使用B-Tree ?

4. 什么时候使用B+树索引

你可能感兴趣的:(深入数据库索引背后算法及数据结构)