Voltline

数据库系统原理与实践笔记 #10

文章目录

数据库系统原理与实践笔记 #10
存储管理与索引(续)
- 数据字典存储
- - 系统元数据的关系表示
- 数据缓冲区
- - 存储访问
  - 缓冲区管理器
  - 缓冲区替换策略
- 顺序索引
- - 基本概念
  - 索引技术评价指标
  - 顺序索引
  - 稠密索引
  - 稀疏索引
  - 索引
  - 多级索引
  - 辅助索引
  - 主索引与辅助索引
  - 多码索引
- B+树索引
- - B+树索引文件
  - B+树结点结构
  - B+树中的叶结点
  - B+树中的非叶结点
  - B+树特性
  - B+树的查询
  - B树索引文件
  - B树索引的优缺点
- 散列索引
- - 静态散列
  - 散列函数
  - 桶溢出处理
- SQL中的索引定义
- - SQL中的索引定义

数据库系统原理与实践笔记 #10

存储管理与索引(续)

数据字典存储

数据字典：也称系统目录存储元数据（即关于数据的数据）
关系的信息：
- 关系的名字
- 每个关系属性的名字、类型和长度
- 视图的名字和定义
- 完整性约束
用户和账户信息，包括密码
统计和描述性数据：每个关系中的元组数目
物理文件组织信息：
- 关系如何存储(顺序/散列/…)
- 关系的物理位置
索引的信息

系统元数据的关系表示

磁盘上关系的表示
为在内存中进行高效访问而设计的特殊数据结构（微型数据库）
,源站可能有防盗链机制,建议将图片保存下来直接上传](https://img-home.csdnimg.cn/images/20230724024159.png?origin_url=image-18.png&pos_id=img-cCHHBIDt-1701068752975)

数据缓冲区

存储访问

每个文件分成定长的存储单元，称为块。块是存储分配和数据传输的基本单元
数据库系统的一个主要目标就是减少磁盘和存储器之间传输的块数。减少磁盘访问次数的一种方法是在主存储器中保留尽可能多的块
缓冲区：主存储器中用于存储磁盘块的副本的那一部分
缓冲区管理器：负责缓冲区空间的子系统

缓冲区管理器

程序需要磁盘上的块时，可以向缓冲区管理器发出请求：
1.如果这个块已经在缓冲区中，缓冲区管理器将这个块在主存储器中的地址传给请求者
2.如果这个块不在缓冲区中，缓冲区管理器
- (1).在缓冲区中为这个块分配空间
  - a.如果需要的话，会把其他块移出主存储器，为这个新块腾出空间
  - b.移出的块仅当它自从最近一次写回硬盘后被修改过，才被写回硬盘
- (2).把这个块从磁盘读入缓冲区，并将这个块在主存储器中的地址传给请求者

缓冲区替换策略

大多数操作系统使用LRU(最近最少使用策略 Least Recently Used)
LRU—根据过去使用块的模式进行将来访问模式的预测
当设计对数据重复扫描的访问模式时，LRU是一个糟糕的策略
由查询优化器提供的带有提示的混合替换策略是较好的选择
被钉住(Pinned)的块：不允许写回硬盘的块
立即丢弃策略：一旦块最后一个元组被处理完毕，就立刻命令缓冲区管理器释放这个块所占用的空间
最近最常使用策略(与LRU相反)：系统要替换最近一直在使用的块，当块中最后一个元组处理完毕后，块将被解除钉住，称为最近最常使用的块被移除
缓冲区管理器可以使用请求访问某个特定关系的统计信息
为保证数据可恢复性，缓冲区管理器也支持块的强制写出到硬盘

顺序索引

基本概念

索引机制用来加速对所需数据的访问
搜索码：用于在文件中查找记录的属性或属性集
一个索引文件包含如下形式的记录：

搜索码值	记录指针

索引文件一般比源文件小很多
两种基本类型索引：
- 顺序索引：按搜索码顺序存储索引
- 散列索引：使用散列函数将搜索码平均分布到若干散列桶中（一般作为辅助索引）

索引技术评价指标

访问类型：能有效支持的访问类型。例如：
- 具有特定属性值的所有记录
- 属性值在某个特定范围内的所有记录
访问、插入、删除时间、空间开销

顺序索引

顺序索引：按顺序存储搜索码的值，并将每个搜索码与包含该搜索码的记录关联起来
主索引：顺序文件组织中，索引的搜索码指定了文件中记录的顺序（一个关系只有一个）:
- 也叫聚集索引
- 主索引的搜索码一般是主码，但不是必须的
辅助索引：搜索码指定的顺序与文件中记录的物理顺序不同的索引（一个关系可以有多个）
索引顺序文件：在搜索码上有聚集索引的文件（若记录按搜索码顺序排列）

稠密索引

稠密索引：文件中的每个搜索码值有一个索引记录

稀疏索引

系数索引：只为搜索码的某些值建立索引记录：在记录按照搜索码顺序排列时适用
寻找有搜索值K的记录：
- 找到最大搜索码值小于或等于K的索引值
- 从该索引项指向的记录开始，沿着文件中的指针查找，查到找到所需记录为止

索引

稠密索引和稀疏索引对比：
- 稀疏索引插入和删除时所需的空间及维护开销较小
- 稀疏索引定位一条记录的速度比较慢
好的折中方案：为每个块建一个索引项（块起始搜索码）的系数索引

多级索引

如果主索引太大无法放入主存，那么开销就很大
解决方案：将主索引以顺序文件的形式放于磁盘，并为其建立一个系数索引
具有两级或两级以上的索引称为多级索引：
- 外层索引—主索引的稀疏索引
- 内层索引—主索引文件
如果外层索引还是太大，那么就可以再建另外一级索引，以此类推
对文件进行插入或删除操作后，所有级别的索引都需要更新

辅助索引

通常，我们希望找到某一特定字段（非主索引的搜索码）符合某些条件的所有记录
我们可以使用一个副主索引：每个搜索码都有一个索引记录（稠密索引）
索引记录指向包含所有指向具有特定搜索键值的实际记录的指针
辅助索引必须是稠密的，即不可能存在辅助稀疏索引

主索引与辅助索引

搜索记录时索引能带来很多好处
但是索引的更新会给数据库的修改带来额外的开销，每当文件被修改时，这个文件上的每个索引都要更新
使用主索引进行顺序扫描是很高效的，但是使用辅助索引却花费很大，因为：
- 每次对记录的访问都可能从磁盘获得一个新块
- 获取新块需要5~10ms，而存储器访问只需要100ns

多码索引

复合搜索码是指包含不止一个属性的搜索码
词典顺序： $a_1, a_2) < (b_1, b_2)$ 如果：
- $a_1 < b_1$ ，或
- $a_1 = b_1$ 且 $a_2 < b_2$

B+树索引

B+树索引文件

使用顺序索引的缺点：
- 性能随着文件的增长而下降，因为创建了许多溢出块
- 需要定期重组整个文件
B+树索引文件的优势：
- 在面对插入和删除时，使用小的局部更改自动重组
- 不需要重组整个文件来保持查询性能
B+树索引缺点：额外的插入和删除开销、空间开销
B+树被广泛运用于数据库系统索引的数据结构

B+树是一种满足以下属性的树：
- 从根到所有叶的路径的长度都是相同的
- 每个非叶结点（除根节点之外）都有 $\lceil\frac{n}{2}\rceil$ 到 $n$ 个子节点
- 一个叶结点可包含搜索码的数量在 $\lceil\frac{n-1}{2}\rceil$ 到 $n - 1$ 之间
特殊情况：
- 如果根结点是一个非叶结点，则它至少有两个子结点
- 如果根结点是一个叶子结点，则它可以有0到 $n - 1$ 个值（搜索码）

B+树结点结构

B+树的典型结点
- $K_i$ 搜索码的值
- $P_i$ 是指向子节点(对于非叶结点)或指向记录或记录桶(对于叶结点)的指针
一个结点中的搜索码是按顺序排序的：
$K_1 < K_2 < K_3 <...K1<K2<K3<...<Kn−1$

B+树中的叶结点

叶结点具有如下属性：
- 对于 $i = 1, 2, ..., n - 1$ ，指针 $P_i$ 指向具有搜索键值为 $K_i$ 的记录
- 如果 $L_i, L_j$ 是叶子结点，且 $， L_{i} 的搜索码值小于或等于 L_{i} 的搜索码值$
- $P_n$ 按搜索键的顺序指向下一个叶子结点

B+树中的非叶结点

非叶结点在叶子结点之上形成了一个多级（稀疏）索引。对于带有m个指针（m称之为扇出,fanout）的非叶结点：
- $P_1$ 所在的子树中的所有搜索码都小于 $K_1$
- 对于 $2\leq i\leq n-1$ ， $P_i$ 所在子树的所有搜索码的值大于或等于 $K_{i-1}$ 、且小于 $K_i$
- $P_n$ 所在的子树中的所有搜索键的值大于或等于 $K_{n-1}$

B+树特性

B+树形成了一个稀疏索引的层次结构
B+树可以用相对较少的层次来表示大量的搜索码
- 低于根的一个级别子树至少有 $2\times\lceil\frac{n}{2}\rceil$ 个搜索值
- 再下一级别则至少有 $2\times\lceil\frac{n}{2}\rceil\times\lceil\frac{n}{2}\rceil$ 个搜索码值
因此，如果索引文件中有K个搜索键值，则树的高度（即搜索路径长度）不超过
$\lceil\log_{\lceil\frac{n}{2}\rceil}(K)\rceil$
可以利用B+树进行有效地搜索
可以有效地处理对主文件的插入和删除，因为B+树索引可以在有限时间呢(与树的高度成正比关系)进行有效重构

B+树的查询

典型B+树的结点规模通常和磁盘块的大小相同，通常取值为4KB
- 因此，n通常取值为100左右(每个索引条目40字节)
对于有100万个搜索码的索引文件，n=100
- 最多查询 $log_{50}(1,000,000)=4$ 个结点（4个块），即可完成从根到叶子结点的遍历
将其与具有100万个搜索键值的平衡二叉树(AVL树)对比：再一次查找中需要访问大约20个结点

B树索引文件

类似于B+树，但B树只允许搜索码出现一次，消除了搜索键的冗余存储
非叶结点中的搜索码在B树中没有其他位置可出现，因此，必须为非叶结点中每个搜索包含一个额外的指针字段（需指向文件记录）

B树索引的优缺点

B树的优点：
- 可能比相应的B+树使用更少的结点
- 有时可以在到达结点之前找到搜索码
B树的缺点：
- 在所有搜索码中，只有一小部分被早期找到
- 非叶结点需要存储搜索码的记录指针，所以扇出相应地变小了。因此，B树通常比B+树具有更大的深度
- 插入和删除比B+树更复杂
- 实现比B+树更难

散列索引

静态散列

桶是能存储一条或多条记录的一个存储单元（一个桶就是一个磁盘块）
在散列文件组织中，通过使用散列函数直接从搜索码中获得包含该记录的桶
散列函数h是一个从K到B的函数，K表示所有搜索码值集合
散列函数用来为获取、插入和删除操作定位记录
具有不同搜索码值的记录可能映射到同一个桶，因此整个桶都要被顺序搜索来定位记录

散列函数

一个理想的散列函数是均匀的。即：散列函数从所有可能的搜索码值集合中为每个桶分配同样数量的搜索码值
理想的散列函数是随机的的，不管搜索码值怎样分布，每个桶应分配到的搜索码值数目几乎相同
最坏的可能是散列函数把所有的搜索码值映射到同一个桶中；这使得访问时间与文件中的搜索码的数量成正比
通常散列函数依据搜索码字符的二进制码来计算
- 这种类型的一个简单散列函数是先计算码中字符的二进制码的综合，然后返回该总和取桶数目的模
散列索引无法支持范围查询

桶溢出处理

溢出链：一个给定桶的所有溢出桶用一个链接列表链接在一起
开散列：桶集合固定，没有溢出链，当一个桶满了之后，系统将记录插入到初始桶集合的其他桶中

SQL中的索引定义

创建索引

create index <索引名> on <关系名>(<属性列表>);
# 例如
create index b-index on branch(branch_name);

使用create unique index直接声明该搜索码是一个候选码
- 如果数据库系统支持SQL标准的unique声明，那么这里的unique特性就是多余的
撤销索引

drop index <索引名>;

大多数数据库允许指定索引类型，并声明聚集索引

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
WHQL签名怎么申请 GDCA SSL证书 windows
WHQL（WindowsHardwareQualityLabs）签名是微软对硬件和驱动程序进行认证的一种方式，以确保它们与Windows操作系统的兼容性和稳定性。以下是申请WHQL签名的基本步骤，供您参考：1.准备阶段准备硬件设备和驱动程序：确保您的硬件设备已经准备好，并且对应的驱动程序已经经过充分的测试，能够在各种配置和环境下正常工作。获取EV代码签名证书：根据微软的要求，驱动程序进行WHQL认
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
基于定制开发开源AI智能名片S2B2C商城小程序的社群游戏定制策略研究说私域人工智能小程序游戏
摘要：本文聚焦社群游戏定制领域，深入探讨以社群文化和用户偏好为导向的定制策略。通过分析互动游戏活动、社群文化塑造等关键要素，结合定制开发开源AI智能名片S2B2C商城小程序的技术特性，提出针对性游戏定制方案。研究旨在提升社群用户参与度与游戏体验，为社群游戏发展提供理论支持与实践指导。关键词：社群游戏定制；定制开发开源AI智能名片S2B2C商城小程序；社群文化；用户偏好一、引言在数字化社交蓬勃发展的
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
22、文档：Google Docs的强大与易用性 pear55 探索云技术的无限可能 Google Docs 云端文档语音输入
文档：GoogleDocs的强大与易用性1.GoogleDocs简介GoogleDocs是Google提供的在线办公套件的一部分，它是一个基于云端的文字处
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
Android ViewBinding 使用与封装教程积跬步DEV Android 开发实战大全 android
AndroidViewBinding使用与封装教程：一、ViewBinding是什么？核心功能：为每个XML布局文件自动生成一个绑定类（如ActivityMainBinding），直接暴露所有带ID的视图引用。优点：避免繁琐的findViewById()，类型安全且编译时检查。对比DataBinding：ViewBinding仅处理视图引用，无数据绑定功能。DataBinding支持双向数据绑定，
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
基于开源AI智能名片链动2+1模式与S2B2C商城小程序的渠道选择策略研究说私域人工智能小程序
摘要：在数字化商业环境下，品牌与产品的渠道选择对其市场推广和运营成功至关重要。本文聚焦于如何依据自身品牌和产品特性，结合开源AI智能名片链动2+1模式与S2B2C商城小程序，运用科学的渠道选择方法，慎重挑选1-2个适宜平台，集中资源发力并取得成绩后再拓展其他渠道。通过理论分析与案例研究，探讨该策略的有效性和可行性，为企业渠道布局提供参考。关键词：渠道选择；开源AI智能名片；链动2+1模式；S2B2
深入解析 TCP 连接状态与进程挂起、恢复与关闭誰能久伴不乏 tcp/ip 网络服务器
文章目录深入解析TCP连接状态与进程挂起、恢复与关闭一、TCP连接的各种状态1.**`LISTEN`**（监听）2.**`SYN_SENT`**（SYN已发送）3.**`SYN_RECEIVED`**（SYN已接收）4.**`ESTABLISHED`**（已建立）5.**`FIN_WAIT_1`**（关闭等待1）6.**`FIN_WAIT_2`**（关闭等待2）7.**`CLOSE_WAIT`**
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

数据库系统原理与实践 笔记 #10

文章目录

数据库系统原理与实践 笔记 #10

存储管理与索引(续)

数据字典存储

系统元数据的关系表示

数据缓冲区

存储访问

缓冲区管理器

缓冲区替换策略

顺序索引

基本概念

索引技术评价指标

顺序索引

稠密索引

稀疏索引

索引

多级索引

辅助索引

主索引与辅助索引

多码索引

B+树索引

B+树索引文件

B+树结点结构

B+树中的叶结点

B+树中的非叶结点

B+树特性

B+树的查询

B树索引文件

B树索引的优缺点

散列索引

静态散列

散列函数

桶溢出处理

SQL中的索引定义

SQL中的索引定义

你可能感兴趣的:(数据库系统原理与实践,数据库,笔记,服务器)

数据库系统原理与实践笔记 #10

数据库系统原理与实践笔记 #10