wind520

深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图

Hash Join只能用于相等连接，且只能在CBO优化器模式下。相对于nested loop join，hash join更适合处理大型结果集
Hash Join的执行计划第1个是hash表(build table)，第2个探查表(probe table)，一般不叫内外表，nested loop才有内外表
Hash表也就是所谓的内表，探查表所谓的外表
两者的执行计划形如：
nested loop
outer table --驱动表
inner table

hash join
build table (inner table) --驱动表

probe table (outer table)

先看一张图片，大致了解Hash Join的过程：

下面详细了解一下Hash Join

㈠ Hash join概念

  Hash join算法的一个基本思想就是根据小的row sources(称作build input 也就是前文提到的build table，我们记较小的表为S，较大的表为B)
建立一个可以存在于hash area内存中的hash table
然后用大的row sources(称作probe input，也就是前文提到的probe table) 来探测前面所建的hash table
如果hash area内存不够大，hash table就无法完全存放在hash area内存中
针对这种情况，Oracle在连接键利用一个hash函数将build input和probe input分割成多个不相连的分区
分别记作Si和Bi，这个阶段叫做分区阶段；然后各自相应的分区，即Si和Bi再做Hash join，这个阶段叫做join阶段
如果HASH表太大，无法一次构造在内存中，则分成若干个partition，写入磁盘的temporary segment，则会多一个写的代价，会降低效率
至于小表的概念，对于 hash join 来说，能容纳在 pga 中的 hash table 都可以叫小表，通常比如：
pga_aggregate_target big integer 1073741824
hash area size 大体能使用到40多 M ，这样的话通常可能容纳几十万的记录
hash area size缺省是2*sort_area_size,我们可以直接修改SORT_AREA_SIZE 的大小，HASH_AREA_SIZE也会跟着改变的
如果你的workarea_size_policy=auto，那么我们只需设定pga_aggregate_target
但请记住，这是一个session级别的参数，有时，我们更倾向于把hash_area_size的大小设成驱动表的1.6倍左右
驱动表仅仅用于nested loop join 和 hash join，但Hash join不需要在驱动表上存在索引，而nested loop join则迫切需求
一两百万记录的表 join上千万记录的表，hash join的通常表现非常好
不过，多与少，大与小，很多时候很难量化，具体情况还得具体分析
如果在分区后，针对某个分区所建的hash table还是太大的话，oracle就采用nested loop hash join
所谓的nested-loops hash join就是对部分Si建立hash table，然后读取所有的Bi与所建的hash table做连接
然后再对剩余的Si建立hash table，再将所有的Bi与所建的hash table做连接，直至所有的Si都连接完了

   ㈡ Hash Join原理

  考虑以下两个数据集：
S={1,1,1,3,3,4,4,4,4,5,8,8,8,8,10}
B={0,0,1,1,1,1,2,2,2,2,2,2,3,8,9,9,9,10,10,11}
Hash Join的第一步就是判定小表（即build input）是否能完全存放在hash area内存中
如果能完全存放在内存中，则在内存中建立hash table，这是最简单的hash join
如果不能全部存放在内存中，则build input必须分区。分区的个数叫做fan-out
Fan-out是由hash_area_size和cluster size来决定的。其中cluster size等于db_block_size * _hash_multiblock_io_count
hash_multiblock_io_count是个隐藏参数,在9.0.1以后就不再使用了

[sql]  view plain copy print ? 
     
    
 sys@ORCL> ed  
 Wrote file afiedt.buf  
   
   1  select a.ksppinm name,b.ksppstvl value,a.ksppdesc description  
   2  from x$ksppi a,x$ksppcv b  
   3  where a.indx = b.indx  
   4* and a.ksppinm like '%hash_multiblock_io_count%'  
 sys@ORCL> /  
   
 NAME                           VALUE DESCRIPTION  
 ------------------------------ ----- ------------------------------------------------------------  
 _hash_multiblock_io_count      0     number of blocks hash join will read/write at once  

Oracle采用内部一个hash函数作用于连接键上，将S和B分割成多个分区
在这里我们假设这个hash函数为求余函数，即Mod(join_column_value,10)
这样产生十个分区，如下表:

经过这样的分区之后，只需要相应的分区之间做join即可（也就是所谓的partition pairs）
如果有一个分区为NULL的话，则相应的分区join即可忽略
在将S表读入内存分区时，oracle即记录连接键的唯一值，构建成所谓的位图向量
它需要占hash area内存的5%左右。在这里即为{1,3,4,5,8,10}
当对B表进行分区时，将每一个连接键上的值与位图向量相比较，如果不在其中，则将其记录丢弃
在我们这个例子中，B表中以下数据将被丢弃{0,0,2,2,2,2,2,2,9,9,9,9,9}
这个过程就是位图向量过滤
当S1,B1做完连接后，接着对Si,Bi进行连接
这里oracle将比较两个分区，选取小的那个做build input，就是动态角色互换
这个动态角色互换发生在除第一对分区以外的分区上面

   ㈢ Hash Join算法

  第1步：判定小表是否能够全部存放在hash area内存中，如果可以，则做内存hash join。如果不行，转第二步
第2步：决定fan-out数
(Number of Partitions) * C<= Favm *M
其中C为Cluster size，其值为DB_BLOCK_SIZE*HASH_MULTIBLOCK_IO_COUNT
Favm为hash area内存可以使用的百分比，一般为0.8左右
M为Hash_area_size的大小
第3步：读取部分小表S，采用内部hash函数(这里称为hash_fun_1)
将连接键值映射至某个分区，同时采用hash_fun_2函数对连接键值产生另外一个hash值
这个hash值用于创建hash table用，并且与连接键值存放在一起
第4步：对build input建立位图向量
第5步：如果内存中没有空间了，则将分区写至磁盘上
第6步：读取小表S的剩余部分，重复第三步，直至小表S全部读完
第7步：将分区按大小排序，选取几个分区建立hash table(这里选取分区的原则是使选取的数量最多)
第8步：根据前面用hash_fun_2函数计算好的hash值，建立hash table
第9步：读取表B，采用位图向量进行位图向量过滤
第10步：对通过过滤的数据采用hash_fun_1函数将数据映射到相应的分区中去，并计算hash_fun_2的hash值
第11步：如果所落的分区在内存中，则将前面通过hash_fun_2函数计算所得的hash值与内存中已存在的hash table做连接
将结果写致磁盘上。如果所落的分区不在内存中，则将相应的值与表S相应的分区放在一起
第12步：继续读取表B，重复第9步，直至表B读取完毕
第13步：读取相应的(Si,Bi)做hash连接。在这里会发生动态角色互换
第14步：如果分区过后，最小的分区也比内存大，则发生nested-loop hash join

㈣ Hash Join的成本

⑴ In-Memory Hash Join
Cost(HJ)=Read(S)+ build hash table in memory(CPU)+Read(B) + Perform In memory Join(CPU)
忽略cpu的时间，则：
Cost(HJ)=Read(S)+Read(B)

⑵ On-Disk Hash Join
根据上述的步骤描述，我们可以看出：
Cost(HJ)=Cost(HJ1)+Cost(HJ2)
其中Cost(HJ1)的成本就是扫描S,B表，并将无法放在内存上的部分写回磁盘，对应前面第2步至第12步
Cost(HJ2)即为做nested-loop hash join的成本，对应前面的第13步至第14步
其中Cost(HJ1)近似等于Read(S)+Read(B)+Write((S-M)+(B-B*M/S))
因为在做nested-loop hash join时，对每一chunk的build input，都需要读取整个probe input，因此
Cost(HJ2)近似等于Read((S-M)+n*(B-B*M/S))，其中n是nested-loop hash join需要循环的次数：n=(S/F)/M
一般情况下，如果n大于10的话，hash join的性能将大大下降
从n的计算公式可以看出，n与Fan-out成反比例，提高fan-out，可以降低n
当hash_area_size是固定时，可以降低cluster size来提高fan-out
从这里我们可以看出，提高hash_multiblock_io_count参数的值并不一定提高hash join的性能

㈤ Hash Join的过程

  一次完整的hash join如下：
  1 计算小表的分区（bucket）数--Hash分桶
决定hash join的一个重要因素是小表的分区（bucket）数
这个数字由hash_area_size、hash_multiblock_io_count和db_block_size参数共同决定
Oracle会保留hash area的20%来存储分区的头信息、hash位图信息和hash表
因此，这个数字的计算公式是：
Bucket数=0.8*hash_area_size/(hash_multiblock_io_count*db_block_size)

  2 Hash计算
读取小表数据（简称为R），并对每一条数据根据hash算法进行计算
Oracle采用两种hash算法进行计算，计算出能达到最快速度的hash值（第一hash值和第二hash值）
而关于这些分区的全部hash值（第一hash值）就成为hash表

  3 存放数据到hash内存中
将经过hash算法计算的数据，根据各个bucket的hash值（第一hash值）分别放入相应的bucket中
第二hash值就存放在各条记录中

  4 创建hash位图
与此同时，也创建了一个关于这两个hash值映射关系的hash位图

  5 超出内存大小部分被移到磁盘
如果hash area被占满，那最大一个分区就会被写到磁盘（临时表空间）上去
任何需要写入到磁盘分区上的记录都会导致磁盘分区被更新
这样的话，就会严重影响性能，因此一定要尽量避免这种情况
2-5一直持续到整个表的数据读取完毕

  6 对分区排序
为了能充分利用内存，尽量存储更多的分区，Oracle会按照各个分区的大小将他们在内存中排序

  7 读取大表数据，进行hash匹配
接下来就开始读取大表（简称S）中的数据
按顺序每读取一条记录，计算它的hash值，并检查是否与内存中的分区的hash值一致
如果是，返回join数据
如果内存中的分区没有符合的，就将S中的数据写入到一个新的分区中，这个分区也采用与计算R一样的算法计算出hash值
也就是说这些S中的数据产生的新的分区数应该和R的分区集的分区数一样。这些新的分区被存储在磁盘（临时表空间）上

  8 完全大表全部数据的读取
一直按照7进行，直到大表中的所有数据的读取完毕

  9 处理没有join的数据
这个时候就产生了一大堆join好的数据和从R和S中计算存储在磁盘上的分区

  10 二次hash计算
从R和S的分区集中抽取出最小的一个分区，使用第二种hash函数计算出并在内存中创建hash表
采用第二种hash函数的原因是为了使数据分布性更好

  11 二次hash匹配
在从另一个数据源（与hash在内存的那个分区所属数据源不同的）中读取分区数据，与内存中的新hash表进行匹配。返回join数据

  12 完成全部hash join
继续按照9-11处理剩余分区，直到全部处理完毕

   ㈥ Hash Join的模式
  Oracle中，Hash Join也有三种模式：optimal，one-pass，multi-pass
  ⑴ optimal

当驱动结果集生成的hash表全部可以放入PGA的hash area时，称为optimal，大致过程如下：
① 先根据驱动表，得到驱动结果集
② 在hash area生成hash bulket，并将若干bulket分成一组，成为一个partition，还会生成一个bitmap的列表，每个bulket在上面占一位
③ 对结果集的join键做hash运算，将数据分散到相应partition的bulket中
当运算完成后，如果键值唯一性较高的话，bulket里的数据会比较均匀，也有可能有的桶里面数据会是空的
这样bitmap上对应的标志位就是0，有数据的桶，标志位会是1
④ 开始扫描第二张表，对jion键做hash运算，确定应该到某个partition的某个bulket去探测
探测之前，会看这个bulket的bitmap是否会1，如果为0，表示没数据，这行就直接丢弃掉
⑤ 如果bitmap为1，则在桶内做精确匹配，判断OK后，返回数据
这个是最优的hash join，他的成本基本是两张表的full table scan，在加微量的hash运算
博客开篇的那幅图描述的也就是这种情况

⑵ one-pass
如果进程的pga很小，或者驱动表结果集很大，超过了hash area的大小，会怎么办？
当然会用到临时表空间，此时oracle的处理方式稍微复杂点需奥注意上面提到的有个partition的概念
可以这么理解，数据是经过两次hash运算的，先确定你的partition，再确定你的bulket
假设hash area小于整个hash table，但至少大于一个partition的size，这个时候走的就是one-pass
当我们生成好hash表后，状况是部分partition留在内存中，其他的partition留在磁盘临时表空间中
当然也有可能某个partition一半在内存，一半在磁盘，剩下的步骤大致如下：
① 扫描第二张表，对join键做hash运算，确定好对应的partition和bulket
② 查看bitmap，确定bulket是否有数据，没有则直接丢弃
③ 如果有数据，并且这个partition是在内存中的，就进入对应的桶去精确匹配，能匹配上，就返回这行数据，否则丢弃
④ 如果partition是在磁盘上的，则将这行数据放入磁盘中暂存起来，保存的形式也是partition，bulket的方式
⑤ 当第二张表被扫描完后，剩下的是驱动表和探测表生成的一大堆partition，保留在磁盘上
⑥ 由于两边的数据都按照相同的hash算法做了partition和bulket，现在只要成对的比较两边partition数据即可
并且在比较的时候，oracle也做了优化处理，没有严格的驱动与被驱动关系
他会在partition对中选较小的一个作为驱动来进行，直到磁盘上所有的partition对都join完
可以发现，相比optimal，他多出的成本是对于无法放入内存的partition，重新读取了一次，所以称为one-pass
只要你的内存保证能装下一个partition，oracle都会腾挪空间，每个磁盘partition做到one-pass

⑶ multi-pass
这是最复杂，最糟糕的hash join
此时hash area小到连一个partition也容纳不下，当扫描好驱动表后
可能只有半个partition留在hash area中，另半个加其他的partition全在磁盘上
剩下的步骤和one-pass比价类似，不同的是针对partition的处理
由于驱动表只有半个partition在内存中，探测表对应的partition数据做探测时
如果匹配不上，这行还不能直接丢弃，需要继续保留到磁盘，和驱动表剩下的半个partition再做join
这里举例的是内存可以装下半个partition，如果装的更少的话，反复join的次数将更多
当发生multi-pass时，partition物理读的次数会显著增加

㈦ Hash Join的位图
这个位图包含了每个hash分区是否有有值的信息。它记录了有数据的分区的hash值
这个位图的最大作用就是，如果probe input中的数据没有与内存中的hash表匹配上
先查看这个位图，以决定是否将没有匹配的数据写入磁盘
那些不可能匹配到的数据（即位图上对应的分区没有数据）就不再写入磁盘

㈧小结
① 确认小表是驱动表
② 确认涉及到的表和连接键分析过了
③ 如果在连接键上数据不均匀的话，建议做柱状图
④ 如果可以，调大hash_area_size的大小或pga_aggregate_target的值
⑤ Hash Join适合于小表与大表连接、返回大型结果集的连接.

转自：http://blog.csdn.net/dba_waterbin/article/details/8554550

Java面试题100道及答案编程大全面试题 java 开发语言
一、Java基础Java17中的sealed类和record类的作用和区别？答案：sealed类：限制继承关系，通过permits指定允许的子类。示例代码：publicsealedclassShapepermitsCircle,Square{...}；record类：不可变数据类，自动生成equals()、hashCode()和toString()。示例代码：publicrecordUser(St
17.RestClient实现数据聚合功能带过滤条件卷土重来… windows
@OverridepublicMap>filters(RequestParamsparam){Map>res=newHashMapbrandList=getAggByName(aggregations,"brandAgg");ListcityList=getAggByName(aggregations,"cityAgg");ListstarList=getAggByName(aggregation
ORACLE 正确删除归档日志的方法俗尘某某程序员记录 oracle 归档日志
ORACLE正确删除归档日志的方法我们都知道在controlfile中记录着每一个archivelog文件的相关信息，当然们在OS下把这些物理文件delete掉后，在我们的controlfile中仍然记录着这些archivelog文件的相关信息，在oracle的OEM管理器中有可视化的日志展现出，当我们手工清除archive目录下的文件后，这些记录并没有被我们从controlfile中清除掉，也就
Oracle查询超时问题，聊聊思路！ bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)数据库 oracle java
本文收录于《CSDN问答解答》专栏，主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述 Oracle在查询超过6秒的sql都会报Socketreadtimedout。我也根据网上的一些资料，在oracleurl后拼接了oracle.net.CONNECT_T
MybatisPlus操作Oracle日期时间时TO_DATE处理一朵梨花压海棠go java mybatis 开发语言
问题描述：在使用mybatis-plus构建查询语句对oracle数据进行查询时会报错，这是因为在ORACLE涉及日期查询时需要使用TO_DATE，所以，mybatis-plus构建查询语句时需要特别注意。mybatis-plus构建查询语句时，怎么处理oracle的日期呢？QueryWrapperwrapper=newQueryWrapper=TO_DATE({0},'yyyy-MM-dd')"
Oracle ORA-3137[12333] 关闭的连接 java.sql.SQLRecoverableException: 无法从套接字读取更多的数据 ... iteye_9244 ORALCE oracle sql
今天在项目中遇到一个异常：OracleORA-3137[12333]关闭的链接java.sql.SQLRecoverableException:无法从套接字读取更多的数据，后来我在网上找了一下解决方案发现有两个：第一个解决方案：换oracle驱动，把驱动版本换成11.2的，但是尝试了一下没有效果，所以使用了第二个解决方案：在PLSQL执行altersystemset"_optim_peek_use
mongodb 基本概念重生之我是一名程序员 mongodb
mongodb基本概念基于mongo:4.4.2databasedatabase数据库tablecollection数据库表/集合rowdocument数据记录行/文档columnfield数据字段/域indexindex索引tablejoins表连接,MongoDB不支持primarykeyprimarykey主键,MongoDB自动将_id字段设置为主键MongoDB数据类型数据类型描述Str
通过 Java 调用 ChromeDriver 启动 Chrome 浏览器后，当用户**手动点击按钮**时导致标签页崩溃 Esengnet java
importorg.openqa.selenium.WebDriver;importorg.openqa.selenium.chrome.ChromeDriver;importorg.openqa.selenium.chrome.ChromeOptions;importorg.openqa.selenium.remote.CapabilityType;importjava.util.HashMap
Redis 集群与分布式实现：从原理到实战一切皆有迹可循 redis redis 分布式数据库后端缓存
前言在大数据与高并发场景下，单节点Redis的容量与可用性已无法满足需求。Redis通过集群与分布式技术，实现了数据的分片存储与高可用部署，成为分布式系统的核心组件。本文将深入解析Redis集群的底层原理、架构模式与实战经验，结合代码示例与最佳实践，帮助开发者构建高性能、高可用的分布式缓存系统。一、集群基础架构与核心原理1.数据分片机制Redis集群采用哈希槽（HashSlot）实现数据分片，共有
nanoGPT复现——prepare拆解（自己构建词表 VS tiktoken） 2301_80365274 python 开发语言
在nanoGPT的data文件夹有两个很相似的文件夹结构：shakespeare和shakespeare-char，这两种都是对shakespeare数据集的处理，但是shakespeare使用的是tiktoken对文字进行编码，另一个则是使用自己构建的词表一、shakespeare-char（自己构建词表）数据获取data_path=os.path.join(os.path.dirname(__
PgSQL内核特性 | Brin索引 yzs87 搜索引擎数据库
PgSQL内核特性|Brin索引数据库在进行过滤扫描或者join时，如果该表特别大，那么就需要顺序扫描表的所有数据然后进行过滤，或者扫描所有数据进行join条件探测。这对IO的负载影响特别大，当在join时，比如HashJoin的外表，需要对每个数据都进行Hash表探测，进一步影响性能。现有列存比如Infobright、Parquet、hydra等都对存储进行了类似的改进，在每个block中增加了
Java基础集合框架之Set框架之TreeSet 骑牛小道士集合框架之Set java 开发语言
TreeSetTreeSet数据结构及实现原理TreeSet的构造方法TreeSet核心特性有序性(`排序大小输出`)自然排序定制排序唯一性底层数据结构:红黑树导航方法(特色核心优势)基础导航方法范围视图（不修改原集合）提取和删除元素逆序视图不允许null元素TreeSet线程不安全TreeSet线程不安全体现解决方案TreeSet优缺点TreeSet应用场景类结构传承去区别于HashSet实现了
Java基础集合框架之Set框架之LinkedHashSet 骑牛小道士集合框架之Set java 开发语言
LinkedHashSetLinkedHashSet构造方法LinkedHashSet底层数据结构及实现原理LinkedHashSet核心特性有序性插入顺序排序伪访问顺序排序(LRU)元素唯一性底层数据结构:[哈希桶+(链表或红黑树)]+追加的双向链表允许null值LinkedHashSet线程不安全LinkedHashSet线程不安全体现解决方案LinkedHashSet优缺点以及适用场景pub
38、Seabor的联合图和成对图的绘制【用Python进行AI数据分析进阶教程】理工男大辉郎 python 人工智能数据分析
用Python进行AI数据分析进阶教程38：Seabor的联合图和成对图的绘制关键词：Seaborn、联合图（JointPlot）、成对图（PairPlot）、数据类型、变量关系摘要：本文介绍了Seaborn库中的联合图（JointPlot）和成对图（PairPlot）的绘制方法。联合图用于展示两个变量之间的关系及各自分布，支持散点图、直方图、核密度估计图等多种类型，适用于连续型变量分析，可自定义
并发编程（2）——线程管控爱吃土豆zzz 并发编程并发编程 C++线程
目录二、day21.线程管控1.1归属权转移1.2joining_thread1.2.1如何使用joining_thread1.3std::jthread1.3.1零开销原则1.3.2线程停止1.4容器管理线程对象1.4.1使用容器1.4.2如何选择线程运行数量1.5线程id二、day2今天学习如何管理线程，包括：1）线程的归属权如何进行转移2）joining_thread3）jthread4）如
003-128 最长连续序列 Ernest_NEU 算法 leetcode
题目我的思考+word题解题解题解思路classSolution{publicintlongestConsecutive(int[]nums){SetnumSet=newHashSet<>();for(intnum:nums){numSet.add(num);}intmaxLength=0;for(intnum:numSet){if(!numSet.contains(num-1)){intcurN
搞笑Java工程师面试：从基础到高并发，大厂技术总监直击水货本质搞Java的小码农 Java技术场景题 Java 面试技术高并发微服务分布式 Redis
搞笑Java工程师面试：从基础到高并发，大厂技术总监直击水货本质场景设定在一个位于硅谷某栋现代化办公楼的会议室里，气氛庄重而专业。面试官李工是一位经验丰富的技术总监，他身穿整洁的西装，神情严肃，手中拿着一份详尽的面试提纲。对面的求职者小兰则显得自信满满，穿着时尚，带着一点漫不经心的神情，准备接受这场“挑战”。第1轮：Java核心、基础框架与数据库问题1：Java中的ConcurrentHashMa
2023年JAVA面试题【Redis/Elasticsearch】 GJH-JAVA java redis elasticsearch
1.什么是Redis？Redis是一个使用C语言写成的，开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sortedset--有序集合)和hash（哈希类型）。Redis的数据都基于缓存的，所以很快，每秒可以处理超过10万次读写操作，是已知性能最快的Key-ValueDB。Redis也可以实
25年银行行业java后端常问高频面试题小凡敲代码 java java后端 java面试 Java面试题互联网大厂 Java八股文后端开发
一、技术八股文高频题（银行侧重点）1.Java基础&并发编程HashMap在JDK1.8中的优化？ConcurrentHashMap如何保证线程安全？银行系统对线程安全要求极高，需深入理解CAS+synchronized的实现细节。synchronized和ReentrantLock的区别？银行系统更推荐哪种？银行系统倾向ReentrantLock（可中断、公平锁），需解释AQS原理。Thread
2025年Java后端面试必刷题：场景题与八股文高频考点小凡敲代码 java 面试 Java面试 java面试题互联网大厂 java面试 java场景题
一、高频八股文面试题Java基础篇HashMap与ConcurrentHashMap的区别HashMap非线程安全，JDK1.8后采用数组+链表/红黑树结构ConcurrentHashMap线程安全，JDK1.8改用CAS+synchronized优化锁粒度synchronized与ReentrantLock区别synchronized是JVM内置锁，自动释放，非公平锁ReentrantLock可
Python Json数据排序 weixin_33851177 python json java
importhashlib#recursivelycalculateeachelementblock'shashcode,andreorderthechildnodesinthelistbasingonthehashcode#finallywillgettheorderedjsonobjectandoverallhashcodedefordered(jsonNode):ifisinstance(j
深入理解HashMap：从数据结构到高并发战场达利源 java面试题哈希算法散列表算法
以下是我在财税业务中的自我体会：一、核心矛盾与设计哲学想象一个存放千万级纳税人信息的仓库（Map）。你需要：极速存取：输入ID，瞬间定位到对象。动态扩容：纳税人数量激增时，仓库能自动变大。空间高效：避免仓库大部分区域空置。线程安全(可选)：多窗口（线程）同时办理业务不混乱。HashMap的答卷：核心武器：数组+链表/红黑树灵魂算法：哈希函数(HashFunction)扩容策略：负载因子(LoadF
rabbitmq动态创建交换机、队列、动态绑定，销毁
//缓存已创建的绑定，避免重复声明privatefinalMapcreatedBindings=newConcurrentHashMapargs=newHashMap{@AutowiredRabbitMQServicerabbitMQService;@OverridepublicvoidonApplicationEvent(ListenerContainerConsumerFailedEvente
中国计算机学会（CCF）推荐学术会议-C（计算机体系结构/并行与分布计算/存储系统）：ATS 2025 爱思德学术可用性测试压力测试功能测试
ATS2025The34thAsianTestSymposium(ATS)andthe9thInternationalTestConferenceinAsia(ITC-Asia)willbeheldinconjunctionwithSEMICONJapan2025inTokyo,Japan.Thisjointeventprovidesavaluableplatformforacademicrese
数组数据转换为实体类 Jerry_carry 工具数组转实体类
importjava.lang.reflect.Constructor;importjava.lang.reflect.Field;importjava.lang.reflect.Method;importjava.time.LocalDate;importjava.time.LocalDateTime;importjava.util.ArrayList;importjava.util.HashM
达梦dsc与mpp集群机制比较 wyllove97 数据库 dba
达梦数据库现有2套分布式产品，即DMdsc共享存储集群以及DMmpp非共享存储集群DMdsc共享存储集群：该产品功能类似于oraclerac，具有高可用性和高伸缩性的特征，可提供横向扩展，实现超单一服务器的功能。其提升了错误恢复能力，并且随着系统增长而逐步扩展。一旦系统发生失败，该集群对用户保证最高可用性，保障关键业务数据不被丢失。拓扑图如下图所示：在配置DMdsc时，需配置两套网络，一套用于提供
DM8 DSC共享集群搭建部署 LeeWen2020 达梦
DMDSC共享集群属于达梦数据库集群架构产品之一，类似于OracleRAC架构。一、环境说明主机规划：IPAddrDBVersionOSVersion节点1192.168.15.11（外网）192.168.25.11（内网）DMV81-1-72-20.04.03-119959-ENTDSCVeriosn:V2.0中标麒麟6节点2192.168.15.12（外网）192.168.25.12（内网）D
MySQL的btree索引和hash索引的区别 xiaolyuh123 MySQL 哈希算法 mysql 算法
MySQL的BTree索引和Hash索引的区别一、定义类型定义说明时间复杂度BTree索引使用B+树结构组织索引数据，适用于范围查询、有序遍历等O(logn)Hash索引使用哈希表结构组织索引，仅适用于等值查找操作O(1)二、使用引擎存储引擎索引类型InnoDB默认使用BTree索引Memory默认使用Hash索引，可手动改为BTree三、核心区别对比维度BTree索引Hash索引数据结构B+树结
ORACLE数据库转国产阿里OceanBase数据库
1.BLOB类型修改将接口内oracle.sql.BLOB改为java.sql.Blob2.REGEXP_LIKE判断函数正则表达式中字符转义问题OB的正则表达式使用的是标准的Linux模式,oracle是黑盒子,在处理部分转义符([]+)的时候,Oracle无需使用转义符,OB务必使用转义符,加/转义处理,例如在regexp_like(t.xx,’^(+|[0-9]+)$’)改为regexp_l
Oracle 角色与自定义角色深度解析不辉放弃 oracle 数据库大数据开发
一、角色（Role）的核心概念在Oracle中，角色是权限的逻辑集合，通过将多个权限封装到角色中，可实现权限的批量管理。角色具有以下特性：权限容器：可包含系统权限、对象权限甚至其他角色简化管理：通过角色分配权限，避免直接对用户授权的繁琐操作动态权限控制：可通过激活/禁用角色临时调整用户权限二、系统预定义角色Oracle数据库自带多种预定义角色，按功能可分为以下几类：1.核心管理角色角色名称权限范围
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

深入理解Oracle表(5)：三大表连接方式详解之Hash Join的定义，原理，算法，成本，模式和位图

你可能感兴趣的:(JOIN,oracle,hash)