wsql

Oracle Index Clustering Factor 说明

一. 官网说明

The indexclustering factor measures row order in relation to an indexed value suchas employee last name. The more order that exists in rowstorage for this value, the lower the clustering factor.

-- row 存储的越有序，clustering factor 的值越低

Theclustering factor is useful as a rough measure of thenumber of I/Os required to read an entire table by means of an index:

（1）If the clustering factor is high, then Oracle Database performs a relativelyhigh number of I/Os during a large index range scan. The index entriespoint to random table blocks, so the databasemay have to read and reread the same blocks over and over again to retrieve thedata pointed to by the index.

--当clustering factor 很高时，说明index entry（rowid）是随机指向一些block的，在一个大的indexrange scan时，这样为了读取这些rowid 指向的block，就需要一次有一次重复的去读这些block。

（2）If the clustering factor is low, then Oracle Database performs a relativelylow number of I/Os during a large index range scan. The index keys in arange tend to point to the same data block, sothe database does not have to read and reread the same blocks over and over.

--当clustering factor 值低时，说明index keys（rowid）是指向的记录是存储在相同的block里，这样去读row时，只需要在同一个block里读取就可以了。就可以减少重复读取block的次数。

The clustering factor isrelevant for index scans because it can show:

（1）Whether the database will use an index for large range scans

（2）The degree of table organization in relation to the index key

（3）Whether you should consider using an index-organized table,partitioning, or table cluster if rows must be ordered by the index key

http://download.oracle.com/docs/cd/E11882_01/server.112/e16508/indexiot.htm#CNCPT89180

二. Index Clustering Factor说明

之前也整理过一篇有关索引维护的Blog，参考：

Oracle 索引的维护

http://blog.csdn.net/tianlesoftware/article/details/5680706

在里面没有提到index Clustering Factor参数，所以这里说明一下。

简单的说， IndexClustering Factor是通过一个索引扫描一张表，需要访问的表的数据块的数量，即对I/O的影响. 也代表索引键值存储位置是否有序。

（1）如果越有序，即相邻的键值存储在相同的block，那么这时候ClusteringFactor 的值就越低。

（2）如果不是很有序，即键值是随即的存储在block上，这样在读取键值时，可能就需要一次又一次的去访问相同的block，从而增加了I/O.

Clustering Factor 的计算方式如下：

（1）扫描一个索引（large index range scan）

（2）比较某行的rowid和前一行的rowid，如果这两个rowid不属于同一个数据块，那么cluster factor增加1

（3）整个索引扫描完毕后，就得到了该索引的cluster factor。

如果ClusteringFactor接近于表存储的块数，说明这张表是按照索引字段的顺序存储的。

如果ClusteringFactor接近于行的数量，那说明这张表不是按索引字段顺序存储的。

在计算索引访问成本的时候，这个值十分有用。Clustering Factor乘以选择性参数（selectivity ）就是访问索引的开销。

如果这个统计数据不能真实反映出索引的真实情况，那么可能会造成优化器错误的选择执行计划。另外如果某张表上的大多数访问是按照某个索引做索引扫描，那么将该表的数据按照索引字段的顺序重新组织，可以提高该表的访问性能。

三. 测试

3.1 模拟问题

--查看版本信息

SYS@anqing2(rac2)> select * fromv$version where rownum=1;

BANNER

----------------------------------------------------------------

Oracle Database 10g Enterprise EditionRelease 10.2.0.4.0 - Prod

--创建测试表

SYS@anqing2(rac2)> create table t asselect * from dba_objects where 1=2;

Table created.

SYS@anqing2(rac2)> begin

2 for i in 1..10 loop

3 insert /*+append*/ into tselect * from dba_objects order by i;

4 commit;

5 end loop;

6 end;

7 /

PL/SQL procedure successfully completed.

-- 这样insert的原因是保证数据存储的无序性

SYS@anqing2(rac2)> select count(*) fromt;

COUNT(*)

----------

502720

--查看表的大小

SYS@anqing2(rac2)> set wrap off

SYS@anqing2(rac2)> col owner for a10

SYS@anqing2(rac2)> col segment_name fora15

SYS@anqing2(rac2)> select owner, segment_name, blocks, extents,bytes/1024/1024||'M' "size" from dba_segments where owner='SYS' andsegment_name='T';

OWNERSEGMENT_NAME BLOCKS EXTENTS size

---------- --------------- -------------------- -------------------------------

SYST 6912 69 54M

--在object_id上构建索引

SYS@anqing2(rac2)> create index idx_t_id on t(object_id);

Index created.

SYS@anqing2(rac2)> select owner, segment_name, segment_type,blocks, extents,bytes/1024/1024||'M' "SIZE" from dba_segments where owner='SYS' andsegment_name=upper('idx_t_id');

ownersegment_name segment_type blocksextents size

---------- --------------------------------- ---------- ---------- ------------

SYSIDX_T_ID INDEX 115224 9M

--在没有收集相关的统计信息之前，我们查看一下Index Clustering Factor

SYS@anqing2(rac2)> select owner,index_name, clustering_factor, num_rows from dba_indexes where owner='SYS' andindex_name='IDX_T_ID';

OWNERINDEX_NAMECLUSTERING_FACTOR NUM_ROWS

---------- ----------------------------------------------- ----------

SYSIDX_T_ID 502720 502720

--收集统计信息

SYS@anqing2(rac2)> execdbms_stats.gather_table_stats('SYS','T',cascade => true);

PL/SQL procedure successfully completed.

--再次查看InexClustering Factor

SYS@anqing2(rac2)> select owner, index_name,clustering_factor, num_rows from dba_indexes where owner='SYS' andindex_name='IDX_T_ID';

OWNERINDEX_NAMECLUSTERING_FACTOR NUM_ROWS

---------- ----------------------------------------------- ----------

SYSIDX_T_ID 502720 502720

--统计信息收集前和后，Clustering Factor 值不变，说在创建索引的时候，会收集表中中数据真正的行数。并且这里的Clustering Factor 等于Num_rows，也也说明表的Clustering Factor 是无序的。

--查看一个确定值，然后查看执行计划

SYS@anqing2(rac2)> explain plan for select *from t where object_id=1501;

Explained.

SYS@anqing1(rac1)> select * fromtable(dbms_xplan.display);

PLAN_TABLE_OUTPUT

-------------------------------------------------------------------------------------------------------

Plan hash value: 514881935

----------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------

| 0| select statement | |10 | 930 | 14(0)| 00:00:01 |

| 1| table accessby index rowid| t | 10 |930 | 14(0)| 00:00:01 |

|* 2| index range scan | idx_t_id | 10 || 3 (0)| 00:00:01 |

----------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

PLAN_TABLE_OUTPUT

-------------------------------------------------------------------------------------------------------

2- access("OBJECT_ID"=1000)

--这里走了索引，cost为14

--查询一个范围的执行计划

SYS@anqing1(rac1)> explain plan for select * from t where object_id>1000 andobject_id<2000;

Explained.

SYS@anqing1(rac1)> select * fromtable(dbms_xplan.display);

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

Plan hash value: 1601196873

--------------------------------------------------------------------------

--------------------------------------------------------------------------

| 0| SELECT STATEMENT | |8884 | 806K| 1537(2)| 00:00:19 |

|* 1| TABLE ACCESSFULL| T | 8884 |806K| 1537 (2)| 00:00:19 |

--------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

1- filter("OBJECT_ID"<2000 AND "OBJECT_ID">1000)

13 rows selected.

--注意，object_id上是否索引的，但这里并没有使用索引而是使用了全表扫描

--刷新buffercache，然后查看SQL 执行的物理读，这个是否全表扫描的

SYS@anqing1(rac1)> alter system flushbuffer_cache;

System altered.

Elapsed: 00:00:00.24

SYS@anqing1(rac1)> set autot traceonlystat

SYS@anqing1(rac1)> select * from t where object_id>1000 andobject_id<2000;

9990 rows selected.

Elapsed: 00:00:17.13-- 用了17秒

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

7573 consistent gets

6911 physical reads--物理读

984 redo size

746085 bytes sent via SQL*Net toclient

7715 bytes received via SQL*Netfrom client

667 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

9990 rows processed

--强制走索引，看执行计划

SYS@anqing1(rac1)> set autot off

SYS@anqing1(rac1)> explain plan for select /*+ index(t idx_t_id) */ * from twhere object_id>1000 and object_id<2000;

Explained.

Elapsed: 00:00:00.03

SYS@anqing1(rac1)> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

Plan hash value: 514881935

----------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | |8884 | 806K| 8974(1)| 00:01:48 |

| 1| TABLE ACCESSBY INDEX ROWID| T | 8884 |806K| 8974 (1)| 00:01:48 |

|* 2| INDEX RANGE SCAN | IDX_T_ID | 8942 || 22 (0)| 00:00:01 |

----------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

2- access("OBJECT_ID">1000 AND "OBJECT_ID"<2000)

14 rows selected.

--强制走索引之后，这里的使用了index range scan，但是里的cost 变成了8974.而走全表扫描时，是1537.

--查看强制走索引的物理读

SYS@anqing1(rac1)> alter system flushbuffer_cache;

System altered.

Elapsed: 00:00:00.13

SYS@anqing1(rac1)> select /*+ index(tidx_t_id) */ * from t where object_id>1000 and object_id<2000;

9990 rows selected.

Elapsed: 00:00:00.25

Statistics

----------------------------------------------------------

0 recursive calls

0 db block gets

10679 consistent gets

154 physical reads

0redo size

205626 bytes sent via SQL*Net toclient

7715 bytes received via SQL*Netfrom client

667 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

9990 rows processed

--这里的物理读要比走索引低很多，但是Oracle 却没有使用索引。因为Oracle 认为走索引的Cost 比走全表扫描大。而是是大N倍。而CBO 就是基于Cost 来决定执行计划的。

通过第二节里的分析，对于索引的Cost，Oracle 是根据Clustering Factor参数来计算的，而我们的数据Clustering Factor参数很高，数据存储无序。这就造成了Oracle 认为走索引的cost 比全表扫描大。

3.2 解决问题

通过上面的分析，可以看出，要降低Clustering Factor才能解决问题，而要解决Clustering Factor，就需要重新对table表的存储位置进行排序。

--重建table

SYS@anqing1(rac1)> create table tt as select * from t where 1=0;

Table created.

SYS@anqing1(rac1)> insert /*+append */ into tt select * from t order byobject_id;

502720 rows created.

SYS@anqing1(rac1)> commit;

Commit complete.

SYS@anqing1(rac1)> truncate table t;

Table truncated.

SYS@anqing1(rac1)> insert /*+append */ into t select * from tt;

502720 rows created.

SYS@anqing1(rac1)> commit;

Commit complete.

--查看表和索引的信息

SYS@anqing1(rac1)> select owner,segment_name, blocks, extents, bytes/1024/1024||'M' "size" fromdba_segments where owner='SYS' and segment_name='T';

OWNERSEGMENT_NAME BLOCKS EXTENTS size

---------- --------------- -------------------- -------------------------------

SYST 6912 69 54M

SYS@anqing1(rac1)> select owner,segment_name, segment_type,blocks, extents, bytes/1024/1024||'M'"SIZE" from dba_segments where owner='SYS' andsegment_name=upper('idx_t_id');

OWNERSEGMENT_NAME SEGMENT_TYPEBLOCKS EXTENTS SIZE

---------- --------------------------------- ---------- ---------- ------------

SYSIDX_T_ID INDEX 1024 23 8M

SYS@anqing1(rac1)> select owner,index_name, clustering_factor, num_rows from dba_indexes where owner='SYS' andindex_name='IDX_T_ID';

OWNERINDEX_NAMECLUSTERING_FACTOR NUM_ROWS

---------- ----------------------------------------------- ----------

SYSIDX_T_ID 502720 502720

--对索引进行rebuild

SYS@anqing1(rac1)> alter index idx_t_idrebuild;

Index altered.

--查看ClusteringFactor

SYS@anqing1(rac1)> select owner, index_name, clustering_factor,num_rows from dba_indexes where owner='SYS' and index_name='IDX_T_ID';

OWNERINDEX_NAME CLUSTERING_FACTOR NUM_ROWS

---------- ----------------------------------------------- ----------

SYSIDX_T_ID 6958 502720

--注意这里的Factor，已经变成6958.我们收集一下表的统计信息，然后与表的block 进行一次比较。

SYS@anqing1(rac1)> execdbms_stats.gather_table_stats('SYS','T',cascade => true);

PL/SQL procedure successfully completed.

SYS@anqing1(rac1)> select blocks fromdba_tables where table_name='T';

BLOCKS

----------

6896

--表T 实际使用的block是6896，Clustering Facter 是6958.基本还是比较接近了。这也说明相邻的row是存储在相同的block里。

--再次查看之前sql的执行计划

SYS@anqing1(rac1)> set linesize 100

SYS@anqing1(rac1)> explain plan for select * from t where object_id>1000 andobject_id<2000;

Explained.

SYS@anqing1(rac1)> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

Plan hash value: 514881935

----------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | |8928 | 810K| 147(1)| 00:00:02 |

| 1| TABLE ACCESSBY INDEX ROWID| T | 8928 |810K| 147 (1)| 00:00:02 |

|* 2| INDEX RANGE SCAN | IDX_T_ID | 8944 || 22 (0)| 00:00:01 |

----------------------------------------------------------------------------------------

Predicate Information (identified by operationid):

PLAN_TABLE_OUTPUT

----------------------------------------------------------------------------------------------------

---------------------------------------------------

2- access("OBJECT_ID">1000 AND "OBJECT_ID"<2000)

14 rows selected.

--注意这里的cost已经将到了147. 性能提升还是非常明显。

SYS@anqing1(rac1)> set autot trace stat

SYS@anqing1(rac1)> set timing on

SYS@anqing1(rac1)> alter system flushbuffer_cache;

System altered.

Elapsed: 00:00:00.08

SYS@anqing1(rac1)> select * from t whereobject_id>1000 and object_id<2000;

9990 rows selected.

Elapsed: 00:00:00.25

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

1473 consistent gets

147 physical reads

0 redo size

205626 bytes sent via SQL*Net toclient

7715 bytes received via SQL*Netfrom client

667 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

9990 rows processed

四. 小结

通过以上说明和测试，可以看到Clustering Factor 也是索引健康的一个重要判断的标准。其值越低越好。它会影响CBO 选择正确的执行计划。但是要注意一点，Clustering Factor 总是趋势与不断恶化的。

在之前索引维护的blog里：

Oracle 索引的维护

http://blog.csdn.net/tianlesoftware/article/details/5680706

提到了一个索引的选择性. 索引的选择性是指索引列中不同值的数目与表中记录数的比。如果一个表中有2000条记录，表索引列有1980个不同的值，那么这个索引的选择性就是1980/2000=0.99。一个索引的选择性越接近于1，这个索引的效率就越高。CBO的优化器一般不会使用选择性不好的索引。

现在举一个例子来看下为什么索引的选择性越高效率越高。一般索引里会包含rowid和键值。假设在字段name 上有索引，其值如下：

row1 dave

row2 dave

row3 dave

row4 dave

row5 anqing

按以上6条记录看，索引的选择性=2/6=0.33. 在这种情况下，如果我们根据Dave 来查询，那么索引就返回5行rowid。如果是多表的netsed loop连接，那代价就会很大了。所以当索引的选择性越低，这种扫描的代价越大。

对于这种列，可以说是数据倾斜。对这种情况，就需要收集列信息的直方图（histogram）。让CBO 在选择执行计划时得到更多的信息，从而选择正确的执行计划。

更多信息参考：

Oracle Statistic 统计信息小结

http://blog.csdn.net/tianlesoftware/article/details/4668723

-------------------------------------------------------------------------------------------------------

Blog： http://blog.csdn.net/tianlesoftware

Email: [email protected]

DBA1 群：62697716(满); DBA2 群：62697977(满)DBA3 群：62697850(满)

DBA 超级群：63306533(满); DBA4 群： 83829929 DBA5群： 142216823

DBA6 群：158654907 聊天群：40132017 聊天2群：69087192

--加群需要在备注说明Oracle表空间和数据文件的关系，否则拒绝申请

你可能感兴趣的:(cluster)

四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
02-Cesium聚合分析EntityCluster完整代码 fxshy html css javascript
1.完整代码Document-->-->Cesium.Ion.defaultAccessToken='eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJqdGkiOiJhZjZkZDAwZC1mNTFhLTRhOTEtOGExNi00MzRhNGIzMDdlNDQiLCJpZCI6MTA1MTUzLCJpYXQiOjE2NjA4MDg0Njd9.qajeJtc4-kp
k8s中Service暴露的种类以及用法听说唐僧不吃肉 K8S kubernetes 容器云原生
一、说明在Kubernetes中，有几种不同的方式可以将服务（Service）暴露给外部流量。这些方式通过定义服务的spec.type字段来确定。二、详解1.ClusterIP定义：默认类型，服务只能在集群内部访问。作用：通过集群内部IP地址暴露服务。示例：spec:type:ClusterIPports:-port:80targetPo
【YashanDB知识库】YashanDB 开机自启 YashanDB YashanDB知识库数据库数据库系统崖山数据库 YashanDB oracle
【问题分类】YashanDB开机自启【关键字】开机自启，依赖包【问题描述】数据库所在服务器重启后只拉起monit、yasom、yasom进程，缺少yasdb进程：【问题原因分析】数据库安装的时候未启动守护进程【解决/规避方法】进入数据库之前的安装目录，启动守护进程：Shellcd/home/yashan/install./bin/yasbootmonitstart--clusteryashandb
Redisson分布式锁实现原理和使用牧竹子 springboot #redis Redisson redis
常见的锁内存锁lock,synchronize分布式锁redis，zookeeper实现Redisson基于redis实现了Lock接口的分布式集群锁，是可重入锁，功能强大，源码复杂，比redis单机模式分布式锁可靠，稳定性更高，支持集群模式，支持锁根据业务时长自动延迟释放redis普通分布式锁存在一定的缺陷——它加锁只作用在一个Redis节点上，如果通过sentinel和cluster保证高可用
Redis的持久化和高可用性小辛学西嘎嘎 redis 数据库缓存
目录一、淘汰策略1、背景2、淘汰策略二、持久化1、背景2、fork进程写时复制机制3、Redis持久化方式1、aof2、rdb三、高可用1、主从复制2、Redis哨兵模式3、Rediscluster集群一、淘汰策略1、背景首先Redis是一个内存数据库，将所有数据存放在内存中，通过对K值进行hash后存储在散列表中。有一个小问题Redis数据库占96G，但为什么最终占满只有48G呢。因为中间有个过
Redis安装详解（单机安装，sentinel哨兵模式，Cluster模式） dream21st 中间件学习笔记 sentinel redis java
文章目录1Redis单机安装1.1windows中安装1.2linux中安装2Redis主从复制安装3Redis哨兵模式安装4Springboot项目操作RedisSentinel集群5官方cluster分区搭建5.1部署架构5.2RedisCluster的优势5.3集群搭建6Springboot项目操作Cluster集群1Redis单机安装Redis安装包可以从官网下载，也可以在redis的官方
go-etcd实战小书go golang 实战演练 golang etcd 服务发现服务注册微服务
etcd简介etcdisastronglyconsistent,distributedkey-valuestorethatprovidesareliablewaytostoredatathatneedstobeaccessedbyadistributedsystemorclusterofmachines.Itgracefullyhandlesleaderelectionsduringnetwork
聚类分析 | Python密度聚类（DBSCAN）天天酷科研聚类分析算法（CLA）python 聚类机器学习 DBSCAN
密度聚类是一种无需预先指定聚类数量的聚类方法，它依赖于数据点之间的密度关系来自动识别聚类结构。本文中，演示如何使用密度聚类算法，具体是DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）来对一个实际的数据集进行聚类分析。一、基本介绍密度聚类的核心思想是将数据点分为高密度区域和低密度区域。高密度区域内的数据点被认为属于同一簇，而低
Etcd 配置详解 SkTj
配置标记成员标记—name—data-dir—wal-dir—snapshot-count—heartbeat-interval—election-timeout—listen-peer-urls—listen-client-urls—max-snapshots—max-wals—cors集群标记—initial-advertise-peer-urls—initial-cluster—initia
Redis高可用確定饿的猫 redis 数据库 linux
目录持久化主从复制哨兵Cluster集群RDB持久化手动触发自动触发RDB执行流程RDB载入AOF持久化执行流程命令追加文件写入和文件同步appendfsyncalwaysappendfsyncnoappendfsynceverysecond文件重写文件重写流程载入对比nginx、tomcat、mysql等服务都具有预防单点故障、提高整体性能和安全性的功能，当然，Redis也不例外在Redis中，
图计算：基于SparkGrpahX计算聚类系数妙龄少女郭德纲 Spark 图算法 Scala 聚类数据挖掘机器学习
图计算：基于SparkGrpahX计算聚类系数文章目录图计算：基于SparkGrpahX计算聚类系数一、什么是聚类系数二、基于SparkGraphX的聚类系数代码实现总结一、什么是聚类系数聚类系数（ClusteringCoefficient）是图计算和网络分析中的一个重要概念，用于衡量网络中节点的局部聚集程度。它有助于理解网络中节点之间的紧密程度和网络的结构特性。这是一种用来衡量图中节点聚类程度的
Oracle数据库中的Oracle Real Application Clusters是什么 2401_85812053 数据库 oracle
OracleRealApplicationClusters（简称OracleRAC）是Oracle数据库的一个关键特性，它允许多个数据库实例同时访问和管理同一个数据库。这种架构设计的目的是为了提高数据库系统的可扩展性、可用性和性能。OracleRAC的核心特点包括：高可用性：如果任何一个节点发生故障，其他节点可以继续处理请求，从而保持应用程序的连续运行。数据库实例之间的负载均衡可以自动进行，减少单
kubeadm升级k8s_remote version is much newer v1 2401_86367086 kubernetes 容器云原生
可以看到我们的版本可以升级到v1.24.4###显示版本差异kubeadmupgradediff1.24.4[upgrade/diff]Readingconfigurationfromthecluster…[upgrade/diff]FYI:Youcanlookatthisconfigfilewith‘kubectl-nkube-systemgetcmkubeadm-config-oyaml’—/
如何在 KubeBlocks 中配置实例模板？小猿姐 kubernetes 数据库云原生 mysql
背景在KubeBlocks中，一个Cluster由若干个Component组成，一个Component最终管理若干Pod和其它对象。在0.9版本之前，这些Pod是从同一个PodTemplate渲染出来的（该PodTemplate在ClusterDefinition或ComponentDefinition中定义）。这样的设计不能满足如下需求：对于从同一个Add-on中渲染出来的Cluster，为其设
如何通过Python SDK描述Collection DashVector python java 服务器数据库数据库架构人工智能
本文介绍如何通过PythonSDK获取已创建的Collection的状态和Schema信息。前提条件已创建Cluster：创建Cluster。已获得API-KEY：API-KEY管理。已安装最新版SDK：安装DashVectorSDK。接口定义Python示例：Client.describe(name:str)->DashVectorResponse使用示例说明需要使用您的api-key替换示例中
如何通过Python SDK新建一个DashVector Client DashVector python java 数据库 embedding 大数据人工智能
本文介绍如何通过PythonSDK新建一个DashVectorClient。说明通过DashVectorClient可连接DashVector服务端，进行Collection相关操作。前提条件已创建Cluster：创建Cluster。已获得API-KEY：API-KEY管理。已安装最新版SDK：安装DashVectorSDK。接口定义Python示例：dashvector.Client(api_k
Spark运行时架构 tooolik spark 架构大数据
目录一，Spark运行时架构二，YARN集群架构（一）YARN集群主要组件1、ResourceManager-资源管理器2、NodeManager-节点管理器3、Task-任务4、Container-容器5、ApplicationMaster-应用程序管理器6，总结（二）YARN集群中应用程序的执行流程三、SparkStandalone架构（一）client提交方式（二）cluster提交方式四、
redis cluster之Gossip协议 tracy_668
什么是Gossip协议Gossipprotocol也叫EpidemicProtocol（流行病协议），实际上它还有很多别名，比如：“流言算法”、“疫情传播算法”等。这个协议的作用就像其名字表示的意思一样，非常容易理解，它的方式其实在我们日常生活中也很常见，比如电脑病毒的传播，森林大火，细胞扩散等等。Gossipprotocol最早是在1987年发表在ACM上的论文《EpidemicAlgorith
ActiveMQ集群、负载均衡、消息回流星星都没我亮 ActiveMQ activemq
文章目录集群配置主备集群SharedFileSystemMasterSlavefailover故障转移协议TransportOptions负载均衡静态网络配置可配置属性URI的几个属性NetworkConnectorProperties动态网络配置消息回流消息副本集群配置官方文档http://activemq.apache.org/clustering主备集群http://activemq.apa
【深入学习Redis丨第三篇】深入详解Redis高可用集群模式陈橘又青深入学习Redis 学习 redis 数据库高可用集群
前言本文我们将介绍Redis的四种模式及各自优缺点分析。Redis一共4种模式：1、主从复制模式2、(Sentinel)哨兵模式3、(Cluster)集群模式4、代理模式文章目录前言1.**主从模式****1.1简介****1.2工作机制**2.**哨兵模式****2.1简介****2.2工作机制****2.3注意点**3.**Cluster模式****3.1简介****3.2工作机制****3.
【Redis】Redis 集群搭建与管理: 原理、实现与操作 Hsu琛君珩 Redis redis bootstrap 数据库
目录集群(Cluster)基本概念数据分片算法哈希求余⼀致性哈希算法哈希槽分区算法(Redis使⽤)集群搭建(基于docker)第⼀步:创建⽬录和配置第⼆步:编写docker-compose.yml第三步:启动容器第四步:构建集群主节点宕机演⽰效果处理流程1)故障判定2)故障迁移集群扩容第⼀步:把新的主节点加⼊到集群第⼆步:重新分配slots第三步:给新的主节点添加从节点集群缩容(选学)第⼀步:删
Puppeteer Cluster：自动化网页操作的新利器宋溪普Gale
PuppeteerCluster：自动化网页操作的新利器puppeteer-clusterthomasdondorf/puppeteer-cluster:PuppeteerCluster是一个基于Puppeteer的库，用于并行处理多个网页操作任务，可以提高网页抓取和自动化任务的效率。项目地址:https://gitcode.com/gh_mirrors/pu/puppeteer-cluster在
深度图解Redis Cluster原理 SH的全栈笔记 Redis 后端后端 redis
不想谈好吉他的撸铁狗，不是好的程序员，欢迎微信关注「SH的全栈笔记」前言上文我们聊了基于Sentinel的Redis高可用架构，了解了Redis基于读写分离的主从架构，同时也知道当Redis的master发生故障之后，Sentinel集群是如何执行failover的，以及其执行failover的原理是什么。这里大概再提一下，Sentinel集群会对Redis的主从架构中的Redis实例进行监控，一
elasticsearch 图灵农场 tl微服务专题
cluster：代表一个集群，集群中有多个节点，其中有一个为主节点，这个主节点是可以通过选举产生的，主从节点是对于集群内部来说的。es的一个概念就是去中心化，字面上理解就是无中心节点，这是对于集群外部来说的，因为从外部来看es集群，在逻辑上是个整体，你与任何一个节点的通信和与整个es集群通信是等价的。shards：代表索引分片，es可以把一个完整的索引分成多个分片，这样的好处是可以把一个大的索引拆
Redis cluster 集群TLS and Jedis使用SSL调用redis服务潘多编程 Redis 数据库 redis linux
安装#安装依赖软件sudoaptupdatesudoaptinstallmakegcclibssl-devpkg-config#下载redis解压wgethttps://download.redis.io/releases/redis-6.2.6.tar.gztar-xvfredis-6.2.6.tar.gz#编译cdredis-6.2.6makeBUILD_TLS=yes#如果执行编译出错，提示
Folium：Python地图可视化库使用详解零度° python python 开发语言
{row['Description']}",icon=folium.Icon(color='red',icon='info-sign')).add_to(marker_cluster)#添加多边形folium.Polygon(locations=[[39.9,116.4],[39.95,116.45],[40.0,116.4],[39.9,116.4]],color='blue',fill=Tru
Redis分布式 Flying_Fish_Xuan mongodb 数据库
Redis是一个高性能的内存数据库，具有多种分布式部署和扩展能力。Redis的分布式架构包括主从复制、哨兵模式（Sentinel）、RedisCluster集群模式。不同的分布式机制各自适用于不同的场景，提供了从简单的高可用性到复杂的水平扩展能力。1.主从复制（Master-SlaveReplication）1.1基本概念Redis的主从复制是其最基本的分布式架构模式。在这种模式下，一个Redis
Mysql 8.0 集群简介【官方文档5种方式】 arroganceee 文档介绍 mysql 数据库架构
Mysql官方介绍几种集群架构：Replication【主从复制】GroupReplication【组复制】InnoDBClusterInnoDBReplicaSetMySQLNDBCluster8.0网上比较全的介绍比较少，本文机翻了Mysql官网对Mysql8.0几种集群方式的简介。之后会一一研究并实际部署。Replication【主从复制】https://dev.mysql.com/doc/
存储集群消除pg数量过多的告警大大金 ceph
[root@xxxxxxxxxxxxxx~]#ceph-scluster334cfe7e-9ccc-483d-8d2c-218fde3a5fdehealthHEALTH_WARNtoomanyPGsperOSD(307>max300)nodeep-scrubflag(s)setmonmape1:3monsat{node1=100.88.28.11:6789/0,node2=100.88.28.12
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class