流木随风

第5.1章：StarRocks升级、回滚与扩缩容

通常来说，若项目上线后业务平稳、集群稳定，能不动系统，就不动系统！不过，StarRocks版本迭代非常迅速，不论从新功能新特性还是从稳定性和查询性能的角度考虑，官方每次发版都有新惊喜，值得我们酌情升级。也是因此，StarRocks历史版本中存在数个变动较大的版本，当我们希望跨大版本升级时，就需要使用几个过渡版本来配合升级。

同样，StarRocks官网对于集群管理的介绍地址为：

集群管理 @ Cluster_administration @ StarRocks Docshttps://docs.starrocks.com/zh-cn/main/administration/Cluster_administration

扩容缩容 @ Scale_up_down @ StarRocks Docshttps://docs.starrocks.com/zh-cn/main/administration/Scale_up_down

一、升级说明整理

结合这两年使用StarRocks的实践经验，将StarRocks的升级/回滚注意事项整理如下表。只要大家注意表格中罗列的事项，升级不会有什么其他的风险：

当前版本		目标版本
当前版本		≤1.17.1	≥1.17.2	≤1.18.1	≥1.18.2	≥2.0.0
Apache Doris [百度Palo]	≤0.13.11	可更新[推荐]	可更新，无法回滚[不推荐]			不可更新
	≤0.13.15	可更新，需修改StarRocks FE源码后单独编译	可更新，需修改StarRocks FE源码后单独编译，无法回滚[不推荐]			不可更新
	≥0.14	不可更新
StarRocks	＜1.16.0	可升级	可升级，无法回滚			不可升级
	≤1.17.1	可升级	可升级，无法回滚			可升级，务必先全局开启CBO，无法回滚[升级跨度太大，不推荐]
	≤1.18.1	不可回滚	可回滚		可升级	可升级，务必先全局开启CBO
	≥1.18.2	不可回滚	可回滚		可升级，可回滚	可升级，务必先全局开启CBO
	≥2.0.0	不可回滚	可回滚[回滚跨度太大，不推荐]			可升级

特别说明：

1、StarRocks带有三位的版本号，小版本升级指的是第三位版本，例如2.0.1升级至2.0.2。大版本升级指第二位版本，例如1.19.6升级至2.0.0，或者2.0.1升级至2.1.0。第一位版本是StarRocks里程碑式版本号，也可以同样视为大版本来理解。

2、原则上，每次升级版本跨度不建议超过一个大版本，推荐的升级方式是1.17->1.18，1.18->1.19，1.19->2.0，2.0->2.1等等。现在社区绝大部分同学的版本都不会低于1.16，这里提供一种我实践多次未出现问题的升级路线，即1.16.#->1.17.1->1.17.9->1.19.6->2.0，仅供大家参考，相关版本可私信我或在社区联系StarRocks官方同学获取。

3、StarRocks 2.0.0之前的版本升级至2.#版本时，务必先全局开启CBO。因1.16之前的版本无CBO优化器，所以不要直接升级，可能会出现无法预测的问题。

4、基于Apache版本更新时，推荐修改配置文件后全量替换安装包；StarRocks小版本升级时，推荐替换整个lib目录；大版本升级时，推荐同时替换bin和lib目录。小版本升级时之所以建议整个替换lib，而不是只替换其中的starrocks-fe.jar和starrocks_be，是因为某些小版本也同时升级了其他依赖，为避免引起冲突，整个替换lib目录是较为稳妥的。同样，若不确定当前版本到目标版本是否为大版本升级时，修改配置文件后全量替换安装包也是非常稳妥的方案。

5、Apache Doris/百度Palo需更新至StarRocks时，推荐的方式为先升级至Apache Doris 0.13.11，然后更新至StarRocks 1.17.1，再进行后续升级。

二、升级说明及可能的异常处理

我本地测试环境的三台机器当前是2.0.1版本，咱们就以它为例，将其升级为2.1.1版本。新版本的安装包可以从官网直接获取，官方下载地址：

StarRocks - 新一代极速全场景MPP数据库https://www.starrocks.com/zh-CN/download/community

在官网复制具体的安装包链接后可在服务器上使用wget命令下载：

[root@node01 software]# wget https://www.starrocks.com/zh-CN/download/request-download/15 -O StarRocks-2.1.1.tar.gz

下载后校验MD5码，确认文件无损坏：

[root@node01 software]# md5sum StarRocks-2.1.1.tar.gz

103f189dfbd043683933012a0e1d6c18 StarRocks-2.1.1.tar.gz

2.1、升级前的思考

“升级有风险，操作需谨慎”，这可能都是运维同学的口头禅了，为了尽可能的规避风险，大家在对生产环境进行升级时，除了错开业务高峰时间，不妨也按照这里咱们梳理的步骤“三思而后行”。

2.1.1 确认升级前后版本

根据前面整理的升级说明表，2.0.1升级至2.1.1属于大版本升级，跨度仅为1个大版本，这样就没有其他特别的注意事项，可以正常升级。

假设，我们当前的集群版本是1.17.1，想要升级到的版本是2.1.1。参考前面的表格，当前版本是≤1.17.1，目标版本≥2.0.0，行列相交对应的单元格内容为“可升级，务必先全局开启CBO，无法回滚[升级跨度太大，不推荐]”，看到“不推荐”后，如果是生产环境，我们就要规避风险，不要直接升级，而是逐个大版本的过渡升级。

不久前，社区有同学尝试直接从1.16升级到了1.19.6，结果升级后出现了多个奇怪的报错，例如Vectorized engine not support unknown child type cast，且无法正常回滚。向社区求助后，StarRocks DBA同学排查定位到是几个在1.16中没有但在1.19.6版本需要开启或关闭的参数在升级过程中没有办法自动生效，又在1.19.6中单独配置了一次集群才恢复正常。

社区也有同学曾尝试从1.15直接升级2.0版本，发现升级时BE是根本起不来的，无奈只能将该BE节点DROP掉，利用三副本的特性让集群自己恢复丢失数据。

相信大家都是爱好世界和平的，在没有多次实践检验的前提下，咱们一次一个大版本，慢慢迭代升级，慢是慢了些，但最为稳妥。

2.1.2 确认升级顺序

StarRocks保证BE后向兼容FE，即新版本的BE可以兼容老版本的FE，所以我们升级时要严格按照：BE->FE Observer->FE Follower->FE Leader->Broker来进行。

具体来说，首先逐个升级BE，升级一个后观察几分钟，集群没有异常且没有不健康的tablet即可升级下一个。通常，我们不建议也没有必要在升级一个BE后观察数小时甚至数天才继续升级，这样不同版本的BE在一个集群内长时间运行反而可能会出现问题。从1.18版本后，升级或者回滚其实并没有什么风险，大家放心大胆操作，只要不是一些低级错误的操作，StarRocks没有那么脆弱。

BE全部升级完成后，同样观察几分钟，就可以升级FE。为了方便理解，不细究定义，就认为FE有三类角色：Leader、Follower和Observer，它们的升级顺序为Observer->Follower->Leader，依旧是逐个进行。如果集群中是1 Leader+多Observer的架构，同样也是先逐个升级Observer，再升级Leader。升级每个FE前，务必注意先在本地备份一份元数据（即整个meta目录），这个至关主要！假设出现不可逆问题，这份元数据可能就是救命的稻草。每个FE升级后，查看其状态，观察几分钟，只要Alive为true，即可进行后续的升级。

在FE和BE正常升级完成后，咱们就可以喘口气了，剩下的Broker作为和HDFS类交互的插件，它的升级没有什么风险，但是我们也务必注意将其升级到和咱们FE、BE的主程序版本一致，不然在进行Broker Load等操作时，可能因为版本不一致出现一些看不太懂的问题。

2.1.3 确认升级影响

不考虑升级操作自身的风险，StarRocks的升级我们可以从以下两个角度思考风险和影响：

1）功能变化影响

新版本会不会有一些功能变化导致升级后原有业务受到影响的？比如导入参数名称的改变、SQL语法的修改等等，这部分确实是有一些的。

例如StarRocks 1.18.2版本取消了Broker Load的exec_mem_limit参数，改用load_mem_limit，或者2.0版本后无缓存删除的语法改为drop table tbl force，再或者2.0独有的tablet_max_versions=1000的限制等等。

如果我们是从Apache Doris更新过来，可能还有其他的语法需要注意，例如Apache Doris 0.13版本中，string是等于varchar(1)，其Routine Load任务中允许字段重名而StarRocks不允许等等。

这些功能变化我们是没有办法完全的整理罗列的，最好的方案就是我们先在测试环境进行充分的测试验证后再对生产环境进行升级。

2）升级过程影响

因为升级过程中我们不可避免的要停止原有进程和启动新进程，所以大家一直比较关注升级过程中能不能做到上层业务的无感知。

结论是：多FE多BE的三副本集群，在整个升级过程中，查询通常不会受到影响，导入可能会受到影响（原子性），Schema Change操作可能受到影响，Routine Load例行导入任务个别可能受到影响。

2.2 集群升级

“三思”之后，真正的升级操作反而不复杂了。先将安装包分发至各个节点，当前StarRocks 2.0.1的集群正常运行，以node01节点为例（三台服务器部署路径相同），原部署路径为：

服务名称	原版本	相关路径
FE	2.0.1	部署目录：/opt/module/starrocks/fe 元数据目录：/opt/module/meta
BE	2.0.1	部署目录：/opt/module/starrocks/be 数据目录：/opt/module/storage
Broker	2.0.1	/opt/module/starrocks/apache_hdfs_broker

下载好的2.1.1的安装包位于：/opt/software/StarRocks-2.1.1.tar.gz

2.2.1 升级BE

因为要进行大版本升级，我们需要替换bin和lib，首先重命名BE的bin和lib目录：

[root@node01 ~]# cd /opt/module/starrocks/be

[root@node01 be]# mv bin bin.bak

[root@node01 be]# mv lib lib.bak

解压安装包，并分发新版本的文件到be的目录中：

[root@node01 be]# cd /opt/software/

[root@node01 software]# tar xvf StarRocks-2.1.1.tar.gz

[root@node01 software]# cp -r StarRocks-2.1.1/be/bin /opt/module/starrocks/be/

[root@node01 software]# cp -r StarRocks-2.1.1/be/lib /opt/module/starrocks/be/

注意这里一定不要不重命名原目录直接覆盖，这可能会导致该目录中存在同一个jar包两个不同版本，引发冲突造成不可控的报错。

切换至BE部署目录：

[root@node01 software]# cd /opt/module/starrocks/be/

观察目录结构：

[root@node01 be]# ll

total 0

drwxr-xr-x 2 root root 106 Mar 5 14:36 bin

drwxr-xr-x 2 root root 120 Mar 4 19:54 bin.bak

drwxr-xr-x 2 1007 1007 42 Dec 17 12:21 conf

drwxr-xr-x 4 root root 79 Mar 5 14:37 lib

drwxr-xr-x 7 root root 99 Feb 17 15:53 lib.bak

drwxr-xr-x 2 root root 126 Dec 2 09:37 log

drwxr-xr-x 3 1007 1007 244 Nov 29 21:32 www

停止bin.bak目录下的进程，启动新bin目录下的新BE进程：

[root@node01 be]# ./bin.bak/stop_be.sh

stop starrocks_be, and remove pid file.

[root@node01 be]# ./bin/start_be.sh --daemon

访问StarRocks，查看该BE状态：

[root@node01 be]# mysql -h127.0.0.1 -P9030 -uroot -proot

……

mysql> show backends\G

*************************** 1. row ***************************

            BackendId: 10002

              Cluster: default_cluster

                   IP: 192.168.110.101

        HeartbeatPort: 9050

               BePort: 9060

             HttpPort: 8040

             BrpcPort: 8060

        LastStartTime: 2022-03-05 14:42:20

        LastHeartbeat: 2022-03-05 14:44:20

                Alive: true

SystemDecommissioned: false

ClusterDecommissioned: false

            TabletNum: 13445

     DataUsedCapacity: 376.222 MB

        AvailCapacity: 18.408 GB

        TotalCapacity: 37.017 GB

              UsedPct: 50.27 %

       MaxDiskUsedPct: 50.27 %

               ErrMsg:

              Version: 2.1.1-cdbe41b

               Status: {"lastSuccessReportTabletsTime":"2022-03-05 14:44:20"}

    DataTotalCapacity: 18.775 GB

          DataUsedPct: 1.96 %

查看到Version已经是2.1.1-cdbe41b，Alive也为true后，基本是没什么问题的，但我们先不要着急立刻升级下一个节点，比较稳妥的方案是检查一下当前集群的副本健康情况，执行SQL命令：

mysql> show proc '/statistic';

我们需要关注两个指标：UnhealthyTabletNum和InconsistentTabletNum。

UnhealthyTabletNum代表当前集群中不健康的tablet个数，InconsistentTabletNum表示集群中数据不一致的tablet个数。状态不健康大家好理解，解释一下副本不一致。我们建表时经常提到默认是三副本，这个三副本，其实就是说StarRocks表中的数据经过分区分桶后形成的tablet保存了几份，三副本就是三份。一个tablet的三个副本中的数据理论上是完全一致的，但总有一些特殊的情况比如导入过于频繁、网络异常、IO异常等原因导致它们内部的数据不太一样，此时就会被标记为Inconsistent。同样，一个tablet的三个副本中如果有哪个出现了损坏，那这个tablet也会被标记为Unhealthy。StarRocks后台常驻进程会不断的检查和修复不健康或者不一致的副本，所以每升级完一个BE，我们都需要执行这个命令，来观察这两项指标，确认都为0后，再进行下一个BE的升级。

对InconsistentTabletNum这个指标还需要特别说明一下，当前的版本对该指标的统计可能是不太准确的，这里请教过了StarRocks的研发老大们，如果发现InconsistentTabletNum中有较大的数值且一直没有减少，目前可以先不用在意，通常并不是真的副本不一致，可以正常升级。

而如果UnhealthyTabletNum一直存在数值没有归零，就说明因为某些原因，集群没有修复或者没能优先修复异常的tablet，我们可能就需要手动调整对应库表的修复优先级，再或者找到有问题的tablet，将其状态手动置为Bad，让集群直接对其优先修复。手动设置副本状态为Bad的这个操作需要特别注意，操作前务必确认当前集群中这个tablet是有可用副本的，也就是说对应的表至少是2副本或者3副本的表，不然单副本下，tablet一旦损坏，或者是我们手动将其状态置为了Bad，数据就是真的丢失了。

优先修复指定的表或分区的语法为：

ADMIN REPAIR TABLE table_name[ PARTITION (p1,...)]

可以通过以下命令取消优先级：

ADMIN CANCEL REPAIR TABLE tbl [PARTITION (p1, p2, ...)];

参考地址：

ADMIN REPAIR @ ADMIN REPAIR @ StarRocks Docshttps://docs.starrocks.com/zh-cn/main/sql-reference/sql-statements/Administration/ADMIN%20REPAIR

ADMIN CANCEL REPAIR @ ADMIN CANCEL REPAIR @ StarRocks Docshttps://docs.starrocks.com/zh-cn/main/sql-reference/sql-statements/Administration/ADMIN%20CANCEL%20REPAIR

手动设置指定副本状态语法为：

ADMIN SET REPLICA STATUS PROPERTIES ("key" = "value", ...);

参考地址：

ADMIN SET REPLICA STATUS @ ADMIN SET REPLICA STATUS @ StarRocks Docshttps://docs.starrocks.com/zh-cn/main/sql-reference/sql-statements/Administration/ADMIN%20SET%20REPLICA%20STATUS

假设我们前面发现starrocks库对应的行中有1个不健康的副本一直未被修复，我们可以根据starrocks库对应的DbId 15004查看到具体的tablet编号，查看命令为：

mysql> SHOW PROC '/statistic/15004';

这里假设我们看到的TabletID为17156，就可以进一步查看到这个tablet对应的库表和分区信息：

mysql> show tablet 17156\G

*************************** 1. row ***************************

       DbName: default_cluster:starrocks

    TableName: sales

PartitionName: sales

    IndexName: sales

         DbId: 15004

      TableId: 17122

PartitionId: 17121

      IndexId: 17123

       IsSync: true

    DetailCmd: SHOW PROC '/dbs/15004/17122/partitions/17121/17123/17156';

此时我们就可以通过设置修复优先级的方式让这个表优先修复。

同时，我们也可以继续执行上面的DetailCmd命令，来查看这个tablet的三个副本信息，看看是哪个副本不正常：

mysql> SHOW PROC '/dbs/15004/17122/partitions/17121/17123/17156'\G

*************************** 1. row ***************************

            ReplicaId: 17157

            BackendId: 10004

              Version: 3

          VersionHash: 6249749078520901728

    LstSuccessVersion: 3

LstSuccessVersionHash: 6249749078520901728

     LstFailedVersion: -1

LstFailedVersionHash: 0

        LstFailedTime: NULL

           SchemaHash: 7136400

             DataSize: 562

             RowCount: 1

                State: NORMAL

                IsBad: false

         VersionCount: 1

             PathHash: -599837224777914539

              MetaUrl: http://192.168.110.103:8040/api/meta/header/17156/7136400

     CompactionStatus: http://192.168.110.103:8040/api/compaction/show?tablet_id=17156&schema_hash=7136400

返回值较长，咱们以一个为例，假设它的IsBad属性为true，我们就可以根据前文的信息，提取TabletID和BackendId来将这个副本的状态置为Bad，加速其修复：

mysql> ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "17156", "backend_id" = "10004", "status" = "bad");

因为这个副本原本是正常的，执行后，我们再执行：

mysql> show proc '/statistic';

发现已经有了一个不健康的tablet，根据集群繁忙程度及副本大小，等待数秒或数分钟，会发现已修复完成，UnhealthyTabletNum恢复为0。

若升级后BE立刻出现问题，直接在bin中停止当前BE进程，将当前的bin和lib重命名为bin.new和lib.new，再将bin.bak和lib.bak改回bin和lib，然后重新执行bin中的启动脚本即可完成回滚。

2.2.2 升级FE

如果说升级BE主要需要注意数据问题，升级FE注意的就是元数据。使用show frontends;命令查看当前集群，确认Leader为node02，另外两个为Follower，那我们就以node03演示。

先将原程序目录重命名：

[root@node03 ~]# cd /opt/module/starrocks/fe/

[root@node03 fe]# mv bin bin.bak

[root@node03 fe]# mv lib lib.bak

从node01复制2.1.1的FE文件到该目录下：

[root@node01 fe]# pwd

/opt/software/StarRocks-2.1.1/fe

[root@node01 fe]# scp -r bin node03:/opt/module/starrocks/fe/

[root@node01 fe]# scp -r lib node03:/opt/module/starrocks/fe/

回到node03，查看当前目录情况：

[root@node03 fe]# ll

total 36

drwxr-xr-x 2 root root    86 Mar 5 16:14 bin

drwxr-xr-x 2 root root   100 Mar 4 19:54 bin.bak

drwxr-xr-x 2 1007 1007    42 Dec 2 15:56 conf

drwxr-xr-x 2 root root 12288 Mar 5 16:14 lib

drwxr-xr-x 2 root root 12288 Feb 17 15:52 lib.bak

drwxr-xr-x 2 root root 4096 Mar 5 00:00 log

drwxr-xr-x 3 root root    48 Mar 4 20:16 plugins

drwxr-xr-x 2 1007 1007    55 Nov 29 21:32 spark-dpp

drwxr-xr-x 4 1007 1007    30 Nov 29 21:32 webroot

停止原FE进程：

[root@node03 fe]# ./bin.bak/stop_fe.sh

waiting fe to stop, pid: 72852

stop java, and remove pid file.

备份元数据目录[重要]：

[root@node03 fe]# cp -r /opt/module/meta /opt/module/meta2203051617

备份元数据时务必注意带上详细的时间，特殊情况下我们可能会多次备份元数据，一定要分得清每次备份是做了什么操作。

启动新FE进程：

[root@node03 fe]# ./bin/start_fe.sh --daemon

使用show frontends; 命令查看FE状态，观察几分钟，若Alive为true通常就没有问题。

假设FE出现异常，我们需要立刻停止新版本的FE进程，重命名新版本bin和lib为bin.new和lib.new，将旧版本的bin.bak和lib.bak恢复命名为bin和lib。然后，删除新版本程序使用多的元数据目录meta，并将备份的那份元数据拷贝一份命名为meta，最后再使用老版本的FE程序文件启动。这里的操作非常重要，务必要留意。

在3FE Follower的情况下，假设一个FE出现了无法解决的问题，一种应急的做法是立刻停止这个FE的进程，情况其元数据目录meta，然后将这个FE视为新实例，指定--helper再次添加进集群。

在升级3 Follower的集群时，升级前后FE肯定会进行一次切主，这个我们通常不用在意，连接StarRocks的客户端可以随意指定任意FE的IP进行查询或导入，或者我们也可以通过show frontends; 命令，查到IsMaster为true的Leader节点的IP。

2.2.3 升级Broker

升级Broker没有什么风险，只需要保持与FE和BE版本一致即可，以node01节点为例：

[root@node01 ~]# cd /opt/module/starrocks/apache_hdfs_broker/

[root@node01 apache_hdfs_broker]# mv bin bin.bak

[root@node01 apache_hdfs_broker]# mv lib lib.bak

复制程序到该目录下：

[root@node01 ~]# cd /opt/software/StarRocks-2.1.1/apache_hdfs_broker

[root@node01 apache_hdfs_broker]# cp -r bin /opt/module/starrocks/apache_hdfs_broker/

[root@node01 apache_hdfs_broker]# cp -r lib /opt/module/starrocks/apache_hdfs_broker/

查看目录：

[root@node01 apache_hdfs_broker]# ll

total 28

drwxr-xr-x 2 root root   51 Mar 5 16:32 bin

drwxr-xr-x 2 root root   81 Mar 4 19:54 bin.bak

drwxr-xr-x 2 root root   82 Feb 17 15:53 conf

drwxr-xr-x 2 root root 8192 Mar 5 16:32 lib

drwxr-xr-x 2 root root 8192 Feb 17 15:53 lib.bak

drwxr-xr-x 2 root root 4096 Mar 4 18:11 log

停止旧进程，启动新进程：

[root@node01 apache_hdfs_broker]# ./bin.bak/stop_broker.sh

stop java, and remove pid file.

[root@node01 apache_hdfs_broker]# ./bin/start_broker.sh --daemon

Broker没有自带版本号，确认程序是由新程序所在目录启动的即可。

三、回滚说明

在进行前面的升级操作时，我们每一步都会先使用一个节点进行升级，一旦出现问题，我们也介绍了回滚的操作。而在实际业务中，可能还会出现集群整体正常升级完成后，发现有功能异常的问题。直观来说，就是升级前正常的业务系统在升级后无法正常运行了，这种情况下，如果我们不能快速定位到问题原因，就要立刻进行回滚。

回滚操作和咱们升级过程中介绍的相同，只有三个注意事项咱们着重强调：

3.1 回滚顺序

我们已经说过，StarRocks保证BE后向兼容FE，所以回滚的顺序整体和升级相反，为：

FE Leader->FE Follower->FE Observer->BE->Broker

这个顺序也千万不要颠倒。

3.2 备份元数据

FE回滚前，还要务必注意备份一次元数据，我们一定要养成习惯，在对FE进行任何变更前备份一次元数据。

3.3 回滚版本

参考文章开头的表格，正常来说，除了1.17.2之前的版本因为BE RocksDB版本升级问题导致无法回滚之外，其他版本咱们能正常升级上来就能一定能正常回滚回去，大家不用担心。

四、集群扩缩容

广义来说，StarRocks集群的扩缩容包括了增减节点和增减资源。当我们需要为集群增加节点时，建议先参考前面部署环境准备章节对服务器进行调优。

4.1 FE扩缩容

4.1.1 增加FE节点

在增加FE节点前，我们首先注意要添加的机器与原集群在同一个局域网内或者是能够正常通信的。并且，对要该服务器进行时钟同步操作，因为在StarRocks中，当集群FE之间的时钟差大于5秒时是无法正常启动的。

扩容FE的操作可以参考集群部署章节，同新部署时一样，将FE的部署文件分发到对应服务器上，调整配置文件，绑定IP，创建对应的元数据目录，然后首次必需指定一个集群中已存在的FE节点作为helper启动，这样这个FE才不会被当作一个独立的集群。新扩容的FE可以作为Follower或者Observer，实际业务中，我们通常建议扩容为Observer来增加集群的并发读能力。如果扩容为Follower，就要注意所有Follower（包括Leader）的数量要为奇数个。偶数个Follower不是说不能跑，但从容错的角度来说没有什么意义。

以集群中FE为5个Follower为例，按照Follower活过半才能正常选主的原则，当前集群最多允许同时挂2个Follower，挂第3个后，FE整体将不可用。同样的，5个Follower的情况下，也需要最少启动3个FE后，FE才能正常选主，不然FE就会一直打类似“notify new FE type transfer: UNKNOWN”的日志，始终无法启动。若以集群中FE为4个Follower为例，仍按照过半才可选主的原则，最多允许挂1个FE，当同时挂2个Follower后，集群就不可用了。

通常来说，集群中有1个或3个Follower就可以了，当扩容时都建议扩容为Observer，Observer不参与选主，也没有写元数据的能力，即便Follower都不可用的情况下，Observer仍旧可以保证集群对外提供读的能力。

逻辑讲完，就是语法，StarRocks扩容命令都是一句SQL，扩容FE的语法为：

alter system add follower "fe_host:edit_log_port";

alter system add observer "fe_host:edit_log_port";

4.1.2 删除FE节点

若业务高峰期过后需要缩容FE，同意需要考虑上面选主的问题，不再赘述，删除语法为：

alter system drop follower "fe_host:edit_log_port";

alter system drop observer "fe_host:edit_log_port";

这里注意，在集群中删除FE后，只是说将该FE与集群解耦，并不会同步删除其存在本地磁盘的元数据和部署文件，若确认不需要后，可以手动清理。

4.1.3 增加FE内存

FE另一个需要注意扩容的就是内存，在fe.conf中，有一个配置堆内存的参数：

默认大小是8G，在实际业务中，我们通常建议将其设置为20G或更大。我们知道FE是Java语言开发的，将堆内存设置大除了能避免Full GC外，还有一个重要的原因是FE的元数据是全内存的，且FE隔段时间就会触发Checkpoint，默认情况下，如果JVM内存使用率超过60%，FE就会停止生成元数据的Checkpoint，防止OOM，这样就会让meta/bdb目录一直变大，导致FE重启时非常非常慢。

扩展FE内存的方法就是在JAVA_OPTS中设置给一个较大的合适的内存，然后重启FE生效。如果服务器内存有限，一定要关注bdb目录的大小已经meta/image目录中镜像的生成时间，当发现bdb目录始终超过数G后且image文件很多天没有更新后，就要及时对机器扩容，然后调整这里的参数。

4.2 BE扩缩容

4.2.1 增加BE节点

当集群算力不足以满足业务需求时，扩容BE是最直接的选择。扩容BE同样与新部署时相同，先修改be.conf中相关的配置文件，绑定IP，设置数据存储目录并在本地创建对应的目录。然后启动该BE后，在StarRocks中将其添加进集群：

alter system add backend 'be_host:be_heartbeat_service_port';

4.2.2 缩容BE节点

缩容BE有两种方式：DROP和DECOMMISSION。

DROP会立刻删除BE节点，丢失的副本由FE调度补齐；DECOMMISSION先保证副本补齐，然后再下掉BE节点。DECOMMISSION方式更加友好，生产上建议采用这种方式。

二者的命令类似：

alter system decommission backend "be_host:be_heartbeat_service_port";

alter system drop backend "be_host:be_heartbeat_service_port";

Drop backend是一个危险操作所以需要二次确认后执行，在2.1版本中，如果集群中有单副本的表，直接执行Drop也会报错，提示存在数据丢失风险，如果需要强制删除，语法为：

ALTER SYSTEM DROP BACKEND 'be_host:be_heartbeat_service_port' FORCE;

在使用DECOMMISSION缩容时，我们通过show backends命令查看下线节点的tabletNum发现会逐渐减少迁移到其他节点，但有时会发现tabletNum下降到一定数值后就不变化，导致该节点始终无法下线。这种情况，那些tablet通常是属于刚被删除的表、分区或物化视图，而刚被删除的对象会保留在回收站中，下线逻辑不会处理这些分片。这时可以通过修改FE的配置参数catalog_trash_expire_second来修改对象在回收站中驻留的时间，默认为1天（86400秒），当对象从回收站中被删除后，这些tablet就会被处理了。也或者可以通过show proc "/statistic";命令查看集群是否还有unhealthy的tablet，如果为0，则可以直接通过drop backend语句删除这个BE。

4.2.3 增加BE磁盘

当数据量很大时，我们就需要拓展BE的存储磁盘，为BE节点所在的服务器增加磁盘后，我们首先需要在be.conf中添加该磁盘上的存储目录，例如：

storage_root_path = /data1/storage;/data2/storage;/data3/storage

其中/data1、/data2、/data3分属三块不同的磁盘。配置完成后，再重启BE即可完成扩容。

还有一点需要注意，当前StarRocks是会进行节点内不同磁盘间的数据均衡的，目前磁盘均衡的标准是磁盘使用百分比，如果希望有较好的均衡效果，推荐在扩容时使用多块容量相同的磁盘。

4.3 Broker扩缩容

4.3.1 增加Broker节点

Broker的数量通常与BE节点数保持一致，Broker不会占用多少资源，所以建议和BE直接混布在相同的机器上以减少不必要的带宽传输。

Broker节点不需要绑定IP，增加Broker时同部署章节一样，直接启动Broker进程，然后添加进集群即可，添加Broker的写法为：

ALTER SYSTEM ADD BROKER broker_name "broker_host:broker_ipc_port";

通常建议将集群中所有的broker_name设置为相同的名称，这样在进行Broker Load等作业时，可以并行的调用多个Broker进程来处理各自节点的数据。

4.3.2 缩减Broker节点

缩减语法为：

ALTER SYSTEM DROP BROKER broker_name "broker_host:broker_ipc_port";

4.4 扩缩容影响

在前期调研阶段，其实我们已经对StarRocks集群进行了一系列例如FE BE断网、断电、杀进程、增减节点等等的非功能测试来观察这些突发情况对上层业务的影响，最终结论是都不会影响StarRocks的查询功能，所以大家放心扩缩容，安心大胆的使用。

你可能感兴趣的:(StarRocks,数据库,big,data,数据仓库,mysql)

DuckDB-Wasm 库详解 maply Node.js wasm 前端 node.js 数据库 IndexedDB
DuckDB-Wasm详解DuckDB-Wasm是一种浏览器端实现的DuckDB数据库技术，旨在将DuckDB的强大功能移植到浏览器环境中，通过WebAssembly技术在浏览器内运行SQL查询。它为处理本地数据、快速分析和交互式数据探索提供了一种高效的解决方案，避免了服务器端依赖。1.DuckDB简介DuckDB是一个开源的列存储数据库，专注于在线分析处理（OLAP），特别适合处理中小型数据集。
Vue3+Echarts 绘制省会地图 OPQ迷路的羔羊 echarts 前端 javascript vue.js
Vue3+Echarts绘制省会地图需求：绘制XX省会地图（背景颜色，边框颜色都可自定义，有相应代码注释）鼠标点击XX市区，区域变红色，再次点击，恢复默认蓝色鼠标移入XX市区，区域变橘色，鼠标移开，恢复默认蓝色效果图如下：在这里插入图片描述实现：1.前往https://datav.aliyun.com/portal/school/atlas/area_selector2.输入具体省份，然后复制JS
Objective-C语言的数据库交互 Code花园包罗万象 golang 开发语言后端
Objective-C语言的数据库交互引言在现代应用程序开发过程中，数据库在数据存储和管理方面起着至关重要的作用。对于iOS应用开发者而言，掌握如何在Objective-C中与数据库交互显得尤为重要。本文将全面探讨Objective-C的数据库交互，包括SQLite的基本用法、数据模型的设计、常用的数据库操作及在实际应用中的综合示例。1.数据库基础在深入Objective-C的数据库交互之前，我们
vue3 + echarts5.4.3 实现3D省份地图【动态icon】和生活比个Y 3d
vue3+echarts5.4.3实现3D省份地图【动态icon】vue3项目+echarts5.4.3实现效果：1.下载echarts插件2.按需引入echarts插件3.复制省份json文件1.[查找省份/全国的json文件的地址：](https://datav.aliyun.com/portal/school/atlas/area_selector)2.当前页面中引入刚才复制的json文件4
Dexie.js内存管理技巧：在大型数据集操作中避免浏览器崩溃 maply 前端 Node.js javascript 前端 Dexie.js IndexedDB 数据库内存管理
Dexie.js内存管理技巧：避免浏览器崩溃在使用Dexie.js操作大型数据集时，如果不注意内存管理，可能会导致浏览器内存溢出（OOM，OutofMemory）或崩溃。因此，以下内存管理技巧可用于优化性能，减少内存使用，避免浏览器崩溃。1.避免一次性加载大量数据当数据量较大时，不要一次性加载整个数据集，否则会导致浏览器占用过多内存。IndexedDB是基于磁盘的数据库，Dexie.js提供了流式
springboot毕设基于java的在线学习交流平台程序+论文明思计算机毕设 spring boot 课程设计后端
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容研究背景随着互联网技术的飞速发展和全球教育资源的日益丰富，在线学习已成为人们获取知识、提升技能的重要途径。特别是在近年来，受各种因素影响，线上教育需求激增，促使在线学习交流平台不断涌现。这些平台旨在打破传统教育的时空限制，为学习者提供更加灵活、个性化的学习体验。然而，当前市场上的在线学
高级java每日一道面试题-2025年01月16日-框架篇[Mybatis篇]-说说Mybatis的缓存机制? java我跟你拼了 java每日一道面试题 java mybatis 缓存一级缓存二级缓存工作原理全局配置
如果有遗漏,评论区告诉我进行补充面试官:说说Mybatis的缓存机制?我回答:在Java高级面试中，MyBatis的缓存机制是一个重要的话题。MyBatis是一个流行的Java持久化框架，它提供了强大的数据库访问能力和灵活的SQL映射配置。为了提高查询性能并减少数据库访问次数，MyBatis引入了缓存机制。下面将对MyBatis的缓存机制进行详细解释：MyBatis缓存机制概述MyBatis的缓存
Centos Linux 离线安装 MySQL 5.7、使用MySQL 寒水馨软件解惑 mysql centos 数据库 linux
CentosLinux离线安装MySQL5.7、使用MySQL视频教程链接：https://www.bilibili.com/video/BV1Nv4y1m7u4/1.MySQL简介MySQL是一个开源的关系型数据库管理系统，由瑞典MySQLAB公司开发，属于Oracle旗下产品，适合个人和中小型企业使用。2.准备工作2.1.拥有一台CentosLinux机器参考文章：《VMware安装Cento
【宝藏级】PyEcharts 超详细的使用指南奇怪的大象前端 html echarts python 前端
Python可视化神器-pyecharts手册pyecharts简介优点：安装：官方文档：pyecharts快速开始在`Notebook`中创建一个条形图：链式调用：配置选项：全局配置项`AnimationOpts`：画图动画配置项`InitOpts`：初始化配置项`ToolBoxFeatureOpts`和`ToolboxOpts`：工具箱配置项`TitleOpts`：标题配置项`DataZoom
CSV文件转换coe 一条九漏鱼 matlab fpga开发 matlab
CodeN=165;y=zeros(N,1);%unzip('Under_A.ila')A=importdata('Control_txA.csv');fid=fopen('demo.coe','wt');%-standardformatfprintf(fid,'MEMORY_INITIALIZATION_RADIX=16;\n');fprintf(fid,'MEMORY_INITIALIZATI
PostgreSQL 语法 lly202406 开发语言
PostgreSQL是一个功能强大的开源关系型数据库管理系统，它具有高度的可扩展性、稳定性和安全性，适用于各种规模的应用场景。以下是关于PostgreSQL语法的一些重要信息：数据库连接：使用psql命令可以连接到PostgreSQL数据库。连接时需要指定服务器地址、端口、用户名和数据库名称。例如：psql-h127.0.0.1-Udbuser-p5832-ddatabase【1†source】。
使用spring boot写一个学生管理系统 db_hkq_2039 spring boot 后端 java
目录前言二、博客地址三、实现步骤3.1创建SpringBoot项目3.2连接数据库3.3代码层级3.3.1model层3.3.2Repository层3.3.3service层3.3.4控制层controller3.3.5视图层3.3.6BootStrap4.1登录4.2增4.3删4.4查4.5改4.6分页总结前言学生管理系统是一种常见的应用程序，它可以用于管理学生、学院、班级等信息，是许多企业和
ubuntu 22.04（arm64）环境安装zabbix6.4.4 gaodi2002 ubuntu linux 运维服务器
参考https://www.zabbix.com/download?zabbix=6.0&os_distribution=ubuntu_arm64&os_version=22.04&components=server_frontend_agent&db=mysql&ws=apache在arm环境需要部署zabbix6，尝试过centos7编译、centos8编译、docker部署，都不是想要的结果
linux（arm）安装mysql步骤余额很不足 mysql linux linux mysql 运维数据库 arm开发
1、添加mysql用户组和mysql用户]#groupadd-rmysql&&useradd-r-gmysql-s/sbin/nologin-Mmysql2、安装依赖libaioyuminstall-ylibaio*3、下载mysql对应版本wgethttps://obs.cn-north-4.myhuaweicloud.com/obs-mirror-ftp4/database/mysql-5.7
【RFC2663 IP 网络地址转换器 (NAT) 术语和注意事项】（翻译）羊羊洒洒_Blog rfc tcpip
原文https://datatracker.ietf.org/doc/html/rfc2663IPNetworkAddressTranslator(NAT)TerminologyandConsiderationsIP网络地址转换器(NAT)术语和注意事项前言本文档背后的动机是明确与网络地址转换器结合使用的术语。术语“网络地址转换器”在不同的上下文中有不同的含义。本文档的目的是定义各种类型的NAT并
Python酷库之旅-第三方库Pandas(117) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲516、pandas.DataFrame.add_suffix方法516-1、语法516-2、参数516-3、功能516-4、返回值516-5、说明516-6、用法516-6-1、数据准备516-6-2、代码示例516-6-3、结果输出517、pandas.DataFrame.align方法517-1、语法517-2、参数517-3、功能517-4、返回值517-5、说明517-6
云原生周刊：Prometheus 3.0 Beta 发布｜2024.09.16 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐KumaKuma是一个现代化的基于Envoy的服务网格，能够在每个云平台上运行，支持单区域或多区域部署，兼容Kubernetes和虚拟机。凭借其广泛的通用工作负载支持，以及对Envoy数据平面代理技术的原生支持（但无需Envoy专业知识），Kuma提供了现代化的L4-L7服务连接、发现、安全、可观察性、路由等功能，适用于任何平台上的任何服务，包括数据库。TopoLVMTopoLVM是一
传统数据湖和数据仓库的“中心化瓶颈” PersistDZ 数据架构数据仓库数据湖中心化
传统数据湖和数据仓库的**“中心化瓶颈”**，主要是由于其架构设计和治理模式的局限性，无法有效应对现代企业中数据规模的快速增长和组织复杂性。以下是具体表现：1.单点瓶颈（SinglePointBottleneck）传统数据湖/仓库通常由中心化的数据平台团队负责，所有的数据集成、清洗、建模和治理工作都集中在这一个团队中，导致：工作负载过重：数据平台团队需要处理所有领域的数据需求，响应速度慢。扩展性差
C# Linq 多表查询鹿人甲丁 .net c#linq
在C#中处理数据时，语言集成查询（LINQ）是一个强大的工具，它允许我们以类似于数据库查询的方式查询集合。LINQ进行多表查询，包括内连接、组连接、左连接和交叉连接。基础数据模型首先定义几个基础的数据模型类：//学生publicclassStudent{publicintStudentId{get;set;}publicstringName{get;set;}}//班级publicclassCla
如何设计一款分布式数据库借雨醉东风热点追踪分布式
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
bigemap功能对比分析 tangshenq17565
BIGEMAP功能对比分析图||||||【地图服务行业专家】BIGEMAP是全行业公认的【优秀知名软件】、高新技术企业、国内最早从事GIS领域研发的公司，为全国各行业提供GIS领域的软件产品、解决方案、技术指导以及应用环境的搭建和开发。BIGEMAP通过不断创新产品、提升产品质量，使得产品销量遥遥领先；我们制定了GIS领域的行业应用标准：降低GIS应用难度，提升软件性能，简化用户操作。我们承诺：软
bigemap地图下载器优势分析 tangshenq17565
BIGEMAP功能对比分析图||||||【地图服务行业专家】BIGEMAP是全行业公认的【优秀知名软件】、高新技术企业、国内最早从事GIS领域研发的公司，为全国各行业提供GIS领域的软件产品、解决方案、技术指导以及应用环境的搭建和开发。BIGEMAP通过不断创新产品、提升产品质量，使得产品销量遥遥领先；我们制定了GIS领域的行业应用标准：降低GIS应用难度，提升软件性能，简化用户操作。我们承诺：软
Pandas数据处理基础6---插值填充及其用法阳光下的米雪 Pandas数据处理 python
插值填充插值是数值分析中一种方法。简而言之，就是借助于一个函数（线性或非线性），再根据已知数据去求解未知数据的值。插值在数据领域非常常见，它的好处在于，可以尽量去还原数据本身的样子。我们可以通过interpolate()方法完成线性插值。当然，其他一些插值算法可以阅读官方文档了解。#生成一个DataFramedf=pd.DataFrame({'A':[1.1,2.2,np.nan,4.5,
使用分库分表技术，解决了亿级订单数据存储问题?思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
分库分表技术是解决大规模数据存储问题的一种常见策略，特别是在处理亿级订单数据时。通过将数据分散到多个数据库和表中，可以有效地提高系统的可扩展性和性能。以下是一个思维导图结构，以及一个简化的Java架构代码示例，展示了如何使用分库分表技术来管理亿级订单数据。思维导图结构分库分表解决方案设计原则数据分布算法哈希取模（HashModulo）范围划分（RangePartitioning）列表划分（List
如何确保热点产品查询延迟控制在10ms以内?思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
为了确保热点产品查询的延迟控制在10ms以内，可以采取一系列优化措施和技术手段。以下是一个思维导图的结构和一个简化的Java架构代码示例，用于展示如何实现这一目标。思维导图结构低延迟查询数据预加载热点数据预测提前加载到内存缓存使用高性能缓存内存级缓存（如Caffeine）分布式缓存（如Redis）缓存一致性管理弱一致性模型缓存更新策略（写后失效、读时更新等）并发处理多线程/异步编程线程池管理数据库
Golang Gin系列-1：Gin 框架总体概述梦想画家 #Golang golang gin
本文介绍了Gin框架，探索了它的关键特性，并建立了简单入门的应用程序。在这系列教程里，我们会探索Gin的主要特性，如路由、中间件、数据库集成等，最终能使用Gin框架构建健壮的web应用程序。总体概述Gin是Go编程语言的web框架，以简单和高性能而设计。它为构建web应用程序和RESTfulapi提供了一组轻量级和灵活的工具。Gin的主要优势之一是其简约的设计，允许开发人员对他们的应用程序进行细粒
ECharts折线图显示标点长度不够显示标点 showAllSymbol属性小鸟游上岸 ECharts基本操作 echarts 前端 javascript
原本样式series:[{data:[820,934,901,934,1290,1330,1320,820,934,901,934,1290],type:"line",symbol:'circle',symbolSize:8,showAllSymbol:true}],效果图这是正常有足够空间显示的情况但是如果没有足够空间,会默认隐藏中间间隔的标点足够不足空间显示的情况我们可以利用series-li
Ubuntu本地部署Nebula图数据库 QxAIRobot 图数据库图数据库 nosql nebula
Ubuntu本地部署Nebula图数据库操作系统：Ubuntu20.04硬件架构：x86_64软件版本：nebula-graph-3.0.2、nebula-graph-studio-3.2.3官网：https://nebula-graph.com.cn/安装NebulaGraph核心服务访问官方手册，按教程使用以下指令下载并安装nebula-graph安装包：wgethttps://oss-cdn
在线购物商城系统源码,JSP+servlet+MySQL,idea,eclipse stxy178 python
在线购物商城系统是一个非常热门的开发项目，通过JSP+servlet+MySQL这一技术组合，可以实现一个功能完善的商城系统。本文将介绍如何使用IDEA和Eclipse来进行开发，并简要介绍数据库设计和系统功能。首先，我们需要创建一个新的Web项目，并选择JSP作为前端技术，servlet作为后端技术，MySQL作为数据库。可以使用IDEA或者Eclipse来进行开发，具体选择哪个IDE根据个人喜
全区全服游戏框架 lao geng 游戏服务器游戏
游戏服务器架构概述分布式架构基础：全区全服游戏框架通常采用分布式架构，以应对大量玩家同时在线的情况。这种架构包括多个服务器节点，如登录服务器、游戏逻辑服务器、数据库服务器等。登录服务器负责处理玩家的登录和验证流程，游戏逻辑服务器承载游戏的主要玩法和规则运算，数据库服务器存储玩家数据、游戏配置等关键信息。这些服务器之间通过高效的网络通信协议相互协作。分层架构理念：在游戏服务器内部，分层架构有助于组织
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s