知乎 HBase 实践 - 知乎

前言

HBase 是一个基于 Hadoop 面向列的非关系型分布式数据库(NoSQL), 设计概念来源于谷歌的 BigTable 模型，面向实时读写、随机访问大规模数据集的场景，是一个高可靠性、高性能、高伸缩的分布式存储系统，在大数据相关领域应用广泛. HBase 系统支持对所存储的数据进行透明切分，从而使得系统的存储以及计算具有良好的水平扩展性.

知乎从 2017 年起开始逐渐采用 HBase 系统存储各类在线业务数据，并在 HBase 服务之上构建各类应用模型以及数据计算任务；伴随着知乎这两年的发展，知乎核心架构团队基于开源容器调度平台 Kubernetes 打造了一整套 HBase 服务平台管理系统，经过近两年的研发迭代，目前已经形成了一套较为完整的 HBase 自动化运维服务体系，能够完成 HBase 集群的快捷部署，平滑扩缩容，HBase 组件细粒度监控，故障跟踪等功能.

背景

知乎对 HBase 的使用经验不算太长，在 2017 年初的时候，HBase 服务主要用于离线算法，推荐，反作弊，还有基础数据仓库数据的存储计算，通过 MapReduce 和 Spark 来进行访问. 而在当时知乎的在线存储主要采用 MySQL 和 Redis 系统，其中：

MySQL: 支持大部分的业务数据存储，当数据规模增大后有一些需要进行扩容的表，分表会带来一定的复杂性，有些业务希望能屏蔽这个事情，还有一些是因为历史原因在表设计的时候用 rmsdb 的形式存了一些本该由列存储的数据，希望做一下迁移. 此外 MySQL 基于 SSD，虽然性能很好，花销也比较大;
Redis: 可以提供大规模的缓存，也可以提供一定的存储支持. Redis 性能极好，主要的局限是做数据 Resharding 较为繁琐，其次是内存成本较高;

针对以上两种在线存储所存在的一些问题，我们希望建立一套在线存储 NoSQL 服务，对以上两种存储作为一个补充；选型期间我们也考虑过 Cassandra, 早期一些业务曾尝试使用 Cassandra 作为存储，隔壁团队在运维了一段时间的 Cassandra 系统之后，遇到不少的问题，Cassandra 系统可操作性没有达到预期，目前除了 Tracing 相关的系统，其他业务已经放弃使用 Cassandra.

我们从已有的离线存储系统出发，在衡量了稳定性，性能，代码成熟度，上下游系统承接，业界使用场景以及社区活跃度等方面之后，选择了 HBase，作为知乎在线存储的支撑组件之一.

HBase On Kubernetes

初期知乎只有一套进行离线计算的集群，所有业务都跑在一个集群上，并且 HBase 集群和其他离线计算 yarn 以及 Impala 混合部署，HBase 的日常离线计算和数据读写都严重受到其他系统影响；并且 HBase 的监控都只停留在主机层面的监控，出现运行问题时，进行排查很困难，系统恢复服务时间较长，这种状态下，我们需要重新构建一套适用于在线服务的系统.

在这样的场景下，我们对在线 HBase 服务的需求是明确的：

隔离性:

从业务方的视角来说，希望相关的服务做到环境隔离，权限收归业务，避免误操作和业务相互影响;
对于响应时间，服务的可用性，都可以根据业务的需要指定 SLA;
对于资源的分配和 blockcache 等参数的配置也能够更加有适应性，提供业务级别的监控和报警，快速定位和响应问题；

资源利用率：从运维的角度，资源的分配要合理，尽可能的提升主机 cpu，内存包括磁盘的有效利用率;
成本控制：团队用最小的成本去得到最大的运维收益，所以需要提供便捷的调用接口，能够灵活的进行 HBase 集群的申请，扩容，管理，监控. 同时成本包括机器资源，还有工程师. 当时我们线上的这套系统是由一位工程师独立去进行维护.

综合以上需求，参考我们团队之前对基础设施平台化的经验，最终的目标是把 HBase 服务做成基础组件服务平台向提供给上游业务，这个也是知乎技术平台部门工作思路之一，尽可能的把所有的组件对业务都黑盒化，接口化，服务化. 同时在使用和监控的粒度上尽可能的准确，细致，全面. 我们构建在线 HBase 管理运维系统的一个初衷.

Why Kubernetes?

前文说到我们希望将整个 HBase 系统平台服务化，那就涉及到如何管理和运维 HBase 系统，知乎在微服务和容器方面的工作积累和经验是相当丰富的，在当时我们所有的在线业务都已经完成了容器化的迁移工作，超万级别的业务容器平稳运行在基于 mesos 的容器管理平台 Bay 上(参见[1])；与此同时，团队也在积极的做着 Infrastructure 容器化的尝试，已经成功将基础消息队列组件 Kafka 容器化运行于 Kubernetes 系统之上 (参见[2])，因此我们决定也将 HBase 通过 Kubernetes 来进行资源的管理调度.

Kubernetes[3] 是谷歌开源的容器集群管理系统，是 Google 多年大规模容器管理技术 Borg 的开源版本. Kubernetes 提供各种维度组件的资源管理和调度方案，隔离容器的资源使用，各个组件的 HA 工作，同时还有较为完善的网络方案. Kubernetes 被设计作为构建组件和工具的生态系统平台，可以轻松地部署、扩展和管理应用程序. 有着 Kubernetes 大法的加持，我们很快有了最初的落地版本([4]).

初代

最初的落地版本架构见下图，平台在共享的物理集群上通过 Kubernetes(以下简称 K8S) API 建立了多套逻辑上隔离的 HBase 集群，每套集群由一组 Master 和若干个 Regionserver (以下简称 RS) 构成, 集群共享一套 HDFS 存储集群，各自依赖的 Zookeeper 集群独立；集群通过一套管理系统 Kubas 服务来进行管理([4]).

第一代架构

模块定义

在 K8S 中如何去构建 HBase 集群，首先需要用 K8S 本身的基础组件去描述 HBase 的构成；K8S 的资源组件有以下几种:

Node: 定义主机节点，可以是物理机，也可以是虚拟机;
Pod: 一组紧密关联的容器集合，是 K8S 调度的基本单位;
ReplicationController: 一组 pod 的控制器，通过其能够确保 pod 的运行数量和健康，并能够弹性伸缩;

结合之前 Kafka on K8S 的经验，出于高可用和扩展性的考虑，我们没有采用一个 Pod 里带多个容器的部署方式，统一用一个 ReplicationController 定义一类 HBase 组件，就是上图中的 Master，Regionserver 还有按需创建的 Thriftserver；通过以上概念，我们在 K8S 上就可以这样定义一套最小 HBase 集群：

2 * Master ReplicationController;
3 * Regionserver ReplicationController;
2 * Thriftserver ReplicationController (可选);

高可用以及故障恢复

作为面向在线业务服务的系统，高可用和故障转移是必需在设计就要考虑的事情，在整体设计中，我们分别考虑组件级别，集群级别和数据存储级别的可用性和故障恢复问题.

组件级别

HBase 本身已经考虑了很多故障切换和恢复的方案：

Zookeeper 集群：自身设计保证了可用性；
Master: 通过多个master注册在 Zookeeper 集群上来进行主节点的 HA 和更新；
RegionServer: 本身就是无状态的，节点失效下线以后会把上面的 region 自动迁走，对服务可用性不会有太大影响；
Thriftserver: 当时业务大多数是 Python 和 Golang，通过用 Thrift 对 HBase 的进行，Thriftserver 本身是单点的，这里我们通过 HAProxy 来代理一组 Thriftserver 服务；
HDFS：本身又由 Namenode 和 DataNode 节点组成，Namenode 我们开启 HA 功能, 保证了 HDFS 的集群可用性;

集群级别

Pod 容器失效: Pod 是通过 ReplicationController 维护的， K8S 的 ControllerManager 会在它的存储 etcd 去监听组件的失效情况，如果副本少于预设值会自动新的 Pod 容器来进行服务；
Kubernetes 集群崩溃: 该场景曾经在生产环境中出现过，针对这种情况，我们对 SLA 要求较高的业务采用了少量物理机搭配容器的方式进行混合部署，极端场景出现时，可以保证重要业务收到的影响可控；

数据级别

所有在 K8S 上构建的 HBase 集群都共享了一套 HDFS 集群，数据的可用性由 HDFS 集群的多副本来提供.

实现细节

资源分配

初期物理节点统一采用 2*12 核心的 cpu，128G 内存和 4T 的磁盘，其中磁盘用于搭建服务的 HDFS，CPU 和内存则在 K8S 环境中用于建立 HBase 相关服务的节点.

Master 组件的功能主要是管理 HBase 集群，Thriftserver 组件主要承担代理的角色，所以这两个组件资源都按照固定额度分配.

在对 Regionserver 组件进行资源分配设计的时候，考虑两种方式去定义资源:

资源分配方式

按照业务需求分配:

根据业务方对自身服务的描述，对相关的 QPS 以及 SLA 进行评估，为业务专门配置参数，包含 blockcache, region 大小以及数量等；
优点是针对业务优化，能够充分的利用资源，降低业务的资源占用成本;
管理成本增加，需要对每一个业务进行评估，对平台维护人员非常不友好，同时需要业务同学本身对 HBase 有理解;

统一规格的资源分配:

CPU 以及 MEM 都按照预先设定好的配额来分配, 提供多档的配置，将 CPU 和 MEM 的配置套餐化;
方便之处在于业务扩容时直接增加 Regionserver 的个数，配置稳定，运维成本较低，遇到问题时排障方便;
针对某些有特有访问方式的业务有局限性，如 CPU 计算型，大 KV 存储，或者有 MOB 需求的业务，需要特殊的定制;

介于当时考虑接入的在线业务并不多，所以采用了按业务定制的方式去配置 Regionserver, 正式环境同一业务采用统一配置的一组Regionserver，不存在混合配置的 Regionserver 组.

参数配置

基础镜像基于 cdh5.5.0-hbase1.0.0 构建

        # Example for hbase dockerfile# install cdh5.5.0-hbase1.0.0ADDhdfs-site.xml /usr/lib/hbase/conf/ADDcore-site.xml /usr/lib/hbase/conf/ADDenv-init.py /usr/lib/hbase/bin/ENVJAVA_HOME /usr/lib/jvm/java-8-oracleENVHBASE_HOME /usr/lib/hbaseENVHADOOP_PREFIX /usr/lib/hadoopADDenv-init.py /usr/lib/hbase/bin/ADDhadoop_xml_conf.sh /usr/lib/hbase/bin/

固定的环境变量，如 JDK_HOME, HBASE_HOME, 都通过 ENV 注入到容器镜像中;
与 HDFS 相关的环境变量，如 hdfs-site.xml 和 core-site.xml 预先加入 Docker 镜像中，构建的过程中就放入了 HBase 的相关目录中，用以确保 HBase 服务能够通过对应配置访问到 HDFS;
与 HBase 相关的配置信息, 如组件启动依赖的 Zookeeper 集群地址，HDFS 数据目录路径, 堆内存以及GC 参数等，这些配置都需要根据传入 Kubas Service 的信息进行对应变量的修改, 一个典型的传入参数示例:

        REQUEST_DATA={"name":'test-cluster',"rootdir":"hdfs://namenode01:8020/tmp/hbase/test-cluster","zkparent":"/test-cluster","zkhost":"zookeeper01,zookeeper02,zookeeper03","zkport":2181,"regionserver_num":'3',"codecs":"snappy","client_type":"java","cpu":'1',"memory":'30',"status":"running",}

通过上面的参数 Kubas Service 启动 Docker 时，在启动命令中利用 hadoop_xml_conf.sh 和 env-init.py 修改 hbase-site.xml 和 hbase-env.sh 文件来完成最后的配置注入，如下所示:

        source/usr/lib/hbase/bin/hadoop_xml_conf.sh&&put_config --file /etc/hbase/conf/hbase-site.xml --property hbase.regionserver.codecs --value snappy&&put_config --file /etc/hbase/conf/hbase-site.xml --property zookeeper.znode.parent --value /test-cluster&&put_config --file /etc/hbase/conf/hbase-site.xml --property hbase.rootdir --value hdfs://namenode01:8020/tmp/hbase/test-cluster&&put_config --file /etc/hbase/conf/hbase-site.xml --property hbase.zookeeper.quorum --value zookeeper01,zookeeper02,zookeeper03&&put_config --file /etc/hbase/conf/hbase-site.xml --property hbase.zookeeper.property.clientPort --value2181&&service hbase-regionserver start&&tail -f /var/log/hbase/hbase-hbase-regionserver.log

网络通信

网络方面，采用了 Kubernetes 上原生的网络模式，每一个 Pod 都有自己的 IP 地址，容器之间可以直接通信，同时在 Kubernetes 集群中添加了 DNS 自动注册和反注册功能，以 Pod 的标识名字作为域名，在 Pod 创建和重启和销毁时将相关信息同步全局 DNS.

在这个地方我们遇到过问题，当时我们的 DNS 解析不能在 Docker 网络环境中通过 IP 反解出对应的容器域名，这就使得 Regionserver 在启动之后向 Master 注册和向 Zookeeper 集群注册的服务名字不一致，导致 Master 中对同一个 Regionserver 登记两次，造成 Master 与 Regionserver 无法正常通信，整个集群无法正常提供服务.

经过我们对源码的研究和实验之后，我们在容器启动 Regionserver 服务之前修改 /etc/hosts 文件，将 Kubernetes 对注入的 hostname 信息屏蔽；这样的修改让容器启动的 HBase 集群能够顺利启动并初始化成功，但是也给运维提升了复杂度，因为现在 HBase 提供的 Master 页现在看到的 Regionserver 都是 IP 形式的记录，给监控和故障处理带来了诸多不便.

存在问题

初代架构顺利落地，在成功接入了近十个集群业务之后，这套架构面临了以下几个问题:

管理操作业务 HBase 集群较为繁琐:

需要手动提前确定 HDFS 集群的存储，以及申请独立 Zookeeper 集群，早期为了省事直接多套 HBase 共享了一套 Zookeeper 集群，这和我们设计的初衷不符合;
容器标识符和 HBase Master 里注册的 regionserver 地址不一致，影响故障定位；
单 Regionserver 运行在一个单独的 ReplicationController (以下简称 RC ), 但是扩容缩容为充分利用 RC 的特性，粗暴的采用增加或减少 RC 的方式进行扩容缩容;

HBase 配置：

最初的设计缺乏灵活性，与 HBase 服务配置有关的 hbase-site.xml 以及 hbase-env.sh固化在 Docker Image 里，这种情况下，如果需要更新大量配置，则需要重新 build 镜像;
由于最初设计是共享一套 HDFS 集群作为多 HBase 集群的存储，所以与 HDFS 有关的 hdfs-site.xml 和 core-site.xml 配置文件也被直接配置进了镜像. 如果需要在 Kubas service 中上线依赖其他 HDFS 集群的 HBase，也需要重新构建镜像;

HDFS 隔离:

随着接入 HBase 集群的增多，不同的 HBase 集群业务对 HDFS 的 IO 消耗有不同的要求，因此有了分离 HBase 依赖的 HDFS 集群的需求；
主要问题源自 Docker 镜像对相关配置文件的固化，与 HDFS 有关的 hdfs-site.xml 和 core-site.xml 配置文件与相关 Docker 镜像对应，而不同 Docker 镜像的版本完全由研发人员自己管理，最初版本的实现并未考虑到这些问题;

监控运维:

指标数据不充分，堆内堆外内存变化，region 以及 table 的访问信息都未有提取或聚合
region 热点定位较慢，无法在短时间内定位到热点 region;
新增或者下线组件只能通过扫 kubas service 的数据库来发现相关变更，组件的异常如 regionserver 掉线或重启，master 切换等不能及时反馈;

重构

为了进一步解决初版架构存在的问题，优化 HBase 的管控流程，我们重新审视了已有的架构，并结合 Kubernetes 的新特性，对原有的架构进行升级改造，重新用 Golang 重写了整个 Kubas 管理系统的服务 (初版使用了 Python 进行开发) ，并在 Kubas 管理系统的基础上，开发了多个用于监控和运维的基础微服务，提高了在 Kubernetes 上进行 HBase 集群部署的灵活性，架构如下图所示：

二代架构图

Deployment & Config Map

Deployment

Deployment (部署) 是 Kubernetes 中的一个概念，是 Pod 或者 ReplicaSet 的一组更新对象描述，用于取代之前的 ReplicationController. Deployment 继承了 ReplicationController 的所有功能，并拥有更多的管理新特性；
在新的 Kubas 管理系统中，新设计用 Deployment 代替 ReplicationController 做 Pod 的管理，使用一个 Deployment 部署一组 Regionservers 的方式来代替单Regionserver 对应一个 ReplicationController 的设计，提升集群部署扩缩容管理的灵活性;
每一组 Deployment 都会注入各类信息维度的标签，如相关集群的信息就，服务类型，所属应用等;

Deployment 部署

ConfigMap

ConfigMap 是 Kubernetes 用来存储配置文件的资源对象，通过 ConfigMap 可以将外部配置在启动容器之前挂载到容器中的指定位置，并以此为容器中运行的程序提供配置信息；
重构之后管理系统中，所有 HBase 的组件配置都存放至 ConfigMap 之中，系统管理人员会根据需-要预先生成若干 HBase 的配置模板存放到 K8S 系统的 ConfigMap 中；
在业务方提供出 HBase 服务申请时，管理人员通过业务资源的需求结合配置模板，为申请的 HBase 集群组件渲染具体的 hbase-site.xml 以及 hbase-env.sh 等 HBase 配置相关的文件再存放到 ConfigMap 中;
最后在容器启动时，k8s 会根据 deployment 将 ConfigMap 中的配置文件 Mount 到配置中指定的路径中;
和 Deployment 的操作类似，每一份 ConfigMap 也都会标记上标签，将相关的 ConfigMap 和对应的集群和应用关联上;

ConfigMap 存档

组件参数配置

在引入了 ConfigMap 功能之后，之前创建集群的请求信息也随之改变.

        RequestData
{
  "name": "performance-test-rmwl",
  "namespace": "online",
  "app": "kubas",
  "config_template": "online-example-base.v1",
  "status": "Ready",
  "properties": {
    "hbase.regionserver.codecs": "snappy",
    "hbase.rootdir": "hdfs://zhihu-example-online:8020/user/online-tsn/performance-test-rmwl",
    "hbase.zookeeper.property.clientPort": "2181",
    "hbase.zookeeper.quorum": "zookeeper01,zookeeper02,zookeeper03",
    "zookeeper.znode.parent": "/performance-test-rmwl"
  },
  "client_type": "java",
  "cluster_uid": "k8s-example-hbase---performance-test-rmwl---example"
}

其中 config_template 指定了该集群使用的配置信息模板，之后所有和该 HBase 集群有关的组件配置都由该配置模板渲染出具体配置.

config_template 中还预先约定了 HBase 组件的基础运行配置信息，如组件类型，使用的启动命令，采用的镜像文件，初始的副本数等.

        servers:
{
  "master": {
    "servertype": "master",
    "command": "service hbase-master start && tail -f /var/log/hbase/hbase-hbase-master.log",
    "replicas": 1,
    "image": "dockerimage.zhihu.example/apps/example-master:v1.1",
    "requests": {
      "cpu": "500m",
      "memory": "5Gi"
    },
    "limits": {
      "cpu": "4000m"
    }
  },
}

Docker 镜像文件配合 ConfigMap 功能，在预先约定的路径方式存放配置文件信息，同时在真正的 HBase 配置路径中加入软链文件.

        RUNmkdir -p /data/hbase/hbase-siteRUNmv /etc/hbase/conf/hbase-site.xml /data/hbase/hbase-site/hbase-site.xmlRUNln -s /data/hbase/hbase-site/hbase-site.xml /etc/hbase/conf/hbase-site.xmlRUNmkdir -p /data/hbase/hbase-envRUNmv /etc/hbase/conf/hbase-env.sh /data/hbase/hbase-env/hbase-env.shRUNln -s /data/hbase/hbase-env/hbase-env.sh /etc/hbase/conf/hbase-env.sh

构建流程

结合之前对 Deployment 以及 ConfigMap 的引入，以及对 Dockerfile 的修改，整个 HBase 构建流程也有了改进:

HBase on Kubernetes 构建流程

编制相关的 Dockerfile 并构建基础的 HBase 组件镜像;
为将要创建的 HBase 构建基础属性配置模板，订制基础资源，这部分可以通过 Kubas API 在 Kubernetes 集群中创建 ConfigMap;
具体创建部署集群时，通过调用 Kubas API, 结合之前构建的 ConfigMap 模板，渲染出 HBase 集群中各类组件的详细 ConfigMap, 然后在 Kubernetes 集群中构建 Deployment;
最终通过之前构建好的镜像加载组件 ConfigMap 中的配置，完成在 Kubernetes Node 中运行的一个 HBase 组件容器;

通过结合 K8S 的 ConfigMap 功能的配置模板，以及 Kubas API 调用，我们就可以在短时间部署出一套可用的 HBase 最小集群 ( 2Master + 3RegionServer + 2Thriftserver), 在所有宿主机 Host 都已经缓存 Docker 镜像文件的场景下，部署并启动一整套 HBase 集群的时间不超过 15 秒.

同时在缺少专属前端控制台的情况下，可以完全依托 Kubernetes dashboard 完成 HBase 集群组件的扩容缩容，以及组件配置的查询修改更新以及重新部署.

资源控制

在完成重构之后，HBase 服务面向知乎内部业务进行开放，短期内知乎 HBase 集群上升超过30+ 集群，伴随着 HBase 集群数量的增多，有两个问题逐渐显现：

运维成本增高: 需要运维的集群逐渐增高;
资源浪费：这是因为很多业务的业务量并不高，但是为了保证 HBase 的高可用，我们至少需要提供 2 个 Master + 3 个 Region Server，而往往 Master 的负载都非常低，这就造成了资源浪费.

为了解决如上的两个问题，同时又不能打破资源隔离的需求，我们将 HBase RSGroup 功能加入到了HBase 平台的管理系统中.

优化后的架构如下:

RSGroup 的使用

由于平台方对业务 HBase 集群的管理本身就具有隔离性，所以在进行更进一步资源管理的时候，平台方采用的是降级的方式来管理 HBase 集群，通过监听每个单独集群的指标，如果业务集群的负载在上线一段时间后低于阈值，平台方就会配合业务方，将该 HBase 集群迁移到一套 Mixed HBase 集群上.

同时如果在 Mixed HBase 集群中运行的某个 HBase 业务负载增加，并持续一段时间超过阈值后，平台方就会考虑将相关业务提升至单独的集群.

多 IDC 优化

随着知乎业务的发展和扩大，知乎的基础架构逐渐升级至多机房架构，知乎 HBase 平台管理方式也在这个过程中进行了进一步升级，开始构建多机房管理的管理方式；基本架构如下图所示:

多 IDC 访问方式

业务 HBase 集群分别在多个 IDC 上运行，由业务确定 IDC 机房的主从方式，业务的从 IDC 集群数据通过平台方的数据同步组件进行数据同步;
各 IDC 的 Kubas 服务主要负责对本地 Kubernetes 集群的具体操作，包括 HBase 集群的创建删除管理，regionserver 的扩容等 HBase 组件的管理操作，Kubas 服务部署与机房相关，仅对接部署所在机房的 K8S 集群;
各 IDC 的 Kubas 服务向集群发现服务上报本机房集群信息，同时更新相关集群主从相关信息;
业务方通过平台方封装的 Client SDK 对多机房的 HBase 集群进行访问，客户端通过集群发现服务可以确定 HBase 集群的主从关系，从而将相关的读写操作分离，写入修改访问可以通过客户端指向主 IDC 的集群;
跨机房间的数据同步采用了自研的 HBase Replication WALTransfer 来提供增量数据的同步;

数据同步

在各类业务场景中，都存在跨 HBase 集群的数据同步的需求，比如数据在离线 HBase 集群和在线集群同步，多 IDC 集群数据同步等；对于 HBase 的数据同步来说，分为全量复制和增量复制两种方式;

HBase 数据同步

在知乎 HBase 平台中，我们采用两种方式进行 HBase 集群间的数据同步

HBase Snapshot：

全量数据复制我们采用了 HBase Snapshot 的方式进行；主要应用在离线数据同步在线数据的场景；

WALTransfer:

主要用于 HBase 集群之间的的增量数据同步；增量复制我们没有采用 HBase Replication，相关同步方式我们通过自研的 WALTransfer 组件来对 HBase 数据进行增量同步；

WALTransfer 通过读取源数据 HBase 集群提供 WAL 文件列表，于 HDFS 集群中定位对应的 WAL 文件，将 HBase 的增量数据按序写入到目的集群，相关的细节我们会在以后的文章中详细解析

监控

从之前重构后的架构图上我们可以看到，在 Kubas 服务中我们添加了很多模块，这些模块基本属于 HBase 平台的监控管理模块.

Kubas-Monitor 组件

基本的监控模块，采用轮询的方式发现新增 HBase 集群，通过订阅 Zookeeper 集群发现 HBase 集群 Master 以及 Regionserver 组.

采集 Regionserver Metric 中的数据，主要采集数据包括：

region 的信息，上线 region 数量，store 的数量、storefile 的大小、storefileindex 的大小，读取时 memstore 命中的次数和缺失次数;
blockcache 的信息，例如 blockcache 中使用多少、空闲多少、累计的缺失率、命中率等.
读写请求的统计信息，例如最大最小读写响应时间，读写的表分布、读写数据量、读写失败次数等;
compact 与 split 的操作信息，例如队列的长度、操作次数和时间等;
handler 的信息，例如队列长度、处于活跃 handler 的数量以及活跃的 reader 数量;

其他维度的指标如容器 CPU 以及 Mem 占用来自 Kubernetes 平台监控，磁盘 IO，磁盘占用等来自主机监控

HBase 部分监控

Kubas-Region-Inspector 组件

采集 HBase 表 Region 信息，通过 HBase API 接口，获取每个 HBase Region 的数据统计信息，并将 Region 数据聚合成数据表信息;
通过调用开源组件形成 HBase 集群 Region 分布的图表，对 Region 热点进行定位;

HBase Region 分布监控

通过以上模块采集的监控信息，基本可以描述在 Kubernetes 上运行的 HBase 集群的状态信息，并能够辅助运维管理人员对故障进行定位排除.

Future Work

随着公司业务的快速发展，知乎的 HBase 平台业务同时也在不断的迭代优化，短期内我们会从以下几个方向进一步提升知乎 HBase 平台的管理服务能力:

提升集群安全稳定性. 加入 HBase 权限支持，进一步提升多租户访问下的安全隔离性；
用户集群构建定制化. 通过提供用户数据管理系统，向业务用户开放 HBase 构建接口，这样业务用户可以自行构建 HBase 集群，添加 Phoniex 等插件的支持；
运维检测自动化. 自动对集群扩容，自动热点检测以及转移等；

写在最后

HBase 在知乎的推广应用从 2017 年开始，平台架构经过了若干个版本的迭代最终稳定，在这里感谢 @bzy 在前期的铺垫，感谢 @高勋为资源隔离化和资源利用率优化所做的工作. 特别感谢 @王政英在使用 HBase 服务期间给我们提供的建议和 downtime.

知乎核心架构团队负责解决知乎业务复杂度和并发规模提升给核心资源调度以及数据存储架构带来的问题以及挑战，随着知乎用户和业务规模的快速增长，以及基础架构复杂度的持续提升，团队面临的技术挑战也越来越多，目前正在持续实施多机房异地多活的架构改造和资源的优化，努力保障和提升知乎核心架构的质量和稳定性，欢迎对技术感兴趣、渴望技术挑战的小伙伴与 [email protected] /[email protected] 联系.

Reference

[1] 知乎基于 Kubernetes 的 Kafka 平台的设计和实现

[2] 知乎容器平台演进及与大数据融合实践

[3] Kubernetes

[4] Building online hbase cluster of zhihu based on kubernetes

你可能感兴趣的:(知乎 HBase 实践 - 知乎)

Hyperlane：解锁并发编程的未来 LTPP java 前端网络 rust 开发语言服务器数据库
Hyperlane：解锁并发编程的未来Hyperlane框架以其简洁高效的设计理念，致力于解决多线程并发开发中的常见问题。它充分利用了Rust与Tokio的强大能力，为开发者提供了一种安全、简便的数据共享方式。本文将介绍Hyperlane在锁管理和异步编程方面的实践，展示如何规避死锁问题，从而构建高效可靠的并发程序。死锁问题在并发环境中，不正确的锁管理容易引发死锁问题。Hyperlane框架推荐通
Spring Boot 动态配置管理：ZooKeeper 集成与 Redis 配置覆盖实践 weixin_43833540 java-zookeeper spring boot zookeeper
一、引言在微服务架构中，配置管理的动态性与灵活性至关重要。传统通过application.properties/application.yml进行静态配置的方式，已难以满足实时更新需求。本文将详细介绍如何通过ZooKeeper实现SpringBoot应用的Redis配置动态管理，并支持配置热刷新。二、核心实现方案1整体架构设计ZooKeeper作为配置中心存储Redis配置SpringBoot应用
SMT贴片加工核心技术突破与实践安德胜SMT贴片其他
内容概要在电子制造行业加速向智能化转型的背景下，SMT贴片加工企业的技术革新正成为产业升级的关键驱动力。本文围绕精密点胶工艺优化、三维堆叠焊接技术突破、全自动光学检测系统（AOI）部署等核心环节展开系统性分析，重点探讨工艺参数调优、异形元件焊接精度控制、缺陷检测算法升级等具体技术路径。同时，结合柔性产线动态配置策略与跨行业应用案例，解析设备稼动率提升、多品种混线生产兼容性设计等实践方案。通过汽车电
SMT贴片机视频操作精要安德胜SMT贴片其他
内容概要《SMT贴片机视频操作精要》系统梳理了设备操作的标准化流程与关键技术要点，为工程师提供全链路实操指导。手册从基础编程调试逻辑切入，逐步延伸至吸嘴选型匹配规则、元件识别参数配置等核心模块，并通过视频演示贴装压力、速度、角度的协同优化方法。同时，针对视觉对位校准、抛料率动态控制等痛点问题，提供可落地的解决方案。为强化实践参考价值，内容进一步拆解了PCB定位精度提升、钢网对位误差补偿、FEEDE
评测系统的服务网格架构应用 AI天才研究院 DeepSeek 架构 java 微服务 ai
Step1:标题与概述评测系统的服务网格架构应用关键词：服务网格、评测系统、微服务、架构设计、性能优化摘要：本文将详细探讨服务网格在评测系统中的应用，从背景介绍、核心概念、技术分析、架构设计到实际应用，全方位解析服务网格如何提升评测系统的性能和稳定性。通过具体案例和最佳实践，帮助读者深入理解服务网格的价值和实现方法。第1章:背景介绍1.1问题背景在现代信息化社会中，评测系统扮演着至关重要的角色，尤
作为普通程序员，我们该如何学习大模型（LLM），学习路线和知识体系和老莫一起学AI 学习人工智能深度学习语言模型 ai 程序员转行
前言原谅我的后知后觉，才开始从头写，我是已经上了一阶段大模型的课，也搜集了些资料，并自己做了小部分实践，回过头来，才想开始整理些文章。起初，大家都在写，都在发，我那会在焦虑。自chatgpt爆火以来，AI技术又被广泛关注，国内外各大厂商也纷纷布局，作为我们每一个普通人，也无不时刻感受着AI一波又一波的冲击。尤其是作为程序员的我，相信绝大多数程序员也有和我一样的感受，从一开始的新奇，到焦虑，到试图去
交换平台（一）第一章：数据交换平台的一些基本概念姚毛毛-aione1.com 交换平台项目分享
目录文章目录第零章、前言：为什么？做什么？怎么做？第一章、数据交换平台的一些基本概念1.1数据交换与交换平台1.2什么是物理隔离？第零章、前言：为什么？做什么？怎么做？最近带队做了公司的一个项目，叫数据交换平台，旨在物理隔离的情况下对多端业务系统进行数据的加密、传输、监控。正好这个项目的架构师也在公司做了一次架构层面的技术分享，我便把此次分享和我在项目实践中遇到的一些坑一起整理出来，形成本系列文章
【k8s004】 Docker 打包 K8s镜像姚毛毛-aione1.com kubernetes docker 容器
文章目录一.准备工作1.安装Docker:[官方安装文档](https://docs.docker.com/get-docker/)2.准备应用代码（示例使用Node.js应用）二.创建Dockerfile3、构建镜像（注意最后的点号）4、测试运行5、推送镜像到仓库6、Kubernetes部署文件示例7、部署到Kubernetes三、注意事项8、常用调试命令四、注意事项9、最佳实践一.准备工作1.
手机租赁系统架构设计与实践解析红点聊租赁其他
内容概要如果把手机租赁系统比作一家智能便利店，那它的架构设计就是货架布局手册——既要让用户轻松找到想要的机型，还得防止有人顺走充电器不还。这套系统的心脏由四个模块组成：用户管理负责刷脸认证和信用档案，智能风控模块像全天候AI侦探扫描可疑行为，订单追踪系统化身设备定位雷达，支付接口则要像高速公路收费站般丝滑。有意思的是，系统居然能通过用户刷短视频的时长预测还款概率，这可比星座运势靠谱多了。建议初创团
C++11——智能指针和function库爱吃喵的鲤鱼 c++算法开发语言
目录一、智能指针1.std::unique_ptr（独占所有权指针）2.std::shared_ptr（共享所有权指针）3.std::weak_ptr（弱引用指针）关键区别总结最佳实践基本用法可封装的对象类型核心特性示例代码1.基本调用2.结合Lambda和参数传递3.作为回调函数与模板的对比使用场景注意事项总结一、智能指针shared_ptr和unique_ptr都支持的操作shared_ptr
Python游戏开发自学指南：从入门到实践（第四天） Small踢倒coffee_氕氘氚 python自学经验分享笔记
Python不仅适用于数据分析、Web开发和自动化脚本，还可以用于游戏开发！虽然Python不是传统意义上的游戏开发语言，但其简洁的语法和丰富的库使其成为初学者学习游戏开发的绝佳选择。本文将为你提供一份全面的Python游戏开发自学指南，帮助你从入门到实践，掌握用Python开发游戏的技能。##一、为什么选择Python开发游戏？1.**简单易学**：Python语法简洁，适合初学者快速上手。2.
Yarn 迁移到 pnpm：依赖管理的最佳实践程序员
我解释一下yarn和pnpm的主要区别，以及转换时需要注意的事项：依赖安装机制的区别：Yarn/npm的方式（扁平化）：node_modules├──A├──B├──C(B的依赖)└──D(C的依赖)所有依赖都被提升到顶层，这意味着你的项目可能会访问到未在package.json中声明的依赖（幽灵依赖）。pnpm的方式（严格）：node_modules├──.pnpm│├──[email protected]│├──
Java中的受检异常 weixin_34132768 java runtime
Java中的受检异常Java提供了三种异常类型，受检异常(checkedexception)、运行时异常(runtimeexception)、错误(error)。那么这受检异常在实际开发中又有什么最佳实践呢？受检异常如果抛出的异常是可恢复的，同时我们也期望API的调用者捕获异常进行恢复处理，那么我们应该使用受检异常。受检异常会强迫API的使用者截获异常并恢复处理，或者进行声明继续抛出。图1.IDE
Java中的异常处理机制是什么？奔赴架构师的小白 java python 开发语言
引言在软件开发中，异常处理是确保程序健壮性和用户友好性的关键组成部分。Java作为一种广泛使用的编程语言，提供了丰富且强大的异常处理机制，使得开发者能够有效地处理程序运行时可能出现的各种错误情况。本文将深入探讨Java中的异常处理机制，包括其基本概念、使用方法、最佳实践以及高级主题，帮助读者全面掌握Java异常处理的核心知识。什么是异常处理？异常处理是一种编程技术，用于检测和处理程序运行期间发生的
探索DeepSeek：前端开发者不可错过的新一代AI技术实践指南 formerlyai 人工智能前端
引言：为什么DeepSeek成为技术圈焦点？最近，国产AI模型DeepSeek凭借其低成本训练、高性能输出和开源策略，迅速成为开发者社区的热门话题。作为覆盖语言、代码、视觉的多模态技术矩阵，DeepSeek不仅实现了与ChatGPT相媲美的能力，还通过强化学习驱动的架构创新，解决了大模型落地中的成本与效率瓶颈。对于前端开发者而言，DeepSeek的API接入能力和私有化部署方案，为智能应用开发提供
产品经理知识体系学习与实践指南 liuyuanfeng_7 产品运营
新产品开发管理：从流程到体系0.3产品经理：角色与知识体系产品经理对产品生命周期的各个阶段，产品的孕育、创意、概念、开发、上市负责，以及对产品线和产品组合负责；不仅对实体产品负责，还要对服务、解决方案负责，对客户体验负责，对产品的运营和迭代负责。1.产品责任人2.迷你CEO3.客户代言人2.产品经理与项目经理的区别项目经理主要负责产品生命周期的某个阶段，如开发、上市、需求调研，最常见的是产品开发阶
从剪枝到知识蒸馏：深度学习模型压缩与加速的多重策略一键难忘剪枝深度学习算法知识蒸馏
本文收录于专栏：精通AI实战千例专栏合集https://blog.csdn.net/weixin_52908342/category_11863492.html从基础到实践，深入学习。无论你是初学者还是经验丰富的老手，对于本专栏案例和项目实践都有参考学习意义。每一个案例都附带关键代码，详细讲解供大家学习，希望可以帮到大家。正在不断更新中文章目录从剪枝到知识蒸馏：深度学习模型压缩与加速的多重策略1.
性能测试自动化：JMeter脚本设计与分布式压测实战指南测试渣自动化 jmeter 分布式测试工具
引言在数字化竞争日益激烈的今天，软件系统的性能表现直接影响用户体验和业务连续性。无论是电商大促的“秒杀”场景，还是金融系统的高频交易，性能测试自动化已成为保障系统稳定性的核心手段。ApacheJMeter作为开源性能测试工具中的标杆，凭借其灵活性和扩展性，成为企业构建自动化测试体系的首选工具。本文将从脚本设计与分布式压测两大核心维度，系统阐述JMeter在性能测试自动化中的实践方法，为企业提供可落
104.HarmonyOS NEXT跑马灯组件教程：实际应用场景与最佳实践 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyOSNEXT跑马灯组件教程：实际应用场景与最佳实践效果演示1.跑马灯组件应用场景概述跑马灯组件是HarmonyOSNEXT中一个非常实用的UI组件，它可以在有限的空间内展示超出显示区域的文本内容。本文将详细介绍跑马灯组件的实际应用场景和最佳实践，帮
模型保存与加载：PyTorch中的实践指南冰蓝蓝自然语言处理 pytorch 人工智能 python
在深度学习项目中，模型的保存和加载是一个至关重要的步骤。它不仅有助于在训练过程中保存进度，还可以在训练完成后部署模型。PyTorch提供了灵活的方式来保存和加载模型，本文将详细介绍这些方法。模型保存在PyTorch中，有两种主要的模型保存方法：保存整个模型和仅保存模型参数。保存整个模型保存整个模型意味着保存模型的结构和参数。这种方法简单直接，但文件体积较大，且依赖于模型的具体实现。importto
Node.js系列（1）--架构设计指南一进制ᅟᅠ ‌‍‎‏ Node.js node.js vim 编辑器
Node.js架构设计指南️引言Node.js作为一个高性能的JavaScript运行时环境，其架构设计对于构建可扩展的服务端应用至关重要。本文将深入探讨Node.js的架构设计原则、最佳实践和实现方案。架构概述Node.js架构主要包括以下方面：事件驱动：基于事件循环的异步非阻塞架构模块系统：CommonJS和ES模块系统进程模型：单线程主进程与工作线程流处理：基于Stream的数据处理错误处理
证券交易系统核心技术解析：LinkTrader 的毫秒级响应架构与风控实践 Ashlee_code 架构 python java c++
一、行业痛点：为什么传统交易系统正在被淘汰？2024年，证券行业guweng22346的技术竞争已从“功能完备”转向**“速度+智能”的极限博弈**。以下是传统系统的三大致命缺陷：数据延迟：非官方行情源导致套利窗口丢失（实测延迟普遍>0.1秒）；风控低效：依赖人工监控，凌晨时段风险拦截率不足30%；扩展性差：单体架构下订单处理峰值低于10万/秒，极易崩溃。典型案例：某券商因系统延迟0.05秒，单日
嵌入式开发之STM32学习笔记day06 小程同学>o< 嵌入式学习之STM32 stm32 学习笔记
基于STM32F103C8T6的开发实践——从入门到精通011.引言STM32系列微控制器是STMicroelectronics推出的一款高性能、低功耗的32位微控制器，广泛应用于嵌入式系统中。STM32F103C8T6是其中非常受欢迎的一款，凭借其强大的性能、丰富的外设接口和低廉的价格，成为了开发者的首选之一。本文将通过实例，详细介绍如何基于STM32F103C8T6进行开发，并带领读者完成从简
外包工作：不只是赚钱，更是人生的加油站心灵星图程序人生
外包工作：不只是赚钱，更是人生的加油站在当今互联网时代，外包工作已经成为很多人的职业选择。但你是否想过，外包工作不仅仅是一份收入来源，更可能是你人生的重要跳板？今天，让我们一起来聊聊外包工作带来的三大机遇。一、自我提升的黄金期1.时间优势工作时间相对灵活可以自主安排学习计划有更多个人支配时间2.学习机会接触不同类型的项目了解各行各业的需求积累多样化的经验实践建议：制定学习计划每周固定学习时间设定明
MultiCodeBench:首个涵盖 12 个特定软件应用领域和 15 种编程语言的代码生成基准测试数据集
2024-12-25,由中山大学、西安交通大学、重庆大学共同创建的MultiCodeBench，填补了特定应用领域代码生成性能评估的空白，为开发者选择适合的LLM提供了实践洞见。一、研究背景：随着大型语言模型（LLMs）在代码生成任务中展现出卓越性能，越来越多的AI编程助手被集成到实际的软件开发环境中，显著提升了开发效率。然而，现有的代码生成基准测试主要集中在通用场景，对于LLMs在特定应用领域的
ubuntu20.04 sanzk ubuntu
ubuntu20.04下载Indexof/ubuntu-releases/20.04/|清华大学开源软件镜像站|TsinghuaOpenSourceMirrorIntroduction·Autolabor-ROS机器人入门课程《ROS理论与实践》零基础教程
spring security学习入门指引 LCY133 web开发 spring 学习 java
学习SpringSecurity可以从以下几个方面逐步深入，结合理论与实践，以下是具体的学习路径建议：1.基础准备•熟悉Spring框架：先掌握SpringCore、SpringMVC和SpringBoot的基础，理解依赖注入（DI）、AOP、Bean生命周期等核心概念。•理解安全基本概念：了解认证（Authentication）、授权（Authorization）、加密（Hashing/Encr
无人机学习入门一颗微竹无人机无人机
设备：电脑+遥控器+小飞机+fpv+充电器+各种工具配件设备最开始只有电脑，慢慢的东西越来越多。学习理论知识空域与航空法律法规、安全教育无人机基础（在mooc平台和智慧职教平台上很多课程，当然B站也很多，自学基础内容）目录大概如下：1）无人机的历史2）无人机分类3）无人机系统组成（直升机、多旋翼、固定翼无人机、其他特殊结构）4）无人机飞行原理、空气动力学5）飞行控制、导航系统6）任务载荷学习实践知
嵌入式开发中的Doxygen注释规范实践剁椒鱼头炖香菇 c语言 stm32 单片机
目录一、为什么需要规范的注释？二、Doxygen注释规范详解1.文件注释2.函数注释3.宏定义注释4.结构体注释三、注释规范最佳实践1.文件注释模板2.函数注释模板3.代码注释原则四、常见注释误区与解决方案误区1：过度注释误区2：过时注释误区3：模糊注释五、工具推荐六、项目实践案例七、总结一、为什么需要规范的注释？在嵌入式开发中，规范的代码注释如同精密仪器的说明书，具有以下重要作用：提高可读性：使
这里是 Grok 3 为我规划的大学物联网工程自学计划！王倚山物联网学习开发语言
我理解你可能希望我提供更详细的优化版本，包含更具体的技术细节、时间分配、资源推荐以及项目示例，以便让规划更具操作性。我将在保持原有结构的基础上，显著扩展每个阶段的内容，增加更多具体建议和实践指导，确保优化后的规划更加详尽、全面，同时仍然基于你的裸机开发经验进行调整。优化后的详细学习规划总体思路（扩展版）你的裸机开发经验（数据采集、控制、配网、上云、手机交互）表明你已经掌握了嵌入式开发的基础技能，如
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户