京东智联云技术新知

云原生在京东丨如何在Kubernetes上部署有状态的云原生应用？（下）

云妹导读：

Kubernetes是云计算历史上增长最快的基础设施项目之一，通过Kubernetes可以方便地部署一套高可用、可扩展的分布式无状态服务。但是越来越多的人希望把数据库这类有状态服务也部署到Kubernetes里面，上篇文章我们介绍了在Kubernetes上部署有状态的服务的几种可行方案。本篇文章我们将以开源社区的Crunchy PostgreSQL Operator为例，带大家部署一个基本功能相对完备的PostgreSQL云服务。

上期回顾

点击阅读：《如何在Kubernetes上部署有状态的云原生应用（上）》

下面我们将以最先进的开源数据库PostgreSQL为例，介绍如何在 Kubernetes 上部署运维有状态云服务（以下所有的操作都是基于Kubernetes 1.14及以上版本来完成的）。

Operator出来以前，即使有StatefulSet控制器，将PostgreSQL、MySQL等数据库部署到Kubernetes也是非常复杂的。两年前关于在Kubernetes上部署数据库还有过一场讨论，当时的普遍建议是不要在Kubernetes部署数据库。

关于这场讨论可以通过该链接查看：

https://www.reddit.com/r/devops/comments/8m1bp3/databases_on_kubernetes

通过StatefulSet在Kubernetes上部署高可用的MySQL服务请参考以下链接：

https://www.kubernetes.org.cn/3985.html

这个方法中yaml文件相当复杂，用户可以参与控制的地方不多。

开源的PostgreSQL Operator有CrunchyData/postgres-operator、zalando-incubator/postgres-operator，我们以CrunchyData/postgres-operator为例来讲解如何通过Operator这个新生事物在Kubernetes上管理PostgreSQL数据库，选择它的原因是功能相当完备并且集成了PostgreSQL周边生态相关的应用。

该Operator实现了在Kubernetes上自动化部署PostgreSQL集群，简化了PostgreSQL服务的部署，并通过Kubernetes平台保持PostgreSQL集群的运行状态，其中包含的基本功能有：

PostgreSQL集群配置：轻松创建、扩展和删除PostgreSQL集群，同时完全自定义Pod和PostgreSQL配置。

高可用性：基于分布式共识的高可用解决方案，支持安全的自动故障转移。使用Pod Anti-Affinity来增强弹性，失败的主数据库会自动恢复，从而缩短恢复时间。

灾难恢复：利用开源pgBackRest程序实现备份和还原功能，并包括对全备，增量和差异备份以及有效增量还原的支持。可以设置要保留的备份时间，比较适合较大型的数据库，也通过共享S3存储及多Kubernetes部署实现了跨机房多区域异地灾备。

TLS：通过为PostgreSQL服务器启用TLS来保护应用程序和数据服务器之间的通信安全，包括强制所有连接使用TLS。

监控方式：使用开源pgMonitor库跟踪PostgreSQL集群的运行状况。

PostgreSQL用户管理：使用功能强大的命令给PostgreSQL集群快速添加和删除用户。管理密码过期策略或使用首选的PostgreSQL身份验证方案。

升级管理：安全地将PostgreSQL更新应用到您的PostgreSQL集群中，而对可用性的影响最小。

高级复制支持：用户可以在异步复制和同步复制之间进行选择，以处理对丢失事务敏感的工作负载。

克隆：使用简单的pgo clone命令从现有集群中创建新集群。

连接池：使用pgBouncer进行连接池。

节点亲和力：将PostgreSQL集群部署到您喜欢的Kubernetes节点。

备份策略定制：选择备份的类型（全量，增量，差异备份）以及希望其在每个PostgreSQL集群上发生周期及时间点。

备份到S3：将您的备份存储在任何支持S3协议的对象存储系统中。PostgreSQL Operator可以从这些备份中还原和创建新的集群。

多命名空间支持：您可以通过几种不同的部署模型来控制PostgreSQL Operator如何利用Kubernetes命名空间：

将PostgreSQL Operator和所有PostgreSQL集群部署到同一名称空间；

将PostgreSQL Operator部署到一个名称空间，并将所有PostgreSQL集群部署到另一名称空间；

将PostgreSQL Operator部署到一个名称空间，并跨多个命名空间管理PostgreSQL集群；

使用pgo create namespace和pgo delete namespace命令动态添加和删除由PostgreSQL Operator管理的名称空间。

完全可定制：

为主存储，WAL存储，副本存储和备份存储选择不同的存储类别；

为每个PostgreSQL集群部署选择容器资源类；区别应用于主群集和副本群集的资源；

使用您私有的镜像存储库，包括支持imagePullSecrets存储库和私有存储库；

自定义PostgreSQL配置等。

PostgreSQL Operator包含各种组件，这些组件已部署到您的Kubernetes集群中，如下图所示：

PostgreSQL Operator在指定的namespace中以Deployment对象运行，并且最多由四个容器的Pod组成，其中包括：

Operator：这是PostgreSQL Operator的核心。它包含一系列Kubernetes 控制器，这些控制器将监视事件关注在一系列本地Kubernetes资源（如Job，Pods）以及PostgreSQL Operator自定义的CRD上，如：Pgcluster，Pgtask等。

ApiServer： 提供了一套Restful API接口，方便用户通过pgo命令行或直接通过HTTP请求与其交互，ApiServer还利用一系列RBAC规则来控制用户对资源的访问权限。

Scheduler：运行cron并允许用户设置周期性任务（如备份）以Kubernetes Job的方式运行。

Event：可选组件，一个提供nsq消息队列接口并输出有关Operator内发生的生命周期事件的信息的容器（例如，创建集群，进行备份，创建克隆失败等），可以由pgo watch命令接受消息。

下列流程是理解 Operator工作原理的关键：

使用Kubernetes的CustomResourceDefinition（CRD）定义若干和 PostgreSQL部署运维相关的资源对象。

pgclusters.crunchydata.com：存储管理PostgreSQL集群所需的信息。其中包括集群名称，要使用的存储和资源类，要运行的PostgreSQL版本，有关如何维护高可用性集群的信息等。

pgreplicas.crunchydata.com：存储管理PostgreSQL集群中的副本所需的信息。这包括诸如副本数，要使用的存储和资源类，特殊的相似性规则等。

pgtasks.crunchydata.com：通用CRD，它接受针对集群运行（例如，创建集群，进行备份，执行克隆）所需的一种任务，并通过其工作流跟踪该任务的状态。

pgpolicies.crunchydata.com：存储对可以对PostgreSQL集群执行的SQL文件的引用。过去它用于管理PostgreSQL集群上的RLS策略。

在Kubernetes中部署一个Operator实例，该Operator会持续监听针对这些资源对象的CRUD操作，并观察对象状态。

当用户执行了某项操作，例如创建一个PostgreSQL集群时，一个新的 pgcluster 资源对象会被创建。当Operator监听到了pgcluster的创建事件后，会根据用户配置创建符合需求的集群。这里创建了一个基于流复制协议的高可用PostgreSQL集群，使用了Deployment、Service、ConfigMap、PVC等原生 Kubernetes资源对象。

当Operator观察到PostgreSQL Cluster的当前状态与期望状态存在差别时，会执行相应的编排操作，保证状态的一致性。

通过helm部署PostgreSQL Operator。

1[root@RDS pgo]# helm search repo  
2NAME                           CHART VERSION   APP VERSION     DESCRIPTION  
3jd_tpaas_repo/customconfig     1               4.3.2       Deploys a custom configuration for postgreSQL  
4jd_tpaas_repo/pgodeployer      1               4.3.2       Deploys a job for the installation of the postg...

<左右滑动以查看完整代码>

安装Operator。

5  [root@RDS pgo]#  helm --namespace pgo install pg-operator jd_tpaas_repo/pgo-deployer

<左右滑动以查看完整代码>

部署完成以后查看Operator的状态。

6  [root@RDS ~]# kubectl -n pgo get all  
7  NAME                                      READY   STATUS    RESTARTS   AGE  
8  pod/crunchy-grafana-77b4b84b57-cgrnn      1/1     Running   0          4m12s  
9  pod/crunchy-prometheus-57788f56fb-lcqsp   1/1     Running   0          4m15s  
10  pod/postgres-operator-7f6d4646cc-zf2dg    4/4     Running   0          4m50s  
11    
12  NAME                         TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)                      AGE  
13  service/crunchy-grafana      ClusterIP   192.168.58.207           3000/TCP                     5m34s  
14  service/crunchy-prometheus   ClusterIP   192.168.62.99            9090/TCP                     5m37s  
15  service/postgres-operator    ClusterIP   192.168.60.155           8080/TCP,4171/TCP,4150/TCP   5m23s  
16    
17  NAME                                 READY   UP-TO-DATE   AVAILABLE   AGE  
18  deployment.apps/crunchy-grafana      1/1     1            1           5m34s  
19  deployment.apps/crunchy-prometheus   1/1     1            1           5m37s  
20  deployment.apps/postgres-operator    1/1     1            1           5m22s  
21    
22  NAME                                            DESIRED   CURRENT   READY   AGE  
23  replicaset.apps/crunchy-grafana-77b4b84b57      1         1         1       4m12s  
24  replicaset.apps/crunchy-prometheus-57788f56fb   1         1         1       4m15s  
25  replicaset.apps/postgres-operator-7f6d4646cc    1         1         1       4m50s

<左右滑动以查看完整代码>

我们看到有一个PostgreSQL-Operator Deployment里面包含了4个容器：ApiServer、Operator、Scheduler、 Event，除了Operator，还部署了crunchy-prometheus和crunchy-grafana两个Deployment可以帮助用户进行集中式监控管理。

PostgreSQL Operator的主要目的是围绕PostgreSQL集群的结构创建和更新信息，并传递有关PostgreSQL集群的总体状态和运行状况的信息。目标也是为用户尽可能简化此过程。

例如，假设我们要创建一个具有单个副本的高可用PostgreSQL集群，它支持在本地存储和S3中进行备份，并具有内置监控指标收集和集中的日志收集。我们可以利用如下命令来完成：

pgo create cluster hacluster --replica-count=1 --metrics --pgbackrest-storage-type="local,s3"

<左右滑动以查看完整代码>

通过pgo命令行创建集群示例：

首先为集群创建一个namespace 。

1[root@RDS pgo]# pgo create namespace pgouser2  
2created namespace pgouser2

<左右滑动以查看完整代码>

创建集群，带一个副本并开启监控。

3  [root@RDS pgo]# pgo -n pgouser2 create cluster test-pgcluter-002 --replica-count 1 --metrics  
4  created cluster: test-pgcluter-002  
5  workflow id: cb75373a-518f-49e1-8b6a-55e274d2fc58  
6  database name: test-pgcluter-002  
7  users: 
8  username: testuser password: 7iFe|iS4aF(}:3*6FibWo?jZ

<左右滑动以查看完整代码>

查看集群信息。

9  [root@RDS pgo]#  pgo -n pgouser2 show cluster  test-pgcluter-002  
10  cluster : test-pgcluter-002 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
11     pod : test-pgcluter-002-b7d8b4bd4-qk5cp (Running) on k8s-node-vm7sjf-yn5hsstwuf (2/2) (primary)  
12     pvc : test-pgcluter-002  
13     pod : test-pgcluter-002-jcfm-6bfff77fcf-vxpn6 (Running) on k8s-node-vmr4ej-yn5hsstwuf (2/2) (replica)  
14     pvc : test-pgcluter-002-jcfm  
15     resources : Memory: 128Mi  
16     storage : Primary=20Gi Replica=20Gi  
17     deployment : test-pgcluter-002  
18     deployment : test-pgcluter-002-backrest-shared-repo  
19     deployment : test-pgcluter-002-jcfm  
20     service : test-pgcluter-002 - ClusterIP (192.168.120.61)  
21     service : test-pgcluter-002-replica - ClusterIP (192.168.123.182)  
22     pgreplica : test-pgcluter-002-jcfm  
23     ...

<左右滑动以查看完整代码>

查看集群的服务状态。

 24  [root@RDS pgo]# pgo -n pgouser2 test  test-pgcluter-002  
 25  cluster : test-pgcluter-002  
 26     Services  
 27         primary (192.168.120.61:5432): UP  
 28         replica (192.168.123.182:5432): UP  
 29     Instances  
 30         primary (test-pgcluter-002-b7d8b4bd4-qk5cp): UP  
 31         replica (test-pgcluter-002-jcfm-6bfff77fcf-vxpn6): UP

<左右滑动以查看完整代码>

不难看到集群中包含两个Deployment，对应的两个Pod各绑定一个PVC，暴露出两个Service：

Service-Primary：test-pgcluter-002 - ClusterIP (192.168.120.61) 负责用户的读写请求；

Service-Replica： test-pgcluter-002-replica - ClusterIP (192.168.123.182)负责用户的只读请求。

集群创建成功以后，Pod和Service的状态都是Up，处于正常运行状态。

PostgreSQL的一大优点是它的可靠性：它非常稳定，通常可以“正常工作”。但是，在部署PostgreSQL的环境中可能会发生某些事情，从而影响其正常运行时间，包括：

数据库存储磁盘发生故障或发生其他一些硬件故障；

数据库所在的网络无法访问；

主机操作系统变得不稳定并崩溃；

密钥数据库文件已损坏；

数据中心丢失。

可能还会由于正常操作而导致停机事件，例如执行小版本升级，操作系统的安全修补，硬件升级或其他维护。

为此，在Crunchy PostgreSQL Operator 创建的集群中每一个PostgreSQL容器里面都包含Patroni工具，由Patroni通过raft 分布式共识的特性来处理PostgreSQL的高可用。

Patroni是一个用Python编写的开源工具套件，用于管理PostgreSQL集群的高可用性。Patroni没有构建自己的一致性协议，而是巧妙地利用了分布式配置存储（DCS）提供的一致性模型。它支持的DCS解决方案包括：Zookeeper，etcd，Consul和Kubernetes。Crunchy PostgreSQL Operator中采用的是Kubernetes的ConfigMap作为其DCS。

Patroni确保PostgreSQL HA集群的端到端设置，包括流复制。它支持各种方式创建备用节点，并且可以像模板一样工作，可以根据需要进行自定义。这个功能丰富的工具通过RestFul API和称为patronictl的命令行程序暴露其功能。它通过使用其运行状况检查API处理负载均衡来支持与HAProxy集成。在Operator中是通过处理Kubernetes的Service来实现，Patroni还借助回调来支持事件通知，这些回调是由某些操作触发的脚本。通过提供暂停/恢复功能，它使用户能够执行任何维护操作。

最初，需要安装PostgreSQL和Patroni二进制文件。完成此操作后，您还需要设置HA DCS配置。需要在yaml配置文件中指定所有用于引导集群的必要配置，并且Patroni将使用该文件进行初始化。在第一个节点上，Patroni初始化数据库，从DCS获取领导者锁，并确保该节点作为主节点运行。

下一步是添加备用节点，Patroni为此提供了多个选项。默认情况下，Patroni使用pg_basebackup创建备用节点，并且还支持WAL-E、pgBackRest、Barman等自定义方法来创建备用节点。Patroni使添加备用节点变得非常简单，并且可以处理所有引导任务和流复制的设置。集群设置完成后，Patroni将主动监视集群并确保其处于正常状态。主节点每ttl秒更新一次领导者锁（默认值：30秒）。当主节点无法更新领导者锁时，Patroni会触发选举，并且获得领导者锁的节点将被选举为新的主节点。

在分布式系统中，共识在确定一致性方面起着重要作用，而Patroni使用DCS来达成共识。只有持有领导者锁的节点才能成为主节点，并且领导者锁是通过DCS获得的。如果主节点未持有领导者锁，那么Patroni将立即将其降级以作为备用节点运行。这样，在任何时间点，系统中都只能运行一个主服务器。

我们通过下面一系列的图片来演示Patroni在集群的Failover发生后重新选主的过程：

图 A 显示了一个集群暂时的稳定状态，Pod A是当前的主节点，每隔一段时间就要刷新一次自己的心跳信息，保持自己领导者的地位，其对应的PostgreSQL在集群中是Primary的角色。Pod B 和 Pod C一直在watch leader，集群中有两个Service，master service其后挂载的endpoint指向带有label=master标签的Pod，replica service其后挂载的endpoint指向带有label=replica标签的Pod；

图B 示意某一时刻，Pod A发生了故障，没有及时更新心跳，超过ttl=30s后，Kubernetes会通知 Pod B、Pod C主节点Pod A心跳缺失超时信息。

图C示意Pod B和Pod C都会发起检查集群中其他节点的状态，均会发现主节点Pod A Failed，从而重新发起选举主节点流程，Pod B和Pod C谁的wal_position更大谁将是下一轮主节点，如果一样大就会发生竞争，先抢到领导者锁的节点将成为下一轮的主节点。如图D所示意，Pod B成功抢到了领导者锁。

图E示意抢到领导者锁的Pod B对应的PostgreSQL会被提升为Master，Pod C中的PostgreSQL会向Pod B的PostgreSQL同步数据。Pod B会周期刷新自己的心跳，巩固自己领导者的地位，Pod C会一直Watch Leader。到此，集群又进入下一轮稳定状态。

图F示意因为Operator要保证集群的replica的个数，会拉起一个新的Pod D，作为replica加入到集群中，从Pod B的PostgreSQL同步数据，并且带有replica的label，其endpoint会挂载到replica service下面。

实际操作示意：

删除Primary的Pod 。

1  [root@RDS pgo]# kubectl -n pgouser2 delete pod test-pgcluter-002-b7d8b4bd4-qk5cp  
2  pod "test-pgcluter-002-b7d8b4bd4-qk5cp” deleted  
3  稍等片刻......

<左右滑动以查看完整代码>

查看集群的状态

4  [root@RDS pgo]# pgo -n pgouser2 show cluster  test-pgcluter-002  
5  cluster : test-pgcluter-002 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
6     pod : test-pgcluter-002-b7d8b4bd4-97qqp (Running) on k8s-node-vm7sjf-yn5hsstwuf (2/2) (replica)  
7     pvc : test-pgcluter-002  
8     pod : test-pgcluter-002-jcfm-6bfff77fcf-vxpn6 (Running) on k8s-node-vmr4ej-yn5hsstwuf (2/2) (primary)  
9     pvc : test-pgcluter-002-jcfm  
10    resources : Memory: 128Mi  
11    storage : Primary=20Gi Replica=20Gi  
12    deployment : test-pgcluter-002  
13    deployment : test-pgcluter-002-backrest-shared-repo  
14    deployment : test-pgcluter-002-jcfm  
15    service : test-pgcluter-002 - ClusterIP (192.168.120.61)
16    service : test-pgcluter-002-replica - ClusterIP (192.168.123.182)  
17    pgreplica : test-pgcluter-002-jcfm  
18    ...  
19
20    [root@RDS pgo]# pgo -n pgouser2 test  test-pgcluter-002  
21    cluster : test-pgcluter-002 
22    Services  
23        primary (192.168.120.61:5432): UP  
24        replica (192.168.123.182:5432): UP  
25    Instances  
26       replica (test-pgcluter-002-b7d8b4bd4-97qqp): UP  
27       primary (test-pgcluter-002-jcfm-6bfff77fcf-vxpn6): UP

<左右滑动以查看完整代码>

可以看到原来的Replica Pod：test-pgcluter-002-jcfm-6bfff77fcf-vxpn6 变成了Primary，Operator又新建了一个Pod：test-pgcluter-002-b7d8b4bd4-97qqp 作为replica 运行，其挂载的还是原来Primary的PVC：test-pgcluter-002，Services相对于集群创建的时候没有发生变化，还是primary （192.168.120.61:5432）和 replica （192.168.123.182:5432），连接的用户除了有秒级别的闪断基本没有感知。

通过pgo scale来进行水平扩容，以下命令对集群test-pgcluter-002水平扩容增加一个replica节点。

1  [root@RDS pgo]# pgo -n pgouser2 scale test-pgcluter-002 --replica-count=1  
2  WARNING: Are you sure? (yes/no): yes  
3  created Pgreplica test-pgcluter-002-tbrl

<左右滑动以查看完整代码>

查看扩容以后的集群状态：

4  [root@RDS pgo]#  pgo -n pgouser2 show cluster  test-pgcluter-002  
5  cluster : test-pgcluter-002 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
6    pod : test-pgcluter-002-b7d8b4bd4-97qqp (Running) on k8s-node-vm7sjf-yn5hsstwuf (2/2) (replica)  
7    pvc : test-pgcluter-002  
8    pod : test-pgcluter-002-jcfm-6bfff77fcf-vxpn6 (Running) on k8s-node-vmr4ej-yn5hsstwuf (2/2) (primary)  
9    pvc : test-pgcluter-002-jcfm  
10    pod : test-pgcluter-002-tbrl-7d69bc5fb9-8xmx2 (Running) on k8s-node-vmwnpv-yn5hsstwuf (2/2) (replica)  
11    pvc : test-pgcluter-002-tbrl  
12    resources : Memory: 128Mi  
13    storage : Primary=20Gi Replica=20Gi  
14    deployment : test-pgcluter-002  
15    deployment : test-pgcluter-002-backrest-shared-repo  
16    deployment : test-pgcluter-002-jcfm  
17    deployment : test-pgcluter-002-tbrl  
18    service : test-pgcluter-002 - ClusterIP (192.168.120.61)  
19    service : test-pgcluter-002-replica - ClusterIP (192.168.123.182)

<左右滑动以查看完整代码>

通过增加一个名为test-pgcluter-002-tbr的Deployment，增加了一个replica。新建的pod为test-pgcluter-002-tbrl-7d69bc5fb9-8xmx2，绑定的pvc：test-pgcluter-002-tbrl，暴露的服务还是原来的两个Service：primary (192.168.120.61:5432)、replica (192.168.123.182:5432) 。Service replica 后面对应着两个replica节点的Pod暴露的endpoint，对用户数据面没有影响。

以下命令查看可以缩容的replica节点：

1  [root@RDS pgo]# pgo -n pgouser2 scaledown test-pgcluter-002 --query  
2  Cluster: test-pgcluter-002  
3  REPLICA                 STATUS        NODE          REPLICATION LAG         PENDING RESTART  
4  test-pgcluter-002        running       k8s-node-vm7sjf-yn5hsstwuf               0 MB                   false  
5  test-pgcluter-002-tbrl    running       k8s-node-vmwnpv-yn5hsstwuf               0 MB                   false

<左右滑动以查看完整代码>

通过pgo scaledown命令进行缩容：

6  [root@RDS pgo]# pgo -n pgouser2 scaledown test-pgcluter-002 --target test-pgcluter-002  
7  WARNING: Are you sure? (yes/no): yes  
8  deleted replica test-pgcluter-002

<左右滑动以查看完整代码>

查看集群的详情：

9  [root@RDS pgo]# pgo -n pgouser2 show cluster test-pgcluter-002  
10  cluster : test-pgcluter-002 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
11    pod : test-pgcluter-002-jcfm-6bfff77fcf-vxpn6 (Running) on k8s-node-vmr4ej-yn5hsstwuf (2/2) (primary)  
12    pvc : test-pgcluter-002-jcfm  
13    pod : test-pgcluter-002-tbrl-7d69bc5fb9-8xmx2 (Running) on k8s-node-vmwnpv-yn5hsstwuf (2/2) (replica)  
14    pvc : test-pgcluter-002-tbrl  
15    resources : Memory: 128Mi  
16    storage : Primary=20Gi Replica=20Gi  
17    deployment : test-pgcluter-002-backrest-shared-repo  
18    deployment : test-pgcluter-002-jcfm  
19    deployment : test-pgcluter-002-tbrl  
20    service : test-pgcluter-002 - ClusterIP (192.168.120.61)  
21    service : test-pgcluter-002-replica - ClusterIP (192.168.123.182)  
22  …

<左右滑动以查看完整代码>

我们不难发现，Pod：test-pgcluter-002 和其关联的 PVC：test-pgcluter-002 已经被回收，两个Service还是保持在原来的状态primary (192.168.120.61:5432)、replica (192.168.123.182:5432)，对用户数据面没有影响。

通过pgo update cluster命令来修改集群的cpu和memory资源。

1  [root@RDS pgo]# pgo -n pgouser2 update cluster test-pgcluter-002 --memory 256Mi --cpu 1  
2  Updating CPU resources can cause downtime.  
3  Updating memory resources can cause downtime.  
4  WARNING: Are you sure? (yes/no): yes  
5  updated pgcluster test-pgcluter-002  
6  
7  [root@RDS pgo]# pgo -n pgouser2 show cluster test-pgcluter-002  
8  
9  cluster : test-pgcluter-002 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
10    pod : test-pgcluter-002-jcfm-54ff784874-jfwgk (Running) on k8s-node-vmr4ej-yn5hsstwuf (2/2) (replica)  
11    pvc : test-pgcluter-002-jcfm  
12    pod : test-pgcluter-002-tbrl-8695b6d956-j9pdv (Running) on k8s-node-vmwnpv-yn5hsstwuf (2/2) (primary)  
13    pvc : test-pgcluter-002-tbrl  
14    resources : CPU: 1 Memory: 256Mi

<左右滑动以查看完整代码>

用户在用pgo create cluster创建集群的时候可以通过参数--cpu ，--memory和--pvc-size来指定集群所用的cpu，内存和存储的大小，集群创建完成以后，还可以通过pgo update cluster命令来修改 cpu和memory资源配置，pvc大小的变更需要csi支持，如京东的chubaofs等。

出于安全的考虑，周期性的备份对于生产级别的数据库服务来说是非常重要的，Crunchy PostgreSQL Operator提供了全量备份，差异备份，增量备份，周期性的备份和周期性的WAL文件归档。

备份策略定制：选择备份的类型（全量，增量，差异备份）以及希望其在每个PostgreSQL集群上执行的频率及时间点。

备份到S3：将您的备份存储在任何支持S3协议的对象存储系统中，Operator可以从这些备份还原和创建新集群。

示例：

创建用s3备份的cluster

1  pgo create cluster test-pgcluter-004 -n pgouser2 --pgbackrest-storage-type s3 --pgbackrest-s3-region cn-north-1 --pgbackrest-s3-endpoint s3.cn-north-1.jdcloud-oss.com --pgbackrest-s3-key 7FD8AC9D8XX --pgbackrest-s3-key-secret BE059515AXYX --pgbackrest-s3-bucket caas-test --replica-count 1 --metrics  
2  created cluster: test-pgcluter-004  
3  workflow id: 7c1ae19b-937d-441f-80ff-ff50ac8943b0  
4  database name: test-pgcluter-004  
5  users:  
6  username: testuser password: (Ev{k)VoEWStc8mW\ryL3r10

<左右滑动以查看完整代码>

创建备份

7  [root@RDS pgo]# pgo -n pgouser2 backup test-pgcluter-004 --pgbackrest-storage-type s3  
8  created Pgtask backrest-backup-test-pgcluter-004

<左右滑动以查看完整代码>

查看备份

9  [root@RDS pgo]# pgo -n pgouser2 show backup test-pgcluter-004  
10  cluster: test-pgcluter-004  
11  storage type: s3  
12  stanza: db  
13     status: ok  
14     cipher: none  
15     db (current)  
16         wal archive min/max (12-1)  
17         full backup: 20200710-022111F  
18             timestamp start/stop: 2020-07-10 10:21:11 +0800 CST / 2020-07-10 10:22:11 +0800 CST  
19             wal start/stop: 000000010000000000000002 / 000000010000000000000003  
20             database size: 31.1MiB, backup size: 31.1MiB  
21             repository size: 3.7MiB, repository backup size: 3.7MiB  
22             backup reference list:

<左右滑动以查看完整代码>

周期备份设置

23  pgo create schedule --schedule="* * * * *" --schedule-type=pgbackrest --pgbackrest-backup-type=full test-pgcluter-004

<左右滑动以查看完整代码>

使用简单的pgo clone命令从现有集群中创建新集群。

通过命令pgo clone从源集群test-pgcluter-007克隆创建新的集群test-pgcluter-008，并打开监控。

1  [root@RDS pgo]# pgo -n pgouser2 clone test-pgcluter-007 test-pgcluter-008 --pgbackrest-storage-source s3 --enable-metrics  
2  Created clone task for:  test-pgcluter-008  
3  workflow id is  232b0c7b-fb13-451e-a65f-194ee3fe2413  
4

<左右滑动以查看完整代码>

克隆过程中的任务顺序

5  [root@RDS pgo]# pgo -n pgouser2 show workflow 232b0c7b-fb13-451e-a65f-194ee3fe2413  
6  parameter           value  
7  ---------           -----  
8  clone 1.1: create pvc2020-07-10T06:33:59Z  
9  clone 1.2: sync pgbackrest repo2020-07-10T06:33:59Z  
10  clone 2: restoring backup2020-07-10T06:34:23Z  
11  clone 3: cluster creating2020-07-10T06:35:16Z  
12  pg-cluster          test-pgcluter-008  
13  task submitted      2020-07-10T06:33:59Z  
14  workflowid          232b0c7b-fb13-451e-a65f-194ee3fe2413  
15

<左右滑动以查看完整代码>

克隆完成以后查看新的集群test-pgcluter-008信息

16  [root@RDS pgo]# pgo -n pgouser2 show cluster test-pgcluter-008  
17  cluster : test-pgcluter-008 (crunchy-postgres-ha:centos7-12.3-4.3.2-0)  
18     pod : pgo-backrest-repo-sync-test-pgcluter-008-beje-b99pp (Succeeded) on k8s-node-vmj91e-yn5hsstwuf (0/1) (unknown)  
19     pvc : test-pgcluter-008-pgbr-repo  
20     pod : test-pgcluter-008-59cbf78584-cld7j (Running) on k8s-node-vm7sjf-yn5hsstwuf (2/2) (primary)  
21     pvc : test-pgcluter-008  
22     resources : Memory: 128Mi  
23     ...

<左右滑动以查看完整代码>

不难从 show workflow的输出中看到克隆大体流程：先为新集群创建一个pvc，然后通过pgbackrest将老集群的备份信息同步到新PVC中，再恢复增量WAL文件，最后用刚才的PVC创建集群。

一个完备的系统少不了监控和告警，由Crunchy PostgreSQL Operator创建的PostgreSQL集群可以选择通过Prometheus Exporters提供性能指标。指标收集器（metric exporter）包含在数据库集群的每个Pod里面，为数据库容器提供实时监控指标收集。为了存储和查看这些数据，还有需要使用Grafana和Prometheus两个组件，用户可以通过最新版本的helm chart部署Operator项目自带的Grafana和Prometheus组件。

Prometheus收集到的监控指标显示如下：

示例图片是集群中WAL文件积压空间的相关监控信息，图片中阶梯下降的线展示了集群里面wal文件由12GB左右的积压数据，降到0GB的过程，期间PostgreSQL的archive commoand通过pgbackrest在周期性的做WAL文件归档操作，示例中WAL文件积压消化的有点慢，可以调整pgbackrest的并行度加速。更美观更多维度的监控信息可以通过Grafana展示，如下一小节所示。

Grafana监控指标信息显示：

容器生成的日志对于系统至关重要，因为它们提供了有关系统运行状况的详细记录。PostgreSQL日志非常详细，并且有些信息只能从日志中获取（但不仅限于）：

用户的连接和断开。

检查点统计。

PostgreSQL服务器错误。

跨多个主机聚合容器日志可让管理员很方便的审核、调试问题并防止违规行为。

本文首先探讨了一下在Kubernetes上部署有状态的服务的几种可行方案，然后以开源社区的Crunchy PostgreSQL Operator为例部署了一个基本功能相对完备的PostgreSQL云服务。我们可以看到Operator屏蔽了复杂应用的编排细节，大大降低了它们在Kubernetes中的使用门槛，而且能做到对应用非常复杂而又精细的管理和控制，能够帮助开发人员实现所有主流云厂商相同云产品的同等功能。同时，借助于强大的Kubernetes，系统更健壮、扩展更灵活方便，如果您有其它复杂应用需要部署，也建议采用Operator方式来部署。

参考资料

1.CrunchyData/postgres-operator:

https://github.com/CrunchyData/postgres-operator

2.zalando/postgres-operator:

https://github.com/zalando/postgres-operator

3.Patroni组件：

https://github.com/zalando/patroni

4.K8s应用管理之道 - 有状态服务：

https://developer.aliyun.com/article/689685spm=a2c6h.13262185.0.0.40eb6ca1qCAqyQ

5.Managing High Availability in PostgreSQL — Part 3 Patroni：

https://scalegrid.io/blog/managing-high-availability-in-postgresql-part-3/

6.https://thenewstack.io/different-approaches-for-building-stateful-kubernetes-applications/

7.Databases on Kubernetes:

https://www.reddit.com/r/devops/comments/8m1bp3/databases_on_kubernetes

8.https://www.slideshare.net/jkatz05/operating-postgresql-at-scale-with-kubernetes-137132067?from_action=save

9.https://www.slideshare.net/AlexanderKukushkin1/patroni-kubernetesnative-postgresql-companion

10.https://github.com/operator-framework/awesome-operators

11.https://www.kubernetes.org.cn/3985.html

你可能感兴趣的:(数据库,kubernetes,java,分布式,docker)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
docker igotyback eureka 云原生
Docker容器的文件系统是隔离的，但是可以通过挂载卷（Volumes）或绑定挂载（BindMounts）将宿主机的文件系统目录映射到容器内部。要查看Docker容器的映射路径，可以使用以下方法：查看容器配置：使用dockerinspect命令可以查看容器的详细配置信息，包括挂载的卷。例如：bashdockerinspect在输出的JSON格式中，查找"Mounts"部分，这里会列出所有的挂载信息
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在