zl1zl2zl3

陆金所 CAT 优化实践

1 背景

CAT 介绍

CAT （Central Application Tracking）是一个实时监控系统，由美团点评开发并开源，定位于后端应用监控。应用集成客户端的方式上报中间件和业务数据，支持 Transaction、Event 和 Heartbeat 等数据类型 Metrics 报表，也支持调用链路 Trace，对于发现和定位应用问题有很大帮助。

CAT 服务端也可以认为是一个 Lamda 架构的报表系统，通过汇聚客户端上报的原始消息 MessageTree，实时计算出 Transaction、Event、Problem、heartbeat 等报表，保存在内存中；历史报表序列化后保存到本地并上传到 DB 存储，原始上报数据压缩和建立索引后上传至 hdfs。

陆金所的后端应用监控也主要基于 CAT，是在前几年的一个版本上做二次开发，增加了新的报表。各类架构中间件大量使用 CAT 埋点，并一直在丰富各类场景，在各类问题发现和问题定位发挥了很大作用。

下图是应用的 Transaction 报表，集成了多个中间件打点:

下图是某一个 MessageTree，用户通过报表中 Sample 或者通过额外的 ES 索引等搜索到某个应用的 MessageTree，trace 到具体调用事件

遭遇性能问题

由于业务扩大，应用数量剧增，生产环境的机器数从半年前的 6000+ 增加到 10000+；另外新版本中间件增加了埋点量，随着应用升级，单个应用实例上传的 CAT 数据也在增加。

在 19 年 12 月份, 发现会出现偶尔某些 CAT 实例无响应的问题。由于当时手上有更紧急的问题处理，这些偶尔的崩溃往往通过重启来解决。直到 20 年 1 月份，开发同学开始抱怨 CAT 界面响应慢，“重启大法” 不再管用了，往往上个小时刚刚重启，下个小时就又挂了。

具体表现

生产上的 CAT 用的都是物理机，配置是志强物理核心 E5 双路 CPU（CPU 8*2，超线程 32 核）， 128G 内存， OS redhat 6.5。高峰时的 CAT 的 context switch 相当高，达到 120 万 / 秒，系统负载偶尔到 20 以上，一次较大的 Full GC 往往耗时 3-5 秒；一次长时间的 GC 就可能造成 CAT 的端口无响应，只有重启才能解决。

临时治理

GC 方式从 CMS 改到了 G1，并调大了 heap 到 80G
宕机的实例总是那么几台，这是负载不均衡造成的，因此我们修改客户端上报数据的路由规则让负载更加均衡
申请紧急扩容，无奈年末硬件资源和人员都非常紧张，远水解决不了近渴

生产上的应用集群还在扩大，明年还有更多项目需要上线，硬件扩容不仅增加硬件成本，也会增加运维成本；直接提升性能应该是最好的方案。

测试环境 CAT 也存在类似的容量问题，我们有 3 台物理机来跑 CAT，但我们的测试环境一共有 15000 个应用实例。之前尝试过应用开启 CAT，但导致 CAT 崩溃，当前的策略是部分环境和应用开启 CAT 打点的方式，是能提供了部分的监控能力，但也对开发测试人员造成了不小的困扰。

对 CAT 做性能优化，一方面能解决生产容量不足的问题，另一方面也能协助规划测试环境的集群容量，大幅提升开发测试效率。

优化准备

性能优化不是没有方向的，其实我们在 2018 年就观察到 CAT 在业务高峰时刻的上下文切换特别高（>1mil/s。在 19 年的 Qcon 会议上，携程的梁锦华介绍了他们对 CAT 的性能优化工作，服务端的优化集中在改进线程模型来降低上下文切换，改进内存模型来降低 GC。所以我们的优化也要覆盖这两个方向，另外，我们也要看下在 JVM、OS 配置层面能做哪些改进。

线程模型优化

目的是降低上下文切换带来的开销；

我们来看下什么是上下文切换，我们都知道现代 OS 基本是多任务的，CPU 资源在 OS 在不同的任务（线程）需求之间切换分配。为了确保正确性，每一次切换 OS 都需要保存上一次线程的运行状态，并加载下一个线程的状态，这些状态往往涉及 CPU 上的多种寄存器；另外，在切换到下一个的线程之后，还会造成内存访问效率的损失，这主要是不同线程运行时需要访问的数据不同，由此带来的多级缓存命中率下降而降低运行效率。

一次上下文切换的直接开销在 1-5ns 级别，而带来的间接开销则可能到 1us 到数个 ms 之间，有兴趣的同学可以参考这两篇文章: Quantifying The Cost of Context Switch 、 Measuring context switching and memory overheads for Linux threads

内存优化

CAT 作为 APM 应用，每秒摄入的数据在几十到一百多 MB 级别，数据经过反序列化之后，还需要对内存报表做大量的更新操作，这个过程会创建特别多的临时对象，会造成频繁的 Young GC。CAT 内存中维护了当前小时的报表，每一个小时中中，常驻内存随着时间推移逐渐增大，造成可用内存减少，频繁触发 Full GC。

JVM/OS/ 网络设置优化

JVM 已经发布到版本 11，新版本带来了一部分免费的性能提升，另外 GC 的方式和参数也可以调整。开启 OS 内存大页和调整网络参数等在理论上也能带来性能提升。

核心指标

作为一个实时数据摄入的报表系统，我们很快就确定了几个核心的性能指标：

服务端稳定性: 功能核心功能正常工作，服务端是否有 OOM、无响应甚至进程崩溃现象
服务端负载: 操作系统系统负载
摄入数据速率：主要考察单位时间（1 小时）消费消息数量和数据大小
服务端消息丢失量：因为来不及处理而丢弃的消息数量
客户端失败消息数量：客户端由于发送速率低于生产速率造成的消息丢弃量

2 第一轮优化

下图描述了 CAT 的消息处理和线程模型，Netty Worker 线程生成 MessageTree 后，offer 到每个 Analyzer 专有队列（Blocking Queue）中，由 Analyzer 线程从队列中拉去后处理并生成对应的内存报表。

不难理解这里的设计初衷是让每个 Analyzer 独立使用其队列，实现了 Analyzer 处理的隔离，慢的 Analyer 不会影响那些快的 Analzyer。

对于某些重要且计算量较大的 Analyzer（例如图中 Transaction Analyzer)，使用了多个队列，并根据客户端应用名的 hash 来均衡多个队列任务；CAT 内部自建报表合并机制来合并多份报表。

如果某一个 Analyzer 的队列满了导致无法推送，Netty 线程则会直接丢弃该消息，并统计丢弃次数。

下面的代码描述了插入消息队列的过程：

public void distribute(MessageTree tree) {
    String domain = tree.getDomain(); // domain 就是上传消息的应用名
    for(Entry> entry: m_tasks.entrySet())
    {
       List tasks = entry.getValue(); // PeriodTask 封装了消息队列
       int index = 0;
       int length = tasks.size(); // 多个 Analyzer 队列
       if (length > 1) {
          index = Math.abs(domain.hashCode()) % length;
       }
       PeriodTask task = tasks.get(index);  
       if(!task.enqueue(tree)) { 
           // 记录的消息丢失
       }
    }    
}

Analyzer 拉取并消费消息的代码如下：

while(true) 
    // 无限循环拉取数据，最大 5ms 超时
    MessageTree message = m_queue.poll(5, TimeUnit.MILLISECONDS); 
    if(message != null) {
    process(message)    
    }
}

现在一共有 22 个 Analyzer，略微有点多，我们也不能删除现有的 Analyzer，因为不少系统已经依赖 CAT 的各类报表来协助监控。

通过线下 profiling 并结合研究代码，我们发现:

队列的 offer 和 poll 占用了超过 7% 的 CPU 处理时间
从线程 dump 来看，Analyzer 线程经常处于 LockSupport.parkNanos 调用上
由于部分 Analyzer 有多个线程，Analyzer 线程总数量约 30 个，其线程 CPU 占用又不太高 (<30%)
不同类型的 Analyzer 只会处理满足特定条件的 MessageTree，但是 Netty Worker 线程在做 queue.offer 动作时没有判断 MessageTree 能否被该 Analyzer 处理，Analyzer 获取到部分 MessageTree 之后又丢弃

回到系统设计模式上来，一组线程生成 MessageTree，并采用 BlockingQueue 发送到另一组线程来处理，这是典型的消息传递场景。提到跨线程的消息传递，我们不能不提到大名鼎鼎的 Disruptor 的 RingBuffer 模型。

Disruptor 框架是 LMAX Exchange 开发的高性能队列模型，该框架充分利用了 Java 语言中的 volatile 语义，创新性地使用了 RingBuffer 数据结构，实现了在线程之间快速消息传递，支持批量消费。吞吐量和延时性能都高于 Java 标准库中的 BlockingQueue，其性能关系是:

Disruptor > ArrayBlockingQueue > LinkedBlockingQueue

由于篇幅关系，我们就不在这里详细介绍 Disruptor 内部原理了，有兴趣的小伙伴请参考 Disruptor 介绍。

线程模型尝试和调整

MessageTree 做预过滤是必须要做的，这部分很快做完了，但在线程模型的改动上我们经过了几次尝试：

尝试一

考虑到 Disruptor 做线程间的消息传递效率，我们将 BlockingQueue 简单替换成了 Disruptor 实现。效果不是很明显，总体的 CPU 使用并没有下降多少。

由于 Disruptor 需要 Event 对象放入 RingBuffer，封装 MessageTree 的类定义如下:

class MessageTreeEvent {
  MessageTree message;
}

尝试二

为降低 Analyzer 线程数，我们想到将多个 Analyzer 线程合并，在 Disruptor 框架下需使用同一个 RingBuffer。于是我们将一个 MessageTree 映射到多个 MessageTreeEvent，并通过１个全局的的 RingBuffer，分发给一个线程池来处理。考虑到 Ringbuffer 中 MessageTreeEvent 数量增加，我们将 RingBuffer 大小调整到 262144 (1<<18)

新的 MessageTreeEvent 定位如下：

class MessageTreeEvent {
    MessageTree message;
    String analyzerId;
}

如果 22 个 Analyzer 都采用这个方法，并假设 MessageTree 速率为每秒 5 万，那么最大就有 22 * 5w/s = 110w/s 速率的消息需要通过 Ringbuffer。这个数字乍一看非常大，但如果对照性能 Disruptor 测试结果, 这个速率对于 Disruptor 框架来说压力不大。

我们挑选了大概 10 个 Analyzer 加入这个大的 RingBuffer 来处理，但无论如何如何增大 buffer 消息丢弃情况还是有点多，特别是较为重要的 Transaction/Problem 等 Analyzer 的消息。

尝试三

考虑到不同的 Analyzer 重要程度不同，我们的尽量保证核心 Analyzer 能正常工作，那些不太重要的 Analyzer 丢一点消息是可以接受的。于是我们给 Analyzer 引入了优先级概念，

enum AnalyzerLevel {
  HIGH(1),
  MID(GLOBAL_REPORT_QUEUE_SIZE/16),
  LOW(GLOBAL_REPORT_QUEUE_SIZE/4);
  
  public final int requiredCapacity;
  AnalyzerLevel(int requiredCapacity) {
    this.requiredCapacity=requirecapacity;
  }
}

下面是往 RingBuffer 插入数据的代码，也体现了 disruptor 的优点，hasAvailableCapacity 这个方法与 BlockingQueue 的 size 相比，其内部实现是无锁的。

RingBuffer ringBuffer = disruptor.getRingBuffer();
if(ringBuffer.hasAvailableCapacity(m_analyzer.getLevel().requiredCapacity)) { 
   long seq=ringBuffer.next();
   try {
      // 准备 MessageTreeEvent 对象
       MessageTreeEvent event = ringBuffer.get(sequence);
       event.message = messageTree;
       event.analyzerName = m_analyzerName;
   } finally {
         ringBuffer.publish(seq)  ;
   }
} else  {
    // 丢弃并记录
}

我们又引入了分组的概念，将 Analyzer 分为 2 组，每一组使用一个 RingBuffer，每一个 RingBuffer 使用 2 个线程来消费。CAT 一共 22 个 Analyzer，我们将 15 个 Analyzer 改造到了新的线程模型。

Disruptor 消费和启动代码如下：

// int threadsPerRingBuffer = 2 
WorkHandler [] handlers = new WorkHanlder[threadsPerRingBuffer];
for(int index = 0; index < threadsPerRingBuffer; index ++) {
  handlers[index] = createHanlder(index); // 创建多个消费线程对等
}
disruptor.handleEventWithWokerPool(handlers); // 设置 disruptor 的消费者
disruptor.start(); // 启动

private WorkHanlder createHandler(int threadIdx) {
  return WorkerHanlder () {
    public void onEvent(MessageTreeEvent event) {
      String analyzerName = event.analyzerName;
      getAnalyzer(threadIdx).process(event.message);
    }
  };
}

另外，有了之前合并线程成功的经验，在仔细检查代码时和检查线程栈时，发现 Netty 的 worker 线程数为 24，确实有点多。我们逐步降低，测试表明 Netty work 线程数为 2 时仍然一切正常，从 top -H 的输出来看，在 100MB/ 秒的网络摄入流量下，Netty Worker 线程的 CPU 也就在 70% 左右，未见客户端发送失败的情况。

最终的线程模型如下：

JVM 设置改动

在 JVM 和 GC 方式的选择上，我们选用了 open Jdk 11 和 G1 的方式，在测试环境，这个组合的运行稳定，GC 的延时较低， CAT 的页面响应也比较快。

优化工作做了 2 周，快到了过年的时间，我们先找了 2 台机器验证，验证通过后更新到了所有实例。

改造效果

我们将测试环境 4500 台机器左右的流量导入到一台机器，在修改前，这台 CAT 机器刚起来 1 分钟后就会陷入无响应状态。

改造后测试环境的这台服务器顺利跑了起来，在小时消息量 0.94 亿，消息大小 210G 情况下 “top -H” 输出如下，可以看到 Netty work 线程（图中 epollEventLoopG）的占用不高，4 个全局的 Analyzer 线程 (图中 Cat-Global 开头线程) 的占用也不太高，无消息丢失。

在生产环境中也找出一台机器，通过配置路由规则，让其承载较大流量，这台机器在不同负载情况下表现如下：

注：我们区分了核心消息（优先级为 High 的 Analyzer）与非核心消息丢失。

G1GC 在生产环境表现稳定，一次 young G1GC 平均耗时约 200ms，未见 Old GC。

上下文切换下降了一半以上，CPU 负载也下来了很多，没有出现超过负载 20+ 的情况，应该可以安稳过年了！

未解决的问题

春节前的一轮优化主要覆盖线程模型优化与 JVM 设定，内存优化还没做。

生产环境中 CAT 在日常的高峰流量中 CPU 负载依然超过 10，并随着小时报表在内存中积累，10 分钟后的 CPU 负载明显攀升（如下图）

结合测试环境中 CAT 进程的堆 dump，"jmap -histo $pid" 的输出的分析中，我们发现还存在如下几个问题：

CPU 使用率还是有点高，承载较大流量是出现核心消息丢失
上下文切换较高，平时负载在 40 万 / 秒，高峰时间到 50 多万 / 秒
临时对象较多，例如 SimpleDateFormat/DecimalFormat 等对象
LinkedHashMap 中的内存使用效率较低
驻留内存中简单对象数量太多

详细优化过程先从内存优化部分说起

3 内存优化

有效内存使用率概念

关于内存使用效率，和大家分享下 Java 中对象的大小概念

Shallow Size: 包含当前对象 Header 和对象直接拥有的内部数据，以下面的对象 s 为例，除了对象 Header 之外，包含 1 个数组引用、1 个 Map 引用、1 个 double 和 1 个 int，其内部数据大小是 8*3+4 = 28 byte

在 64 位 JVM 未开启指针压缩情况下加上对象 Header 16 byte 并保持 8 byte 的对齐，最终 Shallow Size 大小 28 + 16 + 4 = 48 byte

class Sample {
    int[] intArray; // reference size 8
    Map map; // reference size 8
    double doubleValue; // double size 8
    int intValue;    // int size 4
 }
 Sample s = new Sample();

希望了解更多 java 对象内存布局的朋友可以使用 open jdk jol 工具，下面是利用 jol 打印上述对象 layout 的代码

import org.openjdk.jol.info.ClassLayout;
import org.openjdk.jol.vm.VM;
  
public class ObjectLayoutMain {
    public static void main(String[] args) throws Exception {
        System.out.println(VM.current().details());
        System.out.println(ClassLayout.parseClass(Sample.class).toPrintable());
    }
}

以下是使用 “-Xms40g -Xmx40g” 的 vm 参数在 64 位 jvm11 下的输出

 # Running 64-bit HotSpot VM.
  # Objects are 8 bytes aligned.
  # Field sizes by type: 8, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
  # Array element sizes: 8, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
  
  org.jacky.playground.jol.Sample object internals:
   OFFSET  SIZE            TYPE DESCRIPTION                               VALUE
        0    16                 (object header)                           N/A
       16     8          double Sample.doubleValue                        N/A
       24     4             int Sample.intValue                           N/A
       28     4                 (alignment/padding gap)                  
       32     8           int[] Sample.intArray                           N/A
       40     8   java.util.Map Sample.map                                N/A
  Instance size: 48 bytes

注: 设置堆内存大于 32G 会关闭引用压缩，兴趣的同学可以自己跑一下看应用压缩或者是 32 位 JVM 下的输出。

Retain Size: 内存中的对象存在引用关系，消除循环后可以认为是一个个对象树。对象的 Retain Size 是该对象对应的对象树的大小。与对象的 Shallow Size 相比，Retain Size 是一个相对动态的值，随着其下层对象具体值变化而变化。内存有效使用率定义如下：

内存使用率 = 实际数据占用大小 / Retain Size

更多内存效率理论请参考：Building Memory-efficient Java Applications: Practices and Challenges

优化实践

现状

从 CAT 的 heap dump 中我们看到最大的对象主要是当前小时的各种 Report 对象，这些 Report 大量使用了多层级的 Map 结构，如下图 (图中的数字是经验估计数量)。可以看到 Map 对象非常多，特别是层次往下的那些对象。

现有代码采用 java 标准库中的 LinkedHashMap 来表示这些层次结构，这也就产生了大量 LinkedHashMap 以及子对象 LinkedhashMap$Entry，从下面堆 dump 的内存文件分析看到这几个 package 的对象在内存占用按照类型排行上非常靠前:

heartbeat.model.event.*
transaction.model.event.*
event.model.entity.*

内存使用概览

开放地址 HashMap 实现

我们发现对于那些靠近叶子节点的报表对象，采用 LinkedHashMap 在大多数时候有点多余，因为不需要记录插入顺序，可以简化成 HashMap，下面是这两者 Entry/Node 节点类的定义比较:

  //java.util.Hash
  static class Node implements Map.Entry {
        final int hash;
        final K key;
        V value;
        Node next;
    }
   //java.util.LinkedHashMap
   static class Entry extends HashMap.Node {
        Entry before, after; // 额外的 before & after 引用
        Entry(int hash, K key, V value, Node next) {
            super(hash, key, value, next);
        }
    }

是不是还能进一步优化呢？答案是可以，而且改动很小

很多 Java 技术栈的同学对标准库中利用链表法实现的 HashMap 比较熟悉，但大学学过《数据结构》课程的同学可能还记得另一种 Hash 的实现开放地址 Hash 。与链表法开一个链表来解决冲突的方式不同，开放地址 Map 通过在线性表中重新计算一个新位置来解决。

实测大小对比：

下述测试代码生成一个包含大小为 size 的数组，其保存大小从 0 到 size-1 的 HashMap

import org.agrona.collections.Int2ObjectHashMap;
import java.util.*

private static Map[] populate(int size, boolean useOpenMap) {
    List> result = new ArrayList<>();
    for (int i = 1; i <= size; i++) {
        Map m = useOpenMap ? new Int2ObjectHashMap<>() : new LinkedHashMap<>();
        for (int j = 0; j < i; j++) {
            m.put(j, new Range());
        }
        result.add(m);
    }
    return result.toArray(new Map[]{});
}
public static class Range { // retain size=56
    int id = 0;
    int count = 0;
    int fails = 1;
    double sum = 1.0;
    double avg = 1.0;
    double max = 1;
}

运行结果整理如下，可以看到切换到 Int2ObjectHashMap 的实现就能轻松节省 30% 以上内存，如果值类型的 shallow 更小，节省还会更多。

值得说明的是：

在 CPU 性能测试中，开放地址的 Map 的 get/put 都比 HashMap 性能略差，但绝对值差距很小
开放地址的 Map 在删除时需要在将这个位置 mark 成已删除，会造成空间浪费，但在 CAT 计算中无删除操作

对象消除

在上一个图中，可以注意到 heartbeat.model.event.Detail 对象数量非常之多，其占用内存就超过 1G！

对应到业务逻辑，每一个 Detail 都是描述应用 heartbeat 的某一个属性，例如 "SystenLoad"、“PhysicalFreeMemory”、"GC Count" 等，这些 Details 存在如下几个特点：

Key 大量重复， Key 去重后数量很少，同一个应用的 CAT 客户端在不同时间、不同实例的 heartbeat 中的 Key 都一样；还有部分 Key 是 CAT 客户端自带的，这部分 Key 对所有应用都一样
Detail 的定义非常简单，m_label 总是为 null，可以直接去掉

class Detail {
     String m_id;
     double m_value;
     String m_label; // 总为 null， 可以消除
}

Detail 对象保存在 Extension 对象中，其中的 key 与 value 中 id 值相同

class Extension {
  Map m_detais = new LinkedHashMap<>();
}

从上面的几个特点，我们可以将这里的 key 对象映射成 int，一个 detail 对象的有效数据就是一个 int 和一个 double 对象，总的有效大小为 12byte。

我们来找两个例子来计算下内存使用效率：

这是一个非典型场景， m_details 中 key 数量为 122，比较多

我们来计算上面 m_details hashmap 的内存使用效率:

Retained size 17632
有效大小 122 * 12
内存有效率 122 * 12 / 17632 = 8.3%

下面这个 m_details，key 数量较小，内存使用效率: (12 *2)/472=5.1%

在使用 eclipse collection 的 LongDoubleMap 替代后，上述两例的使用效率分别提高到 46.1 和 15.8%。

其他内存优化

考虑到线程安全问题，SimpleDateFormat 和 DecimalFormat 等对象在使用时创建新实例，使用线程安全的实现来代替即可。

4 继续线程优化

为了可以更方便地调整全局线程 /ringBuffer，并始终保持不同线程之间负载和优先级的均衡，我们引入了 Analyzer 动态分组。

Analyzer 动态分组

我们对大约 20 个 Analyzer 按照重要正度和计算复杂度综合考虑排序，用于 Analyzer 分组。

动态分组保证那些计算量大且优先级又高的 Analyzer 不集中竞争计算资源，实现规则如下

effectiveRingBufferIndex = analyzer.getGlobalIndex() % ringbufferCount

我们将剩下的几个 Analyzer 合并到了全局线程组，对 Netty Worker 数、全局线程数和每个 RingBuffer 的消费线程数做了配置化。默认开启 2 个 Netty Worker 线程，3 个全局线程 /ringBuffer，考虑到维护多份报表的内存开销较大，每个 RingBuffer 的消费线程数默认设置为 1。优化后的典型的线程配置如下:

另外继续增加了 Ringbuffer 大小到 524288 (2^19) ，当然我们也清楚增加缓存大小有两个坏处：

最大处理延时增加，考虑到 CAT 的处理能力，这个影响最大不超过 5 秒，业务上可以接受
buffer 增大导致内存使用增加，由于 CAT 进程都是动辄几十 G 的堆，额外的百万个 buffer 对象带来的影响微乎其微

其他优化与尝试

对 ConcurrentHashMap 做 null 检查后使用 synchronize 改到使用 ConcurrentMap.computeIfAbsent

CAT 启动或者跨小时的时候会集中创建 bucket，采用 null 检查 + synchronize 的方法会造成集中的线程堵塞

ConcurrentMap m_buckets = new ConcurrentHashMap();
// 改造前
bucket=m_buckets.get(path);
if(bucket == null) { 
   synchronize(m_buckets) {
       bucket= createBucker(); // 慢操作
       m_buckets.put(path, bucket);
   }
}

// 改造后
bucket=m_buckets.computeIfAbsent(path,path -> createBucket());

缩减 CAT 集群内部请求的线程数量，增加其 buffer 大小，并使用连接池来管理连接
增加磁盘写入线程数量和 buffer 来缓解测试环境磁盘写入较慢的问题
测试环境 OS 的电源管理从 on-demand 改成 performance 模式，与生产对齐
测试环境尝试开启内存大页，效果不太明显，生产环境也需要运维协助配置，暂放弃

5 效果

单机性能

为了验证优化效果，我们对某一台机器又加大了流量，比较了不同负载的表现

注：1.74 亿消息量是人为加大负载，每秒网络流量 114MB(402GB/3600) ，已打满千兆线路。

下图为小时消息量 1.45 亿下的系统表现：

可以看到上下文切换、CPU 的使用率和 GC 都非常平稳，核心消息丢失为 0；非核心消息丢失略高。可考虑增加全局处理线程数到４甚至５来缓解极端负载下的非核心消息丢失。

容量评估

基于最新的单机性能和总的生产数据量，现有生产环境集群还有约 50% 的冗余容量，未来 2 年都无需扩容。

测试环境的 CAT 容量也评估了出来，现有 3 台 CAT 支撑 15000 个测试应用实例有点勉强，正在申请额外 3 台服务器，这样就能支持所有的测试集群，并留有部分冗余。

6 思考

超线程

超线程（Hyper Thread，HT）给 OS 提供了更多的可用核心，但这些核心是毕竟是硬件虚拟出来的，目的是更好地使用 CPU 多余的计算和缓存资源，提供更高的吞吐量。

简单地认为开启 HT 可以免费获得一倍的可用线程并计算能力能翻倍是不可取的，物理核心和虚拟核心会竞争使用计算和缓存资源，在某些情况下甚至会降低吞吐量。

在计算密集的场景下，HT 的虚拟核心是不能计算在可用核心里面的，因为虚拟 CPU 的计算能力有限。这可能也是我们生产环境 CPU 飙到 20 左右就会出现计算能力严重不足，带来端口无响应等问题。

Java 内存使用效率

Java 有很好的面向对象的特性，在书写程序时带来了很多便利，但也带来了运行时刻的内存负担，每个对象都有个很大的 Header，有时 Header 甚至超过了本身数据的大小。

这有两个比较好的解决方案值得期待：

Java 语言支持 struct 类型

Java 语言 struct 类型需求很早就被提了出来，struct 类型和原生类型一样，不属于对象范畴，没有对象 Header 的内存成本。近年放在 valhalla 项目中， 19 年 5 月份发布了原型版，有兴趣的同学可以看下。

java 与原生语言混合编程

Oracle 的 graalvm 项目，支持 Java 语言与其他原生语言混合编程，在 Java 应用的性能瓶颈的部分采用 C 或者 Rust 语言来实现。该项目已经开源，已经取得了一定的进展，可在官网下载社区版的 graalvm 的 JDK。

7 总结

两轮性能优化各耗时 2 周，回顾整个优化过程，我们制定了大体的方向，找到核心的性能指标，大量查找资料，从原理验证做起，并结合线下环境的逐步验证，直到目标达成为止。

在优化过程中，我们也学习了 CAT 本身设计巧妙的地方，例如异步化的实时数据处理、支持水平扩容、高效的序列化 / 反序列化和集群数据路由等。在此感谢美团点评的朋友把这个项目开源出来，让大量的开发者收益。

性能优化是一个综合的话题，并没有什么圣杯，只需在工作中勤摸索、常思考、积极与他人交流并敢于尝试总能有收获。我们把这次优化经历写出来，希望能抛砖引玉，也欢迎各位同行指正。

8 作者介绍

蔡健，陆金所应用架构师。2008 年复旦大学硕士毕业后加入大摩， 2016 年加入陆金所，负责 Java 架构中间件和应用监控；职业理念是专注，并对新技术时刻充满热情。

方超，陆金所应用架构师。十年工作经验。热爱生活和技术。

你可能感兴趣的:(监控,优化)

8、深入理解AWS认证解决方案架构师助理考试：设计与优化君子心理 AWS认证解决方案架构师弹性架构
深入理解AWS认证解决方案架构师助理考试：设计与优化1设计弹性架构的关键要素设计弹性架构是AWS认证解决方案架构师助理考试的重要组成部分。弹性架构不仅能够确保系统的高可用性和容错能力，还能在面对流量峰值时提供稳定的服务。以下是设计弹性架构的一些关键要素：1.1选择可靠和弹性的存储在设计弹性架构时，选择合适的存储解决方案至关重要。AWS提供了多种存储选项，如AmazonS3、AmazonEBS、Am
短剧业务产业链涉及的技术系统-TKano模型百态老人大数据
短剧业务产业链涉及的技术系统中，TKano模型的应用主要集中在用户需求分析方面。TKano模型是一种用于识别和分类用户需求的方法，通过将用户需求分为基础型需求、期望型需求和兴奋型需求，帮助短剧业务更好地理解用户需求并优化产品。在短剧业务中，TKano模型的应用可以帮助企业识别出哪些是基础型需求（如内容的连贯性和完整性），哪些是期望型需求（如快速观看和推荐功能），以及哪些是兴奋型需求（如附加资源和福
短剧小程序的「技术革命」：从「粗放生长」到「精准运营」 weixin_lynhgworld 小程序
随着短剧行业进入「存量竞争」阶段，技术能力正成为小程序的核心竞争力。从内容推荐到用户留存，从广告变现到IP开发，每一环节都需要数据驱动和算法优化。一、智能推荐：让「用户找到剧」变成「剧找到用户」传统短剧平台依赖标签匹配，而小程序通过多维度数据实现精准推荐：「情绪图谱」分析：记录用户观看时的快进、暂停、重复播放等行为，构建情绪波动曲线；「场景化推荐」：根据时间（如深夜）、地点（如地铁）、设备（如手机
【加解密与C】Base系列(六)Base45
Base45编码简介Base45是一种基于ASCII字符的编码方式，主要用于紧凑地表示二进制数据（如二维码中的内容）。它由45个可打印字符组成，包括数字、大写字母及部分符号，优化了数据压缩率和可读性。Base45字符集Base45使用以下45个字符（按顺序排列）：0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ$%*+-./:每个字符对应一个数值（0-44），编码时将二进制
云端成本治理利器：亚马逊云科技智能仪表盘（AWS Cost Intelligence Dashboard）深度解析 AWS官方合作商 aws 云计算
引言：在云计算的广阔天地中，资源弹性带来了业务敏捷性的飞跃，但也带来了成本管理的复杂性。多账户、多服务、按需付费的模式下，成本如何透明化？异常支出如何及时发现？优化机会如何精准定位？这些都是企业云端成本治理（CloudCostGovernance）面临的严峻挑战。亚马逊云科技提供的AWSCostIntelligenceDashboard，正是应对这些挑战的一把利器。本文将深度解析这一基于Amazo
创新人才引进机制优化人才发展环境焕梧
12月16日出版的第24期《求是》杂志将发表中共中央总书记、国家主席、中央军委主席习近平的重要文章《深入实施新时代人才强国战略加快建设世界重要人才中心和创新高地》。文章强调，必须坚持党管人才，坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康，深入实施新时代人才强国战略，全方位培养、引进、用好人才，加快建设世界重要人才中心和创新高地，为2035年基本实现社会主义现代化提供人才
人脸检测算法——SCRFD 海绵波波107 #计算机视觉算法计算机视觉
SCRFD算法核心解析1.算法定义与背景SCRFD（SampleandComputationRedistributionforEfficientFaceDetection）由JiaGuo等人于2021年在arXiv提出，是一种高效、高精度的人脸检测算法，其核心创新在于：双重重分配策略：样本重分配（SR）：动态增强关键训练阶段的样本数据。计算重分配（CR）：通过神经架构搜索（NAS）优化骨干网络（B
坚持“三聚焦”不断提升政务服务打造优质营商环境小微2020
持续巩固扩大机关作风整顿成果，坚持“三聚焦”精准施策，优化服务，不断转变干部作风，提升政务服务水平，着力打造公平优质高效的营商环境。聚焦中心工作，突出重点抓整改。深入贯彻落实新发展理念及中央和省、市决策部署，围绕中心工作和重点任务，深入推进领导干部“走流程”，不断提升服务质效。以办事群众走流程、工作人员坐窗口等形式，围绕招商引资、项目建设、信访办理等中心工作，体验办事服务、行政执法等工作经历，多层
opencv、torch、torchvision、tensorflow的区别
一、框架定位与核心差异PyTorch动态计算图：实时构建计算图支持Python原生控制流（如循环/条件），调试便捷。学术主导：2025年工业部署份额24%，适合快速原型开发（如无人机自动驾驶、情绪识别）。TensorFlow静态计算图优化：预编译图结构提升部署效率支持动态图（Eager模式）兼顾灵活性。工业部署首选：市场份额38%，擅长边缘计算（YOLO部署）和大规模项目（工业自动化）-59）。O
专利侵权司法实务对专利申请文件撰写的优化启示 cb828605a3f7
专利制度赋予了专利人在一定期限内对市场形成合法的“垄断”，以此鼓励创新，促进科学技术的进步。专利权人可以将专利权商业化、产业化，从而获得商业利益。但是高价值的专利权往往容易引人关注，有可能被竞争对手所利用。这就要求我们在撰写专利申请文件的时候要提前考虑到将来可能出现的争议，尽量完善专利申请文件的撰写，最大限度地保护自身的合法权益。笔者通过专利侵权司法实务的角度，结合实务中的经验和教训，谈谈如何优化
认识ETL流程：数据工程的基石淦暴尼数仓 etl 原型模式数据仓库
1.ETL流程简介2.ETL流程设计的关键步骤2.1需求分析2.2数据抽取（Extract）2.3数据转换（Transform）2.4数据加载（Load）2.5调度与监控3.ETL设计模式3.1批处理ETL3.2流式ETL3.3Lambda架构4.主流ETL技术栈选择4.1技术栈一览表4.2各环节简要说明4.3典型技术组合建议5.ETL最佳实践与完整流程示例5.1ETL最佳实践5.2完整ETL流程
低速信号设计之 PECI 篇万花丛中一抹绿网络服务器服务器硬件研发低速信号设计 PECI
一、PECI原理介绍PECI，即PlatformEnvironmentControlInterface（平台环境控制接口），由Intel提出，是一种用于处理器与其他芯片或系统稳定性监控设备之间通信的专用单线型双向总线。从物理连接上看，它采用单线连接方式，极大地简化了硬件设计，减少了布线复杂度和引脚数量。在电气特性方面，主从机接口内均采用强上拉方式，主机还配备弱下拉，使得总线在默认状态下为0伏。信号
鸿蒙开发进阶（HarmonyOS ）短距离通信的BLE蓝牙扫描实践案例你我皆是牛马星人 OpenHarmony 鸿蒙开发 HarmonyOS 1024程序员节华为 harmonyos 鸿蒙 android 前端 ui
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）场景描述蓝牙是一种短距的无线通讯技术，可实现固定设备、移动设备之间的数据交换
大模型日报10月21日大模型空间站人工智能
资讯篇资讯01清华开源混合精度推理系统MixQ量化权重与激活：MixQ同时量化权重和激活，使用INT8/INT4张量核心进行推理加速，并通过FP16张量核心处理少量激活中的离群值，既保持精度又提升吞吐量。其混合精度量化策略使推理精度几乎无损，精度下降不到0.1%。等价变换优化计算图：MixQ基于离群点的局部性，优化了混合精度推理的计算图，避免了重复检查离群点的开销。通过量化系数中的amax值判断矩
2019-05-16 海牙kyogre
前端优化动画性能之requestAnimationFrame@(技术分享)在前端做动画很多人第一人的反应是用定时器，比如setInterval、setTimeout，除此之外css3可以使用transition和animation来实现。而编写动画循环的关键是要知道延迟时间多长合适。一方面，循环间隔必须足够短，这样才能让不同的动画效果显得平滑流畅；另一方面，循环间隔还要足够长，这样才能确保浏览器有
0315_算法22级1班实验2（递归分治策略）
目录ProblemA众数问题题目描述输入输出样例输入样例输出思路分析代码实现思路优化ProblemB半数集问题题目描述输入输出样例输入样例输出思路分析代码实现ProblemC查找数组拐点题目描述输入输出样例输入样例输出思路分析代码实现思路优化ProblemA众数问题题目描述所谓众数，就是对于给定的含有N个元素的多重集合，每个元素在S中出现次数最多的成为该元素的重数，多重集合S重的重数最大的元素成为
.NET 9 RC 2正式发布 li dream .net
距离最终版本还有一个月的时间，Microsoft已经交付了.NET9的第二个也是最后一个候选版本。.NET团队在公告帖子中写道[1]，“当我们为11月的.NET9正式发布（GA）版本做准备时，我们正在对性能、稳定性和任何其他优化进行最后的润色，使其成为.NET9的最佳版本。.NET9ReleaseCandidate2包含在上线许可证中，因此您在生产应用程序中使用它时可以获得支持。我们鼓励开发人员今
线上故障排查神器！用strace和ftrace揪出系统调用的“幕后黑手“ 悠悠12138 运维
前几天凌晨2点，我又被监控报警给吵醒了。服务器CPU飙到90%，但是top看了半天也找不到罪魁祸首。这种时候，就得请出我们运维人员的两大法宝了——strace和ftrace。说实话，刚开始接触这两个工具的时候，我也是一脸懵逼。什么系统调用、内核跟踪，听起来就很高大上的样子。但是用多了你就会发现，这玩意儿简直就是排查问题的神器！今天就跟大家分享一下我这些年用下来的一些心得。先说说系统调用这个东西你可
PHP 面试题狮子座鲸鱼 php 开发语言
一、PHP新版本特性PHP7是一个重大版本，引入了许多新特性和性能优化，比如返回类型声明、泛型、异步函数、NUllable类型和标量类型声明等。PHP8(2018-今)PHP8引入了许多新特性和改进，在性能上有大幅提升，包括Just-in-Time(JIT)编译器、属性的初始化简化语法、UnionTypes（联合类型）等二、http状态码HTTP协议中几个状态码的含义:1xx（临时响应）表示临时响
预售工作一周小结小西FineYoga梵音瑜伽
12-13号两天的培训，我清晰了解了梵音的整个发展历程；更清晰预售工作性质以及如何更好的做好预售工作；信息量之大，跨度广，我吸收并不多，希望多跟几次教授的培训，会有不一样的启发！教授是个非常有魅力的天生演讲者，风趣幽默，肢体语言表情丰富，特别有感染力。有着独到的眼光和超强的学习能力，他会从各行各业中取其精华去其糟粕，从每一期预售中不停的去总结，分析，判断，不停优化预售方案14号开始由李白店长带领我
PHP 性能优化全攻略：提升 Web 应用速度的关键来恩1003 PHP 从入门到精通 php 性能优化前端
PHP学习资料PHP学习资料PHP学习资料在Web开发领域，PHP凭借其简单易用、开源免费等特性，成为众多开发者构建网站和应用的首选语言。然而，随着业务的发展和用户量的增加，PHP应用的性能问题逐渐凸显。性能不佳不仅会导致用户体验下降，还可能影响业务的发展。因此，对PHP代码进行性能优化至关重要。本文将深入探讨PHP性能优化的各个方面，包括缓存的使用、代码优化策略以及服务器配置优化等，帮助开发者打
物联网系统中-告警配置功能的定义小赖同学啊 test Technology Precious 物联网 struts servlet
物联网系统中的告警配置功能是用户定义异常事件触发条件、通知方式和处理流程的核心管理模块。它通过对设备数据、系统状态的实时监控，在满足预设规则时主动推送风险信息，确保运维人员及时响应。以下是其详细定义与技术实现要点：一、核心定义告警配置功能允许用户通过可视化界面或API，为物联网系统设定异常检测规则与响应策略，包含三大核心要素：触发条件：基于设备数据/系统指标的逻辑判断（如温度＞100℃持续5分钟）
用项目说话：我的React博客构建成果与经验复盘 Pan Zonghui 移动端 react 项目总结 react.js 前端前端框架
这是一个基于React19+TypeScript+Vite构建的现代化博客系统，采用了最新的前端技术栈和工程化实践。项目不仅实现了完整的博客功能，更在架构设计、性能优化、开发体验等方面体现了企业级应用的标准。成品展示个人博客链接地址：https://pzhdv.cnpc端页面展示首页分类页面关于我文章详情页面移动端技术栈选择与分层设计技术栈选择核心框架与工具React19.1.0:最新版本的Rea
物联网系统中的可视化大屏定义小赖同学啊 test Technology Precious 物联网
物联网系统中的可视化大屏（也称数据驾驶舱或数字孪生看板）是通过图形化界面集中展示设备状态、业务指标和地理信息的实时监控与决策支持系统。它聚合多源物联网数据，将复杂信息转化为直观图表，帮助管理者快速掌握全局态势并驱动行动。以下是其系统化定义与实现要点：一、核心定义与价值维度说明核心目标实现“一屏知天下”：设备状态透明化、异常可视化、决策数据化数据时效性支持实时流（＜3秒延迟）、近实时（1-5分钟）、
JVM对synchronized的锁优化 ycllycll
一、Synchronized实现Synchronized是通过对象内部的一个叫做监视器锁（monitor）来实现的，监视器锁本质又是依赖于底层的操作系统的MutexLock（互斥锁）来实现的。而操作系统实现线程之间的切换需要从用户态转换到核心态，这个成本非常高，状态之间的转换需要相对比较长的时间，这就是为什么Synchronized效率低的原因。因此，这种依赖于操作系统MutexLock所实现的锁
sql优化之延迟关联 ycllycll mysql sql 数据库
具体看这个文章，写得非常不错：mysql优化：覆盖索引（延迟关联）-一枝花算不算浪漫-博客园看完后思考：1.业务相关的表规范上都要设置递增的主键字段，便于后续优化2.很多时候sql查询的性能瓶颈基本都在io上而不是cpu，所以才会这么优化，尽量在sql的where条件后都走主键，不要让sql走回表操作3.博客中改造的sql比较适合大表跟小表的关联情形
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
Linux: rsync+inotify实时同步及rsync+sersync实时同步能不能别报错 linux系统运维 linux 服务器运维
rsync+sersync和rsync+inotify是两种常用的实时文件同步方案，用于监控源目录变化并自动同步到目标位置。以下是对两者的详细对比和配置指南：核心区别方案原理优点缺点rsync+inotify使用Linux内核的inotify监控文件变化，触发rsync同步原生支持，无需额外依赖需手动编写脚本，稳定性依赖实现rsync+sersync基于inotify和rsync，封装为独立工具，
人工智能视频分析系统人员离岗报警设计方案 liuhu21 人工智能云计算运维
一、方案概述近几年安防监控技术不断的进步，特别是在人工智能推出之后。安防监控系统结合人工智能算法做到了许多以前无法做到的事情。就比如我们今天要说的离岗检测报警监控系统。以前我们只能通过人工值守监控室的方式，通过人的判断去观看现场人员在岗情况。如今有了离岗检测监控系统，系统可以自动监测现场人员是否在岗、离岗时间以及离岗人数等等。这样，大大减少了监控室值班人员的工作量，同时相较人工监管提升了工作效率。
2025年服务器技术全景解析：量子计算、液冷革命与未来生态构建国际云1688 腾讯云国际量子计算腾讯云服务器云计算架构运维
2025年服务器技术全景解析：量子计算、液冷革命与未来生态构建一、量子计算：从实验室到产业化的跨越1.中国量子计算产业化突破•本源量子“悟空”超导计算机：搭载72位自主超导量子芯片“悟空芯”，支持198个量子比特并行计算，已为全球139个国家完成超32万个计算任务。在金融领域，其投资组合优化应用使资源消耗较经典计算机降低50%，黑石集团等机构已将其用于高频交易策略优化；在生物医药领域，量子混合神经
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen