Alan CGH

RocketMQ存储原理 CommitLog解析

RocketMQ作为消息队列中间件，肯定有消息存储的机制，毕竟提供高可靠的消息投递功能，at least once保证每条消息至少被消费一次。rmq的消息存储机制由几个核心的类提供服务，组织起来的。MapFile类是对磁盘文件的抽象管理对象，MapFileQueue类是对一系列同类磁盘文件的，按照文件内第一个数据偏移量为名字排序的MapFile队列。CommitLog类就是对磁盘commitlog文件的抽象管理对象，提供了一系列写入，读取，提交，刷盘的方法保证消息被写入磁盘。本文章会解析CommitLog的几个核心工作原理。

CommitLog的变量

其中比较重要的变量就是刷盘线程flushLogService，提交线程commitLogService，写入回调函数对象appendMessageCallback。在后面的刷盘机制中会重点讲解两个刷盘线程的工作以及区别。

    // Message's MAGIC CODE daa320a7
    public final static int MESSAGE_MAGIC_CODE = -626843481;
    protected static final InternalLogger log = InternalLoggerFactory.getLogger(LoggerName.STORE_LOGGER_NAME);
    // End of file empty MAGIC CODE cbd43194
    protected final static int BLANK_MAGIC_CODE = -875286124;

    /**
     * commitlog组成的mapfile队列，可以通过它获取正在使用的mapfile或创建新的mapfile
     */
    protected final MappedFileQueue mappedFileQueue;

    /**
     * 消息存储对象，对存储机制的再次抽象，由它统筹msg的存储逻辑。进行msg写入，主从同步，转发给indexService进行索引建立
     */
    protected final DefaultMessageStore defaultMessageStore;

    /**
     * 刷盘线程，对commitlog的mapfile或filechannel刷盘
     */
    private final FlushCommitLogService flushCommitLogService;

    /**
     * If TransientStorePool enabled, we must flush message to FileChannel at fixed periods
     * 异步刷盘时，msg先写入writeBuf，再由commitLogService线程定时提交到commitlog的fileChannel中
     */
    private final FlushCommitLogService commitLogService;

    private final AppendMessageCallback appendMessageCallback;
    private final ThreadLocal batchEncoderThreadLocal;

    /**
     * commitlog承载所有topic的msg存储
     */
    protected HashMap topicQueueTable = new HashMap(1024);

    protected volatile long confirmOffset = -1L;

    private volatile long beginTimeInLock = 0;

    /**
     * 写入msg时要获取同步锁
     */
    protected final PutMessageLock putMessageLock;

CommitLog的初始化

初始化动作会做一些成员变量的赋值，对刷盘策略选择不同的实现类。除此之外，在rmq刚启动时还需要将磁盘的log文件加载到内存中，此时不会真正将数据加载到内存，会做文件抽象对象的创建和虚拟内存的映射。

    /**
     * 在Broker的JVM启动时，创建BrokerController对象，创建MessageStore对象，创建CommitLog
     */
    public CommitLog(final DefaultMessageStore defaultMessageStore) {
        // 专门管理commitlog的mapfile的对象，mapfile队列
        // 像consume queue文件也有自己的mapfile队列
        this.mappedFileQueue = new MappedFileQueue(
                defaultMessageStore.getMessageStoreConfig().getStorePathCommitLog(),
                defaultMessageStore.getMessageStoreConfig().getMappedFileSizeCommitLog(),
                // 创建mapfile文件的线程，commitlog用来做文件提前创建和预热
                defaultMessageStore.getAllocateMappedFileService());

        this.defaultMessageStore = defaultMessageStore;
        // 根据commitlog的刷盘策略，选择不同的刷盘线程实现
        if (FlushDiskType.SYNC_FLUSH == defaultMessageStore.getMessageStoreConfig().getFlushDiskType()) {
            this.flushCommitLogService = new GroupCommitService();
        } else {
            this.flushCommitLogService = new FlushRealTimeService();
        }
        // 异步刷盘使用到的提交线程
        this.commitLogService = new CommitRealTimeService();

        // commitlog写入msg的实现逻辑，mapfile是抽象的文件管理对象，mapfile写入数据时只做统筹逻辑，具体的文件写入逻辑由appendMessageCallback对象回调实现
        this.appendMessageCallback = new DefaultAppendMessageCallback(defaultMessageStore.getMessageStoreConfig().getMaxMessageSize());
        batchEncoderThreadLocal = new ThreadLocal() {
            @Override
            protected MessageExtBatchEncoder initialValue() {
                return new MessageExtBatchEncoder(defaultMessageStore.getMessageStoreConfig().getMaxMessageSize());
            }
        };
        // 因为commitlog保存所有topic的消息，Broker接收msg是多线程并行的，存在并发写入，这里选择同步锁的实现策略，悲观锁或乐观锁
        this.putMessageLock = defaultMessageStore.getMessageStoreConfig().isUseReentrantLockWhenPutMessage() ?
                new PutMessageReentrantLock() :
                new PutMessageSpinLock();
    }

rmq刚启动时加载磁盘文件到内存

    /**
     * Broker启动后，MessageStore初始化阶段调用commitlog加载磁盘路径上所有log文件变为mapfile对象
     * log文件并没有立即被读取到内存中，只是封装为mapfile对象构建mapfile队列，方便管理
     */
    public boolean load() {
        boolean result = this.mappedFileQueue.load();
        log.info("load commit log " + (result ? "OK" : "Failed"));
        return result;
    }

启动刷盘线程和提交线程，在JVM正常退出时关闭线程

    /**
     * Broker启动，同时启动commitlog对象，让它做些事情
     * 例如启动刷盘线程，启动提交线程
     */
    public void start() {
        this.flushCommitLogService.start();
        if (defaultMessageStore.getMessageStoreConfig().isTransientStorePoolEnable()) {
            this.commitLogService.start();
        }
    }

    /**
     * 同样的在Broker正常关闭时做资源回收的动作，让commitlog优雅关闭线程
     */
    public void shutdown() {
        if (defaultMessageStore.getMessageStoreConfig().isTransientStorePoolEnable()) {
            this.commitLogService.shutdown();
        }
        this.flushCommitLogService.shutdown();
    }

CommitLog的Msg消息体序列化协议

我们从calMsgLength函数可以看出一条消息被写入log文件时它的序列化协议，每个字段的字节长度以及顺序。对于properties的处理值得我们借鉴，在设计序列化协议时对不定长的数据，我们可以把这部分数据放在字节数组的尾部，在redis的sds结构体中也是对字符串这么处理，实际的字符内容封装为char数组放在尾部，称为柔性数组。

protected static int calMsgLength(int sysFlag, int bodyLength, int topicLength, int propertiesLength) {
        int bornhostLength = (sysFlag & MessageSysFlag.BORNHOST_V6_FLAG) == 0 ? 8 : 20;
        int storehostAddressLength = (sysFlag & MessageSysFlag.STOREHOSTADDRESS_V6_FLAG) == 0 ? 8 : 20;
        final int msgLen = 4 //TOTALSIZE
            + 4 //MAGICCODE
            + 4 //BODYCRC
            + 4 //QUEUEID
            + 4 //FLAG
            + 8 //QUEUEOFFSET
            + 8 //PHYSICALOFFSET
            + 4 //SYSFLAG
            + 8 //BORNTIMESTAMP
            + bornhostLength //BORNHOST
            + 8 //STORETIMESTAMP
            + storehostAddressLength //STOREHOSTADDRESS
            + 4 //RECONSUMETIMES
            + 8 //Prepared Transaction Offset
            + 4 + (bodyLength > 0 ? bodyLength : 0) //BODY 4个字节的消息体长度 + 实际的消息体字节
            + 1 + topicLength //TOPIC 1个字节的topic长度 + 实际的topic字节
            + 2 + (propertiesLength > 0 ? propertiesLength : 0) //propertiesLength 2个字节的消息属性长度 + 实际的消息属性字节
            + 0;
        return msgLen;
    }

写入消息的原理

Producer发送消息时会根据发送消息封装一个RemotingCommand对象，这个对象包含了命令编码code，消息内容body。发送消息的code=SEND_MESSAGE=10，并且在Broker启动时向RemotingServer对象注册SendMessageProcessor对象处理消息写入的逻辑。SendMessageProcessor对象也是一个NettyProcuessor，rmq是用netty框架进行网络通信的。

最终在DefaultMessageStore.asyncPutMessage函数中调用commitlog对象的asyncPutMessage函数进行消息保存。其实看到这里会有疑问为什么是async开头的，不是同步写入消息吗？rmq在这里是采用异步阻塞式的写入消息，根据刷盘策略可能同步刷盘或异步刷盘，但是对于消息的写入到内存，是异步阻塞式的写入。

异步是指当前工作线程将消息的刷盘和主从同步的工作交给另一个线程去做，这里会交给ForkJoinPoo的线程。
阻塞是指工作线程被挂起，等待异步线程的唤醒。

可以思考下这里为什么要做成异步阻塞式的，会导致线程上下文切换，不是比同步更加慢吗？其实主要在刷盘逻辑和主从同步逻辑可以并行执行，提高效率所以才做成异步阻塞式。asyncPutMessage函数对比putMessage函数，主要区别就在于最后的消息刷盘逻辑和主从同步逻辑是并行还是串行。

延迟消息的处理

TRANSACTION_NOT_TYPE是指普通消息。延迟的msg处理会将真实topic和queueId备份到properties字段中，替换成SCHEDULE_TOPIC_XXXX，是一个专门的延迟TOPIC，这个Top[ic下有每个延迟级别的queue，由DeliverDelayedMessageTimerTask类定时调度，到时间就会将消息取出替换回真实的topic和queueId，重新写入到commitlog，再转发到对应consumeQueue和Index中。

        StoreStatsService storeStatsService =     this.defaultMessageStore.getStoreStatsService();

        String topic = msg.getTopic();
        // producer在发送端就会根据轮询策略选择topic下的队列
        int queueId = msg.getQueueId();
        // msg的sysFlag是一个4字节长度的系统属性标识，通过二进制位判断msg是否事务消息
        final int tranType = MessageSysFlag.getTransactionValue(msg.getSysFlag());
        if (tranType == MessageSysFlag.TRANSACTION_NOT_TYPE
                || tranType == MessageSysFlag.TRANSACTION_COMMIT_TYPE) {
            // Delay Delivery
            if (msg.getDelayTimeLevel() > 0) {
                // 社区版的rmq延迟消息只支持特定级别的延迟时间，所以是delay level
                if (msg.getDelayTimeLevel() > this.defaultMessageStore.getScheduleMessageService().getMaxDelayLevel()) {
                    msg.setDelayTimeLevel(this.defaultMessageStore.getScheduleMessageService().getMaxDelayLevel());
                }

                // 对于延迟msg要替换真实的topic&queue，然后投递到专门的延迟topic去
                topic = TopicValidator.RMQ_SYS_SCHEDULE_TOPIC;
                queueId = ScheduleMessageService.delayLevel2QueueId(msg.getDelayTimeLevel());

                // 真实的topic&queue备份到msg字节数组的最后(看看msg的序列化协议就知道了)
                MessageAccessor.putProperty(msg, MessageConst.PROPERTY_REAL_TOPIC, msg.getTopic());
                MessageAccessor.putProperty(msg, MessageConst.PROPERTY_REAL_QUEUE_ID, String.valueOf(msg.getQueueId()));
                msg.setPropertiesString(MessageDecoder.messageProperties2String(msg.getProperties()));

                msg.setTopic(topic);
                msg.setQueueId(queueId);
            }
        }

消息序列化写入内存

从代码逻辑可以看出来写消息到内存里的时候是串行的，虽然会影响并发度但是这是必须的。因为commitlog文件保存所有的topic的消息，在进行写入时为了避免字节数据的彼此覆盖造成错乱需要互斥。

这里还可以看到MapFile的文件预热功能，主要是为了避免创建新文件时导致某些消息等待过久导致Producer发送超时。这时候应该会看见Producer发送消息的尖刺抖动

        long elapsedTimeInLock = 0;
        MappedFile unlockMappedFile = null;
        // 最后一个mapfile是正在使用的mapfile
        MappedFile mappedFile = this.mappedFileQueue.getLastMappedFile();

        putMessageLock.lock(); // 涉及并发存储消息
        try {
            long beginLockTimestamp = this.defaultMessageStore.getSystemClock().now();
            this.beginTimeInLock = beginLockTimestamp;

            // Here settings are stored timestamp, in order to ensure an orderly
            // global
            msg.setStoreTimestamp(beginLockTimestamp);

            if (null == mappedFile || mappedFile.isFull()) {
                // 创建新的commitlog，如果没有开启文件预热功能，创建文件要发生磁盘IO恰好磁盘繁忙时，可能导致producer端网络超时
                mappedFile = this.mappedFileQueue.getLastMappedFile(0); // Mark: NewFile may be cause noise
            }
            if (null == mappedFile) {
                log.error("create mapped file1 error, topic: " + msg.getTopic() + " clientAddr: " + msg.getBornHostString());
                beginTimeInLock = 0;
                return CompletableFuture.completedFuture(new PutMessageResult(PutMessageStatus.CREATE_MAPEDFILE_FAILED, null));
            }
            // 追加msg到log尾部，序列化的操作在callback做
            result = mappedFile.appendMessage(msg, this.appendMessageCallback);
            switch (result.getStatus()) {
                case PUT_OK:
                    break;
                // msg长度大于log的可用空间，创建新文件重新写入
                case END_OF_FILE:
                    unlockMappedFile = mappedFile;
                    // Create a new file, re-write the message
                    mappedFile = this.mappedFileQueue.getLastMappedFile(0);
                    if (null == mappedFile) {
                        // XXX: warn and notify me
                        log.error("create mapped file2 error, topic: " + msg.getTopic() + " clientAddr: " + msg.getBornHostString());
                        beginTimeInLock = 0;
                        return CompletableFuture.completedFuture(new PutMessageResult(PutMessageStatus.CREATE_MAPEDFILE_FAILED, result));
                    }
                    result = mappedFile.appendMessage(msg, this.appendMessageCallback);
                    break;
                // msg或属性长度过长了
                case MESSAGE_SIZE_EXCEEDED:
                case PROPERTIES_SIZE_EXCEEDED:
                    beginTimeInLock = 0;
                    return CompletableFuture.completedFuture(new PutMessageResult(PutMessageStatus.MESSAGE_ILLEGAL, result));
                case UNKNOWN_ERROR:
                    beginTimeInLock = 0;
                    return CompletableFuture.completedFuture(new PutMessageResult(PutMessageStatus.UNKNOWN_ERROR, result));
                default:
                    beginTimeInLock = 0;
                    return CompletableFuture.completedFuture(new PutMessageResult(PutMessageStatus.UNKNOWN_ERROR, result));
            }

            elapsedTimeInLock = this.defaultMessageStore.getSystemClock().now() - beginLockTimestamp;
            beginTimeInLock = 0;
        } finally {
            putMessageLock.unlock();
        }

        if (elapsedTimeInLock > 500) {
            // 写入消息耗时超过500ms告警，由此可见rmq的设计者对写消息到内存中，最坏阈值时间500ms内，一般来说肯定是低于阈值的
            log.warn("[NOTIFYME]putMessage in lock cost time(ms)={}, bodyLength={} AppendMessageResult={}", elapsedTimeInLock, msg.getBody().length, result);
        }

        if (null != unlockMappedFile && this.defaultMessageStore.getMessageStoreConfig().isWarmMapedFileEnable()) {
            // 倒数第2个mapfile满了，且因为文件预热对它虚拟内存锁定了，这里对它解锁内存，使操作系统可以对这部分虚拟内存有必要时进行置换到磁盘的处理
            this.defaultMessageStore.unlockMappedFile(unlockMappedFile);
        }

消息刷盘和主从同步

在消息数据写入到内存中后，如果开启了内存池会写入writeBuf，正常是写到mappedByteBuf，前者是一块堆外直接内存并且通过系统调用进行内存锁定。后者是commitlog磁盘文件通过mmap函数映射到虚拟内存的一块零拷贝内存空间。

在现代操作系统中进程看到的所有内存都是虚拟内存，虚拟内存也就是虚拟的内存地址空间，进行内存寻址时需要OS或硬件将虚拟地址转换成真实物理地址。所以每个进程可以拥有比物理内存大很多的内存地址空间，原理就是当物理内存不够时，OS采用淘汰脏页的方式将部分虚拟内存页刷写回磁盘，也就是虚拟内存在物理内存和磁盘之间会发生置换。内存锁定之后的虚拟内存不会被OS置换到磁盘中，可以保证对这块虚拟内存的高效读写。

在写入writeBuf或mapBuf后，可能需要将数据写入磁盘，并且开启了主从同步后也需要将数据同步给broker的slave节点，达到高可用。这2件事是不相干的可以并行执行，rmq使用CompletableFuture并行执行。CompletableFuture使用JDK中默认的ForkJoinPool线程池，ForkJoinPool线程池使用makeCommonPool函数创建，通过java.util.concurrent.ForkJoinPool.common.parallelism指定线程数，默认是cpu-1。

        // Statistics
        storeStatsService.getSinglePutMessageTopicTimesTotal(msg.getTopic()).incrementAndGet();
        storeStatsService.getSinglePutMessageTopicSizeTotal(topic).addAndGet(result.getWroteBytes());

        // 提交刷盘请求，如果commitlog配置是同步刷盘则在下面会阻塞等待异步线程的刷盘结果
        CompletableFuture flushResultFuture = submitFlushRequest(result, msg);
        // 提交同步slave请求，如果broker被配置为同步推送msg到slave则在下面会等待异步线程的推送结果
        CompletableFuture replicaResultFuture = submitReplicaRequest(result, msg);
        // 并行执行刷盘和主从同步，并在匿名函数中处理2个请求的执行结果(2个都正常执行完毕的话)
        return flushResultFuture.thenCombine(replicaResultFuture, (flushStatus, replicaStatus) -> {
            if (flushStatus != PutMessageStatus.PUT_OK) {
                putMessageResult.setPutMessageStatus(flushStatus);
            }
            if (replicaStatus != PutMessageStatus.PUT_OK) {
                putMessageResult.setPutMessageStatus(replicaStatus);
                if (replicaStatus == PutMessageStatus.FLUSH_SLAVE_TIMEOUT) {
                    log.error("do sync transfer other node, wait return, but failed, topic: {} tags: {} client address: {}",
                            msg.getTopic(), msg.getTags(), msg.getBornHostNameString());
                }
            }
            return putMessageResult;
        });

提交刷盘请求就是对刷盘逻辑的封装为CompletableFuture，从broker读取配置的刷盘策略，同步刷盘如果要确保broker把消息写入到磁盘了就要把message的waitStoreMsgOk属性设置true，这个属性是在producer发送时设置的。如果waitStoreMsgOk=false或异步刷盘都是直接返回PUT_OK的CompletableFuture，此时工作线程不会阻塞，可立即拿到future的结果。

同步刷盘是构造个request丢给GroupCommitService的请求队列，然后返回future，工作线程就会阻塞等待future的结果。GroupCommitService前面提过是负责同步刷盘的线程，它有2个请求队列，write和read队列都用volatile修饰。每次线程只从read队列拿请求处理，并且处理完read队列后立即交换2个队列，这样可避免读写并发的问题，实现无锁的读写并发。

public CompletableFuture submitFlushRequest(AppendMessageResult result, MessageExt messageExt) {
        // Synchronization flush
        if (FlushDiskType.SYNC_FLUSH == this.defaultMessageStore.getMessageStoreConfig().getFlushDiskType()) {
            final GroupCommitService service = (GroupCommitService) this.flushCommitLogService;
            if (messageExt.isWaitStoreMsgOK()) {
                GroupCommitRequest request = new GroupCommitRequest(result.getWroteOffset() + result.getWroteBytes(),
                        this.defaultMessageStore.getMessageStoreConfig().getSyncFlushTimeout());
                service.putRequest(request);
                return request.future();
            } else {
                service.wakeup();
                return CompletableFuture.completedFuture(PutMessageStatus.PUT_OK);
            }
        }
        // Asynchronous flush
        else {
            if (!this.defaultMessageStore.getMessageStoreConfig().isTransientStorePoolEnable()) {
                flushCommitLogService.wakeup();
            } else  {
                commitLogService.wakeup();
            }
            return CompletableFuture.completedFuture(PutMessageStatus.PUT_OK);
        }
    }

初探主从同步原理

关于主从复制机制的代码解析，会在另一篇文章解析。

submitReplicaRequest函数只是对每个消息提交一个主从同步的请求给GroupTransferService线程的请求队列。每个GroupCommitRequest对象是一个消息的物理偏移量，只有主从同步的成功偏移量 > 这个request的偏移量，就算这条消息被传输给了slave。实际上GroupTransferService线程不做实际的消息数据的传输工作，只是对请求队列中的每个消息偏移量判断是否 < push2SlaveMaxOffset，如果小于代表此条请求的消息已被同步到至少一个slave中。可以唤醒挂起的工作线程返回。

RocketMQ的主从同步设计的比较复杂，本身副本数据的冗余就需要比较多的代码量去做。HAService是主从同步的逻辑实现类，既充当master的角色也是slave的角色。

每个broker启动后都有一个角色身份，是master或slave，然后在HAService构造时同步创建一个HAClient对象，在broker启动时将master地址传递给HAClient，HAClient线程在循环工作体中建立master链接。HAClient是代表slave角色的broker对master建立的链接，不断从master和slave的socketChannel中读取传输过来的消息写入commitlog。HAClient线程同时会每隔5秒向master报告自己的主从复制偏移量，算是心跳检测。

HAConnection是代表master对slave的链接，同时也是一个近实时传输commitlog数据给slave的工作线程。从HAConnection的推送代码逻辑来看，rmq的主从复制机制还是采取的推模式，由master控制推送的频率。

所以总的来说，submitReplicaRequest函数只是提交主从复制的请求给GroupTransferService判断这条Msg有没有被传输给至少一个slave，真正的传输动作是在每个HAConnection对象做的，每个HAConnection对象近乎实时的推送commitlog数据给slave。而slave的HAClient线程也会在收到复制数据写入commitlog后立即给master报告已经收到的偏移量，在master的HAConnection的ReadSocketService线程监听来自slave的ACK offset，更新push2SlaveMaxOffset变量。GroupTransferService线程就可以立即读到更新的push2SlaveMaxOffset，判断msg是否已完成主从复制。

public CompletableFuture submitReplicaRequest(AppendMessageResult result, MessageExt messageExt) {
        // 检查broker是否同步推送msg到slave
        if (BrokerRole.SYNC_MASTER == this.defaultMessageStore.getMessageStoreConfig().getBrokerRole()) {
            // 高可用服务被封装为对象，高可用指将数据冗余在多个异地节点，防止当前broker损坏导致丢数据
            HAService service = this.defaultMessageStore.getHaService();
            if (messageExt.isWaitStoreMsgOK()) {
                // 检查高可用服务是否正常：1.有slave长连接存在 2.master和slave的字节同步差异在可接受范围内，代表主从同步是正常工作的
                if (service.isSlaveOK(result.getWroteBytes() + result.getWroteOffset())) {
                    GroupCommitRequest request = new GroupCommitRequest(result.getWroteOffset() + result.getWroteBytes(),
                            this.defaultMessageStore.getMessageStoreConfig().getSyncFlushTimeout());
                    // 提交请求到HAservice，有groupTransferService线程专门推送给slave
                    service.putRequest(request);
                    service.getWaitNotifyObject().wakeupAll();
                    return request.future();
                }
                else {
                    return CompletableFuture.completedFuture(PutMessageStatus.SLAVE_NOT_AVAILABLE);
                }
            }
        }
        return CompletableFuture.completedFuture(PutMessageStatus.PUT_OK);
    }

异步刷盘策略

Broker的刷盘策略配置是针对CommitLog、ConsumeQueue、IndexFile等所有磁盘文件的配置。异步刷盘策略是指消息被同步写入到writeBuf或mapBuf内存中，写入线程立即返回。同步到磁盘的动作交由异步线程去做。根据是否开启了内存池有一点小区别。

如果开启了内存池，消息先写到writeBuf，由CommitRealTimeService线程近实时将writeBuf数据提交到fileChannel中，再由FlushRealTimeService线程近实时将fileChannel存在OS缓冲区的数据刷写到磁盘。
如果没有开内存池，消息直接写到mapBuf，由FlushRealTimeService线程近实时将mapBuf数据刷写到磁盘。

但无论有无开启内存池，对异步刷盘策略来说，在写入消息到内存时，写完之后都是立即返回，不会像同步刷盘一样等待数据同步到磁盘之后才返回。

在mapfile的写入代码逻辑可以看到是优先选择writeBuf写入数据的。MappedFile类appendMessageInner函数

public AppendMessageResult appendMessagesInner(final MessageExt messageExt, final AppendMessageCallback cb) {
            ...

            // 根据刷盘策略不同，选择写到writeBuf还是mapBuf
            ByteBuffer byteBuffer = writeBuffer != null ? writeBuffer.slice() : this.mappedByteBuffer.slice();
            // 调整buf的写入指针
            byteBuffer.position(currentPos);
            AppendMessageResult result;
            // 回调具体文件对象的写入消息实现函数
            if (messageExt instanceof MessageExtBrokerInner) {
                result = cb.doAppend(this.getFileFromOffset(), byteBuffer, this.fileSize - currentPos, (MessageExtBrokerInner) messageExt);
            } else if (messageExt instanceof MessageExtBatch) {
                result = cb.doAppend(this.getFileFromOffset(), byteBuffer, this.fileSize - currentPos, (MessageExtBatch) messageExt);
            } else {
                return new AppendMessageResult(AppendMessageStatus.UNKNOWN_ERROR);
            }
            
            ...
    }

线程写入消息到内存中后，在提交刷盘请求的代码中可以明显看出同步刷盘和异步刷盘的区别。一个是要等待刷盘线程处理完刷盘请求唤醒自己，一个是唤醒异步线程直接返回。

public CompletableFuture submitFlushRequest(AppendMessageResult result, MessageExt messageExt) {
        // Synchronization flush
        if (FlushDiskType.SYNC_FLUSH == this.defaultMessageStore.getMessageStoreConfig().getFlushDiskType()) {
            final GroupCommitService service = (GroupCommitService) this.flushCommitLogService;
            if (messageExt.isWaitStoreMsgOK()) {
                // 同步刷盘策略 且 producer要求等这条msg落盘后才返回，就会提交请求给GroupCommitService线程处理刷盘，然后当前线程等待落盘后被唤醒
                GroupCommitRequest request = new GroupCommitRequest(result.getWroteOffset() + result.getWroteBytes(),
                        this.defaultMessageStore.getMessageStoreConfig().getSyncFlushTimeout());
                service.putRequest(request);
                return request.future();
            } else {
                service.wakeup();
                return CompletableFuture.completedFuture(PutMessageStatus.PUT_OK);
            }
        }
        // Asynchronous flush
        else {
            // 异步刷盘策略，开启了内存池就唤醒提交线程，否则直接唤醒刷盘线程，好处是当前线程不用等待可立即返回
            if (!this.defaultMessageStore.getMessageStoreConfig().isTransientStorePoolEnable()) {
                flushCommitLogService.wakeup();
            } else  {
                commitLogService.wakeup();
            }
            return CompletableFuture.completedFuture(PutMessageStatus.PUT_OK);
        }
    }

从上面我们知道如果把commitlog的存储配置成开启内存池且把broker刷盘策略配置为异步刷盘，broker是master角色。这时候commitlog创建的MapFile对象是带有writeBuf缓冲的，当我们发送消息时会先写入到writeBuf中。接着看看CommitRealTimeService线程如何工作，把writeBuf数据提交到fileChannel中。

CommitRealTimeService线程run函数，虽然有个interval变量200ms的间隔，在waitForRunning(interval)函数中会睡眠200ms，但实际上waitForRunning函数会优先判断如果hasNotified标志位被改成true代表有新消息被写入，需要立即处理，就不会进入睡眠。而在消息写入的最后submitFlushRequest函数我们知道异步刷盘策略，会调用CommitRealTimeService.wakeup函数将hasNotified改为true。所以将消息从writeBuf提交到fileChannel的动作是近实时的。不单只提交线程是近实时设计，异步刷盘的FlushRealTimeService线程和同步刷盘的GroupCommitService线程也是近实时设计，主要目的是提高CPU的使用率，有新的请求时立即处理。

@Override
public void run() {
    CommitLog.log.info(this.getServiceName() + " service started");
    while (!this.isStopped()) {
        // 提交writeBuf的间隔，默认200ms
        int interval = CommitLog.this.defaultMessageStore.getMessageStoreConfig().getCommitIntervalCommitLog();
        // 一次提交的脏页阈值，默认4页
        int commitDataLeastPages = CommitLog.this.defaultMessageStore.getMessageStoreConfig().getCommitCommitLogLeastPages();
        // 两次提交的最大间隔，如果超过了阈值就表示距离上次提交已有一段时间，忽略脏页阈值限制，立即提交一次
        int commitDataThoroughInterval =
            CommitLog.this.defaultMessageStore.getMessageStoreConfig().getCommitCommitLogThoroughInterval();

        long begin = System.currentTimeMillis();
        if (begin >= (this.lastCommitTimestamp + commitDataThoroughInterval)) {
            this.lastCommitTimestamp = begin;
            commitDataLeastPages = 0;
        }

        try {
            // writeBuf数据写到fileChannel内存，此时数据存在OS的fd缓冲区中
            boolean result = CommitLog.this.mappedFileQueue.commit(commitDataLeastPages);
            long end = System.currentTimeMillis();
            if (!result) {
                this.lastCommitTimestamp = end; // result = false means some data committed.
                // 唤醒FlushRealTimeService线程对fileChannel刚写入的数据刷盘
                flushCommitLogService.wakeup();
            }

            if (end - begin > 500) {
                log.info("Commit data to file costs {} ms", end - begin);
            }
            this.waitForRunning(interval);
        } catch (Throwable e) {
            CommitLog.log.error(this.getServiceName() + " service has exception. ", e);
        }
    }

    boolean result = false;
    // Broker正常关闭，对剩余mapfile数据进行提交，尝试提交10次
    for (int i = 0; i < RETRY_TIMES_OVER && !result; i++) {
        result = CommitLog.this.mappedFileQueue.commit(0);
        CommitLog.log.info(this.getServiceName() + " service shutdown, retry " + (i + 1) + " times " + (result ? "OK" : "Not OK"));
    }
    CommitLog.log.info(this.getServiceName() + " service end");
}

FlushRealTimeService异步刷盘线程的run函数。逻辑上和提交线程很相似，有间隔，最少刷盘的脏页数。最后调mapFile.flush函数写入磁盘。

public void run() {
    CommitLog.log.info(this.getServiceName() + " service started");

    while (!this.isStopped()) {
        // 是否有计划的刷盘，默认是false，FlushRealTimeService的实时原来是指fileChannel有数据就刷的意思
        boolean flushCommitLogTimed = CommitLog.this.defaultMessageStore.getMessageStoreConfig().isFlushCommitLogTimed();
        // 刷盘间隔
        int interval = CommitLog.this.defaultMessageStore.getMessageStoreConfig().getFlushIntervalCommitLog();
        // 刷盘的脏页阈值
        int flushPhysicQueueLeastPages = CommitLog.this.defaultMessageStore.getMessageStoreConfig().getFlushCommitLogLeastPages();
        // 最大的刷盘间隔阈值，超过间隔忽略脏页阈值限制，立即刷一次
        int flushPhysicQueueThoroughInterval =
            CommitLog.this.defaultMessageStore.getMessageStoreConfig().getFlushCommitLogThoroughInterval();

        boolean printFlushProgress = false;

        // Print flush progress
        long currentTimeMillis = System.currentTimeMillis();
        if (currentTimeMillis >= (this.lastFlushTimestamp + flushPhysicQueueThoroughInterval)) {
            this.lastFlushTimestamp = currentTimeMillis;
            flushPhysicQueueLeastPages = 0;
            printFlushProgress = (printTimes++ % 10) == 0;
        }

        try {
            if (flushCommitLogTimed) {
                Thread.sleep(interval);
            } else {
                this.waitForRunning(interval);
            }

            if (printFlushProgress) {
                // 日志打印磁盘字节数和内存写入字节数的差异比例，但是现在注释了
                this.printFlushProgress();
            }

            long begin = System.currentTimeMillis();
            // 对fileChannel中在OS缓冲区的数据刷盘
            CommitLog.this.mappedFileQueue.flush(flushPhysicQueueLeastPages);
            long storeTimestamp = CommitLog.this.mappedFileQueue.getStoreTimestamp();
            if (storeTimestamp > 0) {
                CommitLog.this.defaultMessageStore.getStoreCheckpoint().setPhysicMsgTimestamp(storeTimestamp);
            }
            long past = System.currentTimeMillis() - begin;
            if (past > 500) {
                log.info("Flush data to disk costs {} ms", past);
            }
        } catch (Throwable e) {
            CommitLog.log.warn(this.getServiceName() + " service has exception. ", e);
            this.printFlushProgress();
        }
    }

    // Normal shutdown, to ensure that all the flush before exit
    boolean result = false;
    for (int i = 0; i < RETRY_TIMES_OVER && !result; i++) {
        result = CommitLog.this.mappedFileQueue.flush(0);
        CommitLog.log.info(this.getServiceName() + " service shutdown, retry " + (i + 1) + " times " + (result ? "OK" : "Not OK"));
    }

    this.printFlushProgress();

    CommitLog.log.info(this.getServiceName() + " service end");
}

同步刷盘策略

把broker.conf文件的flushDiskType配置为SYNC_FLUSH，开启同步刷盘。每条写入消息的线程把消息同步写入mapBuf，等待消息落盘后返回。写入磁盘由GroupCommitService线程去做，看名字像提交线程，实际干的是刷写磁盘的工作。run函数

public void run() {
    CommitLog.log.info(this.getServiceName() + " service started");

    while (!this.isStopped()) {
        try {
            // 每次处理完read队列的刷盘请求，如果没有新的请求到达就会休息10毫秒
            this.waitForRunning(10);
            // 一次性处理read队列的请求，执行刷盘
            this.doCommit();
        } catch (Exception e) {
            CommitLog.log.warn(this.getServiceName() + " service has exception. ", e);
        }
    }

    // Under normal circumstances shutdown, wait for the arrival of the
    // request, and then flush
    try {
        Thread.sleep(10);
    } catch (InterruptedException e) {
        CommitLog.log.warn("GroupCommitService Exception, ", e);
    }

    synchronized (this) {
        this.swapRequests();
    }

    this.doCommit();

    CommitLog.log.info(this.getServiceName() + " service end");
}

对requestRead队列提交的刷盘请求做处理。每个请求代表一条msg的磁盘写入位置偏移量，判断这条msg是否落盘依靠当前刷盘偏移量是否超过了msg的写入偏移量。对一条请求最多执行两次2刷盘，是防止一条msg被截断写到2个MapFile文件中，但从CommitLog的写入消息代码逻辑看一条msg不可能被拆分写入。理论上这里mapFileQueue.flush只会调一次就把所有数据写入磁盘了，后续对所有的刷盘请求偏移量都是大于等于的。

private void doCommit() {
    synchronized (this.requestsRead) {
        if (!this.requestsRead.isEmpty()) {
            // 一个GroupCommitRequest对象代表一条msg写入
            for (GroupCommitRequest req : this.requestsRead) {
                boolean flushOK = CommitLog.this.mappedFileQueue.getFlushedWhere() >= req.getNextOffset();
                // 通常只需要一次刷盘，就可将read队列所有请求的数据写入磁盘，但这里对一条msg却要最多刷两次盘，一条msg可能被分段写入2个mapfile？
                // 至少commitlog是不会的，在commitlog的回调写入逻辑中会判断剩余空间不够msg写入时会填充0，创建新commitlog写入msg
                for (int i = 0; i < 2 && !flushOK; i++) {
                    CommitLog.this.mappedFileQueue.flush(0);
                    flushOK = CommitLog.this.mappedFileQueue.getFlushedWhere() >= req.getNextOffset();
                }
                // 唤醒阻塞等待消息刷盘的线程，返回结果给producer
                req.wakeupCustomer(flushOK ? PutMessageStatus.PUT_OK : PutMessageStatus.FLUSH_DISK_TIMEOUT);
            }

            long storeTimestamp = CommitLog.this.mappedFileQueue.getStoreTimestamp();
            if (storeTimestamp > 0) {
                CommitLog.this.defaultMessageStore.getStoreCheckpoint().setPhysicMsgTimestamp(storeTimestamp);
            }

            this.requestsRead.clear();
        } else {
            // Because of individual messages is set to not sync flush, it
            // will come to this process
            CommitLog.this.mappedFileQueue.flush(0);
        }
    }
}

同步刷盘真的能做到不丢消息吗

丢消息的场景对MQ来说是老生常谈，通常分为3个可能场景。

Producer端发送消息给Broker，可能网络超时导致丢消息
Broker端收到消息，未来得及落盘，此时宕机、进程崩溃、掉电导致丢消息
Consumer端拉取到消息，由于业务逻辑不正确，导致消费异常，丢消息

对于使用rmq需要高可靠的场景，我们通常把Broker刷盘策略配置为同步刷盘，且消息的property改为waitStoreOk=true。这样就能保证消息在Broker端存储时不丢失吗？

MapFileQueue.flush函数最终调到Mapfile.flush函数，实际上看代码逻辑在极端情况下是有可能发生丢失消息可能。先看看MappedFileQueue.flush函数，调用mapFile.flush刷盘后返回此mapFile中刷盘指针的位置，加上mapfile起始偏移量算出flushedWhere指针。这个flushedWhere变量是GroupCommitService线程判断msg是否落盘的依据。

/**
     * flushedWhere当前mapfile队列中刷盘指针的位置
     * committedWhere当前mapfile队列中提交指针的位置
     * 这2个指针都由mapfileQueue对象维护，因为mapfileQueue负责这类mapfile的刷盘和提交工作
     */
    public boolean flush(final int flushLeastPages) {
        boolean result = true;
        MappedFile mappedFile = this.findMappedFileByOffset(this.flushedWhere, this.flushedWhere == 0);
        if (mappedFile != null) {
            long tmpTimeStamp = mappedFile.getStoreTimestamp();
            int offset = mappedFile.flush(flushLeastPages);
            long where = mappedFile.getFileFromOffset() + offset;
            result = where == this.flushedWhere;
            this.flushedWhere = where;
            if (0 == flushLeastPages) {
                this.storeTimestamp = tmpTimeStamp;
            }
        }
        return result;
    }

再看看MappedFile.flush函数，无非就是对fileChannel或mapBuf滞留在内存中的脏页进行刷盘，但是对这2个动作做了catch，这就比较显眼。

如果刷盘报错了，只是打个错误日志，下面又把flushedPosition更新到写入指针位置，相当于这部分数据并未落盘，直到下次新数据写入同步刷盘时才会连带把这部分数据落盘，如果这时候发生断电，就导致这部分数据丢失。但是这里把flushedPosition指针更新后，在GroupCommitLogService刷盘逻辑中判断flushedPosition >= msg的写入位置了，就唤醒被挂起的写入线程，返回PUT_OK。producer收到ok，以为msg被落盘了，实际msg此时在OS的缓冲区中，如果突然断电或操作系统崩溃了，消息就丢失了。

从mappedByteBuffer.force()来看并没有声明抛出异常，但是在JVM的本地方法和OS层面是否有运行时异常，甚至磁盘硬件层面是否有异常导致刷盘不成功呢？

这个问题尝试给社区提了issue https://github.com/apache/rocketmq/issues/5235

/**
     * @return 当前已经刷盘的位置指针，指针之前的数据已落盘
     */
    public int flush(
            // 至少需要刷盘的页数
            final int flushLeastPages) {
        // 这里去计算当前内存累计的脏页是否到了最低脏页刷盘的阈值
        if (this.isAbleToFlush(flushLeastPages)) {
            // 检查当前mapfile没有被销毁，destroy函数会将refCount置为0，hold同时会将refCount++代表此时有至少一个线程在访问mapfile
            if (this.hold()) {
                int value = getReadPosition();
                try {
                    // 开启内存池，CommitRealTimeService从writeBuf写到fileChannel，直接将fileChannel数据刷盘
                    if (writeBuffer != null || this.fileChannel.position() != 0) {
                        this.fileChannel.force(false);
                    } else {
                        // 同步刷盘的数据每一次都会直接写入mapBuf，异步刷盘但没有开启内存池的数据也会写入mapBuf
                        this.mappedByteBuffer.force();
                    }
                } catch (Throwable e) {
                    log.error("Error occurred when force data to disk.", e);
                }
                // 更新当前刷盘指针为当前写入指针的位置
                this.flushedPosition.set(value);
                // 将refCount--，当refCount=0时会释放mapBuf的内存
                this.release();
            } else {
                log.warn("in flush, hold failed, flush offset = " + this.flushedPosition.get());
                this.flushedPosition.set(getReadPosition());
            }
        }
        return this.getFlushedPosition();
    }

CommitLog过期文件的删除机制

待补充

你可能感兴趣的:(RocketMQ,rocketmq,java)

Java IDEA中Gutter Icons图标的含义路宇 java笔记 java intellij-idea 开发语言 gutter-icons 图标 Java开发工具
前些天发现了一个蛮有意思的人工智能学习网站,8个字形容一下"通俗易懂，风趣幽默"，感觉非常有意思,忍不住分享一下给大家。点击跳转到教程前言：很多人刚开始用IDEA来学习编程，会发现下面这些图标。但是我们有时候并不知道它的含义和设置显示与隐藏，下面给大家讲解一下装订线图标位于左侧编辑器中。它们调用一些基本操作以及其他特定于框架和技术的功能。设置步骤File->Setting进到idea的设置页面。接
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
【科大讯飞笔试题汇总】2024-04-21-科大讯飞春招笔试题-三语言题解(CPP/Python/Java) 春秋招笔试突围最新互联网春秋招试题合集 python java 开发语言春招笔试互联网大厂笔试题
大家好这里是KK爱Coding，一枚热爱算法的程序员✨本系列打算持续跟新科大讯飞近期的春秋招笔试题汇总～ACM银牌|多次AK大厂笔试｜编程一对一辅导感谢大家的订阅➕和喜欢KK这边最近正在收集近一年互联网各厂的笔试题汇总，如果有需要的小伙伴可以关注后私信一下KK领取，会在飞书进行同步的跟新，5月1日之前限时免费领取哦，后续会由ACM银牌团队持续维护~。文章目录01.硬币最少组合问题问题描述输入格式输
vite中使用Web Worker 脚本
MDN对WebWorker的说明WebWorker为Web内容在后台线程中运行脚本提供了一种简单的方法。线程可以执行任务而不干扰用户界面。此外，它们可以使用XMLHttpRequest（尽管responseXML和channel属性总是为空）或fetch（没有这些限制）执行I/O。一旦创建，一个worker可以将消息发送到创建它的JavaScript代码，通过将消息发布到该代码指定的事件处理器（反
【java】注解 6<7 java 开发语言
注解什么是注解Annotation（注解）是从JDK5.0开始引入的新技术。Annotation的作用：不是程序本身必需的，但是可以对程序做出解释。可以被其他程序（比如编译器等）读取。Annotation的格式：注解是以“@注释名”在代码中存在的，还可以添加一些参数值，例如：@SuppressWarnings(value=“unchecked”)。Annotation在哪里可以使用?可以附加在pa
【java】反射 6<7 java python 开发语言
反射反射机制可以读取注解。反射的概念在Java中，通常情况下，我们在编译时就知道要使用的类和方法。但反射机制打破了这种常规，它允许程序在运行时动态地分析类、调用方法、操作字段等。也就是说，在运行时，程序可以根据需要来决定要使用哪个类、调用哪个方法、访问哪个字段，而不是在编译时就确定下来。反射的核心类Java反射机制主要涉及以下几个核心类：1、Class类Class类是反射机制的基础，它代表一个类或
深度解析Java中的代码分支策略规划：掌握GitFlow与GitHub Flow的艺术墨夶 Java学习资料2 java github 开发语言
在这个技术日新月异的时代，每一个开发者都在寻找提高效率、减少错误并优化团队协作的方法。而当涉及到代码管理时，选择正确的分支策略至关重要。今天，我们将深入探讨如何在Java项目中应用两种流行的分支策略——GitFlow和GitHubFlow，并通过详尽的示例代码来展示它们的实际运用。1.分支管理策略概览分支管理策略不仅帮助团队成员之间进行有效的沟通，还确保了代码库的健康状态。无论是小型创业公司还是大
【VSCode】VSCode常用插件 Ctrl Z. vscode ide 编辑器
Chinese(Simplified)(简体中文)LanguagePackforVisualStudioCode：简体中文支持插件HTML/CSS/JavaScriptSnippets：支持HTML/CSS/JavaScript快速匹配输入HTMLSnippets：这个插件提供了一系列HTML代码片段，通过简单的缩写就可以快速生成常用的HTML结构。例如，输入!并按下Tab键，就可以快速生成一个完
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
linux 安装jdk1.8 李逍遙️ linux 运维服务器
通过终端，使用wget命令下载JDK：wgethttps://download.java.net/openjdk/jdk8u41/ri/openjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz解压下载的文件。你可以使用tar命令解压：tar-xzfopenjdk-8u41-b04-linux-x64-14_jan_2020.tar.gz将解压后的JDK移动到/op
实现一个完整的计算器（Java）李逍遙️
直接上代码importjava.awt.BorderLayout;importjava.awt.Color;importjava.awt.GridLayout;importjava.awt.event.ActionEvent;importjava.awt.event.ActionListener;importjavax.swing.JButton;importjavax.swing.JFrame;
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
泛型擦除和TypeToken liudachu java
泛型可以让代码更加通用，但同时也可能会导致一些类型信息在运行时丢失，这就是所谓的类型擦除。Guava的TypeToken帮咱们巧妙地解决了这个问题。第1章：泛型编程的挑战先来说说泛型。在Java中，泛型是一种在编译时进行类型检查的机制。它让咱们能在类、接口、方法中使用类型参数，比如List或者Map。这样的好处是代码更安全，更易读，同时还能重用。但是，泛型也有个大问题——类型擦除。听起来有点高深，
2025美团最新面试题—Java程序减少GC的设计程序员共鸣 java jvm 开发语言
1.对象复用与池化线程局部变量：通过ThreadLocal缓存线程私有对象，避免竞争。可变对象：优先使用可修改对象（如StringBuilder代替String拼接）。2.减少对象创建避免隐式装箱：使用基本类型（int而非Integer）。优化循环：避免在循环内创建临时对象。静态不可变对象：将常量声明为staticfinal（如配置参数）。3.数据结构优化预分配容量：初始化集合时指定合理大小（如A
探索 LangChain、Hugging Face、LM Studio 等 AI 应用工具 Alex程 langchain 人工智能
目录1.LangChainv0.2简介安装概念指南简单试用(1)模型选择(2)基础操作(3)更多操作Runnable调用链的连接Runnable并行自定义函数RunnableLambda额外assign参数(4)langchain.js2.HuggingFace简介如何调用API3.LMStudio简介LMStudio服务器JavaScript/TypeScriptSDK4.Dify.AI简介安装
美团Leaf分布式ID生成器使用教程：号段模式与Snowflake模式详解 Cloud_. 分布式
引言在分布式系统中，生成全局唯一ID是核心需求之一。美团开源的Leaf提供了两种分布式ID生成方案：号段模式（高可用、依赖数据库）和Snowflake模式（高性能、去中心化）。本文将手把手教你如何配置和使用这两种模式，并解析其核心机制。一、Leaf号段模式使用教程1.环境准备数据库：MySQL5.7+Java环境：JDK1.8+Leaf源码：从GitHub克隆Leaf仓库（推荐使用feature/
java八股文之常见的集合 qq_45923849 java 开发语言
一、数组的索引为什么从0开始？寻址公式：数组的首地址+索引乘以存储数据的类型大小在根据数组索引获取元素的时候，会用索引和寻址公式来计算内存所对应的元素数据。如果数组的索引从1开始，寻址公式中，就需要增加一次减法操作（数组的首地址-1），对于CPU来说就多了一次指令，性能会降低。二、数组进行查找操作的时间复杂度如果是通过下标，查询的时间复杂度是O(1)如果不通过下标，和使用的查找方式有关–从头往后顺
初级面试题：数据类型面试题大揭秘佩奇的技术笔记 Java面试小册 java 开发语言
一、引言在Java开发的面试中，数据类型相关的问题经常出现。面试官通过这些问题考察候选人对Java基础的理解程度以及在实际开发中对数据类型的运用能力。本文将深入剖析常见的数据类型面试题，帮助读者全面掌握这些知识点。二、基本数据类型与引用数据类型面试题：int和Integer的区别是什么？答案：int是基本数据类型，占用4个字节内存，直接存储数值；Integer是int对应的引用数据类型，即包装类，
List 和 Set 的区别不会搬砖的淡水鱼数据结构 list windows 数据结构
List和Set的区别在Java中，List和Set都是Collection接口的子接口，但它们的存储结构、特点、使用场景不同。对比项List（有序、可重复）Set（无序、不可重复）是否允许重复元素✅允许❌不允许是否有序✅按插入顺序排序❌无序（TreeSet除外）是否可以有null✅允许多个null✅只允许一个null底层数据结构数组、链表哈希表、红黑树访问方式通过索引访问通过iterator遍历
Java WebSocket与项目页面（通常是HTML + JavaScript）之间建立连接并传输数据 hh_fine java websocket html
JavaWebSocket与项目页面（通常是HTML+JavaScript）之间建立连接并传输数据1.创建JavaWebSocket服务器：使用JavaWebSocketAPI创建一个WebSocket服务器端点。2.在HTML页面中使用JavaScript连接WebSocket：通过JavaScript的WebSocketAPI与JavaWebSocket服务器建立连接。3.双向数据传输：实现服
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
Lodash源码分析-every,some,size,includes 初学者7. Loadsh源码分析 javascript 前端
collection相关的函数，collection指的是一组用于处理集合（如数组或对象）的工具函数。lodash源码研读之every,some,size,includes一、源码地址GitHub地址:GitHub-lodash/lodash:AmodernJavaScriptutilitylibrarydeliveringmodularity,performance,&extras.官方文档地址
Lodash源码分析-uniq,uniqBy,uniqWith 初学者7. Loadsh源码分析 javascript 前端
lodash源码研读之uniq,uniqBy,uniqWith一、源码地址GitHub地址:GitHub-lodash/lodash:AmodernJavaScriptutilitylibrarydeliveringmodularity,performance,&extras.官方文档地址:Lodash官方文档二、结构分析uniq,uniqBy,uniqWith基于baseUniq模块。三、函数介
Android开发哈哈哈隔 android
AndroidAdapter是将数据绑定到UI界面上的桥接类比如:当lambada中只有一个参数时，可以用it指代@Target和@Retention是由Java提供的元注解，所谓元注解就是标记其他注解的注解，下面分别介绍https://blog.csdn.net/javazejian/article/details/71860633#%E5%A3%B0%E6%98%8E%E6%B3%A8%E8%
大整数加、减法（Java实现）与debug找错 gfu_ java 算法数据结构
前言这篇文章主要内容涉及大整数加法的实现以及debug使用的简单记录。以前当我碰到程序报错时，总是想找别人帮忙，感觉debug太难了，自己根本看不懂。这次，自己在做一道算法题时，程序能够运行，结果却出错了。本来想找别人帮忙，但想着学习还是要脚踏实地，于是自己硬着头皮上了，先在网上了解如何debug，然后一步一步找到了错误所在。主要是想记录下第一次debug找到问题的快乐。一、大整数加法（java）
Java+Selenium+Cucumber自动化测试框架：高效软件测试的利器测试渣 java selenium
一、引言在当今软件开发的快速迭代的背景下，确保软件质量和功能的正确性变得愈发关键。自动化测试作为一种提高测试效率、降低成本的有效手段，受到了广泛的关注。Java作为一门功能强大且广泛应用的编程语言，与Selenium和Cucumber相结合的自动化测试框架，为软件测试领域带来了诸多优势。本文将深入探讨这一自动化测试框架，包括其简介、各组件的作用、环境搭建、实际应用案例以及未来发展趋势等内容。二、J
华为余承东“剧透”新形态手机；自DeepSeek发布以来，英伟达市值已蒸发4200亿美元；Java 24正式发布 | 极客头条极客日报华为智能手机 java
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN（ID：CSDNnews）一分钟速览新闻点！华为余承东“揭秘”新形态手机：不是卷轴屏/伸缩屏，但男生女生都会喜欢腾讯去年营收增长8%，马化腾：重组AI团队，增加AI相关的资本开支金山办公：2024年WPSOffice全球月度活跃设备数达6.32亿，
都快3202年了，你还不会用Java生成计算机统一标识符 Heping_Ge2333 java
Java生成计算机统一标识符计算机统一标识符的概念什么是计算机统一标识符？计算机统一标识符就相当于每台电脑每个系统的“身份证”。它是唯一的。通常，计算机统一标识符是根据电脑的硬件情况（主板、cpu的序列号，mac地址）和系统情况（windows/linux/unix）生成的。Java语言的实现下面这段代码浅浅的实现了计算机统一标识符importlombok.Data;importlombok.ex
Java IO流详解我真的不想做程序员 java 文件读写 java 开发语言后端数据结构算法
目录一、JavaIO流基础（一）字节流常见字节流类（二）字符流常见字符流类二、字节流操作示例（一）读取文件（二）写入文件（三）带缓冲功能的字节流三、字符流操作示例（一）读取文件（二）写入文件（三）带缓冲功能的字符流四、总结一、JavaIO流基础JavaIO流用于处理设备之间的数据传输，主要包括字节流和字符流两大类。字节流以字节为单位进行数据传输，适用于处理二进制数据；字符流以字符为单位进行传输，适
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe