VLTIC

jackrabbit in action seven（索引合并（上））

我们从文本提取的逻辑中走出来，回到主体流程。

在前面的文章中，我们可以看到一次索引创建的操作，可能会产生多个 persistentindex 对象，而这些对象其实代表着一个索引目录。随着创建索引的次数越来越多，那么索引目录也在增多，但是索引目录中的数据却不是很多，所以我们需要把多个目录合并，其实也就是索引的合并。

执行这个操作的类是 IndexMerger ，看其定义为：

class IndexMerger extends Thread implements IndexListener

/*由此可见它是一个线程，并且同时充当着listener的角色，看看它的构造方法：
*/
IndexMerger(MultiIndex multiIndex) {

        this.multiIndex = multiIndex;
        setName("IndexMerger");
        setDaemon(true);
        try {
            mergerIdle.acquire();

        } catch (InterruptedException e) {
            // will never happen, lock is free upon construction
            throw new InternalError("Unable to acquire mutex after construction");
        }
}

还是一个 deamon 线程。而且一构造就来了一个 mergerIdle.acquire(); 真是迫不及待啊。啥意思啊？得到一把锁，一把非阻塞的锁。

在创建完 IndexMerger ，那么就有可能把 PersistentIndex 加进来了，因为 Merger 类必须知道哪些 PersistentIndex 是需要 Merger 的，那么我们看看负责这段逻辑的代码：这段代码主要负责 3 个功能，一个是初始化 indexBuckets ，这个一个 ArrayList ，其中放的是需要 Merger 的 PersistentIndex 的列表，也就是我们可以认为 indexBucket 里放的还是 list ，这里有一个非常奇怪的设计，就是在初始化的时候将 PersistentIndex 按照 docnums 的范围分组了，一组就是一个 indexBucket 。

第二个是把需要加入的 PersistentIndex 加入到对应的分组中。

第三个是判断是否需要合并，如果需要就加到一个队列中，等待被合并。

先看第一段代码：

synchronized (lock) {

            // initially create buckets
            if (indexBuckets.size() == 0) {
                long lower = 0;
// default minMergeDocs is 100
                long upper = minMergeDocs;

//default maxMergeDocs is 2147483647
// IndexBucket实际上就是一个ArrayList

                 while (upper < maxMergeDocs) {

                    indexBuckets.add(new IndexBucket(lower, upper, true));
                    lower = upper + 1;
//default mergeFactor is 10
                    upper *= mergeFactor;

                }

                // one with upper = maxMergeDocs

                indexBuckets.add(new IndexBucket(lower, maxMergeDocs, false));

                // and another one as overflow, just in case...

                indexBuckets.add(new IndexBucket(maxMergeDocs + 1, Long.MAX_VALUE, false));
            }
 ············

仔细阅读代码，我们发现，在初始化 indexBuckets 的代码中，其实按照范围来初始化的，比如当添加第一 IndexBucket 的时候 lower=0 ， upper=100

即 new IndexBucket(0 100 ， rue )

第二个则为： new IndexBucket(101, 100*10, t rue )

第三个则为： new IndexBucket(1001, 100*10*10, t rue )

第四个则为： new IndexBucket(10001, 100*10*10*10, t rue )

第五个则为： new IndexBucket(100001, 100*10*10*10*10, t rue)

````````````

一直持续下去直到 upper 小于 2147483647 ，且是 10 的最大幂。那么就是说 10 亿，当一个目录中有 10 亿个 document 的 index 数据时，这个目录将不再参与 merge 过程， indexBuckets 中总共有 8 个 IndexBucket, 不过在循环外面还有两个创建 IndexBucket 的语句，不过这两个都是不允许参加合并的，所以第 3 个参数是 false ，也就是说一共有 10 个，第九个是：

new IndexBucket(1000000001, 2147483647, false)





 
 
那么第十个是： 
new IndexBucket(2147483648, 0x7fffffffffffffffL, false)





 

搞清楚 indexBuckets 的 初始化之后，我们再来看看第二个步骤，把根据 docNums 把对应的 persistentindex 加入到 IndexBucket 中 :
// put index in bucket

            IndexBucket bucket = (IndexBucket) indexBuckets.get(indexBuckets.size() - 1);

            for (int i = 0; i < indexBuckets.size(); i++) {

                bucket = (IndexBucket) indexBuckets.get(i);

                if (bucket.fits(numDocs)) {
                    break;
                }
            }

/*如果indexBuckets 没有值，那么就把Index 添加到第10个IndexBucket中，否则就从indexBuckets 的第一IndexBucket开始匹配，根据numDocs的值放到对应的IndexBucket中。*/

            bucket.add(new Index(name, numDocs));

            if (log.isDebugEnabled()) {
                log.debug("index added: name=" + name + ", numDocs=" + numDocs);

            }

            // if bucket does not allow merge, we don't have to continue

//如果是最后两个IndexBucket，那么即刻退出
            if (!bucket.allowsMerge()) {
                return;
            }

 

/*这段代码没有什么难的，接着看第3个步骤：
*/            // check if we need a merge
//超过indexbucket中超过10个元素<其实就是10个目录>则开始合并

            if (bucket.size() >= mergeFactor) {
 
                long targetMergeDocs = bucket.upper;
                targetMergeDocs = Math.min(targetMergeDocs * mergeFactor, maxMergeDocs);

                // sum up docs in bucket

                List indexesToMerge = new ArrayList();

                int mergeDocs = 0;

                for (Iterator it = bucket.iterator(); it.hasNext() && mergeDocs <= targetMergeDocs;) {

                    indexesToMerge.add(it.next());

                }
/* 结合上下文，indexesToMerge.size()这值会小于2吗？？？？？*/
                if (indexesToMerge.size() > 2) {

                    // found merge

                    Index[] idxs = (Index[]) indexesToMerge.toArray(new Index[indexesToMerge.size()]);

                    bucket.removeAll(indexesToMerge);

                    if (log.isDebugEnabled()) {

                        log.debug("requesting merge for " + indexesToMerge);

                    }

                    mergeTasks.add(new Merge(idxs));

                    log.debug("merge queue now contains " + mergeTasks.size() + " tasks.");
                }
            }


这段代码的主要功能是把 indexbucket 里的 persistentindex 信息拿出来，而且量超过 2 的话就把他们加入到一个队列中，并将它们从该 indexbucket 里删除。通过这个步骤，那么 mergeTasks 队列中就存在一些需要合并的 index 了。
  
中场总结： 
通过上面的方法和前面的索引提交的文章我们得到一些重要信息：当用户把 ramdirectory 中超过 100 的 docs 的 index data 刷到 fsdirectory 中时，新建一个目录，作为这个新 fsdirectory 的目录，接着把这个 fsdirectory 对应的 PersistentIndex 加到 IndexMerger 类的某个 IndexBucket 中，接着当某个 IndexBucket 中的 PersistentIndex 数量（即这些目录的数量）超过 10 （ mergefactor
 ）的时候，就会执行合并的操作。 
那么下面的问题是，合并之后，这 10 个目录将会何去何从，它们是把另外 9 个合并到其中一个中去呢还是怎么滴？接着看吧。 
  
显然，这里又用到生产消费模型，任何调用 indexAdded 方法的都属性生产者，生产者根据一些条件，有选择的把需要合并的 persistentindex 放到 mergeTasks 的队列中，有了生产者肯定存在消费者，文章开头提过， IndexMerger 类是一个 deamon 线程，看看它的 run 方法，那么就发现，其实它就是消费者。它主要完成以下几个功能：
1 判断消费者是否空闲 
2 判断队列中是否有退出命令 
3 如果空闲则进入 wait 状态 
4 根据 persistentindex 的名字取到所有的 persistentindex 
   的 IndexReader 对象 
5 再创建一个新的 PersistentIndex, , 原来的 index 文件合并到这个新的目录中 
  
6 将前面的 IndexReader 对象添加到 PersistentIndex 的 indexwriter 方法中，并执行 optimize 。 
7 关闭这些 readers 
8 根据名字删除已经被合并的 PersistentIndex 的索引文件和目录等。 
我们再来看看代码，代码中已经加入了 ahuaxuan 的注释：
public void run() {

        for (;;) {
            boolean isIdle = false;

      //队列长度为0，表示消费者处于空闲状态，那么会进入wait状态
            if (mergeTasks.size() == 0) {

                mergerIdle.release();

                isIdle = true;

            }

/*2判断队列中是否有退出命令

*/

            Merge task = (Merge) mergeTasks.remove();

            if (task == QUIT) {
                mergerIdle.release();
                break;
            }

            if (isIdle) {

                try {
                    mergerIdle.acquire();
                } catch (InterruptedException e) {

                    Thread.interrupted();
                    log.warn("Unable to acquire mergerIdle sync");
                }
            }

             log.debug("accepted merge request");

             // reset deleted documents
            deletedDocuments.clear();

            // get readers

/*4 根据persistentindex的名字取到所有的persistentindex

   的IndexReader对象

*/

            String[] names = new String[task.indexes.length];

            for (int i = 0; i < task.indexes.length; i++) {
                names[i] = task.indexes[i].name;
            }

            try {

                log.debug("create new index");

/*再创建一个新的PersistentIndex,原来的index文件合并到这个新的目录中

*/
                PersistentIndex index = multiIndex.getOrCreateIndex(null);

                boolean success = false;

                try {

                    log.debug("get index readers from MultiIndex");

                    IndexReader[] readers = multiIndex.getIndexReaders(names, this);

                    try {

                        // do the merge

                        long time = System.currentTimeMillis();

/*6 将前面的IndexReader对象添加到PersistentIndex的indexwriter方法中，并执行optimize。

*/
                        index.addIndexes(readers);

                        time = System.currentTimeMillis() - time;

                        int docCount = 0;

                        for (int i = 0; i < readers.length; i++) {
                            docCount += readers[i].numDocs();
                        }

                        log.info("merged " + docCount + " documents in " + time + " ms into " + index.getName() + ".");

                    } finally {
                        for (int i = 0; i < readers.length; i++) {

/*7 关闭这些readers

*/

                            try {
                                readers[i].close();
                            } catch (IOException e) {
                                log.warn("Unable to close IndexReader: " + e);
                            }
                        }
                    }

                    // inform multi index

                    // if we cannot get the sync immediately we have to quit

                    if (!indexReplacement.attempt(0)) {
                        log.debug("index merging canceled");
                        break;
                    }

                    try {
                        log.debug("replace indexes");
                        multiIndex.replaceIndexes(names, index, deletedDocuments);
                    } finally {
                        indexReplacement.release();
                    }
                     success = true;
                 } finally {

                    if (!success) {

                        // delete index

                        log.debug("deleting index " + index.getName());

/*8 根据名字删除已经被合并的PersistentIndex的索引文件和目录等。

*/
                        multiIndex.deleteIndex(index);
                    }
                }
            } catch (Throwable e) {
                log.error("Error while merging indexes: " + e);
            }
        }
        log.info("IndexMerger terminated");
    }


看到这里爱思考的同学们一定会意识到这里还漏了什么，是什么呢？前面讲到，一个 bucket 中超过 10 个目录，会被合并一个新的目录，那么也就是说这个新目录中至少有 1000 个 document 的索引数据，这样下来，如果我有 100000 个节点，而且恰好每个目录中之后 1000 个 document 的数据，那么就得用 100 个目录来存储数据了。这样带来的问题是，每做一次查询，都需要把 100 个 indexReader 传给 search ，即使使用多线程并行搜索，那目录数也还是太多了，而且如果是
 100w 个节点，那就更不得了了，所以 jackrabbit 中一定还有机制会把这些目录合并成更大目录的逻辑。为什么这么说，因为之前在创建 indexbucket 中的时候，分了 8 个允许合并的段，而上面的逻辑只会用到前面一个 bucket ，后面的几个肯定是有用处的，那么是谁来触发它们的，它们在哪里呢？
  
我们看到在上面的 run 方法中，我们有一个方法没有讲到： multiIndex .replaceIndexes(names, index, deletedDocuments );
我们将会在这个方法中寻找到真相，同样， ahuaxuan 在代码中加入了自己的注释
/* obsoleteIndexes 是需要被删除的 dir ，因为他们的数据已经被合并到新的目录里， index 参数则表示那个对应那个新目录的 PersistentIndex ， deleted 表示需要被删除的类 */ 

void replaceIndexes(String[] obsoleteIndexes,
                        PersistentIndex index,
                        Collection deleted)

            throws IOException {

/*在multiIndex中，到处都是synchronized ，而且都是锁定multiindex对象，为啥呢? 详见后文*/

        synchronized (this) {

/*这段代码在multiIndex#update方法中也出现过，你知道它的用途吗，其实可以猜出来*/

            synchronized (updateMonitor) {
                updateInProgress = true;
            }
            try {

                // if we are reindexing there is already an active transaction

                if (!reindexing) {

                    executeAndLog(new Start(Action.INTERNAL_TRANS_REPL_INDEXES));

                }

                // delete obsolete indexes

/*10个目录已经合并成一个了，那这个10个目录该删的就删，不需要犹豫*/

                Set names = new HashSet(Arrays.asList(obsoleteIndexes));

                for (Iterator it = names.iterator(); it.hasNext();) {

                    // do not try to delete indexes that are already gone

                    String indexName = (String) it.next();

                    if (indexNames.contains(indexName)) {
                        executeAndLog(new DeleteIndex(getTransactionId(), indexName));
                    }

                }

                 // Index merger does not log an action when it creates the target

                // index of the merge. We have to do this here.

/*还记得CreateIndex的作用吗？复习一下：根据名字获取PersistentIndex对象，如果名字不存在或者为null，则新建一个PersistentIndex对象，罗嗦一句，一个PersistentIndex代表一个目录*/

                executeAndLog(new CreateIndex(getTransactionId(), index.getName()));
  
/*又来了AddIndex对象，还记得它的作用吗，将这个persistentIndex加入到*/

                executeAndLog(new AddIndex(getTransactionId(), index.getName()));
 
                // delete documents in index

                for (Iterator it = deleted.iterator(); it.hasNext();) {
                    Term id = (Term) it.next();
                    index.removeDocument(id);
                }

                index.commit();
 
                if (!reindexing) {
                    // only commit if we are not reindexing
                    // when reindexing the final commit is done at the very end
                    executeAndLog(new Commit(getTransactionId()));
                }

            } finally {
                synchronized (updateMonitor) {
                    updateInProgress = false;
                    updateMonitor.notifyAll();
                    releaseMultiReader();
                }
            }
        }

        if (reindexing) {
            // do some cleanup right away when reindexing
            attemptDelete();
        }
    }


看完这段方法，我们发现，小的目录合并成大目录之后，这个大目录又被加到 indexbucket 等待下一次被合并，如此递归，一直当一个目录的 document 的 index 数据超过 10 亿，那么就不会再合并了， ahuaxuan 画了一张图：
=========================================================================



图中的0-100表示最基层的目录级别，这些目录只包含0-100个document的index数据，而默认参数情况下这些目录根本用不着，因为在前面的流程中，我们看到，ramdirectory中的数据只有满100才会加入到fsdirectory中，这意味着一开始用到的目录就是101-1000级别的目录（101-1000的目录表示这些目录中的document的index数据也只有101-1000个这个范围。）。这种目录超过10个就会合并成一个新目录。依次类推高层目录。见图中ahuaxuan的注释



说到这里，大部分人都知道了，很多参数可以控制合并的调优，这些参数在前文已经讲过了，不再赘述。

  

到这里，IndexMerger的主体流程基本上完成了，其实就是一个生产-消费模型+小目录生产大目录，大目录生成更大目录的算法，这样做的好处是什么？当然是尽量少改动索引文件，应该说是便于分布式的查询架构。但是在后文中，我们会详细分析jackrabbit还没有为分布式查询准备好的原因，它的这块设计还有待改进，人无完人，框架亦是如此，不用过于苛求，也不必抱怨，用的不爽，那么就---改它，再不行---重新实现（某个模块或者全部）。



TO BE CONTINUE

【编程小白必看】Python编程练习题元组操作秘籍一文全掌握 6个q python习题集 python 网络开发语言
【编程小白必看】Python编程练习题元组操作秘籍一文全掌握文章目录前言一、练习题精选1.创建一个空元组2.创建一个单元素元组3.创建一个包含多个元素的元组4.访问元组中的第一个元素5.访问元组中的最后一个元素6.访问元组中的多个元素7.元组拼接8.元组重复9.获取元组的长度10.检查元素是否在元组中11.检查元素是否不在元组中12.计算元组中元素出现的次数13.获取元组中元素的索引14.获取元组
Python 虚拟环境搭建 tigercat920 python 开发语言
虚拟环境1.为什么要搭建虚拟环境?在开发过程中,当需要使用python的某些工具包/框架时需要联网安装比如联网安装Django框架django的2.2.5版本sudopipinstalldjango==2.2.5提示：使用如上命令,会将Django安装到/usr/local/lib/python版本号/dist-packages路径下问题：如果在一台电脑上,想开发多个不同的项目,需要用到同一个包的
数组at()方法：负索引的救赎与JavaScript标准化之路不做超级小白前端功能通关秘籍 web前端 javascript 开发语言 ecmascript
数组at()方法：负索引的救赎与JavaScript标准化之路从一次代码评审说起在某次团队代码评审中，小白注意到有同事写下了这样的代码：constlastItem=arr[arr.length-1];这让我回想起自己早期开发时被负索引问题困扰的经历。今天，随着ES2022的发布，我们终于迎来了官方解决方案——Array.prototype.at()。本文将带你深入理解这一新特性背后的设计哲学与技术
es6.7.1分词器ik插件安装-和head插件连接es特殊配置运维实战课程 jenkins 运维
es6.7.1分词器ik插件安装-和head插件连接es特殊配置如果对运维课程感兴趣，可以在b站上、A站或csdn上搜索我的账号：运维实战课程，可以关注我，学习更多免费的运维实战技术视频1.查看es6.7.1和es-head安装位置和es插件路径[root@verify-10-100-4-4data]#dockerps|grepes4f0fe4db0ca9elasticsearch-head:6.
Servlet 总结 SAFE20242034 #二 JavaWeb servlet
Servlet总结Servlet是JavaEE(JakartaEE)技术中的一个核心组件，用于开发基于服务器的动态Web应用程序。它是运行在支持Java的Web服务器或应用服务器上的Java类，能够处理客户端请求并生成响应。Servlet的核心特点：平台无关性：Servlet是基于Java的，具有跨平台特性。高效性：Servlet在服务器端运行，可以在同一进程中处理多个请求，减少了性能开销。生命周
Github趋势榜的新年冠军，竟是用AI玩数独 beyondma AI与最新技术演进 AI MINST Github
今天笔者无意中打开Github发现了这个目前趋势榜霸榜的项目是是一个利用AI玩数独的项目AI_Sudoku（Github发址：https://github.com/neeru1207/AI_Sudoku）笔者体验了一下感觉还是比较有意思的，AI_Sudoku本质上就是使用图像识别的方式来完成MINST数字识别，然后再使用dancinglinksx算法解出数独问题，对于初学者来说既能解决AI的入门问
大系统的标准规范介绍代码改变世界ctw optee精选 armv8 trustzone TEE armv9 optee 标准规范
快速链接:.《optee精选全集》付费专栏-[目录]付费专栏-付费课程【购买须知】目录1、思考2、未来系统软件架构图3、当前主流系统软件架构图4、GP/PSCI/SMCCC规范概览5、生态：系统软件架构1、思考当前的主流软件框架是怎样的？有什么标准规范吗？不同的SOC系统启动时有什么标准规范吗？在运行状态跨系统进行电源管理时有什么标准规范吗2、未来系统软件架构图在未来的软件生态架构中，一个SOC上
超简洁 100行Javascript代码实现2048游戏，浏览器可玩入职啦 100行实战项目 javascript 游戏开发语言
本文发表于入职啦(公众号:ruzhila)大家可以访问入职啦学习更多的编程实战。完全用Javascript的Canvas实现2048游戏，打开浏览器就可以玩项目地址代码已经开源，2048-js欢迎Star代码运行效果：所有的项目都在github上开源：100-line-code欢迎Star用100行代码的不同语言（Java、Python、Go、Javascript、Rust）实现项目，通过讲解项目
Nginx 学习笔记韩某- nginx 学习笔记
目录一、引言二、Nginx概述三、Nginx的作用（一）正向代理（二）反向代理（三）负载均衡策略（四）动静分离四、Nginx安装五、Nginx的常用命令六、Nginx实战及总结一、引言在项目发展初期，并发量和用户量较少时，简单地将一个jar包部署到服务器tomcat上即可满足需求。然而，随着用户数量的不断增长以及并发量的持续增大，单台服务器容易面临性能瓶颈，出现“红温”现象。此时，为了提升系统的处
ABAP git客户端
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
Spring Cloud底层原理 spring_root springCloud 原理
概述毫无疑问，SpringCloud是目前微服务架构领域的翘楚，无数的书籍博客都在讲解这个技术。不过大多数讲解还停留在对SpringCloud功能使用的层面，其底层的很多原理，很多人可能并不知晓。因此本文将通过大量的手绘图，给大家谈谈SpringCloud微服务架构的底层原理。实际上，SpringCloud是一个全家桶式的技术栈，包含了很多组件。本文先从其最核心的几个组件入手，来剖析一下其底层的工
用C++实现炫酷的黑客代码雨边城仔 C++小项目 c++开发语言
目录前言一、准备工作二、思路介绍1.结构体的封装2.宏定义的确定3.雨滴的行为3.1雨滴的初始化3.2绘制雨滴3.3临界条件处理3.4加上背景音乐三、完整代码四、项目安装包总结前言作为一名技术求知者，大家是不是觉得黑客电脑屏幕上的代码雨十分的帅气呢？下面，我将用C++来实现它，一起来感受这份代码所带来的酷炫与美感。首先，让我们来演示一下最终效果：一、准备工作1.安装VisualStudio2.安装
Pandas基础01（Series创建/索引/切片/属性/方法/运算） XYX的Blog 数据分析与可视化 pandas
Pandas基础Pandas是一个功能强大的数据分析和操作库，主要用于处理和分析表格型数据（例如：CSV、Excel、SQL数据库等）。它建立在NumPy基础上，提供了许多便捷的数据结构，主要是Series和DataFrame，用于处理和分析数据。3.1Series数据结构Series是一种类似于一维数组的对象，它包含了一组数据（可以是整数、浮点数等）以及与之相关的标签（索引）。可以将Series
计算机不识别加密狗,用友加密狗识别不到_电脑无法识别用友软件加密狗 Rubix-Kai 计算机不识别加密狗
今天有一个用友T3的客户说他的正版用友T3加密狗有时候识别不到，不知道具体的原因？一下好一下坏，重启下电脑又好了，不知道具体什么情况下用友T3会识别不到加密狗？经过各种百度，谷歌搜索和排查，跟我学用友的老师将用友T3经常识别不到加密狗的情况进行了总结和归类。我们发现，一般出现用友T3识别不到加密狗的情况基本上可分为：一、电脑USB接口不稳定，供电不足；1、由于用友软件加密狗分为很多种，有黄色，蓝色
vscode通过ssh连接github仓库（git+ssh+github+vscode详细步骤） en你好 vscode ssh github git
vscode如何通过ssh连接github仓库（详细步骤）文章目录vscode如何通过ssh连接github仓库（详细步骤）前言1.ssh2.github一、安装Git二、获取ssh密钥三、在github配置ssh密钥四、在vscode上添加远程仓库总结前言首先我们先来了解一下什么是ssh和github1.sshSSH（SecureShell）是一种网络协议，用于在不安全的网络中安全地传输数据和执
记录一次排查docker中mysql一会儿可以连接上一会儿会话断开问题，服务硬盘损坏，导致docker中mysql没100s自启动一次出现的问题 qkfm docker 容器运维 mysql
1、起因项目现场服务器宕机后，上面的docker容器启动后，突然有一个应用的服务端，总是突然报错，说数据库连接不上，但是通过navicat外面又可以连接。Causedby:org.apache.tomcat.jdbc.pool.PoolExhaustedException:[http-nio-7006-exec-9]Timeout:Poolempty.Unabletofetchaconnectio
python-leetcode-合并两个有序链表 Joyner2018 leetcode 链表算法
21.合并两个有序链表-力扣（LeetCode）#Definitionforsingly-linkedlist.#classListNode:#def__init__(self,val=0,next=None):#self.val=val#self.next=nextclassSolution:defmergeTwoLists(self,list1:Optional[ListNode],list2
ubuntu下复制大文件 Joyner2018 计算机综合 ubuntu ubuntu 服务器硬盘网络
ubuntu下复制大文件1.在服务器上的文件复制：cp源文件目的文件cp源文件目的文件夹2.从一台服务器上拷贝到另一台服务器scpusername@ip:directory本台服务器的路径3.从硬盘拷贝文件到服务器这里复制的方法很多：操作最直观的就是远程客户端的上传，但是这个受网络限制，速度慢命令上的上传rz回车暴力快速的方法是把硬盘插到服务器上sudofdisk-lsudomount/dev/s
【Oracle 数据库】奶妈式教程day05 集合操作符菜鸟进阶站 PLSQL Oracle 数据库数据库 oracle sql
集合集合：(1,3,4,65,234,123,12)每一个单列sql查询的结果就是一个集合并集：取两个集合中所有元素unionall:表示取两个集合的并集，不删除重复元素union：取两个集合的并集，删除重复的元素--查询员工工资大于1000的员工信息select*fromempwheresal>1000;--查询员工工资小于3000的员工信息select*fromempwheresal1000u
2025年软件工程/计算机科学与技术最新毕业设计专题精选推荐小五java毕设 java毕设选题推荐案例软件工程课程设计毕业设计 java
选题指导：近期开题的同学越来越多，很多同学不知道怎么选题，不知道老师分配的题目应该怎么做，指导老师分享的信息不多，无从下手？选题避坑：毕设选题实际上对很多同学来说一个大坑，每年挖坑给自己跳的人太多太多，选题选得好后面的答辩以及论文撰写会轻松很多，选的不好就是一个无穷无尽的折磨难度把控：其实这主要是由于大部分同学对某种具体场景所需要的技术不清晰而导致的，定题的时候想当然的觉得某种功能是很好实现的，但
Python中报错：ModuleNotFoundError: No module named ‘pip’ 解决方案爱理科的小王子 python pip 开发语言
1、报错原因在项目中遇到“Nomodulenamed‘pip’”这个错误一般是PC的Python环境上没有安装pip模块，运行项目时无法使用pip命令安装并运行Python库之类的操作。2、解决方案：需在PC的Python环境上安装pip模块；（1）安装pip模块成功安装（2）升级pip版本：python-mpipinstall--upgradepip（3）查看当前Python环境中已安装的库：p
设计模式思想的元规则每天三杯咖啡服务器运维
ETC能适应使用者的就是好的设计。对代码而言，就是要顺应变化。因此要信奉ETC原则（EasierToChange，更容易变更）——就该如此。据我们所知，无论是什么设计原则，都是ETC的一个特例。为什么解耦很好？因为通过隔离关注焦点，可让每一部分都容易变更——此谓ETC。为什么单一职责原则很有用？因为一个需求变化仅体现为某个单一模块上的一个对应变化——此谓ETC。为什么命名很重要？因为好的命名可以使
五、BLE Demo目录详解及演示才才爱烤火 BLE入门到精通（基于TI cc26x2）linux c语言 mcu stm32 物联网嵌入式硬件 iot
1、导入、编译、烧录打开之前安装的CCS，如下点击导入工程选择如下工程：simplelink_cc13xx_cc26xx_sdk_7_10_01_24\examples\rtos\CC26X2R1_LAUNCHXL\ble5stack\simple_peripheral如图常用的三个按钮2、BLE使用演示咱们详细介绍下目录：介绍完成后连接开发板点击下载，下载成功后打开串口工具，重新上电就可以看到我
《Python 动画：实现多种不同速度的炫酷烟花效果》后端工匠之道 python 开发语言新手入门表白表白代码爱心烟花
《Python动画：实现多种不同速度的炫酷烟花效果》前言烟花绽放是一个经典的视觉效果，通过Python和Matplotlib，我们可以轻松实现动态的烟花动画效果。本篇文章将教你如何实现多个不同速度、位置的烟花动画，让它们在屏幕上绚丽绽放，占满整个画布。效果预览本代码的最终效果如下，完整代码底部获取：多个烟花随机从屏幕不同位置升空。烟花绽放时，粒子以随机颜色和方向扩散。不同烟花有快有慢，呈现出真实的
mysql查看主从同步时间_MySql——主从同步延迟监控李昭材 mysql查看主从同步时间
前言MySQL同步功能由3个线程(master上1个，slave上2个)来实现，简单的说就是：master发送日志一个，slave接收日志一个，slave运行日志一个。主从延迟判断的方法，通常有两种方法：Seconds_Behind_Master和pt-heartbeat1.Seconds_Behind_Master通过监控showslavestatus\G命令输出的Seconds_Behind_
python主要是做什么的-Python到底可以干什么?主要应用领域 weixin_37988176
如果说挑选一门编程语言进行学习，你会选择哪个?当然是Python。Python是一门简单的编程语言，适合初学者学习，也是很多人都喜欢的语言，那么Python到底可以干什么?Python语言在学术上是非常受欢迎的，不是计算机专业的人，都可以学习Python。这个语言的前景是不可限量的，语法是非常容易理解的，很多人可以减去学习的负担，没有压力。Python到底可以干什么?主要应用领域：1、Linux运
MySQL 8.0——主从同步花_城数据库 mysql 数据库服务器
文章目录一、MySQL8.0主从同步二、MySQL主从搭建2.1Master上的操作2.2Slave上的操作一、MySQL8.0主从同步主从同步的流程（原理）：master将变动记录到二进制日志文件（binarylog）中，即配置文件中log-bin指定的文件，这些记录叫做二进制日志事件(binarylogevents)；master将二进制日志文件发送给slave；slave通过I/O线程读取文
Java 中泛型的继承 Yes_LiuSir Java java
首先来介绍一下什么是泛型类？泛型类就是上一节中介绍的泛型的第一个应用，即在类名的后面加上类型参数。问题1：当使用类型没有确定之前的泛型类和类型一旦确定之后的泛型类当作形参的区别？比如ArrayList和ArrayList。没有答案，内心依然模糊（2024.7.25）。（2024.7.26）首先ArrayList已经是一个具体的类了，根据多态只能传递本类及其子类对象，但是ArrayList还是一个泛
mysql数据库解析树形参数 fengzelun mysql相关数据库 mysql database
一、前言因为项目数据的地址是树形，格式：440000;440300;440312;659971;查询出的数据又需要转为中文：XXX省XXX市XXX区欢乐港湾东岸L2-016所以需要借助sql存储过程实现二、思路把要读取数据的所有地址编码都查询出来解析地址编码，因为地址编码是分号分隔，所有根据分号循环每个编码解析，解析后再拼接把解析好的地址编码和地址名称存入一张数据表（存的时候利用唯一索引去重）业务
MySQL主从同步复制实现 MostSnails sharding 数据库 mysql
MySQL主从同步复制实现一.概念1.数据库一主多从高性能:单点分散到多台机器上。备份:等同于实现Backup。负载均衡:若主挂掉，切换一台Slave机器作为Mater。若Slave挂掉，还有其他Slave支持。二.实现原理1.Mater将变更记录到二进制日志BinaryLog中，Mysql根据事物提交顺序依次记录2.Slave从库两个线程（I/Othread、SQLthread），IO请求主库获
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

jackrabbit in action seven（索引合并（上））

你可能感兴趣的:(jackrabbit in action seven（索引合并（上））)