l294265421

Heritrix3.3.0源码阅读种子模块(观察者模式实践)

种子模块从外部加载种子，并把种子发布给所有需要种子的对象。我们将会看到，这个模块是以观察者模式的形式实现的。本文不会讲到种子的具体加载过程，也不会讲到种子的消费过程，而只会讲种子模块本身，也就是该模块各个类的具体实现及组织方式。让我们开始吧。

“种子模块”是该模块一个抽象类的名称，其它具体类都必须继承它。该类源码如下：

package org.archive.modules.seeds;

import java.io.File;
import java.io.Serializable;
import java.util.HashSet;
import java.util.Set;

import org.archive.modules.CrawlURI;
import org.springframework.beans.factory.annotation.Autowired;

public abstract class SeedModule implements Serializable
{
    private static final long serialVersionUID = 1L;
    
    /**
     * Whether to tag seeds with their own URI as a heritable 'source' String,
     * which will be carried-forward to all URIs discovered on paths originating
     * from that seed. When present, such source tags appear in the
     * second-to-last crawl.log field.
     * 
     * 是否把种子作为可继承的源字符串，如果是，这个源字符串将被添加到所有以这个种子开始的路径
     * 上发现的URI。
     */
    protected boolean sourceTagSeeds = false;
    public boolean getSourceTagSeeds() {
        return sourceTagSeeds;
    }
    public void setSourceTagSeeds(boolean sourceTagSeeds) {
        this.sourceTagSeeds = sourceTagSeeds;
    }
    
    // 这个种子模块是一个主题，这里保存这个主题的所有观察者
    protected Set<SeedListener> seedListeners = 
        new HashSet<SeedListener>();
    public Set<SeedListener> getSeedListeners() {
        return seedListeners;
    }
    @Autowired
    public void setSeedListeners(Set<SeedListener> seedListeners) {
        this.seedListeners.addAll(seedListeners);
    }
    
    /**
     * 通知所有观察者
     * @param curi
     */
    protected void publishAddedSeed(CrawlURI curi) {
        for (SeedListener l: seedListeners) {
            l.addedSeed(curi);
        }
    }
    protected void publishNonSeedLine(String line) {
        for (SeedListener l: seedListeners) {
            l.nonseedLine(line);
        }
    }
    protected void publishConcludedSeedBatch() {
        for (SeedListener l: seedListeners) {
            l.concludedSeedBatch();
        }
    }

    public SeedModule() {
        super();
    }
    
    public abstract void announceSeeds();
    
    public abstract void actOn(File f); 
    
    public abstract void addSeed(final CrawlURI curi);

    /**
     * 注册观察者
     * @param sl
     */
    public void addSeedListener(SeedListener sl) {
        seedListeners.add(sl);
    }
}

从源码和注释中，我们可以看出，这个类就是观察者模式中的“主题”。seedListeners域用于保存注册的观察者。setSeedListeners和addSeedListener方法分别用于批量和单个观察者注册。publishAddedSeed，publishNonSeedLine和publishConcludedSeedBatch用于向观察者发布消息，是通过调用观察者相应的方法来实现的。publishAddedSeed用于发布种子；publishNonSeedLine用于发布不是种子的行；publishConcludedSeedBatch用于让监听者对种子做一些事情。前两个方法的作用在接下来的SeedModule的子类TextSeedModule的分析中就会变得很清晰；而publishConcludedSeedBatch方法的作用只有在分析具体的监听者实现时才能明白，而具体的监听者实现在本文不会涉及。

接下来我们来瞟一眼观察者接口SeedListener的定义，它里面包含了我们之前说过的“观察者相应的方法”的定义：

import org.archive.modules.CrawlURI;

/**
 * Implemented by components which want notifications of 
 * seed list changes.
 * 
 * 那些想在种子列表改变后获得通知的类实现这个接口（成为观察者）。
 * @author gojomo
 */
public interface SeedListener {
    void addedSeed(final CrawlURI uuri);
    boolean nonseedLine(String line);
    void concludedSeedBatch();
}

接下来，我们看看SeedModule的具体子类TextSeedModule：

package org.archive.modules.seeds;

import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.Reader;
import java.io.Writer;
import java.util.Iterator;
import java.util.concurrent.CountDownLatch;
import java.util.logging.Level;
import java.util.logging.Logger;

import org.apache.commons.httpclient.URIException;
import org.apache.commons.io.IOUtils;
import org.archive.io.ReadSource;
import org.archive.modules.CrawlURI;
import org.archive.modules.SchedulingConstants;
import org.archive.net.UURI;
import org.archive.net.UURIFactory;
import org.archive.spring.WriteTarget;
import org.archive.util.ArchiveUtils;
import org.archive.util.DevUtils;
import org.archive.util.iterator.LineReadingIterator;
import org.archive.util.iterator.RegexLineIterator;
import org.springframework.beans.factory.annotation.Required;

/**
 * Module that announces a list of seeds from a text source (such
 * as a ConfigFile or ConfigString), and provides a mechanism for
 * adding seeds after a crawl has begun.
 * 
 * 该模块从一个文本源获得种子，并且提供了在爬取开始之后添加种子的机制
 *
 * @contributor gojomo
 */
public class TextSeedModule extends SeedModule 
implements ReadSource {
    private static final long serialVersionUID = 3L;

    private static final Logger logger =
        Logger.getLogger(TextSeedModule.class.getName());

    /**
     * Text from which to extract seeds
     * 从文本中抽取种子
     */
    protected ReadSource textSource = null;
    public ReadSource getTextSource() {
        return textSource;
    }
    @Required
    public void setTextSource(ReadSource seedsSource) {
        this.textSource = seedsSource;
    }
    
    /**
     * Number of lines of seeds-source to read on initial load before proceeding
     * with crawl. Default is -1, meaning all. Any other value will cause that
     * number of lines to be loaded before fetching begins, while all extra
     * lines continue to be processed in the background. Generally, this should
     * only be changed when working with very large seed lists, and scopes that
     * do *not* depend on reading all seeds. 
     * 
     * 在抓取之前，最初从seeds-source加载进来的行数。默认值是-1，意味着加载所有。任何其它值
     * 将会导致那个数量的行在抓取开始之前被加载进来，然而其余的行在后台被处理。通常情况下，这个
     * 值只有在有很多种子或者不依赖于读取所有种子的情况下才需要改变。
     */
    protected int blockAwaitingSeedLines = -1;
    public int getBlockAwaitingSeedLines() {
        return blockAwaitingSeedLines;
    }
    public void setBlockAwaitingSeedLines(int blockAwaitingSeedLines) {
        this.blockAwaitingSeedLines = blockAwaitingSeedLines;
    }

    public TextSeedModule() {
    }

    /**
     * Announce all seeds from configured source to SeedListeners 
     * (including nonseed lines mixed in). 
     * 
     * 向所有种子观察者宣布来源于配置源的所有种子
     * @see org.archive.modules.seeds.SeedModule#announceSeeds()
     */
    public void announceSeeds() {
        if(getBlockAwaitingSeedLines()>-1) {
            final CountDownLatch latch = new CountDownLatch(getBlockAwaitingSeedLines());
            new Thread(){
                @Override
                public void run() {
                    announceSeeds(latch); 
                    while(latch.getCount()>0) {
                        latch.countDown();
                    }
                }
            }.start();
            try {
                latch.await();
            } catch (InterruptedException e) {
                // do nothing
            } 
        } else {
            announceSeeds(null); 
        }
    }
    
    protected void announceSeeds(CountDownLatch latchOrNull) {
        BufferedReader reader = new BufferedReader(textSource.obtainReader());       
        try {
            announceSeedsFromReader(reader,latchOrNull);    
        } finally {
            IOUtils.closeQuietly(reader);
        }
    }
            
    /**
     * Announce all seeds (and nonseed possible-directive lines) from
     * the given Reader
     * @param reader source of seed/directive lines
     * @param latchOrNull if non-null, sent countDown after each line, allowing 
     * another thread to proceed after a configurable number of lines processed
     */
    protected void announceSeedsFromReader(BufferedReader reader, CountDownLatch latchOrNull) {
        String s;
        Iterator<String> iter = 
            new RegexLineIterator(
                    new LineReadingIterator(reader),
                    RegexLineIterator.COMMENT_LINE,
                    RegexLineIterator.NONWHITESPACE_ENTRY_TRAILING_COMMENT,
                    RegexLineIterator.ENTRY);

        int count = 0; 
        while (iter.hasNext()) {
            s = (String) iter.next();
            if(Character.isLetterOrDigit(s.charAt(0))) {
                // consider a likely URI
                seedLine(s);
                count++;
                if(count%20000==0) {
                    System.runFinalization();
                }
            } else {
                // report just in case it's a useful directive
                nonseedLine(s);
            }
            if(latchOrNull!=null) {
                latchOrNull.countDown(); 
            }
        }
        publishConcludedSeedBatch(); 
    }
    
    /**
     * Handle a read line that is probably a seed.
     * 
     * 处理可能是种子的读入行
     * @param uri String seed-containing line
     */
    protected void seedLine(String uri) {
        if (!uri.matches("[a-zA-Z][\\w+\\-]+:.*")) { // Rfc2396 s3.1 scheme,
                                                     // minus '.'
            // Does not begin with scheme, so try http://
            uri = "http://" + uri;
        }
        try {
            UURI uuri = UURIFactory.getInstance(uri);
            CrawlURI curi = new CrawlURI(uuri);
            curi.setSeed(true);
            curi.setSchedulingDirective(SchedulingConstants.MEDIUM);
            if (getSourceTagSeeds()) {
                curi.setSourceTag(curi.toString());
            }
            publishAddedSeed(curi);
        } catch (URIException e) {
            // try as nonseed line as fallback
            nonseedLine(uri);
        }
    }
    
    /**
     * Handle a read line that is not a seed, but may still have
     * meaning to seed-consumers (such as scoping beans). 
     * 
     * 处理一个不是种子但是对种子消费者还是有意义的的读入行
     * @param uri String seed-containing line
     */
    protected void nonseedLine(String line) {
        publishNonSeedLine(line);
    }
    
    /**
     * Treat the given file as a source of additional seeds,
     * announcing to SeedListeners.
     * 
     * 从一个给定文件读取种子，并告知给监听者
     * @see org.archive.modules.seeds.SeedModule#actOn(java.io.File)
     */
    public void actOn(File f) {
        BufferedReader reader = null;
        try {
            reader = ArchiveUtils.getBufferedReader(f);
            announceSeedsFromReader(reader, null);    
        } catch (IOException ioe) {
            logger.log(Level.SEVERE,"problem reading seed file "+f,ioe);
        } finally {
            IOUtils.closeQuietly(reader);
        }
    }

    /**
     * Add a new seed to scope. By default, simply appends
     * to seeds file, though subclasses may handle differently.
     *
     * <p>This method is *not* sufficient to get the new seed 
     * scheduled in the Frontier for crawling -- it only 
     * affects the Scope's seed record (and decisions which
     * flow from seeds). 
     * 
     * 添加一个新的种子。默认情况下，只是把种子放到种子文件后面，子类
     * 可以有不同的处理方式。
     * 
     * 这个方法不能使新的种子被Frontier调度。也就是说，新的种子被当做普通
     * 的种子对待。
     *
     * @param curi CandidateUri to add
     * @return true if successful, false if add failed for any reason
     */
    @Override
    public synchronized void addSeed(final CrawlURI curi) {
        if(!(textSource instanceof WriteTarget)) {
            // TODO: do something else to log seed update
            logger.warning("nowhere to log added seed: "+curi);
        } else {
            // TODO: determine if this modification to seeds file means
            // TextSeedModule should (again) be Checkpointable
            try {
                Writer fw = ((WriteTarget)textSource).obtainWriter(true);
                // Write to new (last) line the URL.
                fw.write("\n");
                fw.write("# Heritrix added seed " +
                    ((curi.getVia() != null) ? "redirect from " + curi.getVia():
                        "(JMX)") + ".\n");
                fw.write(curi.toString());
                fw.flush();
                fw.close();
            } catch (IOException e) {
                DevUtils.warnHandle(e, "problem writing new seed");
            }
        }
        publishAddedSeed(curi); 
    }

    public Reader obtainReader() {
        return textSource.obtainReader();
    }
    
}

在这个类中，announceSeeds用于发布消息，具体是通过这个流程实现的：announceSeeds()调用announceSeeds(CountDownLatch latchOrNull)，announceSeeds(CountDownLatch latchOrNull)调用announceSeedsFromReader(BufferedReader reader, CountDownLatch latchOrNull)，announceSeedsFromReader(BufferedReader reader, CountDownLatch latchOrNull)调用seedLine(String uri)、nonseedLine(String line)和publishConcludedSeedBatch()，seedLine(String uri)调用publishAddedSeed(CrawlURI curi)和publishNonSeedLine(String line)。除此之外，还有两个方法值得关注，那就是actOn(File f)和addSeed(final CrawlURI curi)。前者用于从一个种子文件中读取信息，并把读到的信息发布出去，这个方法是下一篇文章将要讲到的爬虫在开始工作之后从指定目录加载种子文件的关键；而后者用于向种子列表添加一个种子。

以上讲的种子模块，其实就是Heritrix的org.archive.modules.seeds包下的三个类。

一款色彩绚丽的个人主页源码酷爱码 html HTML
源码介绍一款色彩绚丽的个人主页源码，源码由HTML+CSS+JS组成，记事本打开源码文件可以进行内容文字之类的修改，双击html文件可以本地运行效果效果预览源码获取一款色彩绚丽的个人主页源码
HTML5期末大作业：基于 html css js仿腾讯课堂首页 web学生网页设计 web前端 css dreamweaver html html5期末作业
精彩专栏推荐文末获取联系✍️作者简介:一个热爱把逻辑思维转变为代码的技术博主作者主页:【主页——获取更多优质源码】web前端期末大作业：【毕设项目精品实战案例(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】超炫酷的Echarts大屏可视化源码：【Echarts大屏展示大数据平台可视化(150套)】HTML+CSS+JS实例代码：【️HTML+CSS+JS实例代码
工程项目管理系统源码与Spring Cloud：实现高效系统管理与二次开发微服务技术分享 spring cloud java 企业工程管理系统源码工程项目管理系统源码工程管理系统源码
随着企业规模的不断扩大和业务的快速发展，传统的工程项目管理方式已经无法满足现代企业的需求。为了提高工程管理效率、减轻劳动强度、提高信息处理速度和准确性，企业需要借助先进的数字化技术进行转型。本文将介绍一款采用SpringCloud+SpringBoot+Mybatis技术框架的工程项目管理系统，该系统涵盖了项目管理、合同管理、预警管理、竣工管理、质量管理等多个方面，通过数据字典、编码管理、用户管理
Objective-C实现NLP中文分词（附完整源码）源代码大师 Objective-C实战教程自然语言处理 objective-c 中文分词
Objective-C实现NLP中文分词实现中文分词（NLP中的重要任务之一）在Objective-C中需要处理文本的切分和识别词语边界。尽管Objective-C在自然语言处理（NLP）领域并不常见，但通过合理的算法设计和数据结构，可以实现基本的中文分词功能。本文将介绍如何使用基于字典的最大匹配算法（MaximumMatchingAlgorithm），例如正向最大匹配（ForwardMaximu
细说单链表、双向链表、LinkedList类（附 add 源码解读）和 ArrayList 和 LinkedList 的区别 —— 数据结构 honglan297 数据结构 Java 链表数据结构算法
前言：上一篇文章我们初步介绍了List以及ArrayList，我们不难发现使用ArrayList过程中，对元素进行操作可能会涉及到大量数据的改变，所以LinkedList“临危受命”，本篇文章将从链表的相关概念入手，对单向、双线链表进行模拟实现，再回到LinkedList集合内当中进行简单分析，最后结合上一篇文章，阐述四点LinkedList和ArrayLIst区别。如果有需要快速了解两者区别的朋
Buildroot 添加自定义模块-内置文件到文件系统 ansondroider Linux buildroot linux
目录概述实现步骤1.创建包目录和文件结构2.配置Config.in3.定义cp_bin_files.mk4.添加源文件`install.sh``my.conf`5.配置与编译概述Buildroot是一个高度可定制和模块化的嵌入式Linux构建系统，适用于从简单到复杂的各种嵌入式项目.buildroot的源码中buildroot/package下面放着应用软件的配置文件，每个应用软件的配置文件有Co
2025开源SCA工具推荐 | 组件依赖包安全风险检测利器程序员
软件成分分析（SoftwareCompositionAnalysis,SCA）是Gartner定义的一种应用程序安全检测技术，该技术用于分析开源软件以及第三方商业软件涉及的各种源码、模块、框架和库等，以识别和清点开源软件的组件及其构成和依赖关系，并检测是否存在已知的安全和功能漏洞、安全补丁是否已经过时或是否存在许可证合规或兼容性风险等安全问题，帮助确保企业软件供应链中组件的安全。OpenSCA是国
深入拆解Nightingale(一) weixin_47028810 夜莺运维 github 开源软件 golang
前言了解了一段时间的开源项目夜莺，虽说看了一些官方提供了文档和还有视频，并且有幸参加快猫的黄埔营培训，算是新手入门水平。还是存在很多问题不懂，我想关键应该其中细节并没有很了解，另一方面也听大佬说‘阅读优秀的源代码是软件工程师提高自己编程能力和学习开源框架的最佳手段之一’，所有我打算写一系列关于夜莺监控在源码级别的分析，希望能做到深入拆解的地步并且深入浅出的表达出来，哈哈哈。ps夜莺是源于滴滴，目前
[k8s源码]9.workqueue weixin_45396500 k8s源码 java 开发语言
client-go是一个库，提供了与KubernetesAPI服务器交互的基础设施。它提供了诸如Informer、Lister、ClientSet等工具，用于监听、缓存和操作Kubernetes资源。而自定义控制器则利用这些工具来实现特定的业务逻辑和自动化任务。业务逻辑实现：client-go不包含特定的业务逻辑。自定义控制器允许实现特定于您的应用程序或需求的逻辑。扩展Kubernetes：通过自
jlatexmath-android如何实现自定义渲染字符 sz_denny android
使用jlatexmath-android的过程，如果出现个别字符渲染不了，会导致无法显示常用的做法是新增自定义字体+切换系统默认字体渲染，下面我们介绍第2种方法。修改流程：1、到jlatexmath-android的官网下载源码到本地，导入到IDE2、找到这个类JLatexMathDrawable3、在这个方法做替换操作publicBuilder(Stringlatex){//把latext里面不
Python 网络爬虫入门全知道安年CJ Python python 爬虫开发语言运维 php 服务器
一、引言在当今数字化时代，网络上的数据量呈爆炸式增长。无论是进行数据分析、市场调研，还是开发智能应用，获取网络数据都变得极为重要。而Python网络爬虫就是一把打开网络数据宝库的利器。它能够自动地从网页中抓取我们需要的信息，为后续的数据处理和分析提供丰富的素材。本博客将带领大家逐步走进Python网络爬虫的精彩世界。二、网络爬虫基础概念（一）什么是网络爬虫网络爬虫，也称为网页蜘蛛，是一种按照一定的
基于springboot的在线小说阅读平台设计与实现-计算机毕业设计源码+LW文档 qq_375279829 计算机毕业设计程序源码 java spring boot java 数据库
开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：Maven3.3.9浏览器：谷歌浏览器数据库代码：DROPTABLEIFEXISTS`discussxiaoshuoxinxi`;/*!40101SET@saved_c
为什么选择Linux而放弃windows，比较Windows和Mac它出色的优势在哪儿？ MAX在码字程序人生程序员 Linux Windows Mac
前言：MacOS全封闭，只支持自家硬件，设计风格和使用体验比较独特；Windows半封闭，虽然源码不开放，但适配市面上几乎所有的x86机器，Windows和各家硬件厂商总体是合作共建生态圈，从市场份额看，Windows是个人电脑桌面操作系统的霸主；Linux内核开放、开源，可以基于Linux内核开发一系列各种各样的操作系统（其中最著名的是Android系统），支持x86、ARM等各种硬件，是目前嵌
android studio调用python_Android-Python混合开发 1 （java和python互相调用） weixin_39630095 android studio调用python
众所周知，python的语法简洁，并且拥有丰富强大的开源库，如果能把python移植到Android系统，能够用Android和python混合开发一款app,那就太酷了。要想移植python，得需要下载源码并且交叉编译才行。这个过程太复杂。在这里，介绍一款第三方，复杂的过程交给它处理，我们只需要处理逻辑相关的python代码即可。Chaquopy0x01集成1)打开项目根目录下的build.gr
基于微信小程序的毕业设计——花店管理系统（附源码+论文） picking_bananas 微信小程序课程设计小程序毕业设计
关键词：微信小程序；花店管理；花室管理；毕业；我们专注于软件开发工程领域，熟练掌握多种开发技术，包括基于SpringBoot、Vue.js、SSM框架的应用开发，以及针对AndroidAPP和微信小程序的开发。（具体流程参见文章最后段落）一、引言随着移动互联网的普及和微信小程序的崛起，越来越多的传统行业开始利用小程序进行数字化转型。花店作为一个具有浪漫和文化意义的行业，通过微信小程序可以更好地满足
基于微信小程序的设计—挂号管理系统设计（附论文+源码） picking_bananas 微信小程序小程序毕业设计课程设计
关键词：微信小程序；挂号管理；名医推荐；毕业；论文；我们专注于软件开发工程领域，熟练掌握多种开发技术，包括基于SpringBoot、Vue.js、SSM框架的应用开发，以及针对AndroidAPP和微信小程序的开发。（具体流程参见文章最后段落）一、引言随着移动设备的普及和微信小程序技术的发展，医疗服务的移动化已成为趋势。挂号是医疗服务中一个关键环节，对于患者来说，方便、快捷的挂号方式是他们所期待的
基于微信小程序的毕业设计——社区宠物管理系统（附源码+论文） picking_bananas 微信小程序课程设计宠物小程序
关键词：SpringBoot；宠物管理；宠物医院；宠物店管理；毕业；我们专注于软件开发工程领域，熟练掌握多种开发技术，包括基于SpringBoot、Vue.js、SSM框架的应用开发，以及针对AndroidAPP和微信小程序的开发。（具体流程参见文章最后段落）摘要随着移动互联网的普及，微信小程序因其便捷性受到了广大用户的青睐。本文旨在探讨如何利用微信小程序设计一个社区宠物管理系统，以提升社区居民对
【含文档+PPT+源码】基于小程序开发的宠物寄养平台管理系统编程毕设宠物 spring intellij-idea
项目介绍本课程演示的是一款基于小程序开发的宠物寄养平台管理系统，主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。1.包含：项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项目附带的源码资料可作为毕设使用宠物寄养平台的重要核心功能包括首页、系统公告管理、用户管理、帖子管理、系统公告管理、支付方式管理、购物车管理、系统公告帖子收藏管理
【FL0091】基于SSM和微信小程序的社区二手物品交易小程序猿毕设小程序微信小程序 spring boot python 后端 java
‍博主介绍‍全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/知乎/b站/华为云/阿里云等平台优质作者、专注于Java、小程序/APP、python、大数据等技术领域和毕业项目实战，以及程序定制化开发、文档编写、答疑辅导等。精彩专栏推荐订阅计算机毕业设计精品项目案例（持续更新）文末获取源码+数据库+文档感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以和学长沟
实现阅读器翻页效果鸿蒙示例代码
介绍本示例基于显式动画、List组件、drawing接口实现了阅读器上下翻页、左右覆盖翻页以及仿真翻页效果。实现阅读器翻页效果源码地址效果预览使用说明进入应用默认为仿真翻页，长按屏幕并滑动可实现翻页效果，点击屏幕中部区域，弹出翻页方式选择栏。选择上下翻页，显示上下翻页页面，支持上下滑动翻页。选择覆盖翻页，显示覆盖翻页页面。支持左右滑动翻页，以及点击屏幕左右侧后滑动翻页。实现思路上下翻页效果使用Li
解读 Uniapp：从入门到精通的底层原理 xcLeigh UniApp技术点解析 uni-app
解读Uniapp：从入门到精通的底层原理一、前言二、Uniapp与Vue.js的关系2.1Vue.js基础回顾2.2Uniapp对Vue.js的继承与扩展三、Uniapp的组件系统3.1组件的基本概念与创建3.2组件的生命周期四、数据绑定与响应式原理4.1数据绑定的实现方式4.2响应式原理剖析五、Uniapp的跨平台实现原理5.1多端编译机制5.2条件编译六、总结结束语优质源码分享解读Uniapp
alluxio 编译源码org.codehaus.mojo:buildnumber-maven-plugin 错误 weixin_40455124 大数据 alluxio buildnumber maven git
alluxio编译源码遇到如下错误[ERROR]Failedtoexecutegoalorg.codehaus.mojo:buildnumber-maven-plugin:1.4:create-metadata(default)onprojectalluxio-core-common:Executiondefaultofgoalorg.codehaus.mojo:buildnumber-maven
rocketmq-bashboard部署 ldlly0505 rocketmq java spring 开发语言
下载rocketmq可视化界面，源码地址：https://github.com/apache/rocketmq-dashboard修改application.yml配置文件端口为8089和namesrvAddrs，打包直接部署，结果拉取依赖报错，大概意思是maven-antrun-plugin仓库找不到，pom文件的maven-antrun-plugin这里改下：org.apache.maven.
由 Mybatis 源码畅谈软件设计（九）：“能用就行” 其实远远不够方圆想当图灵由 Mybatis 源码畅谈软件设计 mybatis java 开发语言代码规范
到本节Mybatis源码中核心逻辑基本已经介绍完了，在这里我想借助Mybatis其他部分源码来介绍一些我认为在编程中能最快提高编码质量的小方法，它们可能比较细碎，希望能对大家有所启发。关于方法的长度和方法拆分之前我在读完《代码整洁之道》时，非常痴迷于写小方法这件事，记得某次代码评审时，有同事对将一个大方法拆分成多个小方法提出了异议：拆分出的小方法不能算作做了一件事，它们都只是大方法中的一个“动作”
自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 python llama 开发语言
LLaMA3是继Mistral之后最有前途的开源模型之一，可以解决各种任务。我之前在Medium上写过一篇博客，介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的LLM。现在LLaMA-3已经发布，我们将以更简单的方式重新创建它。我们不会在本博客中使用GPU，但您至少需要17GB的RAM，因为我们将加载一些大小超过15GB的文件。如果这对您来说是个问题，您可以使用Kaggle作为解
STM32MP157A之U-boot移植学编程的小杨 stm32 嵌入式硬件单片机
（一）U-boot移植步骤1.1》导入源码1）打开ubuntu，打开终端（ctrl+alt+T），在用户目录下建立如下目录：linux@ubuntu:~$mkdirfs_mp157alinux@ubuntu:~$cdfs_mp157a/linux@ubuntu:~/fs_mp157a$mkdirkerneldriversfs_mp157a-----stm32mp157驱动开发总目录kernel--
QML实现自己的桌面萌宠源码分享小灰灰搞电子 QML开发数据库
一、效果展示1、撒娇2、拖动3、右下角效果二、源码分享1、工程目录2、主窗口源码Main.qmlimportQtQuickimportQtQuick.ControlsWindow{width:640height:480visible:truetitle:qsTr("HelloWorld")propertyQtObjectpetWindow:nullComponent.onCompleted:{va
2025年计算机毕业设计选题推荐、题目参考计算机Java毕业设计计算机毕设选题推荐案例 spring boot 课程设计 java 毕业设计毕设后端大数据
博主介绍：✌全网粉丝30W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者,计算机毕设实战导师。目前专注于大学生项目实战开发,讲解,毕业答疑辅导✌主要服务内容：选题定题、开题报告、任务书、程序开发、文档编写和辅导、文档降重、程序讲解、答辩辅导等，欢迎咨询~文末获取源码+数据库+文档感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及文档编写等相关问题都可以给我沟通，希望
【Linux知识】Linux上从源码编译到软件安装全过程详细说明问道飞鱼服务器相关 Linux相关技术 linux 运维服务器编译
文章目录**1.下载源码****(1)使用`wget`或`curl`下载****(2)解压源码****2.配置编译环境****(1)执行`./configure`脚本**常见参数说明：**3.编译源码****(1)执行`make`****4.安装软件****(1)执行`makeinstall`****(2)自定义安装路径****5.验证安装****(1)检查版本信息****(2)查看安装路径***
【Java设计模式】Java设计模式之（十五）策略模式（Strategy Pattern） No8g攻城狮 Java设计模式设计模式 java 开发语言
本文目录一、策略模式介绍1.1含义1.2适用场景1.3主要解决1.4应用实例1.5优缺点二、策略模式实现2.1类图2.2代码实现第一个案例：策略模式代码实现第二个案例：策略模式代码实现2.3角色分析三、源码分析这种类型的设计模式属于行为型模式。一、策略模式介绍1.1含义在策略模式（StrategyPattern）中，一个类的行为或其算法可以在运行时更改。这种类型的设计模式属于行为型模式。在策略模式
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/pwd@192.168.0.5:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

Heritrix3.3.0源码阅读 种子模块(观察者模式实践)

你可能感兴趣的:(源码,Heritrix,网络爬虫)

Heritrix3.3.0源码阅读种子模块(观察者模式实践)