AaronSimon

改善 Java 程序的151个建议之性能与开源工具

一、提升Java性能的基本方法

1.不要在循环条件中计算

如果在循环条件中计算，则每循环一次就要遍历一次，这会降低系统的效率，例如如下代码：

while(i < count*2){
    //do something
}

应该修改为

int total = count * 2;
while(i < count){
    //do something
}

2.尽可能把变量、方法声明为final static类型

假设要将阿拉伯数字转化为中文数字，其定义如下：

public String toChineseNum(int num){
    //中文数字
    String[] cns = {"零","壹",...};
    return cns[num];
}

每次调用方法时都会重新生成一个cns数组，注意数组不会改变，属于不变数组，在这种情况下把它声明为类变量，并且加上final static修饰会更合适，有助于提高系统性能。

    //中文数字
final static String[] cns = {"零","壹",...};
public String toChineseNum(int num){
    return cns[num];
}

3.缩小变量的作用范围

关于变量，能定义在方法内的就定义在方法内，能定义在循环体内的就定义在循环体内，其目的是加快GC的回收

4.频繁字符串使用StringBuilder或StringBuffer

5.使用非线性检索

如果在ArrayList中存储了大量的数据，使用indexOf查找元素会比java.utils.Collections.binarySearch的效率低很多，原因是binarySearch是二分法搜索法，而indexOf使用的是逐个元素比对的方法，但是binarySearch搜索时必须先对元素进行排序

6.覆写Exception的fillInStackTrace方法

fillInStackTrace方法是用来记录异常时的栈信息的，这是一个非常耗时的动作，如果不关注栈信息，可以覆盖之，进而提升系统性能

二、若非必要，不要克隆对象

通过clone方法生成对象时，就会不再执行构造函数，只是内存中数据块的拷贝，但是一般情况下clone的性能要比new的性能好很多，原因如下：

构造函数简单，JVM对new做了大量的性能优化

clone方法一般用于构造函数比较复杂的情况，对象属性比较多。

三、推荐使用Guava扩展工具包

说起Guava(石榴)，可能知道它的读者并不多，要是说起Google-collections，相信大部分读者都有所耳闻。2008年Google发布了Google-collections扩展工具包，主要是对JDK的Collection包进行了扩展，2010年Google发布了Guava项目，其中包含了collections、caching、primitives support、concurrency libraries、common annotations、I/O等，这些都是项目编码中的基本工具包，我们大致浏览一下它的主要功能。

1.Collections

com. google.common.collect包中主要包括四部分：不可变集合(Immutable Collections)、多值Map、Table表和集合工具类。

不可变集合

不可变集合包括ImmutableList、ImmutableMap、ImmutableSet、ImmutableSortedMap、ImmutableSortedSet等，它比不可修改集合(Unmodifiable Collections)更容易使用，效率更高，而且占用的内存更少。示例代码如下：

//不可变列表
ImmutableList list = ImmutableList.of("A","B","C");
//不可变Map
ImmutableMap map = ImmutableMap.of(1,"壹",2,"贰",3,"叁");

其中的of方法有多个重载，其目的就是为了便于在初始化的时候直接生成一个不可变集合。

多值Map

多值Map比较简单，在JDK中，Map中的一个键对应一个值，在put一个键值对时，如果键重复了，则会覆盖原有的值，在大多数情况下这比较符合实际应用，但有的时候确实会存在一个键对应多个值的情况，比如我们的通讯录，一个人可能会对应两个或三个号码，此时使用JDK的Map就有点麻烦了。在这种情况下，使用Guava的Multimap可以很好地解决问题，代码如下：

//多值Map
MultimapphoneBook=ArrayListMultimap.create();
phoneBook.put("张三","110");
phoneBook.put("张三","119");
System.out.println(phoneBook.get("张三"));

输出的结果是一个包含两个元素的Collection，这是一种很巧妙的处理方式，可以方便地解决我们开发中的问题。

Table表

在GIS(Geographic Information System，地理信息系统)中，我们经常会把一个地点标注在一个坐标上，比如把上海人民广场标注在北纬31.23、东经121.48的位置上，也就是说只要给出了准确的经度和纬度就可以进行精确的定位——两个键决定一个值，这在Guava中是使用Table来表示的，示例代码如下：

Table g =HashBasedTable.create();
//定义人民广场的经纬度坐标
g.put(31.23,121.48,"人民广场");
//输出坐标点的建筑物
g.get(31.23,121.48);

其实Guava的Table类与我们经常接触的DBRMS表非常类似，可以认为它是一个没有Schema限定的数据表，比如：

//Table，完全类似于数据库表
Table user = HashBasedTable.create();
//第一行、第一列的值是张三
user.put(1,1,"张三");
//第一行、第二列的值是李四
user.put(1,2,"李四");
//第一行第一列是谁
user.get(1,1);

集合工具类

Guava的集合工具类分得比较细，比如Lists、Maps、Sets分别对应的是List、Map、Set的工具类，它们的使用方法比较简单，比如Map的过滤，如下所示。

//姓名、年龄键值对
Map user = new HashMap();
user.put("张三",20);
user.put("李四",22);
user.put("王五",25);
//所有年龄大于20岁的人员
Map filtedMap = Maps.flterValues(user,new Predicate(){
    public boolean apply(Integer_age){
        return_age>20;
    }
});

2.字符串操作

Guava提供了两个非常好用的字符串操作工具：Joiner连接器和Splitter拆分器。当然，字符串的连接和拆分使用JDK的方法也可以实现，但是使用Guava更简单一些，比如字符串的连接，代码如下所示：

//定义连接符号
Joiner joiner=Joiner.on(",");
//可以连接多个对象，不局限于String;如果有null，则跳过
String str=joiner.skipNulls().join("嘿","Guava很不错的。");
Map map = new HashMap();
map.put("张三","普通员工");
map.put("李四","领导");
//键值之间以"是"连接，多个键值以空格分隔
System.out.println(Joiner.on("\r\n").withKeyValueSeparator("是").join(map));

Joiner不仅能够连接字符串，还能够把Map中的键值对串联起来，比直接输出Map优雅了许多。Splitter是做字符拆分的，使用方法也比较简单，示例代码如下：

String str="你好，Guava";  
//以"，"中文逗号分隔  
for(String s : Splitter.on("，").split(str)){  
    System.out.println(s); 
}  
//按照固定长度分隔  
for(String s：Splitter.fixedLength(2).split(str)){  
    System.out.println(s);  
}

注意fixedLength方法，它是按照给定长度进行拆分的，比如在进行格式化打印的时候，一行最大可以打印120个字符，此时使用该方法就非常简单了。

3.基本类型工具

基本类型工具在primitives包中，是以基本类型名+s的方式命名的，比如Ints是int的工具类，Doubles是double的工具类，注意这些都是针对基本类型的，而不是针对包装类型的。如下代码所示:

intints={10,9,20,40,80};
//从数组中取出最大值
System.out.println(Ints.max(ints));
List integers = new ArrayList();
//把包装类型的集合转为基本类型数组
ints = Ints.toArray(integers);

Guava还提供了其他操作(如I/O操作)，相对来说功能不是非常强大，不再赘述，读者有兴趣可以自行下载源码研究一番。

四、Apache扩展包

Apache Commons通用扩展包基本上是每个项目都会使用的，只是使用的多少不同而已。

1.Lang

Apache Lang在开发中是最常使用的，更新频率很高

字符串操作工具类：诸如StringUtils(基本的String操作类)、StringEscapeUtils(String的转义工具)、RandomStringUtils(随机字符串工具)等
Object工具类：覆写equals、hashCode,toString方法会用到
可变的基本类型：包装类型的运算会用到
其它Utils工具：日期方面主要提供DateUtils和DateFormatUtils两个工具类，没有Joda强大

2.BeanUtils

它是JavaBean的操作工具包，不仅可以实现属性的拷贝，转换等，还可以建立动态的Bean,甚至加你一些自由度很高的bean

属性拷贝：PO与VO之间的转换
动态Bean和自由Bean
转换器

3.Collections

Collections工具包提供了ListUtils、MapUtils等基本集合操作工具

Bag：可以荣南重复元素，提供重复统计的功能
lazy系列
双向Map：key和value都是唯一的

五、推荐使用Joda日期时间扩展包

开发一个项目必然要和日期时间打交道，特别是一些全球性的项目，必须要考虑语言和时区问题，但是在JDK中，日期时间的操作比较麻烦，例如1000小时后是星期几，伦敦时间是几点等，这里介绍一下通过Joda开源包来操作时间的方法，非常简单方便。

1.本地格式的日期时间

依据操作系统或指定的区域输出日期或时间，例如：

//当前时间戳
DateTime dt=new DateTime();
//输出英文星期
dt.dayOfWeek().getAsText(Locale.ENGLISH);
//本地日期格式
dt.toLocalDate();
//日期格式化
dt.toString(DateTimeFormat.forPattern("yyyy年M月d日"));

2.日期计算

这是Joda最方便的地方，也是JDK最麻烦的地方，比如我们要计算100天后是星期几，直接使用JDK提供的日期类会非常麻烦，使用Joda就简单很多，例如：

//当前时间戳
DateTime dt=new DateTime();
//加100小时是星期几
dt.plusHours(100).dayOfWeek();
//100天后的日期
dt.plusDays(100).toLocalDate();
//10年前的今天是星期几
dt.minusYears(10).dayOfWeek().getAsText();
//离地球毁灭还有多少小时
Hours.hoursBetween(dt, new DateTime("2012-12-21")).getHours();

这里需要注意的是，DateTime是一个不可变类型，与String非常类似，即使通过plusXXX、minusXX等方法进行操作，dt对象仍然不会变，只是新生成一个DateTime对象而已。但是，Joda也提供了一个可变类型的日期对象：MutableDateTime类，这样，日期的加减操作就更加方便了，比如列出10年内的黑色星期五，实现代码如下(此实现若用JDK的类来计算会异常复杂，读者可以尝试一下)：

//当前可变时间
MutableDateTime mdt=new MutableDateTime();
//10年后的日期
DateTime destDateTime=dt.plusYears(10);
while(mdt.isBefore(destDateTime)){
    //循环一次加1天
    mdt.addDays(1);
    //是13号，并且是星期五
    if(mdt.getDayOfMonth() == 13 && mdt.getDayOfWeek()==5){
    //打印出10年内所有的黑色星期五
        System.out.println("黑色星期五:" + mdt);
    }
}

3.时区时间

这个比较简单实用，给定一个时区或地区代码即可计算出该时区的时间，比如在一个全球系统中，数据库中全部是按照标准时间来记录的，但是在展示层要按照不同的用户、不同的时区展现，这就涉及时区计算了，代码如下：

//当前时间戳
DateTime dt=new DateTime();
//此时伦敦市的时间
dt.withZone(DateTimeZone.forID("Europe/London"));
//计算出标准时间
dt.withZone(DateTimeZone.UTC);

Joda还有一个优点，它可以与JDK的日期库方便地进行转换，可以从java.util.Date类型转为Joda的DateTime类型，也可以从Joda的DateTime转为java.util.Date，代码如下：

DateTime dt=new DateTime();
//Joda的DateTime转为JDK的Date
Date jdkDate=dt.toDate();
//JDK的Date转为Joda的DateTime
dt=new DateTime(jdkDate);

经过这样的转换，Joda可以很好地与现有的日期类保持兼容，在需要复杂的日期计算时使用Joda，在需要与其他系统通信或写到持久层中时则使用JDK的Date。Joda是一种令人惊奇的高效工具，无论是计算日期、打印日期，或是解析日期，Joda都是首选，当然日期工具类也可以选择date4j，它也是一个不错的开源工具，这里就不再赘述了。

六、可以选择多种Collection扩展

为什么这么多的开源框架热衷于Collections的扩展呢？是因为我们程序(经典的定义：程序=算法+数据结构，想想看数据结构是为谁而服务的)主要处理的是一大批数据，而能容纳大量数据的也就是Collections类和数组了，但是数据的格式具有多样性，比如数据映射关系多样，数据类型多样等，下面我们再介绍三个比较有个性的Collections扩展工具包。

1.fastutil

fastutil(按照Java的拼写规则应该为FastUtil，但是官网就是这样命名的，我们尊重官方)是一个更新比较频繁的工具包，它的最新版本是6.3，主要提供了两种功能：一种是限定键值类型(Type Specific)的Map、List、Set等，另一种是大容量的集合。我们先来看示例代码：

//明确键类型的Map
Int2ObjectMapmap=new Int2ObjectOpenHashMap();
map.put(100，"A");
//超大容量的List，注意调整JVM的Heap内存
BigListbigList=new ObjectBigArrayBigList(
1L+Integer.MAX_VALUE);
//基本类型的集合，不再使用Integer包装类型
IntArrayList arrayList=new IntArrayList();

这里要特别注意的是大容量集合，什么叫大容量集合呢？我们知道一个Collection的最大容量是Integer的最大值(2 147 483 647)，不能超过这个容量，一旦我们需要把一组超大的数据放到集合中，就必须要考虑对此进行拆分了，这会导致程序的复杂性提高，而fastutil则提供了Big系列的集合，它的最大容量是Long的最大值，这已经是一个非常庞大的数字了，超过这个容量基本上是不可能的。但在使用它的时候需要考虑内存溢出的问题，注意调节Java的mx参数配置。

2.Trove

Trove提供了一个快速、高效、低内存消耗的Collection集合，并且还提供了过滤和拦截的功能，同时还提供了基本类型的集合，示例代码如下：

//基本类型的集合，不使用包装类型
TIntList intList=new TIntArrayList();
//每个元素值乘以2
intList.transformValues(new TIntFunction(){
    public int execute(int element){
        return element*2;
    }
});
//过滤，把大于200的元素组成一个新的列表
TIntList t2=intList.grep(new TIntProcedure(){
    public boolean execute(int_element){
        return_element>200;
    }
});
//包装为JDK的List
Listlist=new TIntListDecorator(intList);
//键类型确定Map
TIntObjectMapmap=new TIntObjectHashMap();

Trove的最大优势是在高性能上，在进行一般的增加、修改、删除操作时，Trove的响应时间比JDK的集合少一个数量级，比fastutil也会高很多，因此在高性能项目中要考虑使用Trove。

3.lambdaj

lambdaj是一个纯净的集合操作工具，它不会提供任何的集合扩展，只会提供对集合的操作，比如查询、过滤、统一初始化等，特别是它的查询操作，非常类似于DBRMS上的SQL语句，而且也会提供诸如求和、求平均值等的方法，示例代码如下：

Listints=new ArrayList();
//计算平均值
Lambda.avg(ints);
//统计每个元素出现的次数，返回的是一个Map
Lambda.count(ints);
//按照年龄排序
Listpersons=new ArrayList();
Lambda.sort(persons, Lambda.on(Person.class).getAge()));
//串联所有元素的指定属性，输出为：张三，李四，王五
Lambda.joinFrom(persons).getName();
//过滤出年龄大于20岁的所用元素，输出为一个子列表
Lambda.select(persons, new BaseMatcher(){
    @Override
    public boolean matches(Object_person){
        Person p=(Person)_person;
        return p.getAge()>20;
    }
    public void describeTo(Description desc){
    }
});
//查找出最大年龄
Lambda.maxFrom(persons).getAge();
//抽取出所有姓名形成一个数组
Lambda.extract(persons, Lambda.on(Person.class).getName()));

lambdaj算是一个比较年轻的开源工具，但是它符合开发人员的习惯，对集合的操作提供了"One Line"式的解决方法，可以大大缩减代码的数量，而且也不会导致代码的可读性降低，读者可以在下一个项目中使用此类开源工具。

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
设计模式之建造者模式(通俗易懂--代码辅助理解【Java版】） ok!ko 设计模式设计模式建造者模式 java
文章目录设计模式概述1、建造者模式2、建造者模式使用场景3、优点4、缺点5、主要角色6、代码示例：1）实现要求2）UML图3)实现步骤：1）创建一个表示食物条目和食物包装的接口2）创建实现Packing接口的实体类3）创建实现Item接口的抽象类，该类提供了默认的功能4）创建扩展了Burger和ColdDrink的实体类5）创建一个Meal类，带有上面定义的Item对象6）创建一个MealBuil
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =