JAVA 开发规范
一、编程规约
(一)命名规约
1. 【强制】 代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符 号结束。
反例:_name / __name / $Object / name_ / name$ / Object$
2. 【强制】 代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的 方式。说明:正确的英文拼写和语法可以让阅读者易于理解,避免歧义。注意,即使纯 拼音命名方式也要避免采用。
反例:DaZhePromotion [打折]/getPingfenByName() [评分]/int 某变量 = 3 正 例:alibaba/taobao/youku/hangzhou 等国际通用的名称,可视同英文。
3. 【强制】类名使用 UpperCamelCase 风格,必须遵从驼峰形式,但以下情形例外:(领 域模型的相关命名)DO/ BO / DTO /VO 等。
正例:MarcoPolo/UserDO/XmlService/TcpUdpDeal/TaPromotion 反例:macroPolo/UserDo/XMLService/TCPUDPDeal/TAPromotion
4. 【强制】方法名、参数名、成员变量、局部变量都统一使用 lowerCamelCase 风 格,必须遵从驼峰形式。
正例:localValue /getHttpMessage() /inputUserId
5. 【强制】常量命名全部大写,单词间用下划线隔开,力求语义表达完整清楚,不要嫌名 字长。
正例:MAX_STOCK_COUNT 反例:MAX_COUNT
6. 【强制】抽象类命名使用 Abstract 或 Base 开头;异常类命名使用 Exception 结 尾;测试类命名以它要测试的类的名称开始,以 Test 结尾。
7. 【强制】中括号是数组类型的一部分,数组定义如下:String[]args;
反例:请勿使用 String args[]的方式来定义。
8. 【强制】POJO 类中布尔类型的变量,都不要加 is,否则部分框架解析会引起序列化错 误。
反例:定义为基本数据类型 boolean isSuccess;的属性,它的方法也是 isSuccess(),RPC 框架在反向解析的时候,“以为”对应的属性名称是 success,导致 属性获取不到,进而抛出异常。
9. 【强制】包名统一使用小写,点分隔符之间有且仅有一个自然语义的英语单词。包名 统一使用单数形式,但是类名如果有复数含义,类名可以使用复数形式。
正例:应用工具类包名为 com.alibaba.open.util、类名为 MessageUtils(此规则参
考 spring 的框架结构)
10. 【强制】杜绝完全不规范的缩写,避免望文不知义。
反例:AbstractClass“缩写”命名成 AbsClass;condition“缩写”命名成 condi,此
类随意缩写严重降低了代码的可阅读性。 11. 【推荐】如果使用到了设计模式,建议在类名中体现出具体模式。
说明:将设计模式体现在名字中,有利于阅读者快速理解架构设计思想。 正例:public class OrderFactory; public class LoginProxy; public class ResourceObserver;
1) 【强制】对于 Service 和 DAO 类,基于 SOA 的理念,暴露出来的服务一定是接口, 内部的实现类用 Impl 的后缀与接口区别。
正例:CacheServiceImpl 实现 CacheService 接口。
2) 【推荐】 如果是形容能力的接口名称,取对应的形容词做接口名(通常是–able 的形式)。
正例:AbstractTranslator 实现 Translatable。
14. 【参考】枚举类名建议带上 Enum 后缀,枚举成员名称需要全大写,单词间用下划线隔 开。
说明:枚举其实就是特殊的常量类,且构造方法被默认强制是私有。 正例:枚举名字:DealStatusEnum,成员名称:SUCCESS/UNKOWN_REASON。
15. 【参考】各层命名规约:
A. Service/DAO 层方法命名规约
B. 领域模型命名规约
1) 数据对象:xxxVO,xxx 即为数据表名。
(二)常量定义
1. 【强制】不允许出现任何魔法值(即未经定义的常量)直接出现在代码中。
反例:
String key="Id#taobao_"+tradeId; cache.put(key,value);
2. 【强制】long 或者 Long 初始赋值时,必须使用大写的 L,不能是小写的 l,小写容易跟 数字 1 混淆,造成误解。
说明:Long a= 2l;写的是数字的 21,还是 Long 型的 2?
反例:易懂变量也要统一定义成应用内共享常量,两位攻城师在两个类中分别定义 了表示“是”的变量: 类 A 中:public static final String YES= "yes"; 类 B 中:public static final String YES= "y";
A.YES.equals(B.YES),预期是 true,但实际返回为 false,导致产生线上问题。
5. 【推荐】如果变量值仅在一个范围内变化用 Enum 类。如果还带有名称之外的延伸属 性,必须使用 Enum 类,下面正例中的数字就是延伸信息,表示星期几。
正例:
public Enum{
MONDAY(1),TUESDAY(2),WEDNESDAY(3),THURSDAY(4),FRIDAY(5),SATURDAY(6),SUNDA Y(7);
}
(三)格式规约
1. 【强制】大括号的使用约定。如果是大括号内为空,则简洁地写成{}即可,不需要换 行;如果是非空代码块则:
1)左大括号前不换行。 2)左大括号后换行。 3)右大括号前换行。 4)右大括号后还有 else 等代码则不换行;表示终止右大括号后必须换行。
2. 【强制】 左括号和后一个字符之间不出现空格;同样,右括号和前一个字符之间也不 出现空格。详见第 5 条下方正例提示。
3. 【强制】if/for/while/switch/do 等保留字与左右括号之间都必须加空格。 4. 【强制】任何运算符左右必须加一个空格。
说明:运算符包括赋值运算符=、逻辑运算符&&、加减乘除符号、三目运行符等。
5. 【强制】缩进采用 4 个空格,禁止使用 tab 字符。
说明:如果使用 tab 缩进,必须设置 1 个 tab 为 4 个空格。IDEA 设置 tab 为 4 个空格时,请勿勾选 Use tab character insert spaces for tabs ;而在 eclipse 中,必须勾选。
正例:(涉及 1-5 点)
public static void main(String args[]) {
//缩进 4 个空格
String say = "hello";
//运算符的左右必须有一个空格
int flag = 0;
//关键词 if 与括号之间必须有一个空格,括号内的 f 与左括号,0 与右括号不需要空格
if (flag == 0) {
System.out.println(say);
}
//左大括号前加空格且不换行;左大括号后换行
if (flag == 1) { System.out.println("world");
//右大括号前换行,右大括号后有 else,不用换行
} else {
}
System.out.println("ok");
//在右大括号后直接结束,则必须换行
}
6. 【强制】单行字符数限制不超过 120 个,超出需要换行,换行时遵循如下原则:
1) 第二行相对第一行缩进 4 个空格,从第三行开始,不再继续缩进,参考示例。 2) 运算符与下文一起换行。 3) 方法调用的点符号与下文一起换行。
4) 在多个参数超长,逗号后进行换行。 5) 在括号前不要换行,见反例。 正例: StringBuffer sb = new StringBuffer(); //超过 120 个字符的情况下,换行缩进 4 个空格,并且方法前的点符号一起换行 sb.append("zi").append("xin")...
.append("huang")... .append("huang")... .append("huang"); 反例:
StringBuffer sb = new StringBuffer();
//超过 120 个字符的情况下,不要在括号前换行 sb.append("zi").append("xin")...append("huang");
//参数很多的方法调用可能超过 120 个字符,不要在逗号前换行 method(args1, args2, args3, ..., argsX);
7. 【强制】方法参数在定义和传入时,多个参数逗号后边必须加空格。
正例:下例中实参的"a",后边必须要有一个空格。method("a", "b", "c");
8. 【强制】IDE 的 text file encoding 设置为 UTF-8; IDE 中文件的换行符使用 Unix 格式,不要使用 windows 格式。
9. 【推荐】没有必要增加若干空格来使某一行的字符与上一行的相应字符对齐。正例:
int a = 3; long b = 4L; float c = 5F; StringBuffer sb = new StringBuffer(); 说明:增加 sb 这个变量,如果需要对齐,则给 a、b、c 都要增加几个空格,在变量比较 多的情况下,是一种累赘的事情。
10. 【推荐】方法体内的执行语句组、变量的定义语句组、不同的业务逻辑之间或者不 同的语义之间插入一个空行。相同业务逻辑和语义之间不需要插入空行。说明:没 有必要插入多行空格进行隔开。
(四) OOP 规约
1. 【强制】避免通过一个类的对象引用访问此类的静态变量或静态方法,无谓增加编译 器解析成本,直接用类名来访问即可。
2. 【强制】所有的覆写方法,必须加@Override 注解。 反例:getObject()与 get0bject()的问题。一个是字母的 O,一个是数字的 0,加
@Override 可以准确判断是否覆盖成功。另外,如果在抽象类中对方法签名进行修
改,其实现类会马上编译报错。 3. 【强制】相同参数类型,相同业务含义,才可以使用 Java 的可变参数,避免使
用 Object。
说明:可变参数必须放置在参数列表的最后。(提倡同学们尽量不用可变参数编程) 正例:public User getUsers(String type, Integer... ids)
4. 【强制】对外暴露的接口签名,原则上不允许修改方法签名,避免对接口调用方产生 影响。接口过时必须加@Deprecated 注解,并清晰地说明采用的新接口或者新服务是 什么。
5. 【强制】不能使用过时的类或方法。 说明:java.net.URLDecoder 中的方法 decode(String encodeStr)这个方法已经过 时,应该使用双参数 decode(String source, String encode)。接口提供方既然明 确是过时接口,那么有义务同时提供新的接口;作为调用方来说,有义务去考证过时方 法的新实现是什么。
6. 【强制】Object 的 equals 方法容易抛空指针异常,应使用常量或确定有值的对象 来调用 equals。
正例:"test".equals(object); 反例:object.equals("test");说明:推荐使用 java.util.Objects#equals(JDK7 引 入的工具类)
7. 【强制】所有的相同类型的包装类对象之间值的比较,全部使用 equals 方法比 较。
说明:对于 Integer var=?在-128 至 127 之间的赋值,Integer 对象是在 IntegerCache.cache 产生,会复用已有对象,这个区间内的 Integer 值可以直接使 用==进行判断,但是这个区间之外的所有数据,都会在堆上产生,并不会复用已有对 象,这是一个大坑,推荐使用 equals 方法进行判断。
8. 【强制】关于基本数据类型与包装数据类型的使用标准如下:
1)所有的 POJO 类属性必须使用包装数据类型。 2)RPC 方法的返回值和参数必须使用包装数据类型。 3)所有的局部变量【推荐】使用基本数据类型。 说明:POJO 类属性没有初值是提醒使用者在需要使用时,必须自己显式地进行赋值, 任何 NPE 问题,或者入库检查,都由使用者来保证。 正例:数据库的查询结果可能是 null,因为自动拆箱,用基本数据类型接收有 NPE 风 险。 反例:比如显示成交总额涨跌情况,即正负 x%,x 为基本数据类型,调用的 RPC 服务,调 用不成功时,返回的是默认值,页面显示:0%,这是不合理的,应该显示成中划线-。所 以包装数据类型的 null 值,能够表示额外的信息,如:远程调用失败,异常退出。
9. 【强制】定义 DO/DTO/VO 等 POJO 类时,不要设定任何属性默认值。
反例:POJO 类的 gmtCreate 默认值为 new Date();但是这个属性在数据提取时并没有 置入具体值,在更新其它字段时又附带更新了此字段,导致创建时间被修改成当前时 间。
说明:
String str = "a,b,c,,"; String[] ary = str.split(",");
//预期大于 3,结果是 3
System.out.println(ary.length);
14. 【推荐】当一个类有多个构造方法,或者多个同名方法,这些方法应该按顺序放置在 一起,便于阅读。
15.【推荐】 类内方法定义顺序依次是: 公有方法或保护方法 > 私有方法 > getter/setter 方法。 说明:公有方法是类的调用者和维护者最关心的方法,首屏展示最好;保护方法虽然只 是子类关心,也可能是“模板设计模式”下的核心方法;而私有方法外部一般不需要 特别关心,是一个黑盒实现;因为方法信息价值较低,所有 Service 和 DAO 的 getter/setter 方法放在类体最后。
16. 【推荐】setter 方法中,参数名称与类成员变量名称一致,this.成员名=参数名。在 getter/setter 方法中,尽量不要增加业务逻辑,增加排查问题的难度。
反例:
public Integer getData(){if(true) { return data + 100;}else { return data - 100;}
}
17. 【推荐】循环体内,字符串的联接方式,使用 StringBuilder 的 append 方法进行扩 展。
反例:
String str = "start"; for(int i=0; i<100; i++){
str = str + "hello"; }
说明:反编译出的字节码文件显示每次循环都会 new 出一个 StringBuilder 对象,然 后进行 append 操作,最后通过 toString 方法返回 String 对象,造成内存资源浪费。
说明:对象的 clone 方法默认是浅拷贝,若想实现深拷贝需要重写 clone 方法实现属 性对象的拷贝。
20. 【推荐】类成员与方法访问控制从严: 1)如果不允许外部直接通过 new 来创建对象,那么构造方法必须是 private。2)工具 类不允许有 public 或 default 构造方法。 3)类非 static 成员变量并且与子类共享,必须是 protected。 4)类非 static 成员变量并且仅在本类使用,必须是 private。 5)类 static 成员变量如果仅在本类使用,必须是 private。 6)若是 static 成员变量,必须考虑是否为 final。 7)类成员方法只供类内部调用,必须是 private。 8)类成员方法只对继承类公开,那么限制为 protected。
说明:任何类、方法、参数、变量,严控访问范围。过宽泛的访问范围,不利于模块解 耦。思考:如果是一个 private 的方法,想删除就删除,可是一个 public 的 Service 方法,或者一个 public 的成员变量,删除一下,不得手心冒点汗吗?变量像自己的小 孩,尽量在自己的视线内,变量作用域太大,如果无限制的到处跑,那么你会担心的。
(五)集合处理
1. 【强制】关于 hashCode 和 equals 的处理,遵循如下规则:
正例:String 重写了 hashCode 和 equals 方法,所以我们可以非常愉快地使用 String 对象作为 key 来使用。
2. 【强制】ArrayList 的 subList 结果不可强转成 ArrayList,否则会抛出 ClassCastException 异常:java.util.RandomAccessSubList cannot be cast to java.util.ArrayList ;说明:subList 返回的是 ArrayList 的内部类 SubList,并不
是 ArrayList ,而是 ArrayList 的一个视图,对于 SubList 子列表的所有操作最终会 反映到原列表上。
反例:直接使用 toArray 无参方法存在问题,此方法返回值只能是 Object[]类,若强转 其它类型数组将出现 ClassCastException 错误。
正例:
List
String[] array = new String[list.size()];array = list.toArray(array); 说明:使用 toArray 带参方法,入参分配的数组空间不够大时,toArray 方法内部将重新 分配内存空间,并返回新数组地址;如果数组元素大于实际所需,下标为 [ list.size() ]的数组元素将被置为 null,其它数组元素保持原值,因此最好将方法 入参数组大小定义与集合元素个数一致。
5. 【强制】使用工具类 Arrays.asList()把数组转换成集合时,不能使用其修改集合相关 的方法,它的 add/remove/clear 方法会抛出 UnsupportedOperationException 异常。 说明:asList 的返回对象是一个 Arrays 内部类,并没有实现集合的修改方法。 Arrays.asList 体现的是适配器模式,只是转换接口,后台的数据仍是数组。
String[] str = new String[] { "a", "b" }; List list = Arrays.asList(str); 第一种情况:list.add("c");运行时异常。 第二种情况:str[0]= "gujin";那么 list.get(0)也会随之修改。
6. 【强制】泛型通配符来接收返回的数据,此写法的泛型集合不能使用 add 方法。
说明:苹果装箱后返回一个对象,此对象就不能往里加任何水果,包 括苹果。
7. 【强制】不要在 foreach 循环里进行元素的 remove/add 操作。remove 元素请使用 Iterator 方式,如果并发操作,需要对 Iterator 对象加锁。
反例:
List
if("1".equals(temp)){
}
a.remove(temp);
}
说明:以上代码的执行结果肯定会出乎大家的意料,那么试一下把“1”换成“2”,会是 同样的结果吗?
正例:
Iterator
String temp = it.next(); if(删除元素的条件){
it.remove();
} }
8. 【强制】在 JDK7 版本以上,Comparator 要满足自反性,传递性,对称性,不然 Arrays.sort,Collections.sort 会报 IllegalArgumentException 异常。
说明: 1)自反性:x,y 的比较结果和 y,x 的比较结果相反。 2)传递性:x>y,y>z,则 x>z。 3)对称性:x=y,则 x,z 比较结果和 y,z 比较结果相同。
反例:下例中没有处理相等的情况,实际使用中可能会出现异常: new Comparator
@Override public int compare(Student o1, Student o2) {
return o1.getId() > o2.getId() ? 1 : -1;
}
}
9. 【推荐】集合初始化时,尽量指定集合初始值大小。
说明:ArrayList 尽量使用 ArrayList(int initialCapacity)初始化。
10. 【推荐】使用 entrySet 遍历 Map 类集合 KV,而不是 keySet 方式进行遍历。
说明:keySet 其实是遍历了 2 次,一次是转为 Iterator 对象,另一次是从 hashMap 中取 出 key 所对应的 value。而 entrySet 只是遍历了一次就把 key 和 value 都放到了 entry 中,效率更高。如果是 JDK8,使用 Map.foreach 方法。 正例:values()返回的是 V 值集合,是一个 list 集合对象;keySet()返回的是 K 值集合, 是一个 Set 集合对象;entrySet()返回的是 K-V 值组合集合。
11. 【推荐】高度注意 Map 类集合 K/V 能不能存储 null 值的情况,如下表格:
集合类 | Key | Value | Super | 说明 |
Hashtable | 不允许为 null | 不允许为 null | Dictionary | 线程安全 |
ConcurrentHashMap | 不允许为 null | 不允许为 null | AbstractMap | 分段锁技术 |
TreeMap | 不允许为 null | 允许为 null | AbstractMap | 线程不安全 |
HashMap | 允许为 null | 允许为 null | AbstractMap | 线程不安全 |
null 值时会抛出 NPE 异常。
反例:由于 HashMap 的干扰,很多人认为 ConcurrentHashMap 是可以置入 null 值,注意存储
(六)并发处理
1. 【强制】获取单例对象需要保证线程安全,其中的方法也要保证线程安全。 说明:资源驱动类、工具类、单例工厂类都需要注意。
2. 【强制】创建线程或线程池时请指定有意义的线程名称,方便出错时回溯。
正例:
public class TimerTaskThread extends Thread {public TimerTaskThread(){
super.setName("TimerTaskThread"); ...
}
3. 【强制】线程资源必须通过线程池提供,不允许在应用中自行显式创建线程。
说明:使用线程池的好处是减少在创建和销毁线程上所花的时间以及系统资源的开 销,解决资源不足的问题。如果不使用线程池,有可能造成系统创建大量同类线程而 导致消耗完内存或者“过度切换”的问题。
4. 【强制】线程池不允许使用 Executors 去创建,而是过 ThreadPoolExecutor 的方 式,这样的处理方式让写的同学更加明确线程池的运行规则,规避资源耗尽的风险。说 明:Executors 返回的线程池对象的弊端如下:
1)FixedThreadPool 和 SingleThreadPool: 允许的请求队列长度为 Integer.MAX_VALUE,可能会堆积大量的请求,从而导致 OOM。 2)CachedThreadPool 和 ScheduledThreadPool: 允许的创建线程数量为 Integer.MAX_VALUE,可能会创建大量的线程,从而导致 OOM。
5. 【强制】SimpleDateFormat 是线程不安全的类,一般不要定义为 static 变量,如果定 义为 static,必须加锁,或者使用 DateUtils 工具类。
正例:注意线程安全,使用 DateUtils。亦推荐如下处理:
private static final ThreadLocal
@Override protected DateFormat initialValue() {
return new SimpleDateFormat("yyyy-MM-dd");
}};
说明:如果是 JDK8 的应用,可以使用 Instant 代替 Date,LocalDateTime 代替 Calendar,DateTimeFormatter 代替 Simpledateformatter,官方给出的解释:simple beautiful strongimmutable thread-safe。
6. 【强制】高并发时,同步调用应该去考量锁的性能损耗。能用无锁数据结构,就不要用 锁;能锁区块,就不要锁整个方法体;能用对象锁,就不要用类锁。
7. 【强制】对多个资源、数据库表、对象同时加锁时,需要保持一致的加锁顺序,否则可 能会造成死锁。
说明:线程一需要对表 A、B、C 依次全部加锁后才可以进行更新操作,那么线程二的 加锁顺序也必须是 A、B、C,否则可能出现死锁。
说明:Random 实例包括 java.util.Random 的实例或者 Math.random()实例。
正例:在 JDK7 之后,可以直接使用 API ThreadLocalRandom,在 JDK7 之前,可以做 到每个线程一个实例。
12. 【推荐】通过双重检查锁(double-checked locking)(在并发场景)实现延迟初始化的 优化问题隐患(可参考 The"Double-Checked Locking is Broken"Declaration),推荐 问题解决方案中较为简单一种(适用于 JDK5 及以上版本),将目标属性声明为 volatile 型。
反例:
class Foo {
private Helper helper = null;public Helper getHelper() {
if (helper == null) synchronized(this) {if (helper == null) helper = new Helper();
}
return helper; }
// other functions and members...
}
(七)控制语句
if (condition) statements;
3. 【推荐】推荐尽量少用 else,if-else 的方式可以改写成:
if(condition){
... return obj;
}
// 接着写 else 的业务逻辑代码; 说明:如果非得使用 if()...else if()...else...方式表达逻辑,
4. 【强制】请勿超过 3 层,
超过请使用状态设计模式。 正例:逻辑上超过 3 层的 if-else 代码可以使用卫语句,或者状态模式来实现。
5. 【推荐】除常用方法(如 getXxx/isXxx)等外,不要在条件判断中执行其它复杂的语 句,将复杂逻辑判断的结果赋值给一个有意义的布尔变量名,以提高可读性。 说明:很多 if 语句内的逻辑相当复杂,阅读者需要分析条件表达式的最终结果,才 能明确什么样的条件执行什么样的语句,那么,如果阅读者分析逻辑表达式错误呢?
正例:
//伪代码如下 boolean existed = (file.open(fileName, "w") != null)&& (...) || (...);if (existed) { ...} 反例:
if ((file.open(fileName, "w") != null) &&(...) || (...)) { ...
}
6. 【推荐】循环体中的语句要考量性能,以下操作尽量移至循环体外处理,如 定义对象、变量、
获取数据库连接,进行不必要的 try-catch 操作(这个 try-catch 是否可以 移至循环体外)。
(八)注释规约
1. 【强制】类、类属性、类方法的注释必须使用 Javadoc 规范,使用/**内容*/格式, 不得使用//xxx 方式。
说明:在 IDE 编辑窗口中,Javadoc 方式会提示相关注释,生成 Javadoc 可以正确 输出相应注释;在 IDE 中,工程调用方法时,不进入方法即可悬浮提示方法、参数、 返回值的意义,提高阅读效率。
2. 【强制】所有的抽象方法(包括接口中的方法)必须要用 Javadoc 注释、除了返回 值、参数、异常说明外,还必须指出该方法做什么事情,实现什么功能。
说明:对子类的实现要求,或者调用注意事项,请一并说明。
3. 【强制】所有的类都必须添加创建者信息。 4. 【强制】方法内部单行注释,在被注释语句上方另起一行,使用//注释。方法内部多
行注释
使用/* */注释,注意与代码对齐。
说明:代码与注释更新不同步,就像路网与导航软件更新不同步一样,如果导航软件严 重滞后,就失去了导航的意义。
8. 【参考】注释掉的代码尽量要配合说明,而不是简单的注释掉。
说明:代码被注释掉有两种可能性:1)后续会恢复此段代码逻辑。2)永久不用。前者 如果没有备注信息,难以知晓注释动机。后者建议直接删掉(代码仓库保存了历史代 码)。
反例:
// put elephant into fridge
put(elephant, fridge); 方法名 put,加上两个有意义的变量名 elephant 和 fridge,已经说明了这是在干什 么,语义清晰的代码不需要额外的注释。
11. 【参考】特殊注释标记,请注明标记人与标记时间。注意及时处理这些标记,通过标 记扫描,经常清理此类标记。线上故障有时候就是来源于这些标记处的代码。
1)待办事宜(TODO):(标记人,标记时间,[预计处理时间])表示需要实现,但目前还未 实现的功能。这实际上是一个 Javadoc 的标签,目前的 Javadoc 还没有实现,但已经被广泛使用。只能应用于类,接口和方法(因为它是一个 Javadoc 标签)。
2)错误,不能工作(FIXME):(标记人,标记时间,[预计处理时间]) 在注释中用 FIXME 标记某代码是错误的,而且不能工作,需要及时纠正的情况。
(九)其它
1. 【强制】在使用正则表达式时,利用好其预编译功能,可以有效加快正则匹配速度。
说明:不要在方法体内定义:Pattern pattern = Pattern.compile(规则);
2. 【强制】velocity 调用 POJO 类的属性时,建议直接使用属性名取值即可,模板引擎 会自动按规范调用 POJO 的 getXxx(),如果是 boolean 基本数据类型变量(boolean 命名不需要加 is 前缀),会自动调用 isXxx()方法。
说明:注意如果是 Boolean 包装类对象,优先调用 getXxx()的方法。
3. 【强制】后台输送给页面的变量必须加$!{var}——中间的感叹号。
说明:如果 var=null 或者不存在,那么${var}会直接显示在页面上。
4. 【强制】注意 Math.random()这个方法返回是 double 类型,注意取值的范 围 0≤x<1(能够取到零值,注意除零异常),如果想获取整数类型的随机数,不要将 x 放大 10 的若干倍然后取整,直接使用 Random 对象的 nextInt 或者 nextLong 方法。
5. 【强制】获取当前毫秒数 System.currentTimeMillis();而不是 new Date().getTime();
说明:如果想获取更加精确的纳秒级时间值,用 System.nanoTime()。在 JDK8 中,针对 统计时间等场景,推荐使用 Instant 类。
6. 【推荐】尽量不要在 vm 中加入变量声明、逻辑运算符,更不要在 vm 模板中加入任 何复杂的逻辑。
7. 推荐】任何数据结构的构造或初始化,都应指定大小,避免数据结构无限增长吃光内 存。
8. 【推荐】对于“明确停止使用的代码和配置”,如方法、变量、类、配置文件、动态 配置属性等要坚决从程序中清理出去,避免造成过多垃圾。
二、异常日志
(一)异常处理
1. 【强制】不要捕获 Java 类库中定义的继承自 RuntimeException 的运行时异常 类,如:IndexOutOfBoundsException / NullPointerException,这类异常由程序员预 检查来规避,保证程序健壮性。 正例:if(obj != null) {...}
反例:try { obj.method() } catch(NullPointerException e){...}
说明:如果 JDK7,可以使用 try-with-resources 方式。
7. 【强制】不能在 finally 块中使用 return,finally 块中的 return 返回后方法 结束执行,不会再执行 try 块中的 return 语句。
8. 【强制】捕获异常与抛异常,必须是完全匹配,或者捕获异常是抛异常的父类。
说明:如果预期对方抛的是绣球,实际接到的是铅球,就会产生意外情况。
9. 【推荐】方法的返回值可以为 null,不强制返回空集合,或者空对象等,必须添加注 释充分说明什么情况下会返回 null 值。调用方需要进行 null 判断防止 NPE 问 题。
说明:本规约明确防止 NPE 是调用者的责任。即使被调用方法返回空集合或者空对 象,对调用者来说,也并非高枕无忧,必须考虑到远程调用失败,运行时异常等场景返 回 null 的情况。
正例:一个类中有多个 public 方法,都需要进行数行相同的参数校验操作,这个时候 请抽取:
private boolean checkParam(DTO dto){ ...
}
(二)日志规约
说明:推荐对日志进行分类,错误日志和业务日志尽量分开存放,便于开发人员查看, 也便于通过日志对系统进行及时监控。
6. 【强制】异常信息应该包括两类信息:案发现场信息和异常堆栈信息。如果不处理, 那么往上抛。
正例:logger.error(各类参数或者对象 toString + "_" + e.getMessage(), e);
三、MySQL 规约
(一)建表规约
1. 【强制】表达是与否概念的字段,必须使用 is_xxx 的方式命名,数据类型 是 unsigned tinyint(1 表示是,0 表示否),此规则同样适用于 odps 建表。
说明:任何字段如果为非负数,必须是 unsigned。
2. 【强制】表名、字段名必须使用小写字母或数字;禁止出现数字开头,禁止两个下划 线中间只出现数字。数据库字段名的修改代价很大,因为无法进行预发布,所以字段 名称需要慎重考虑。
正例:getter_admin,task_config,level3_name 反例:GetterAdmin,taskConfig,level_3_name
3. 【强制】表名不使用复数名词。
说明:表名应该仅仅表示表里面的实体内容,不应该表示实体数量,对应于 DO 类名 也是单数形式,符合表达习惯。
说明:uk_即 unique key;idx_即 index 的简称。
8. 【强制】varchar 是可变长字符串,不预先分配存储空间,长度不要超过 5000,如果 存储长度大于此值,定义字段类型为 text,独立出来一张表,用主键来对应,避免影响 其它字段索引效率。
9. 【强制】表必备三字段:id,gmt_create,gmt_modified。
说明:其中 id 必为主键,类型为 unsigned bigint、单表时自增、步长为 1。 gmt_create,gmt_modified 的类型均为 date_time 类型。
10. 【推荐】表的命名最好是加上“业务名称_表的作用”。
正例:tiger_task/tiger_reader/mpp_config
15. 【参考】合适的字符存储长度,不但节约数据库表空间、节约索引存储,更重要的是
提升检索速度。
正例:人的年龄用 unsigned tinyint(表示范围 0-255,人的寿命不会超过 255 岁);海 龟就必须是 smallint,但如果是太阳的年龄,就必须是 int;如果是所有恒星的年龄都 加起来,那么就必须使用 bigint。
(二)索引规约
1. 【强制】业务上具有唯一特性的字段,即使是组合字段,也必须建成唯一索引。
说明:不要以为唯一索引影响了 insert 速度,这个速度损耗可以忽略,但提高查找速 度是明显的;另外,即使在应用层做了非常完善的校验和控制,只要没有唯一索引,根 据墨菲定律,必然有脏数据产生。
说明:索引的长度与区分度是一对矛盾体,一般对字符串类型数据,长度为 20 的索 引,区分度会高达 90%以上,可以使用 count(distinct left(列名,索引长 度))/count(*)的区分度来确定。
4. 【强制】页面搜索严禁左模糊或者全模糊,如果需要请走搜索引擎来解决。
说明:索引文件具有 B-Tree 的最左前缀匹配特性,如果左边的值未确定,那么无法使 用此索引。
5. 【推荐】如果有 order by 的场景,请注意利用索引的有序性。order by 最后的 字段是组合索引的一部分,并且放在索引组合顺序的最后,避免出现 file_sort 的情 况,影响查询性能。
正例:where a=?and b=? order by c; 索引:a_b_c 反例:索引中有范围查找,那么索引有序性无法利用,如:WHERE a>10 ORDER BY b;索 引 a_b 无法排序。
6. 【推荐】利用覆盖索引来进行查询操作,来避免回表操作。
说明:如果一本书需要知道第 11 章是什么标题,会翻开第 11 章对应的那一页吗?目录 浏览一下就好,这个目录就是起到覆盖索引的作用。正例:能够建立索引的种类:主键 索引、唯一索引、普通索引,而覆盖索引是一种查询的一种效果,用 explain 的结 果,extra 列会出现:using index。
7. 【推荐】利用延迟关联或者子查询优化超多分页场景。
说明:MySQL 并不是跳过 offset 行,而是取 offset+N 行,然后返回放弃 前 offset 行,返回 N 行,那当 offset 特别大的时候,效率就非常的低下,要么控制 返回的总页数,要么对超过特定阈值的页数进行 SQL 改写。 正例:先快速定位需要获取的 id 段,然后再关联: SELECT a.* FROM 表 1 a, (select id from 表 1 where 条件 LIMIT 100000,20 ) b where a.id=b.id
8. 【推荐】SQL 性能优化的目标:至少要达到 range 级别,要求是 ref 级别,如果可以是 consts 最好。
说明:
1)consts 单表中最多只有一个匹配行(主键或者唯一索引),在优化阶段即可读取到 数据。 2)ref 指的是使用普通的索引(normal index)。 3)range 对索引进行范围检索。
反例:explain 表的结果,type=index,索引物理文件全扫描,速度非常慢,这个 index 级别比较 range 还低,与全表扫描是小巫见大巫。
9. 【推荐】建组合索引的时候,区分度最高的在最左边。 正例:如果 where a=?and b=? ,a 列的几乎接近于唯一值,那么只需要单建 idx_a 索引即可。
说明:存在非等号和等号混合判断条件时,在建索引时,请把等号条件的列前置。 如:where a>?and b=?那么即使 a 的区分度更高,也必须把 b 放在索引的最前列。
10. 【参考】创建索引时避免有如下极端误解:
1)误认为一个查询就需要建一个索引。
2)误认为索引会消耗空间、严重拖慢更新和新增速度。 3)误认为唯一索引一律需要在应用层通过“先查后插”方式解决。
(三) SQL 规约
1. 【强制】不要使用 count(列名)或 count(常量)来替代 count(*),count(*)就是 SQL92 定义的标准统计行数的语法,跟数据库无关,跟 NULL 和非 NULL 无关。
说明:count(*)会统计值为 NULL 的行,而 count(列名)不会统计此列为 NULL 值的 行。
2. 【强制】count(distinct col)计算该列除 NULL 之外的不重复数量。注 意 count(distinctcol1,col2)如果其中一列全为 NULL,那么即使另一列有不同的 值,也返回为 0。
说明:
5. 【强制】 在代码中写分页查询逻辑时,若 count 为 0 应直接返回,避免执行后面 的分页语句。
6. 【强制】不得使用外键与级联,一切外键概念必须在应用层解决。
说明:(概念解释)学生表中的 student_id 是主键,那么成绩表中的 student_id 则 为外键。如果更新学生表中的 student_id,同时触发成绩表中的 student_id 更新, 则为级联更新。外键与级联更新适用于单机低并发,不适合分布式、高并发集群;级 联更新是强阻塞,存在数据库更新风暴的风险;外键影响数据库的插入速度。
7. 【强制】禁止使用存储过程,存储过程难以调试和扩展,更没有移植性。 8. 【强制】数据订正时,删除和修改记录时,要先 select,避免出现误删除,确认无误
才能执
行更新语句。
9. 【推荐】in 操作能避免则避免,若实在避免不了,需要仔细评估 in 后边的集合元 素数量,控制在 1000 个之内。
10. 【参考】如果有全球化需要,所有的字符存储与表示,均以 utf-8 编码,那么字符计数 方法注意:
说明:
SELECT LENGTH("轻松工作");返回为 12 SELECT CHARACTER_LENGTH("轻松工作");返回为 4 如果要使用表情,那么使用 utfmb4 来进行存储,注意它与 utf-8 编码的区别。
11. 【参考】TRUNCATE TABLE 比 DELETE 速度快,且使用的系统和事务日志资源少,但 TRUNCATE 无事务且不触发 trigger,有可能造成事故,故不建议在开发代码中使用此 语句。
说明:TRUNCATE TABLE 在功能上与不带 WHERE 子句的 DELETE 语句相同。
(四) ORM 规约
1. 【强制】在表查询中,一律不要使用 *作为查询的字段列表,需要哪些字段必须明确 写明。
说明:1)增加查询分析器解析成本。2)增减字段容易与 resultMap 配置不一致。
现 SQL 注入。
10. 【参考】
四、工程规约
(一)应用分层
1. 【推荐】图中默认上层依赖于下层,箭头关系表示可直接依赖,如:开放接口层可以 依赖于 Web 层,也可以直接依赖于 Service 层,依此类推: