十二、考虑实现Comparable接口:
- public static void main(String[] args) {
- HashSet<BigDecimal> hs = new HashSet<BigDecimal>();
- BigDecimal bd1 = new BigDecimal("1.0");
- BigDecimal bd2 = new BigDecimal("1.00");
- hs.add(bd1);
- hs.add(bd2);
- System.out.println("The count of the HashSet is " + hs.size());
- TreeSet<BigDecimal> ts = new TreeSet<BigDecimal>();
- ts.add(bd1);
- ts.add(bd2);
- System.out.println("The count of the TreeSet is " + ts.size());
- }
- /* 输出结果如下:
- The count of the HashSet is 2
- The count of the TreeSet is 1
- */
由以上代码的输出结果可以看出,TreeSet和HashSet中包含元素的数量是不同的,这其中的主要原因是TreeSet是基于BigDecimal的compareTo方法是否返回0来判断对象的相等性,而在该例中compareTo方法将这两个对象视为相同的对象,因此第二个对象并未实际添加到TreeSet中。和TreeSet不同的是HashSet是通过equals方法来判断对象的相同性,而恰恰巧合的是BigDecimal的equals方法并不将这个两个对象视为相同的对象,这也是为什么第二个对象可以正常添加到HashSet的原因。这样的差异确实给我们的编程带来了一定的负面影响,由于HashSet和TreeSet均实现了Set<E>接口,倘若我们的集合是以Set<E>的参数形式传递到当前添加BigDecimal的函数中,函数的实现者并不清楚参数Set的具体实现类,在这种情况下不同的实现类将会导致不同的结果发生,这种现象极大的破坏了面向对象中的"里氏替换原则"。
在重载compareTo方法时,应该将最重要的域字段比较方法比较的最前端,如果重要性相同,则将比较效率更高的域字段放在前面,以提高效率,如以下代码:
- public int compareTo(PhoneNumer pn) {
- if (areaCode < pn.areaCode)
- return -1;
- if (areaCode > pn.areaCode)
- return 1;
- if (prefix < pn.prefix)
- return -1;
- if (prefix > pn.prefix)
- return 1;
- if (lineNumber < pn.lineNumer)
- return -1;
- if (lineNumber > pn.lineNumber)
- return 1;
- return 0;
- }
上例给出了一个标准的compareTo方法实现方式,由于使用compareTo方法排序的对象并不关心返回的具体值,只是判断其值是否大于0,小于0或是等于0,因此以上方法可做进一步优化,然而需要注意的是,下面的优化方式会导致数值类型的作用域溢出问题。
- public int compareTo(PhoneNumer pn) {
- int areaCodeDiff = areaCode - pn.areaCode;
- if (areaCodeDiff != 0)
- return areaCodeDiff;
- int prefixDiff = prefix - pn.prefix;
- if (prefixDiff != 0)
- return prefixDiff;
- int lineNumberDiff = lineNumber - pn.lineNumber;
- if (lineNumberDiff != 0)
- return lineNumberDiff;
- return 0;
- }
十三、使类和成员的可访问性最小化:
信息隐藏是软件程序设计的基本原则之一,面向对象又为这一设计原则提供了有力的支持和保障。这里我们简要列出几项受益于该原则的优势:
1. 更好的解除各个模块之间的耦合关系:
由于模块间的相互调用是基于接口契约的,每个模块只是负责完成自己内部既定的功能目标和单元测试,一旦今后出现性能优化或需求变更时,我们首先需要做的便是定位需要变动的单个模块或一组模块,然后再针对各个模块提出各自的解决方案,分别予以改动和内部测试。这样便大大降低了因代码无规则交叉而带来的潜在风险,同时也缩减了开发周期。
2. 最大化并行开发:
由于各个模块之间保持着较好的独立性,因此可以分配更多的开发人员同时实现更多的模块,由于每个人都是将精力完全集中在自己负责和擅长的专一领域,这样不仅提高了软件的质量,也大大加快了开发的进度。
3. 性能优化和后期维护:
一般来说,局部优化的难度和可行性总是要好于来自整体的优化,事虽如此,然而我们首先需要做的却是如何定位需要优化的局部,在设计良好的系统中,完成这样的工作并非难事,我们只需针对每个涉及的模块做性能和压力测试,之后再针对测试的结果进行分析并拿到相对合理的解决方案。
4. 代码的高可复用性:
在软件开发的世界中,提出了众多的设计理论,设计原则和设计模式,之所以这样,一个非常现实的目标之一就是消除重复代码,记得《重构》中有这样的一句话:“重复代码,万恶之源”。可见提高可用代码的复用性不仅对编程效率和产品质量有着非常重要的意义,对日后产品的升级和维护也是至关重要的。说一句比较现实的话,一个设计良好的产品,即使因为某些原因导致失败,那么产品中应用到的一个个独立、可用和高效的模块也为今后的东山再起提供了一个很好的技术基础。
让我们重新回到主题,Java通过访问控制的方式来完成信息隐藏,而我们的原则是尽可能的使每个类的域成员不被外界访问。对于包内的类而言,则尽可能少的定义公有类,遵循这样的原则可以极大的降低因包内设计或实现的改变而给该包的使用者带来的影响。当然达到这个目标的一个重要前提是定义的接口足以完成调用者的需求。
该条目给出了一个比较重要的建议,既不要提供直接访问或通过函数返回可变域对象的实例,见下例:
public final Thing[] values = { ... };
即便Thing数组对象本身是final的,不能再被赋值给其他对象,然而数组内的元素是可以改变的,这样便给外部提供了一个机会来修改内部数据的状态,从而在主类未知的情况下破坏了对象内部的状态或数据的一致性。其修订方式如下:
- private static final Thing[] PRIVATE_VALUES = { ... };
- public static final Thing[] values() {
- return PRIVATE_VALUES.clone();
- }
总而言之,你应该尽可能地降低可访问性。你在仔细地设计了一个最小的公有API之后,应该防止把任何散乱的类、接口和成员变成API的一部分。除了公有静态final域的特殊情形之外,公有类都不应该包含公有域。并且要确保公有静态final域所引用的对象都是不可变的。
十四、在公有类中使用访问方法而非公有域:
这个条目简短的标题已经非常清晰的表达了他的含义,我们这里将只是列出几点说明:
1. 对于公有类而言,由于存在大量的使用者,因此修改API接口将会给使用者带来极大的不便,他们的代码也需要随之改变。如果公有类直接暴露了域字段,一旦今后需要针对该域字段添加必要的约束逻辑时,唯一的方法就是为该字段添加访问器接口,而已有的使用者也将不得不更新其代码,以避免破坏该类的内部逻辑。
2. 对于包级类和嵌套类,公有的域方法由于只能在包内可以被访问,因而修改接口不会给包的使用者带来任何影响。
3. 对于公有类中的final域字段,提供直接访问方法也会带来负面的影响,只是和非final对象相比可能会稍微好些,如final的数组对象,即便数组对象本身不能被修改,但是他所包含的数组成员还是可以被外部改动的,针对该情况建议提供API接口,在该接口中可以添加必要的验证逻辑,以避免非法数据的插入,如:
- public <T> boolean setXxx(int index, T value) {
- if (index > myArray.length)
- return false;
- if (!(value instanceof LegalClass))
- return false;
- ...
- return true;
- }
十五、使可变性最小化:
只在类构造的时候做初始化,构造之后类的外部没有任何方法可以修改类成员的状态,该对象在整个生命周期内都会保持固定不变的状态,如String、Integer等。不可变类比可变类更加易于设计、实现和使用,而且线程安全。
使类成为不可变类应遵循以下五条原则:
1. 不要提供任何会修改对象状态的方法;
2. 保证类不会被扩展,既声明为final类,或将构造函数定义为私有;
3. 使所有的域都是final的;
4. 使所有的域都成为私有的;
5. 确保在返回任何可变域时,返回该域的deep copy。
见如下Complex类:
- final class Complex {
- private final double re;
- private final double im;
- public Complex(double re,double im) {
- this.re = re;
- this.im = im;
- }
- public double realPart() {
- return re;
- }
- public double imaginaryPart() {
- return im;
- }
- public Complex add(Complex c) {
- return new Complex(re + c.re,im + c.im);
- }
- public Complex substract(Complex c) {
- return new Complex(re - c.re, im - c.im);
- }
- ... ...
- }
不可变对象还有一个对象重用的优势,这样可以避免创建多余的新对象,这样也能减轻垃圾收集器的压力,如:
public static final Complex ZERO = new Complex(0,0);
public static final Complex ONE = new Complex(1,0);
这样使用者可以重复使用上面定义的两个静态final类,而不需要在每次使用时都创建新的对象。
从Complex.add和Complex.substract两个方法可以看出,每次调用他们的时候都会有新的对象被创建,这样势必会带来一定的性能影响,特别是对于copy开销比较大的对象,如包含几万Bits的BigInteger。如果我们所作的操作仅仅是修改其中的某个Bit,如bigInteger.flipBit(0),该操作只是修改了第0位的状态,而BigInteger却为此copy了整个对象并返回。鉴于此,该条目推荐为不可变对象提供一个功能相仿的可变类,如java.util.BitSet之于java.math.BigInteger。如果我们在实际开发中确实遇到刚刚提及的场景,那么使用BitSet或许是更好的选择。
对于不可变对象还有比较重要的优化技巧,既某些关键值的计算,如hashCode,可以在对象构造时或留待某特定方法(Lazy Initialization)第一次调用时进行计算并缓存到私有域字段中,之后再获取该值时,可以直接从该域字段获取,避免每次都重新计算。这样的优化主要是依赖于不可变对象的域字段在构造后即保持不变的特征。
十六、复合优先于继承:
由于继承需要透露一部分实现细节,因此不仅需要超类本身提供良好的继承机制,同时也需要提供更好的说明文档,以便子类在覆盖超类方法时,不会引起未知破坏行为的发生。需要特别指出的是对于跨越包边界的继承,很可能超类和子类的实现者并非同一开发人员或同一开发团队,因此对于某些依赖实现细节的覆盖方法极有可能会导致预料之外的结果,还需要指出的是,这些细节对于超类的普通用户来说往往是不看见的,因此在未来的升级中,该实现细节仍然存在变化的可能,这样对于子类的实现者而言,在该细节变化时,子类的相关实现也需要做出必要的调整,见如下代码:
- //这里我们需要扩展HashSet类,提供新的功能用于统计当前集合中元素的数量,
- //实现方法是新增一个私有域变量用于保存元素数量,并每次添加新元素的方法中
- //更新该值,再提供一个公有的方法返回该值。
- public class InstrumentedHashSet<E> extends HashSet<E> {
- private int addCount = 0;
- public InstrumentedHashSet() {}
- public InstrumentedHashSet(int initCap,float loadFactor) {
- super(initCap,loadFactor);
- }
- @Override public boolean add(E e) {
- ++addCount;
- return super.add(e);
- }
- @Override public boolean addAll(Collection<? extends E> c) {
- addCount += c.size();
- return super.addAll(c);
- }
- public int getAddCount() {
- return addCount;
- }
- }
该子类覆盖了HashSet中的两个方法add和addAll,而且从表面上看也非常合理,然而他却不能正常的工作,见下面的测试代码:
- public static void main(String[] args) {
- InstrumentedHashSet<String> s = new InstrumentedHashSet<String>();
- s.addAll(Arrays.asList("Snap","Crackle","Pop"));
- System.out.println("The count of InstrumentedHashSet is " + s.getAddCount());
- }
- //The count of InstrumentedHashSet is 6
从输出结果中可以非常清楚的看出,我们得到的结果并不是我们期望的3,而是6。这是什么原因所致呢?在HashSet的内部,addAll方法是基于add方法来实现的,而HashSet的文档中也并未列出这样的细节说明。了解了原因之后,我们应该取消addAll方法的覆盖,以保证得到正确的结果。然而仍然需要指出的是,这样的细节既然未在API文档中予以说明,那么也就间接的表示这种未承诺的实现逻辑是不可依赖的,因为在未来的某个版本中他们有可能会发生悄无声息的发生变化,而我们也无法通过API文档获悉这些。还有一种情况是超类在未来的版本中新增了添加新元素的接口方法,因此我们在子类中也必须覆盖这些方法,同时也要注意一些新的超类实现细节。由此可见,类似的继承是非常脆弱的,那么该如何修订我们的设计呢?答案很简单,复合优先于继承,见如下代码:
- //转发类
- class ForwardingSet<E> implements Set<E> {
- private final Set<E> s;
- public ForwardingSet(Set<E> s) {
- this.s = s;
- }
- @Override public int size() {
- return s.size();
- }
- @Override public void clear() {
- s.clear();
- }
- @Override public boolean add(E e) {
- return s.add(e);
- }
- @Override public boolean addAll(Collection<? extends E> c) {
- return s.addAll(c);
- }
- ... ...
- }
- //包装类
- class InstrumentedHashSet<E> extends ForwardingSet<E> {
- private int addCount = 0;
- public InstrumentedHashSet(int initCap,float loadFactor) {
- super(initCap,loadFactor);
- }
- @Override public boolean add(E e) {
- ++addCount;
- return super.add(e);
- }
- @Override public boolean addAll(Collection<? extends E> c) {
- addCount += c.size();
- return super.addAll(c);
- }
- public int getAddCount() {
- return addCount;
- }
- }
由上面的代码可以看出,这种设计最大的问题就是比较琐碎,需要将接口中的方法基于委托类重新实现。
在决定使用继承而不是复合之间,还应该问自己最后一组问题。对于你试图扩展的类,它的API中有没有缺陷呢?如果有,你是否愿意把这些缺陷传播到类的API中?继承机制会把超类API中的所有缺陷传播到子类中,而复合则允许设计新的API来隐藏这些缺陷。