在.NET中System.Linq命名空间中有个扩展方法叫Count
,现在看下面的代码示例:
class Program
{
static void Main(string[] args)
{
var userList = new List();
userList.Add(1);
userList.Add(2);
userList.Add(3);
userList.Add(4);
userList.Add(5);
userList.Add(6);
Console.WriteLine(userList.Count);
Console.WriteLine(userList.Count());
var userList2 = userList.Select(i=>i);//返回的是IEnumerable<TResult>类型
Console.WriteLine(userList2.Count());
for (int i = 0; i < userList2.Count(); i++)
{
Console.WriteLine(userList[i]);
}
}
}
上门代码通过调用了List的自身属性Count,然后又调用了Linq支持的扩展方法Count(),结果都是输出的6,可是它们背后有哪些不一样呢?在上门的for循环中,背后真正走了多少次呢?
我们先开Count本身的属性,这里只粘贴了核心源码,完整的地址自行可以查看http://referencesource.microsoft.com/#mscorlib/system/collections/generic/list.cs,aeb6ba6c11713802
[ContractPublicPropertyName("Count")]
private int _size;
public int Count {
get {
Contract.Ensures(Contract.Result<int>() >= 0);
return _size;
}
}
public void Add(T item) {
if (_size == _items.Length) EnsureCapacity(_size + 1);
_items[_size++] = item;
_version++;
}
我们通过上面可以看到,内部维护了一个_size字段来表示List中的数量,再向集合中添加元素时,已经进行统计过了。这时再取集合的数量时,时间复杂度就为O(1)。
然后我们在看下扩展方法Count
源代码如下:
public static int Count(this IEnumerable source) {
if (source == null) throw Error.ArgumentNull("source");
ICollection collectionoft = source as ICollection;
if (collectionoft != null) return collectionoft.Count;
ICollection collection = source as ICollection;
if (collection != null) return collection.Count;
int count = 0;
using (IEnumerator e = source.GetEnumerator()) {
checked {
while (e.MoveNext()) count++;
}
}
return count;
}
我们通过上面可以看到传入的集合元素如果不能转换为ICollection
和ICollection 便会进行逐个元素进行遍历,然后返回最终的元素集合,这样的时间复杂度当然为O(n)。所以能直接调用集合属性获取数量,就尽量避免使用扩展方法Count
。
说到这里,可能有的小伙伴问了,为何List
能不能转换为ICollection
?
我们来
public class List<T> : IList<T>, ICollection<T>, IList, ICollection, IReadOnlyList<T>, IReadOnlyCollection<T>, IEnumerable<T>, IEnumerable
public interface ICollection
这个ICollection
继承自IEnumerable
如果传入的List
这种继承自ICollection
的集合,当然直接就是调用对应的Count 属性,如果传入的是直接继承自IEnumerable
的集合那么循环遍历获取集合中的数量,因为让一个父类转换为一个子类,理所当然这里一直就是null。
那么在上面的for循环中遍历,相当于每次遍历都需要获取一次集合中的数量,也就等于跑了6*6=36次,可见这是多么浪费CPU。即使List
能够转换成功转换为ICollection
但是在CPU里面也毕竟多了一次转换操作,转换后依旧是按照Count属性获取集合数量,还不如我们能直接获取就直接获取。
当然我们可以把for循环里面的改成如下遍历。如下代码:
for (int i = 0,len=userList2.Count(); i < len; i++)
{
Console.WriteLine(userList2[i]);
}
或者直接使用foreach循环
foreach (var item in userList2)
{
Console.WriteLine(item);
}
亦或者避开Select
延迟查询的特点(关于延迟查询,下篇文章会进行讲解),改成如下的方式:
var userList2 = userList.Select(i=>i).ToList();//返回的是List ToList
for (int i = 0; i < userList.Count(); i++)
{
Console.WriteLine(userList[i]);
}
通过上述源代码我们可以进一步了解到,作为一个公共方法肯定要满足大多数的需要(可以参考我这篇文章:http://blog.csdn.net/u010533180/article/details/50627771),所以这里使用了顶级的父类,就有了中间的两层转换操作,这也是基于性能方面考虑,比如传递过来的就是继承了ICollection接口,这样直接取出数量即可,不过大多数情况我们直接使用的是继承自IEnumerable
接口的类,所以我们作为代码的搬运工要积极思考微软这套东西,持有怀疑性精神前进,这样我们会了解到更多的东西。
最后我想说的是我们要通过提供的源代码,积极优化我们书写的代码,哪怕一个稍微的转换,对你本身代码的性能就是一个很大的提升。