[深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询

简介

  在Git上下载源码
  在工程中我们少不了要定义类或者结构去储存数据,这些数据将被临时地储存在内存中,现在我们想要对其完成一些类似于查找、过滤等等常见的任务的时候,我们该如何去做呢?
  我们可以自己写代码去对集合中的每个对象进行遍历,检查变量的每个字段看其是否满足条件。这样的故事已经发生太多次了,微软怎么可能容忍在C#里发生如此弱智的事情呢?于是,C#的设计者决定在C#中集成查询的语法,以最大限度地减少程序员书写类似代码的情况。
  这也就是我们说的LINQ(Language Intergated Query)也就是语言集成查询,我们可以使用同样的语法访问不同的数据源。

为什么要使用LINQ?

  几乎所有的应用程序都需要对数据进行处理,大部分的程序都通过自定义的逻辑来完成这些操作。这样做的弊端之意就是,代码逻辑将会跟它处理的数据的结构紧密耦合在一起,如果数据结构发生了改变,也许将会带来海量的代码改动。
  为了解决这个问题,C#将这些处理数据的代码都抽象出来,提供给了广大开发者。这就是LINQ。
  LINQ的语法类似于关系和分层查询语言(SQL和XQuery),我们可以在不更改查询代码的情况下对数据结构进行更改。LINQ比之SQL要更加灵活,可以处理更广泛的逻辑数据结构。当然,这些数据结构都需要实现了IEnumerable或者IEnumerable< T >接口,才可以进行LINQ查询。

LINQ查询表达式语法详解

表达式基础语法

  LINQ查询表达式以from子句开始,以select或者group子句结束。在这两个子句之间可以跟零个或者多个from、let、where、join或者orderby子句。
  每个from子句都是一个生成器,该生成器将引入一个包括序列(Sequence)的元素的范围变量(range variable)。每个let子句都会引入一个范围变量,以表示通过前一个范围变量计算的值。每个where子句都是一个筛选器,用于从结果中排除项。每个join子句都将指定的源序列键与其他序列的键进行比较,以产生匹配对。每个orderby子句都会根据指定的条件对各项进行重新排序。而最后的select或者group子句根据范围变量来指定结果的表现形式。最后可以使用into子句来连接查询,将某一查询结果的视为后续查询的生成器。

标准查询操作符

  在了解LINQ查询表达式之前,怎么能不了解下它的查询操作符呢?下面列表列出了LINQ定义的标准查询操作符。

表1:LINQ标准查询操作符

标准查询操作符 说明
where OfType<TResult> 筛选操作符定义了返回元素的条件。在Where查询操作符中,可以使用谓词,例如Lambda表达式定义的谓词,来返回布尔值。OfType<TResult>根据类型筛选元素,只返回TResult的类型元素
Select 和SelectMany 投射操作符用于把对象转换为另一个类型的新对象。Select和SelectMany定义了根据选择器函数选择结果值的投射。
OrderBy、ThenBy 、OrderByDescending 、ThenByDescending 、Reverse 排序操作符改变所返回的元素的顺序。OrderBy按升序排列,OrderByDescending按降序排列。如果第一次排序结果很类似,就可以使用ThenBy和ThenByDescending操作符进行第二次排序。Reverse反转集合中的元素顺序。
GroupBy、ToLookUp 组合运算符把数据放在组里面。GroupBy操作符组合有公共键的元素。ToLookUp通过创建一个一对多的字典,来组合元素。
Join、GroupJoin 链接运算符用于合并不直接相关的集合。使用Join操作符,可以根绝键选择器函数连接两个集合,这类似于SQL中的Join。GroupJoin操作符连接两个集合,组合其结果。
Any、All、Contains 如果元素序列满足指定的条件,两次操作符就返回布尔值。Any、ALll和Contains都是限定符操作符。Any确定集合中是否有确定满足谓词函数的元素。ALll确定集合中的所有元素是否都满足谓词函数。Contains检查某个元素是否在集合中。这些操作符都返回一个布尔值。
Take、Skip、TakeWhile、SkipWhile 分区操作符返回集合的一个子集,Take、Skip、TakeWhile、SkipWhile都是分区操作符。使用它们可以得到部分结果,使用Take必须指定要从集合中提取的元素个数;Skip跳过指定个数的元素,提取其它元素;TakeWhile提取条件为真的元素。
Distinct、Union、Intersect、Except、Zip Set操作符返回一个集合。Distinct从集合中删除重复的元素,除了Distinct之外,其它的Set操作符都需要两个集合。Union返回出现在其中一个集合中的唯一元素。Intersect返回两个集合中都有的元素。Except返回值出现在一个集合中的元素。Zip是.NET 4新增的,它把两个集合合并为一个。
First、FirstOrDefault、Last、LastOrDefault、ElementAt、ElementAtOrDefault、Single、SingleOrDefault 这些元素操作符仅返回一个元素。First返回第一个满足条件的元素。FirstOrDefault类似于First,单如果没有找到满足条件的元素,就返回类型的默认值。Last返回最后一个满足条件的元素。ElementAt指定了要返回的元素的位置。Single只返回一个满足条件的元素。如果有多个元素都满足条件,就抛出一个异常。
Count、Sum、Min、Max、Average、Aggregate 聚合操作符计算集合的一个值。利用这些聚合操作符,可以计算所有值的总和、所有元素的个数、值最大和最小的元素,以及平均值等等。
ToArray、ToEnumerable、ToList、ToDictionary、Cast<TRsult> 这些转换操作符将集合转换为数组:IEnumerable、IList、IDictionary等。
Empty、Range、Repeat 这些生成操作符返回一个心机和。使用Empty时集合是空的;Range返回一系列数字;Repeat返回一个始终重复一个值的集合。

设置案例背景

  假设我们有4个类,Customer,Order,Detail,Product,它们的定义如下:

Customer类字段 字段类型
CustomerID int
Country string
Name string
City string
Orders List<Order>
Order类字段 字段类型
OrderID int
CustomerID int
Total int
OrderDate DateTime
Details List<Detail>
Detail类字段 字段类型
DetailID int
OrderID int
UnitPrice double
Quantity double
ProductID int
Product类字段 字段类型
ProductID int
ProductName string

  假设现在它们各自有一个List集合,分别为Customers,Orders,Details,Products。我们在这基础之上来一步步阐述LINQ查询表达式。
  customers数据:

CustomerID City Country Name Orders
0 北京 中国 小米 orders.FindAll(c => c.CustomerID == 0)
1 首尔 韩国 三星 orders.FindAll(c => c.CustomerID == 1)
2 加州 美国 苹果 orders.FindAll(c => c.CustomerID == 2)
3 台北 中国 HTC orders.FindAll(c => c.CustomerID == 3)
4 珠海 中国 魅族 orders.FindAll(c => c.CustomerID == 4)
5 北京 中国 华为 orders.FindAll(c => c.CustomerID == 5)
6 上海 中国 索尼 orders.FindAll(c => c.CustomerID == 6)
7 北京 中国 联想 orders.FindAll(c => c.CustomerID == 7)
8 上海 中国 诺基亚 orders.FindAll(c => c.CustomerID == 8)

  
  orders数据:

OrderID CustomerID OrderDate Details
0 0 DateTime.Now details.FindAll(d => d.OrderID == 0)
1 0 DateTime.Now details.FindAll(d => d.OrderID == 1)
2 1 DateTime.Now details.FindAll(d => d.OrderID == 2)
3 1 DateTime.Now details.FindAll(d => d.OrderID == 3)
4 2 DateTime.Now details.FindAll(d => d.OrderID == 4)
5 2 DateTime.Now details.FindAll(d => d.OrderID == 5)
6 3 DateTime.Now details.FindAll(d => d.OrderID == 6)
7 3 DateTime.Now details.FindAll(d => d.OrderID == 7)
8 4 DateTime.Now details.FindAll(d => d.OrderID == 8)
9 5 DateTime.Now details.FindAll(d => d.OrderID == 9)
10 6 DateTime.Now details.FindAll(d => d.OrderID == 10)
11 6 DateTime.Now details.FindAll(d => d.OrderID == 11)
12 7 DateTime.Now details.FindAll(d => d.OrderID == 12)
13 7 DateTime.Now details.FindAll(d => d.OrderID == 13)
14 8 DateTime.Now details.FindAll(d => d.OrderID == 14)
15 8 DateTime.Now details.FindAll(d => d.OrderID == 15)
16 8 DateTime.Now details.FindAll(d => d.OrderID == 16)

  
  details数据:

DetailID OrderID ProductID Quantity UnitPrice
0 0 0 1000 10
1 1 1 2134 8
2 2 1 1236 9
3 3 0 754 7
4 4 2 2354 12
5 5 0 6985 13
6 6 2 4213 10
7 7 3 1977 10
8 8 2 287 6
9 9 5 9778 12
10 10 4 854 11
11 11 2 756 10
12 12 3 1000 9
13 13 1 786 8
14 14 3 346 7
15 15 2 576 6
16 16 0 782 10

  
  products数据:

ProductID ProductName
0 samsung
1 nokia
2 apple
3 xiaomi
4 huawei
5 lenovo

Demo查询表达式

条件筛选

  使用where子句,可以按照一个或者多个条件筛选集合,where子句的表达式的结果类型应该是布尔类型。
  筛选在北京且名称以‘小’开头的顾客。

var query = from c in customers
            where c.City == "北京" && c.Name.StartsWith("小")
            select c;
foreach (Customer item in query)
{
    Console.WriteLine(item.Name + "\t\t" + item.City);
}
Console.ReadKey();

  该LINQ查询会返回在北京而且名字以“小”开头的Customer集合。
  输出结果:
  这里写图片描述
  

复合from子句筛选

  当需要根绝对象的一个成员进行筛选,而该成员本身是一个集合或者列表,就可以使用复合的from子句。
  筛选订单数量大于800的信息。

var query = from c in customers
            from o in c.Orders
            from d in o.Details
            where d.Quantity > 800
            select new { Name = c.Name, Total = d.UnitPrice * d.Quantity };

foreach (var item in query)
{
    Console.WriteLine(item.Name + "\t\t" + item.Total);
}
Console.ReadKey();

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第1张图片
  

排序

  要对序列排序,需要使用orderby子句。
  按照城市、顾客ID进行排序。 

var query = from c in customers
            from o in c.Orders
            orderby c.City, o.CustomerID
            select new { Name = c.Name, City = c.City, OrderID = o.OrderID };

foreach (var item in query)
{
    Console.WriteLine(item.Name + "\t\t" + item.City + "\t\t" + item.OrderID);
}
Console.ReadKey();

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第2张图片
    

分组

  要根木一个关键值对查询结果分组,可以使用group子句。
  统计各个产品的订单数量。  

var query = from d in details
            group d by d.ProductID into g
            orderby g.Count(), g.Key
            select new { Name = g.Key, Count = g.Count() };
Console.WriteLine("ProductID"+ "\t" + "Count");
foreach (var item in query)
{
    Console.WriteLine(item.Name + "\t\t" + item.Count);
}
Console.ReadKey();

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第3张图片
  

对嵌套的对象分组

  如果分组的对象包含嵌套的序列,则各个改变select子句创建的匿名类型。
  统计各个产品的订单数量,并输出各个订单的订货数量。

var query = from d in details
            group d by d.ProductID into g
            orderby g.Count(), g.Key
            select new
            {
                Name = g.Key,
                Count = g.Count(),
                Quantity =  from d in g
                            orderby d.Quantity
                            select d.Quantity
            };

Console.WriteLine("ProductID"+"\t"+"Count"+"\t"+"Quantity");
foreach (var item in query)
{
    Console.Write(item.Name + "\t\t" + item.Count+"\t");
    foreach (var quantity in item.Quantity)
    {
        Console.Write("{0};", quantity);
    }
    Console.WriteLine();
}
Console.ReadKey();

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第4张图片
  

连接

  使用join子句可以根据特定的条件合并两个数据源,但之前要获得两个要连接的列表。
  统计各个顾客和其订单的信息。

var query = from r in
                from c in customers
                from o in c.Orders
                from d in o.Details
                select new { Name = c.Name, City = c.City, Money = d.Quantity * d.UnitPrice, ProductID = d.ProductID }
            join t in
                from p in products
                select p
            on r.ProductID equals t.ProductID
            select new { Name = r.Name, City = r.City, Money = r.Money, ProductName = t.ProductName };
Console.WriteLine("Name" + "\t" + "City" + "\t" + "Money" + "\t" + "ProductName");
foreach (var item in query)
{
    Console.WriteLine(item.Name + "\t" + item.City + "\t" + item.Money + "\t" + item.ProductName);
}
Console.ReadKey();

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第5张图片
    

聚合操作符

  聚合操作符(包括Count()、Sum()、Min()、Max()、Average()和Aggregate())它们不返回一个序列,而是返回一个值。
  Count()方法返回集合中的项数;Sum()方法汇总序列中所有数字,返回这些数字的和;Min()方法返回集合中的最小值;Max()方法返回集合中的最大值;Average()方法计算集合中的平均值;Aggregate()方法,可以传递一个Lambda表达式,该表达式对所有的值进行聚合。
  这些方法的使用方式类似,都是直接对序列或者集合进行操作。下面用Sum()做一个示例:
  统计各个顾客总共订单的订货数量。

var query = from r in
                from c in customers
                select new
                {
                    Name = c.Name,
                    OrderCount = (  from o in c.Orders
                                    from d in o.Details
                                    select d.Quantity).Sum()
                }
            orderby r.OrderCount
            select r;

  输出结果:
  [深入学习C#]LINQ查询表达式详解(1)——基本语法、使用扩展方法和Lambda表达式简化LINQ查询_第6张图片

使用扩展方法和Lambda表达式简化LINQ查询

什么是扩展方法

  当方法的第一个形参包含this修饰符的时候,该方法称为扩展方法。扩展方法只能在非泛型、非嵌套的静态类中声明,扩展方法的第一个形参不能带有除this之外的其他任何修饰符,而且形参类型不能是指针类型。
  下面的程序是一个扩展方法的示例:

public static class Extensions
{
    public static void HelloWorld(this string str)
    {
        Console.WriteLine("{0} 调用了:HellWorld",str);
    }
}

  现在就可以调用该方法了:

string str="Jay";
str.HelloWorld();

  我们可以看到,控制台中输出了“Jay 调用了:HelloWorld”。
  之所以这样,是因为HelloWorld第一个参数类型为string类型,因此该方法就是string类型的扩展方法,所有的string类型变量都可以调用,而变量的内容就是传递给HelloWorld的参数。
  上面的程序和下面的代码结果一样:

string str = "Jay";
Extensions.HelloWorld(str);

LINQ扩展方法

  LINQ为IEnumerable<T>接口提供了各种扩展方法,以便用户在实现了该接口的任意集合上使用LINQ查询。表1中列出的LINQ查询操作符,都有相应的扩展方法实现。
  使用扩展方法可以和使用LINQ查询表达式获得十分类似甚至是相同的结果,当扩展方法和Lambda表达式结合的时候,会大大简化LINQ查询。
  

简化LINQ查询

  前面一节的条件筛选LINQ表达式可以简化为:

var query = customers.Where(c => c.City == "北京" && c.Name.StartsWith("小")).Select(c => c);

  
  前面一节的条件复合from子句筛选LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { _customer = c, _order = o, _detail = o.Details }).SelectMany(a => a._detail, (a, b) => new { _var = a, Total = b.Quantity * b.UnitPrice, Quantity = b.Quantity }).Where(_nameless => _nameless.Quantity > 800).Select(_annonymous => new { Name = _annonymous._var._customer.Name, Total = _annonymous.Total });

  
  前面一节的排序LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { _customer = c, _order = o }).OrderBy(_var => _var._customer.City).ThenBy(_var => _var._order.CustomerID).Select(_annonymous => new { Name = _annonymous._customer.Name, City = _annonymous._customer.City, OrderID = _annonymous._order.OrderID });

  
  前面一节的分组LINQ表达式可以简化为:

var query = details.GroupBy(d => d.ProductID).OrderBy(g => g.Count()).ThenBy(g => g.Key).Select(g => new { Name = g.Key, Count = g.Count() });

  
  前面一节的对嵌套的对象分组LINQ表达式可以简化为:

var query = details.GroupBy(d => d.ProductID).OrderBy(g => g.Count()).ThenBy(g => g.Key).Select(_var => new { Name = _var.Key, Count = _var.Count(), Quantity = _var.OrderBy(d => d.Quantity).Select(d => d.Quantity) });

  前面一节的连接LINQ表达式可以简化为:

var query = customers.SelectMany(c => c.Orders, (c, o) => new { Name = c.Name, City = c.City, Details = o.Details }).SelectMany(_var => _var.Details, (_var, _detail) => new { Name = _var.Name, City = _var.City, Money = _detail.Quantity * _detail.UnitPrice, ProductID = _detail.ProductID }).Join(products, a => a.ProductID, b => b.ProductID, (a, b) => new { Name = a.Name, City = a.City, Money = a.Money, ProductName = b.ProductName });

  
  前面一节的聚合操作LINQ表达式可以简化为:

var query = customers.Select(c => new { Name = c.Name, OrderCount = c.Orders.SelectMany(o => o.Details, (o, d) => new { _Quantity = d.Quantity }).Select(_var => _var._Quantity).Sum() }).OrderBy(_var => _var.OrderCount);

  以上利用扩展方法和Lambda表达式的简化后的LINQ查询代码的查询结果,与LINQ查询表达式结果完全一样,证明这样是完全可行的。
  唯一的问题就是代码看起来比较费解了。

LINQ查询表达式简化转换原则

  看到这里我们可能要奇怪,为什么我们能用这样的方式来简化LINQ查询表达式呢?
  关于这个问题,我们将在下一篇文章进行详细讲解。
  欢迎大家点击阅读。
  本人还是菜鸟,写的不对的地方还请各位不吝赐教!

你可能感兴趣的:(C#学习)