LINQ中提供了很多集合的扩展方法,配合lambda能简化数据处理。
例如我们想要找出一个IEnumerable<int>
中所有大于10的元素,使用LINQ则可以这样写
static void Main(string[] args) { int[] nums = new int[] { 3, 5, 6, 5, 10, 12, 14, 7 }; IEnumerable<int> res = nums.Where(a => a > 10); foreach (int i in res) Console.WriteLine(i); }
其中使用IEnumerable
要using System.Collections.Generic;
使用Where
方法要using System.Linq;
,该方法会遍历每个元素然后去判断是否大于10
为了解LINQ背后的原理,我们首先去实现一个简单的Where
方法
第一种方案:
static IEnumerable<int> MyWhere1(IEnumerable<int> items, Func<int, bool> f) { List<int> res = new List<int>(); foreach (int i in items) if (f(i) == true) res.Add(i); return res; }
第二种方案:
static IEnumerable<int> MyWhere2(IEnumerable<int> items, Func<int, bool> f) { List<int> res = new List<int>(); foreach (int i in items) if (f(i) == true) yield return i; }
那么这两种方案的区别是什么?第一种方案是把所有元素全部检查一遍,把符合要求的元素放到List<int> res
里面,然后返回res
;然而第二种方案使用yield
,是一种“流水线”方式处理,找到符合条件的元素立即返回,返回后Console.WriteLine
立即能够打印,从而提高了数据处理效率。
LINQ提供了很多扩展方法,大部分都在System.Linq
命名空间中。
接下来准备一些数据,用于下面的操作。
首先定义一个员工类,里面有姓名工资等成员。
class Employee { public int Id { get; set; } public string Name { get; set; } public int Age { get; set; } public bool Gender { get; set; } public int Salary { get; set; } public override string ToString() { return $"ID={Id}, Name={Name}, Age={Age}, Gender={Gender}, Salary={Salary}"; } }
然后再Main方法中创建实例导入数据,并将所有实例保存到列表中。
List<Employee> lst = new List<Employee>(); lst.Add(new Employee { Id = 1, Name = "jerry", Age = 28, Gender = true, Salary = 5000 }); lst.Add(new Employee { Id = 2, Name = "jim", Age = 33, Gender = true, Salary = 3000 }); lst.Add(new Employee { Id = 3, Name = "lily", Age = 35, Gender = false, Salary = 9000 }); lst.Add(new Employee { Id = 4, Name = "lucy", Age = 16, Gender = false, Salary = 2000 }); lst.Add(new Employee { Id = 5, Name = "kimi", Age = 25, Gender = true, Salary = 1000 }); lst.Add(new Employee { Id = 6, Name = "nancy", Age = 35, Gender = false, Salary = 8000 }); lst.Add(new Employee { Id = 7, Name = "zack", Age = 35, Gender = true, Salary = 8500 }); lst.Add(new Employee { Id = 8, Name = "jack", Age = 33, Gender = true, Salary = 8000 });
该方法会遍历每个元素然后去判断是否符合条件,符合条件的元素则被返回。
IEnumerable<Employee> res = lst.Where(e => e.Age > 20); //把年龄大于20的返回过来 foreach (Employee e in res) Console.WriteLine(e);
返回结果
ID=1, Name=jerry, Age=28, Gender=True, Salary=5000 ID=2, Name=jim, Age=33, Gender=True, Salary=3000 ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=5, Name=kimi, Age=25, Gender=True, Salary=1000 ID=6, Name=nancy, Age=35, Gender=False, Salary=8000 ID=7, Name=zack, Age=35, Gender=True, Salary=8500 ID=8, Name=jack, Age=33, Gender=True, Salary=8000
该方法会返回符合条件的元素的个数
Console.WriteLine(lst.Count(e=>e.Salary>8000));
返回结果
2
该方法会判断是否存在至少一个元素符合条件。另外,如果传入的参数为空,则会判断IEnumerable
(或者实现了IEnumerable
接口的其他类,如List
)是否存在元素。
如以下代码
List<int> test = new List<int>(); Console.WriteLine(test.Any());
由于列表为空,test.Any()
返回的就是false
如果判断是否存在Employee
类型的元素于lst
中,则代码如下,其返回值为true
Console.WriteLine(lst.Any(e=>e.Salary>8000));
同样的,我们使用Count
方法也可以达成此目的(判断返回元素个数是否为0),但是Count
方法相对于Any
方法效率较低。
这是因为Any
找到一个符合条件的元素会立即返回,而Count
方法是统计个数,找到一个符合元素后还要继续向后找。
有关一条数据的方法有好几种,不过在细节上略有不一样,所以我们把他们放一块介绍。
方法 | 描述 |
---|---|
Single() |
有且只有一条满足要求的数据 |
SingleOrDefault() |
最多只有一条满足要求的数据 |
First() |
至少有一条,并且返回第一条 |
FirstOrDefault() |
返回第一条或默认值 |
Signle方法
Employee elem = lst.Single(e => e.Salary > 8000); //错误,有多条数据满足条件 Employee elem = lst.Single(e => e.Salary > 8500); //正确,仅一条数据满足条件
SingleOrDefault方法
对于SingleOrDefault
,当且仅当存在一条数据满足条件,返回该数据;如果存在多条则报错;如果不存在则返回默认值。
Employee elem = lst.SingleOrDefault(e=>e.Salary>8000); //错误,有多条数据满足条件 Employee elem = lst.SingleOrDefault(e=>e.Salary>8500); //正确,仅一条数据满足条件
下面我们来看下默认值的情况
int[] nums = new int[] { 1, 2, 3 }; int i = nums.SingleOrDefault(i => i > 10); Console.WriteLine(i);
由于不存在大于10的整型数字,所以该方法返回变量i
的默认值,输出结果为0
First方法
该方法要求数据至少有一条满足条件,并且只返回查询到的第一条数据。
Employee test = lst.First(e=>e.Salary>9000); //报错,不存在数据满足条件
//正确,满足年龄大于16的有多条,仅按照我们添加数据的顺序返回第一条 Employee test = lst.First(e=>e.Age>16); Console.WriteLine(test);
输出结果
ID=1, Name=jerry, Age=28, Gender=True, Salary=5000
FirstOrDefault方法
该方法返回符合条件的第一条数据,否则返回默认值
如下方代码,从数组中返回一个大于2的整数,其输出结果为3
int[] nums = new int[] { 1, 2, 3, 4, 5, 6 }; int i = nums.FirstOrDefault(e => e > 2); Console.WriteLine(i);
我们再来看看返回默认值的情况
int[] nums = new int[] { 1, 2, 3, 4, 5, 6 }; int i = nums.FirstOrDefault(e => e > 10); Console.WriteLine(i);
由于数组中不存在大于10的数,所以i
的值就是其默认值0
排序方法有两种
方法 | 描述 |
---|---|
OrderBy() |
正序排序 |
OrderByDescending() |
逆序排序 |
二者用法几乎一致,此处仅演示OrderBy
方法
IEnumerable<Employee> res2 = lst.OrderBy(e => e.Age); foreach (Employee e in res2) Console.WriteLine(e);
其输出结果为
ID=4, Name=lucy, Age=16, Gender=False, Salary=2000 ID=5, Name=kimi, Age=25, Gender=True, Salary=1000 ID=1, Name=jerry, Age=28, Gender=True, Salary=5000 ID=2, Name=jim, Age=33, Gender=True, Salary=3000 ID=8, Name=jack, Age=33, Gender=True, Salary=8000 ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=6, Name=nancy, Age=35, Gender=False, Salary=8000 ID=7, Name=zack, Age=35, Gender=True, Salary=8500
很显然数据已经按照年龄从小至大的顺序进行排序了。
此外应该注意的是,该方法必须有参数。如果想要对一个数组进行排序,正确写法如下
int[] nums2 = new int[] { 3, 1, 2, 4, 5, 6 }; IEnumerable<int> resNum = nums2.OrderBy(i => i); //写成nums2.OrderBy()是错误的
所谓多排序,就是按照一个条件对数据进行排序后,存在多个数据该条件下的值一致,然后再对这些值一致的数据按照其他条件排序。
其方法也有两个,一般是在OrderBy()
或OrderByDescending()
之后调用
方法 | 描述 |
---|---|
ThenBy() |
正序再排序 |
ThenByDescending() |
逆序再排序 |
我们对文章上方的数据首先按照对年龄进行排序,然后对年龄一致的员工再按照工资进行逆排序,编写代码如下:
IEnumerable<Employee> sortTest = lst.OrderBy(x => x.Age).ThenByDescending(x => x.Salary); foreach (Employee emp in sortTest) Console.WriteLine(emp);
输出如下:
ID=4, Name=lucy, Age=16, Gender=False, Salary=2000 ID=5, Name=kimi, Age=25, Gender=True, Salary=1000 ID=1, Name=jerry, Age=28, Gender=True, Salary=5000 ID=8, Name=jack, Age=33, Gender=True, Salary=8000 ID=2, Name=jim, Age=33, Gender=True, Salary=3000 ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=7, Name=zack, Age=35, Gender=True, Salary=8500 ID=6, Name=nancy, Age=35, Gender=False, Salary=8000
限制结果集,获取部分数据的方法一般是利用Skip
和Take
方法
例如我想要从上述员工数据中,获取从第2条开始连续的3条数据,则代码可以这样写;
IEnumerable<Employee> sortTest = lst.Skip(2).Take(3); foreach (Employee emp in sortTest) Console.WriteLine(emp);
其输出结果如下:
ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=4, Name=lucy, Age=16, Gender=False, Salary=2000 ID=5, Name=kimi, Age=25, Gender=True, Salary=1000
当然,Skip
方法和Take
方法也可以单独使用:
Take单独使用
IEnumerable<Employee> sortTest = lst.Take(3); foreach (Employee emp in sortTest) Console.WriteLine(emp);
输出:
ID=1, Name=jerry, Age=28, Gender=True, Salary=5000 ID=2, Name=jim, Age=33, Gender=True, Salary=3000 ID=3, Name=lily, Age=35, Gender=False, Salary=9000
Skip单独使用
IEnumerable<Employee> sortTest = lst.Skip(2); foreach (Employee emp in sortTest) Console.WriteLine(emp);
输出:
ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=4, Name=lucy, Age=16, Gender=False, Salary=2000 ID=5, Name=kimi, Age=25, Gender=True, Salary=1000 ID=6, Name=nancy, Age=35, Gender=False, Salary=8000 ID=7, Name=zack, Age=35, Gender=True, Salary=8500 ID=8, Name=jack, Age=33, Gender=True, Salary=8000
LINQ聚合函数常用的有这些,但应当注意的是它们的返回值类型不与其他LINQ的方法一样是IEnumerable
,而是条件的值的类型。
方法 | 描述 |
---|---|
Max() |
返回给定条件的最大值 |
Min() |
返回给定条件的最小值 |
Average() |
返回给定条件的平均值 |
Sum() |
返回给定条件的和 |
Count() |
统计满足条件的数据的个数 |
这些方法用法大致相同,甚至Count
方法在上文中已经介绍过,此处仅用Max
方法演示
int maxSalary = lst.Max(x => x.Salary); Console.WriteLine(maxSalary);
该样例会输出所有员工的最大工资(请注意maxSalary的类型)
如果想要找到大于30岁的员工的最高工资,则可以
int maxSalary = lst.Where(x=>x.Age > 30).Max(x => x.Salary);
该方法用于对数据分组,其参数是分组条件表达式,返回值为IGrouping<TKey, TSource>
类型的泛型IEnumerable。
我们编写代码来实现很具年龄分组:
IEnumerable<IGrouping<int, Employee>> items = lst.GroupBy(x => x.Age); foreach (var item in items) { Console.WriteLine($"年龄为{item.Key}的分组成员有:"); foreach (var i in item) Console.WriteLine(i); Console.WriteLine(); }
其输出结果为:
年龄为28的分组成员有: ID=1, Name=jerry, Age=28, Gender=True, Salary=5000 年龄为33的分组成员有: ID=2, Name=jim, Age=33, Gender=True, Salary=3000 ID=8, Name=jack, Age=33, Gender=True, Salary=8000 年龄为35的分组成员有: ID=3, Name=lily, Age=35, Gender=False, Salary=9000 ID=6, Name=nancy, Age=35, Gender=False, Salary=8000 ID=7, Name=zack, Age=35, Gender=True, Salary=8500 年龄为16的分组成员有: ID=4, Name=lucy, Age=16, Gender=False, Salary=2000 年龄为25的分组成员有: ID=5, Name=kimi, Age=25, Gender=True, Salary=1000
通过打印我们可以发现IEnumerable
元素为IGrouping
类型,其键与值对应关系是一对多的。在这里每个元素的键就是年龄,而值为具有相同年龄的Employee
类型的员工数据。
投影是把集合中每一项转化为另外一种类型。
IEnumerable<string> items = lst.Where(x => x.Salary > 5000).Select(x => x.Gender ? "男" : "女"); foreach (var item in items) Console.WriteLine(item);
输出结果为:
女 女 男 男
匿名类型没有名称,所以我们没有办法去用类型名去声明它,而是需要用到var
关键字
var items = lst.Select(e => new { XingMing = e.Name, NianLing = e.Age, Xingbie = e.Gender ? "男" : "女" }); foreach (var item in items) Console.WriteLine(item);
其输出结果为:
{ XingMing = jerry, NianLing = 28, Xingbie = 男 } { XingMing = jim, NianLing = 33, Xingbie = 男 } { XingMing = lily, NianLing = 35, Xingbie = 女 } { XingMing = lucy, NianLing = 16, Xingbie = 女 } { XingMing = kimi, NianLing = 25, Xingbie = 男 } { XingMing = nancy, NianLing = 35, Xingbie = 女 } { XingMing = zack, NianLing = 35, Xingbie = 男 } { XingMing = jack, NianLing = 33, Xingbie = 男 }
在实际使用中,我们往往不是一定用IEnumerable
,还有可能是List
等,所以需要用到类型转换
例如我们利用Where
方法返回工资大于6000的员工存放到IEnumerable
中,然后将其转化为List
类型
List<Employee> lst2 = lst.Where(e => e.Salary > 6000).ToList();
此外还有ToArray
等方法,此处不过多说明。
所谓链式调用就是调用完一个函数(方法)后还能再后面继续跟着调用其它函数(方法)。
由于LINQ绝大多数方法返回的都是IEnumerable
方法,而且绝大部分都是针对IEnumerable
接口,所以可以在调用方法后继续调用其他方法。
lst.Where(e => e.Salary > 6000).ToList();
例如我们定义数组
int[] nums = new int[] { 1, 2, 3, 4, 5, 6 };
在小于3的元素中选取最大值
int a = nums.Where(x=>x<3).Max();
对于上面这行nums.Where(x=>x<3).Max()
在Where
方法后加一个点然后再调用Max
方法的形式就叫做链式调用。
对于上述的使用Where
、Select
等扩展方法进行数据查询的写法叫做LINQ方法语法。
然而还有一种叫做查询语法。
我们同样定义一个数组演示
int[] nums = new int[] { 6,5,4,3,2,1 };
我们取小于3的元素,然后进行正序排序,则用查询语法则可以如下:
var items = from e in nums where e < 3 orderby e select e;
这里需要注意,查询语法需要以select或group子句结尾
那么问题来了,方法语法与查询语法有什么区别?我们可以用方法语法写一段相同效果的语法,然后用反编译器(ILSpy)去看一下代码。
其反编译结果给出了查询语法的形式,然后对查询语法生成文件进行反编译,发现结果相同,这说明两种方法在编译后没有任何区别只是写法不同
LINQ的基本操作大致就这些,感谢杨中科老师提供的课程