原文地址:http://www.sdfengxi.com/?p=376
我想很多同学会有类似的疑问,就是我配置好了CloudStack或者OpenStack之类的环境之后能够提供什么服务或者应用呢?下面我就我们公司这一年多来搭建CloudStack及在其上而进行的开发做一下简单描述,大家可能会对CloudStack这类云平台能干什么用有更进一步的认识。
公司刚刚准备本地地税局的云计算试点项目时,我测试搭建了openstack,而另一位同事则负责测试CloudStack,后来参考了网上对openstack与CloudStack的比较,觉得CloudStack在稳定性及对某些特定环境的支持方面可能比openstack更好,最终我们选择了CloudStack作为基础云计算平台。
从测试OpenStack云平台到现在一年多的时间了,由于中间过程中我经常还得负责公司其他的一些项目的开发和其他一些杂七杂八的事情,另外对于类似交换机设置、vlan划分、NAT什么的了解也不够深入,搭建与配置CloudStack主要都是由我另外一个同事完成的,对于CloudStack的了解也就只能算是略知皮毛吧。
闲扯了这么多背景,下面该说下正题了:我们使用CloudStack都做了什么呢?
采用CloudStack是针对本地地税局项目而进行的,刚开始的时候是想使用CloudStack建立桌面云,初步设想是可以让地税局的员工办公使用瘦终端,类似无盘工作站那种配置很低的机器,而且在智能手机、平板等终端上也可以随时随地办公。不过这个方案上报到省地税局之后因为考虑到安全因素而被否定了,于是便着手进行第二期的应用:结合金税三期的使用搭建云培训平台,统一部署好金税三期的培训环境为纳税人提供虚拟机,而地税人员也可以使用手机、平板等终端进行咨询协助等服务。目前第二期的开发还在进行ing。
感觉最近这几年云计算这概念火了起来,什么和云一扯上就让人听着觉得高端大气上档次,但我这两年对云计算接触最多的就是类似阿里云、天翼云之类的提供的所谓云主机,或者是百度云、金山快盘等等网盘的应用,我猜想大概也是用OpenStack、CloudStack等等的云平台创建了众多的虚拟机来提供这些服务的,但是我总觉得云平台的稳定性、安全性方面还有所欠缺。
十二天深入理解计算机系统(一)
计算机系统漫游
1 信息就是位+上下文
系统中所有的信息都是由一串位表示的,在不同的上下文中,一个同样的字节序列可能表示一个整数、浮点数、字符串或者机器指令。
2 文本文件和二进制文件
有ASCII字符构成的文件称为文本文件,所有其他文件都是二进制文件。
3 源程序到可执行目标文件的过程
1)预处理 根据以字符#开头的命令,修改原始的hello.c程序,生成hello.i文件。
2)编译阶段 把hello.i文件翻译为汇编语言的hello.s文本文件。
3)汇编阶段 把hello.s翻译为可重定位目标文件hello.o
4)连接阶段 合并hello.o、printf.o生成可执行目标文件
4 字
与总线相关的概念,总线每次可以转送一个字,字中的字节数是一个基本的系统参数,一般为四个字节。
5 进程
是对处理器、主存、I/O设备的抽象,比如我们运行一个程序,看上去只有这个程序在使用处理器、主存和I/O设备。
6 虚拟存储器
是主存和I/O设备的抽象,每个进程看到的是一致的存储器。详细介绍请参考我前面的文章内存管理之程序内存分布
7 文件
是I/O设备的抽象,为应用程序提供了一个统一的视角,来看待系统中可能含有的所有各式各样的I/O设备。
8 多处理器 多核以及超线程
这几个概念可以参考我前面的文章超线程 多核 多处理器区别
9 超标量
指在一个时钟周期执行比一条指令更快的速率。
10 总结
本章主要介绍一些基本概念。但是我们除了了解这些基本概念外,我们要学到一种基本思想--抽象,比如抽象出进程、虚拟存储器、文件以及我们在编程中对代码抽象出了函数,对函数抽象出了类等等。
Linq之旅:Linq入门详解(Linq to Objects)
示例代码下载:Linq之旅:Linq入门详解(Linq to Objects)
本博文详细介绍 .NET 3.5 中引入的重要功能:Language Integrated Query(LINQ,语言集成查询)。通过LINQ,我们可以使用相同API操作不同的数据源。接下来就让我们看看LINQ是什么以及如何使用?
再此之前,需要先了解的相关技术
- 隐式类型、匿名类型、对象初始化器
1) 隐式类型,使用var关键字创建,C#编译器会根据用于初始化局部变量的初始值推断出变量的数据类型。(不过我个人认为,能用具体类型的地方尽量不要用var关键字,因为这样会让你遗忘“被封装类库”方法的返回值类型)
隐式类型使用限制:
a) 隐式类型只能应用于方法或者属性内局部变量的声明,不能使用var来定义返回值、参数的类型或类型的数据成员。
b) 使用var进行声明的局部变量必须赋初始值,并且不能以null作为初始值。
2) 匿名类型,只是一个继承了Object的、没有名称的类。C#编译器会在编译时自动生成名称唯一的类。
3) 对象初始化器,提供一种非常简洁的方式来创建对象和为对象的属性赋值。(相关还有“集合初始化器”)
由于C#强类型语言,即我们在声明变量时必须指定变量的具体类型。所以在创建匿名对象时,需要结合隐式类型、匿名类型、对象初始化器一起创建匿名对象。(避免类型转换)
示例:
var person = new { name = “heyuquan” , age = 24 }
- Lambda表达式,Func委托
1) Lambda表达式只是用更简单的方式来书写匿名方法,从而彻底简化.NET委托类型的使用。
Lambda表达式在C#中的写法是“arg-list => expr-body”,“=>”符号左边为表达式的参数列表,右边则是表达式体(body)。参数列表可以包含0到多个参数,参数之间使用逗号分割。
2) Func委托
Func委托,是微软为我们预定义的常用委托,封装一个具有:零个或多个指定类型的输入参数并返回一个指定类型的结果值的方法。
示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
|
static void Main( string [] args) { // 委托函数 Func< string , string , string > func1 = Hello; // 匿名方法 Func< string , string , string > func2 = delegate ( string a, string b) { return "欢迎光临我的博客" + Environment.NewLine + a + " " + b; }; // Lambda表达式 Func< string , string , string > func3 = (a, b) => { return "欢迎光临我的博客" + Environment.NewLine + a + " " + b; }; // 调用Func委托 Console.WriteLine(helloStr); } static string Hello( string a, string b) { return "欢迎光临我的博客" + Environment.NewLine + a + " " + b; } |
- 扩展方法
1) 扩展方法声明在静态类中,定义为一个静态方法,其第一个参数需要使用this关键字标识,指示它所扩展的类型。
2) 扩展方法可以将方法写入最初没有提供该方法的类中。还可以把方法添加到实现某个接口的任何类中,这样多个类就可以使用相同的实现代码。(LINQ中,System.Linq.Queryable.cs和System.Linq.Enumerable.cs 正是对接口添加扩展方法)
3) 扩展方法虽定义为一个静态方法,但其调用时不必提供定义静态方法的类名,只需引入对应的命名空间,访问方式同实例方法。
4) 扩展方法不能访问它所扩展的类型的私有成员。
示例:
1
2
3
4
5
6
7
8
9
|
public static IEnumerable<TSource> MyWhere<TSource>( this IEnumerable<TSource> source, Func<TSource, bool > predicate) { foreach (TSource item in source) { if (predicate(item)) yield return item; } } |
- Yield迭代器,延迟计算
1) Yield迭代器
在上面定义的MyWhere扩展方法中,我们使用了yield迭代器。使我们不必“显示”实现IEnumerable或IEnumerator接口。只需要简单的使用 yield 关键字,由 JIT 编译器帮我们编译成实现 IEnumerable或IEnumerator 接口的对象(即:本质还是传统遍历,只是写法上非常简洁),就能使用foreach进行遍历。
请详看:《C#稳固基础:传统遍历与迭代器》,通过这篇博文我们可以学会如何实现foreach遍历以及foreach执行遍历的详细过程如下图所示:
2) 延迟计算(Lazy evaluation)
a) 定义:来源自函数式编程,在函数式编程里,将函数作为参数来传递,传递过程中不会执行函数内部耗时的计算,直到需要这个计算结果的时候才调用,这样就可以因为避免一些不必要的计算而改进性能。
b) Yield迭代器的延迟计算原理:JIT 编译器会帮助我们将迭代主体编译到IEnumerator.MoveNext()方法中。从上图foreach的执行流程来看,迭代主体是在每次遍历执行到 in 的时候才会调用MoveNext(),所以其迭代器耗时的指令是延迟计算的。
c) LINQ查询的延迟计算原理:通过给LINQ扩展方法传递方法委托,作为yield迭代器的主体,让遍历执行到MoveNext()时才执行耗时的指令。
- 表达式树
表达式树:表达式树允许在运行期间建立对数据源的查询,因为表达式树存储在程序集中。(后续在Linq to entities博文中与Queryable一起解说)
Language Integrated Query(LINQ,语言集成查询)
从这幅图中,我们可以知道LINQ包括五个部分:LINQ to Objects、LINQ to XML、LINQ to SQL、LINQ to DataSet、LINQ to Entities。
|
程序集 |
命名空间 |
描述 |
LINQ to Objects |
System.Core.dll |
System.Linq |
提供对内存中集合操作的支持 |
LINQ to XML |
System.Xml.Linq.dll |
System.Xml.Linq |
提供对XML数据源的操作的支持 |
LINQ to SQL |
System.Data.Linq.dll |
System.Data.Linq |
提供对Sql Server数据源操作的支持。(微软已宣布不再更新,推荐使用LINQ to Entities) |
LINQ to DataSet |
System.Data.DataSetExtensions.dll |
System.Data |
提供对离线数据操作的支持。 |
LINQ to Entities |
System.Core.dll 和System.Data.Entity.dll |
System.Linq 和System.Data.Objects |
LINQ to Entities 是 Entity Framework 的一部分并且取代LINQ to SQL 作为在数据库上使用 LINQ 的标准机制。(Entity Framework 是由微软发布的开源对象-关系映射(ORM)框架,支持多种数据库。) |
目前,还可以下载其他第三方提供程序,例如LINQ to JSON、LINQ to MySQL、LINQ to Amazon、LINQ to Flickr和LINQ to SharePoint。无论使用什么数据源,都可以通过LINQ使用相同的API进行操作。
- 怎样区分LINQ操作时,使用的是哪个LINQ提供程序?
LINQ提供程序的实现方案是:根据命名空间和第一个参数的类型来选择的。实现扩展方法的类的命名空间必须是打开的,否则扩展类就不在作用域内。Eg:在LINQ to Objects中定义的 Where() 方法参数和在 LINQ to Entities中定义的 Where() 方法实现是不同。
// LINQ to Objects:
1
2
3
4
5
|
public static class Enumerable { public static IEnumerable<TSource> Where<TSource>( this IEnumerable<TSource> source, Func<TSource, bool > predicate); } |
// LINQ to Entities
1
2
3
4
5
|
public static class Queryable { public static IQueryable<TSource> Where<TSource>( this IQueryable<TSource> source, Expression<Func<TSource, bool >> predicate); } |
- LINQ查询提供几种操作语法?
LINQ查询时有两种语法可供选择:查询表达式(Query Expression)和方法语法(Fluent Syntax)。
.NET公共语言运行库(CLR)并不具有查询表达式的概念。所以,编译器会在程序编译时把查询表达式转换为方法语法,即对扩展方法的调用。所以使用方法语法会让我们更加接近和了解LINQ的实现和本质,并且一些查询只能表示为方法调用。但另一方面,查询表达式通常会比较简单和易读。不管怎样,这两种语法是互相补充和兼容的,我们可以在一个查询中混合使用查询表达式和方法语法。
以下扩展方法存在对应的查询表达式关键字:Where、Select、SelectMany、OrderBy、ThenBy、OrderByDescending、ThenByDescending、GroupBy、Join、GroupJoin。
LINQ查询表达式
约束 |
LINQ查询表达式必须以from子句开头,以select或group子句结束。 |
|
|
关键字 |
功能 |
from…in… |
指定要查找的数据源以及范围变量,多个from子句则表示从多个数据源查找数据。 注意:c#编译器会把“复合from子句”的查询表达式转换为SelectMany()扩展方法。 |
join…in…on…equals… |
指定多个数据源的关联方式 |
let |
引入用于存储查询表达式中子表达式结果的范围变量。通常能达到层次感会更好,使代码更易于阅读。 |
orderby、descending |
指定元素的排序字段和排序方式。当有多个排序字段时,由字段顺序确定主次关系,可指定升序和降序两种排序方式 |
where |
指定元素的筛选条件。多个where子句则表示了并列条件,必须全部都满足才能入选。每个where子句可以使用谓词&&、||连接多个条件表达式。 |
group |
指定元素的分组字段。 |
select |
指定查询要返回的目标数据,可以指定任何类型,甚至是匿名类型。(目前通常被指定为匿名类型) |
into |
提供一个临时的标识符。该标识可以引用join、group和select子句的结果。 1) 直接出现在join子句之后的into关键字会被翻译为GroupJoin。(into之前的查询变量可以继续使用) 2) select或group子句之后的into它会重新开始一个查询,让我们可以继续引入where, orderby和select子句,它是对分步构建查询表达式的一种简写方式。(into之前的查询变量都不可再使用) |
书写模版如下:
下面以 LINQ to Objects 为例,介绍LINQ中的各种查询。
LINQ to Objects
LINQ to Objects 提供对内存中集合操作的支持,由程序集System.Core.dll中System.Linq命名空间下的Enumerable静态类提供。
运算符图解:
一、 示例业务背景介绍
示例参考《C#高级编程(第六版)》LINQ章节(P267 - P296),进行改编。
打开示例代码我们看到:
- Racer.cs 文件,定义一级方程式世界车手冠军信息。
- Team.cs 文件,定义一级方程式世界车队冠军信息。
- Formula1.cs 文件,包含两个重要静态方法:(F1是"Formula One"的缩写)
1) GetChampions():返回一组车手列表。这个列表包含了1950到2007年之间的所有一级方程式世界车手冠军。
2) GetContructorChampions():返回一组车队列表。这个列表包含了1985到2007年之间的所有一级方程式世界车队冠军,车队冠军是从1985年开始设立的(是由国际汽车联合会颁发给一个赛季内最成功的一级方程式车队的奖励)。
二、 各种LINQ示例
- 过滤操作符
根据条件返回匹配元素的集合IEnumerable<T>。
1) Where:根据返回bool值的Func委托参数过滤元素。
业务说明:查询获得车手冠军次数大于15次且是Austria国家的一级方程式赛手
1
2
3
4
5
6
7
|
// 查询表达式 var racer = from r in Formula1.GetChampions() where r.Wins > 15 && r.Country == "Austria" select r; // 方法语法 var racer = Formula1.GetChampions().Where(r => r.Wins > 15 && r.Country == "Austria" ); |
2) OfType<TResult>:接收一个非泛型的IEnumerable集合,根据OfType泛型类型参数过滤元素,只返回TResult类型的元素。
业务说明:过滤object数组中的元素,返回字符串类型的数组。
1
2
|
object [] data = { "one" , 2, 3, "four" , "five" , 6 }; var query = data.OfType< string >(); // "one", "four", "five" |
3) Distinct:删除序列中重复的元素。
- 投影操作符
1) Select 将序列的每个元素经过lambda表达式处理后投影到一个新类型元素上。(与SelectMany不同在于,若单个元素投影到IEnumerable<TResult>,Select不会对多个IEnumerable<TResult>进行合并)
API:
1
2
3
|
public static IEnumerable<TResult> Select<TSource, TResult>( this IEnumerable<TSource> source , Func<TSource, TResult> selector); |
2) SelectMany
a) c#编译器会把“复合from子句”的查询表达式转换为SelectMany()扩展方法。
b) 将序列的每个元素经过lambda表达式处理后投影到一个 IEnumerable<TResult>,再将多个IEnumerable<TResult>序列合并为一个返回序列IEnumerable<TResult>。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
public static IEnumerable<TResult> SelectMany<TSource , TResult>( this IEnumerable<TSource> source , Func<TSource, IEnumerable<TResult>> selector); //示例: string [] fullNames = { "Anne Williams" , "John Fred Smith" , "Sue Green" }; IEnumerable< string > query = fullNames.SelectMany(name => name.Split()); foreach ( string name in query) Console.Write(name + "|" ); // Anne|Williams|John|Fred|Smith|Sue|Green| //如果使用Select,则需要双重循环。 IEnumerable< string []> query = fullNames.Select(name => name.Split()); foreach ( string [] stringArray in query) foreach ( string name in stringArray) Console.Write(name + "|" ); // Anne|Williams|John|Fred|Smith|Sue|Green| |
c) 将序列的每个元素经过lambda表达式处理后投影到一个 IEnumerable<TCollection>,再将多个IEnumerable<TCollection>序列合并为一个返回序列IEnumerable<TCollection>,并对其中每个元素调用结果选择器函数。
1
2
3
4
|
public static IEnumerable<TResult> SelectMany<TSource, TCollection , TResult>( this IEnumerable<TSource> source , Func<TSource, IEnumerable<TCollection>> collectionSelector , Func<TSource, TCollection, TResult> resultSelector);<br><br> |
示例:
业务说明:(Racer类定义了一个属性Cars,Cars是一个字符串数组。)过滤驾驶Ferrari的所有冠军
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
// 查询表达式 var ferrariDrivers = from r in Formula1.GetChampions() from c in r.Cars where c == "Ferrari" orderby r.LastName select r.FirstName + " " + r.LastName; // 方法语法 var ferrariDrivers = Formula1.GetChampions() .SelectMany( r => r.Cars, (r, c) => new { Racer = r, Car = c } ) .Where(r => r.Car == "Ferrari" ) .OrderBy(r => r.Racer.LastName) .Select(r => r.Racer.FirstName + " " + r.Racer.LastName);<br><br> |
- 排序操作符
1) OrderBy<TSource,TKey>,OrderByDescending<TSource,TKey>:根据指定键按升序或降序对集合进行第一次排序,输出IOrderedEnumerable<TSource>。
2) ThenBy<TSource,TKey>,ThenByDescending<TSource,TKey>:只会对那些在前一次排序中拥有相同键值的elements重新根据指定键按升序或降序排序。输入IOrderedEnumerable <TSource>。
业务说明:获取车手冠军列表,并依次按照Country升序、LastName降序、FirstName升序进行排序。
1
2
3
4
5
6
7
8
9
|
// 查询表达式 var racers = from r in Formula1.GetChampions() orderby r.Country, r.LastName descending , r.FirstName select r; // 方法语法 var racers = Formula1.GetChampions() .OrderBy(r => r.Country) .ThenByDescending(r => r.LastName) .ThenBy(r => r.FirstName); |
3) Reverse<TSource>:反转集合中所有元素的顺序。
- 连接操作符
先准备两个集合,如下:(racers表示在1958到1965年间获得车手冠军的信息列表;teams表示在1958到1965年间获得车队冠军的信息列表)
1
2
3
4
5
6
7
8
9
10
11
12
|
var racers = from r in Formula1.GetChampions() from y in r.Years where y > 1958 && y < 1965 select new { Year = y, Name = r.FirstName + " " + r.LastName }; var teams = Formula1.GetContructorChampions() .SelectMany(y => y.Years, (t, y) => new { Year = y, Name = t.Name }) .Where(ty => ty.Year > 1958 && ty.Year < 1965); |
注意:join…on…关键字后的相等使用equals关键字。
1) Join:基于匹配键对两个序列的元素进行关联。
API:
1
2
3
4
|
public static IEnumerable<TResult> Join<TOuter, TInner, TKey, TResult>( this IEnumerable<TOuter> outer, IEnumerable<TInner> inner , Func<TOuter, TKey> outerKeySelector, Func<TInner, TKey> innerKeySelector , Func<TOuter, TInner, TResult> resultSelector); |
业务说明:返回1958到1965年间的车手冠军和车队冠军信息,根据年份关联
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
// 查询表达式 var racersAndTeams = from r in racers join t in teams on r.Year equals t.Year select new { Year = r.Year, Racer = r.Name, Team = t.Name }; // 方法语法 var racersAndTeams = racers.Join(teams , r => r.Year, t => t.Year , (r, t) => new { Year = r.Year, Racer = r.Name, Team = t.Name } ); |
2) GroupJoin:基于键相等对两个序列的元素进行关联并对结果进行分组。常应用于返回“主键对象-外键对象集合”形式的查询。
API:
1
2
3
4
|
public static IEnumerable<TResult> GroupJoin<TOuter, TInner, TKey, TResult>( this IEnumerable<TOuter> outer, IEnumerable<TInner> inner , Func<TOuter, TKey> outerKeySelector, Func<TInner, TKey> innerKeySelector , Func<TOuter, IEnumerable<TInner>, TResult> resultSelector); |
业务说明:返回1958到1965年间的车手冠军和车队冠军信息,根据年份关联并分组
注意:直接出现在join子句之后的into关键字会被翻译为GroupJoin,而在select或group子句之后的into表示继续一个查询。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
// 查询表达式 var racersAndTeams = from r in racers join t in teams on r.Year equals t.Year into groupTeams select new { Year = r.Year, Racer = r.Name, GroupTeams = groupTeams }; // 方法语法 var racersAndTeams = racers .GroupJoin(teams , r => r.Year, t => t.Year , (r, t) => new { Year = r.Year, Racer = r.Name, GroupTeams = t } ); |
3) join…on…equals…支持多个键关联
可以使用匿名类型来对多个键值进行Join,如下所示:
from x in sequenceX
join y in sequenceY on new { K1 = x.Prop1, K2 = x.Prop2 }
equals new { K1 = y.Prop3, K2 = y.Prop4 }
...
两个匿名类型的结构必须完全一致,这样编译器会把它们对应到同一个实现类型,从而使连接键值彼此兼容。
4) Join与GroupJoin结果集对比(为了实现此业务,将1959年设置了两个车队冠军)
- 分组操作符
1) 返回值为 IEnumerable<IGrouping<TKey, TSource>> ,根据指定的键选择器函数对序列中的元素进行分组。
业务说明:按城市分组,获取每个城市的车手冠军。
1
2
3
4
5
6
7
8
|
// 查询表达式 var countries = from r in Formula1.GetChampions() group r by r.Country into g select new { Country = g.Key, Racers = g }; // 方法语法 var countries = Formula1.GetChampions() .GroupBy(r => r.Country) .Select(g => new { Country = g.Key, Racer = g }); |
2) 返回值为 IEnumerable<TResult>,根据指定的键选择器函数对序列中的元素进行分组,并且从每个组及其键中创建结果值。
业务说明:按城市分组,获取每个城市的车手冠军。
1
2
3
|
// 方法语法 (等价上面两种方式) var countries = Formula1.GetChampions() .GroupBy(r => r.Country, (k, g) => new { Country = k, Racer = g }); |
- 量词操作符
如果元素序列满足指定的条件,量词操作符就返回布尔值。
1) Any:确定序列是否包含任何元素;或确定序列中的任何元素是否都满足条件。
2) All:确定序列中的所有元素是否满足条件。
3) Contains:确定序列是否包含指定的元素。
1
2
3
|
// 获取是否存在姓为“Schumacher”的车手冠军 var hasRacer_Schumacher = Formula1.GetChampions() .Any(r => r.LastName == "Schumacher" ); |
- 分区操作符
添加在查询的“最后”,返回集合的一个子集。
1) Take:从序列的开头返回指定数量的连续元素。
2) TakeWhile:只要满足指定的条件,就会返回序列的元素。
3) Skip:跳过序列中指定数量的元素,然后返回剩余的元素。
4) SkipWhile:只要满足指定的条件,就跳过序列中的元素,然后返回剩余元素。
业务说明:将车手冠军列表按每页5个名字进行分页。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
private static void Paging() { int pageSize = 5; int numberPages = ( int )Math.Ceiling( Formula1.GetChampions().Count() / ( double )pageSize); for ( int page = 0; page < numberPages; page++) { Console.WriteLine( "Page {0}" , page); var racers = ( from r in Formula1.GetChampions() orderby r.LastName select r.FirstName + " " + r.LastName ) .Skip(page * pageSize).Take(pageSize); foreach ( var name in racers) { Console.WriteLine(name); } Console.WriteLine(); } } |
- 集合操作符
1) Union:并集,返回两个序列的并集,去掉重复元素。
2) Concat:并集,返回两个序列的并集。
3) Intersect:交集,返回两个序列中都有的元素,即交集。
4) Except:差集,返回只出现在一个序列中的元素,即差集。
业务说明:获取使用车型”Ferrari”和车型”Mclaren”都获得过车手冠军车手列表
1
2
3
4
5
6
7
8
9
10
11
12
|
Func< string , IEnumerable<Racer>> racersByCar = Car => from r in Formula1.GetChampions() from c in r.Cars where c == Car orderby r.LastName select r; foreach ( var racer in racersByCar( "Ferrari" ) .Intersect(racersByCar( "McLaren" ))) { Console.WriteLine(racer); } |
5) Zip:通过使用指定的委托函数合并两个序列,集合的总个数不变。
API:
1
2
3
|
public static IEnumerable<TResult> Zip<TFirst, TSecond, TResult>( this IEnumerable<TFirst> first, IEnumerable<TSecond> second , Func<TFirst, TSecond, TResult> resultSelector); |
示例:合并html开始标签和结束标签
1
2
3
4
5
6
7
8
|
string [] start = { "<html>" , "<head>" , "<body>" }; string [] end = { "</html>" , "</head>" , "</body>" }; var tags = start.Zip(end, (s, e) => { return s + e; }); foreach ( string item in tags) { Console.WriteLine(item); } |
6) SequenceEqual:判断两个序列是否相等,需要内容及顺序都相等。
示例:
1
2
3
4
5
6
7
|
int [] arr1 = { 1, 4, 7, 9 }; int [] arr2 = { 1, 7, 9, 4 }; Console.WriteLine( "排序前 是否相等:{0}" , arr1.SequenceEqual(arr2) ? "是" : "否" ); // 否 Console.WriteLine(); Console.WriteLine( "排序后 是否相等:{0}" , arr1.SequenceEqual(arr2.OrderBy(k => k)) ? "是" : "否" ); // 是 |
- 元素操作符
这些元素操作符仅返回一个元素,不是IEnumerable<TSource>。(默认值:值类型默认为0,引用类型默认为null)
1) First:返回序列中的第一个元素;如果是空序列,此方法将引发异常。
2) FirstOrDefault:返回序列中的第一个元素;如果是空序列,则返回默认值default(TSource)。
3) Last:返回序列的最后一个元素;如果是空序列,此方法将引发异常。
4) LastOrDefault:返回序列中的最后一个元素;如果是空序列,则返回默认值default(TSource)。
5) Single:返回序列的唯一元素;如果是空序列或序列包含多个元素,此方法将引发异常。
6) SingleOrDefault:返回序列中的唯一元素;如果是空序列,则返回默认值default(TSource);如果该序列包含多个元素,此方法将引发异常。
7) ElementAt:返回序列中指定索引处的元素,索引从0开始;如果索引超出范围,此方法将引发异常。
8) ElementAtOrDefault:返回序列中指定索引处的元素,索引从0开始;如果索引超出范围,则返回默认值default(TSource)。
业务说明:获取冠军数排名第三的车手冠军
1
2
3
|
var Racer3 = Formula1.GetChampions() .OrderByDescending(r => r.Wins) .ElementAtOrDefault(2); |
- 合计操作符
1) Count:返回一个 System.Int32,表示序列中的元素的总数量。
2) LongCount:返回一个 System.Int64,表示序列中的元素的总数量。
3) Sum:计算序列中元素值的总和。
4) Max:返回序列中的最大值。
5) Min:返回序列中的最小值。
6) Average:计算序列的平均值。
7) Aggregate:对序列应用累加器函数。
Aggregate比较复杂,所以只列出Aggregate示例。
Aggregate的第一个参数是算法的种子,即初始值。第二个参数是一个表达式,用来对每个元素进行计算。第三个参数是一个表达式,用来对最终结果进行数据转换。
1
2
3
4
5
6
7
|
int [] numbers = { 1, 2, 3 }; // 1+2+3 = 6 int y = numbers.Aggregate((prod, n) => prod + n); // 0+1+2+3 = 6 int x = numbers.Aggregate(0, (prod, n) => prod + n); // (0+1+2+3)*2 = 12 int z = numbers.Aggregate(0, (prod, n) => prod + n, r => r * 2); |
- 转换操作符
1) Cast:将非泛型的 IEnumerable 集合元素转换为指定的类型,若类型转换失败则抛出异常。
2) ToArray:从 IEnumerable<T> 创建一个数组。
3) ToList:从 IEnumerable<T> 创建一个 List<T>。
4) ToDictionary:根据指定的键选择器函数,从 IEnumerable<T> 创建一个 Dictionary<TKey,TValue>。
5) ToLookup:根据指定的键选择器函数,从 IEnumerable<T> 创建一个 System.Linq.Lookup<TKey,TElement>。
6) DefaultIfEmpty:返回指定序列的元素;如果序列为空,则返回包含类型参数的默认值的单一元素集合。
Eg:
1
|
var defaultArrCount = ( new int [0]).DefaultIfEmpty().Count(); // 1 |
7) AsEnumerable:返回类型为 IEnumerable<T> 的输入。用于处理LINQ to Entities操作远程数据源与本地集合的协作。(后续在LINQ to Entities博文中会详细解说)
ToLookup使用比较复杂,所以以ToLookup为示例。
Lookup类似于Dictionary,不过,Dictionary每个键只对应一个值,而Lookup则是1:n 的映射。Lookup没有公共构造函数,而且是不可变的。在创建Lookup之后,不能添加或删除其中的元素或键。(可以将ToLookup 视为GroupBy与ToDictionary的功能合体)
API:
1
2
3
|
public static ILookup<TKey, TElement> ToLookup<TSource, TKey, TElement>( this IEnumerable<TSource> source, Func<TSource, TKey> keySelector, Func<TSource, TElement> elementSelector); |
业务说明:将车手冠军按其使用车型进行分组,并显示使用”williams”车型的车手名字。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
ILookup< string , Racer> racers = ( from r in Formula1.GetChampions() from c in r.Cars select new { Car = c, Racer = r } ).ToLookup(cr => cr.Car, cr => cr.Racer); if (racers.Contains( "Williams" )) { foreach ( var williamsRacer in racers[ "Williams" ]) { Console.WriteLine(williamsRacer); } } |
- 生成操作符
生成操作符返回一个新的集合。(三个生成操作符不是扩展方法,而是返回序列的正常静态方法)
1) Empty:生成一个具有指定类型参数的空序列 IEnumerable<T>。
2) Range:生成指定范围内的整数的序列 IEnumerable<Int32>。
3) Repeat:生成包含一个重复值的序列 IEnumerable<T>。
API:
1
2
3
|
public static IEnumerable<TResult> Empty<TResult>(); public static IEnumerable< int > Range( int start, int count); public static IEnumerable<TResult> Repeat<TResult>(TResult element, int count); |
三、 Linq to Objects中的延迟计算
Linq查询的延迟计算原理:通过给LINQ扩展方法传递方法委托,作为yield迭代器的主体,让遍历执行到MoveNext()时才执行耗时的指令。
- Linq延迟计算的注意点
1
2
3
4
5
6
|
IEnumerable< char > query = "Not what you might expect" ; foreach ( char item in "aeiou" ) query = query.Where(c => c != item); // 只删除了'u'----Not what yo might expect foreach ( char c in query) Console.Write(c); |
我们原本的期望结果是:删除掉字符串中所有的原音字母。但现在只删除’u’,因为item变量是循环外部声明的,同一个变量重复声明更新,所以每个lambda表达式获取的是同样的item.之后枚举查询时,所有的lambda表达式引用了这个变量的当前值,即'u'。
为了解决这个问题,必须将循环变量赋值到一个在循环代码块内声明的变量:
1
2
3
4
5
6
7
8
9
|
IEnumerable< char > query1 = "Not what you might expect" ; foreach ( char item in "aeiou" ) { char temp = item; query1 = query1.Where(c => c != temp); } // Nt wht y mght xpct foreach ( char c in query1) Console.Write(c); |
- 整理Linq to Objects中运算符延迟计算特性
按字母顺序整理:
具有延迟计算的运算符 |
Cast,Concat,DefaultIfEmpty,Distinct,Except,GroupBy,GroupJoin,Intersect |
立即执行的运算符 |
Aggregate,All,Any,Average,Contains,Count,ElementAt,ElementAtOrDefault |
特殊的AsEnumerable运算符,用于处理LINQ to Entities操作远程数据源,将IQueryable远程数据立即转化为本地的IEnumerable集合。若AsEnumerable接收参数是IEnumerable内存集合则什么都不做。
示例代码截图:(已在文章开头提供下载连接)
本博文就到此结束了,通过本博文,我们学会什么是LINQ查询、LINQ中涉及的.NET基础知识、LINQ中各种运算符、延迟计算等等……
但这并不是结束,这只是开始。后续还会奉上:
1) 一篇关于运算符比较器的分析,比如SequenceEqual,Union等运算符中都会有个IEqualityComparer比较器参数。
2) Linq to entities
3) Linq to Parallel (PLINQ)
4) Linq to XML
喜欢的园友可以关注我的博客。(另外,最近会翻译些mvc和Entity Framework的文章,看中有5篇的样子)