我的确认为计算机学院应该开一门 Scala 的语言课程。
在这篇文章中,我会讲述为什么我会有这样的想法,在此之前,有几点我想要先声明一下:
本文无意对编程语言进行评比,我要讲述的主体是为什么你应该学习 Scala。51CTO之前曾发布过一篇 Java 程序员为何要学习Scala的文章,可能也会对你有所帮助。
目前 Scala 有两个实现方式,一种是在 JVM(Java 虚拟机)上运行,另一种是在 CLR(Common Language Runtime 的缩写,即公共语言运行库)上运行。不过,JVM 的实现方式更为成熟。如果你想要使用 .Net framework 框架,我认为最好还是听从 Lift framework 框架创始人大卫·波拉克(David Pollack)的建议:使用 F#。但在这篇文章中,我将只关注 JVM 这种实现方式。
我是一个 Ruby 程序员,并且我会继续喜欢 Ruby,因为它是我见到过的最棒的动态语言。但我也喜欢 Scala,因为在其他工作领域,它提供的某些功能非常强大。
现在,让我们来仔细分析一下,是哪些原因让我选择 Scala 作为我的下一个编程语言:
强大的编程语言
Scala 是一门非常强大的语言,它允许用户使用命令和函数范式进行编写代码,因此,编程时你可以使用常用的命令式语句,就像我们使用 C、Java、PHP 以及很多其他语言一样,而且,你也可以使用类似 Lisp 语言中函数式语句,还有,你可以混合使用这两种风格的语句,就像 Ruby 或 Groovy。
不过,当我们谈论的函数范式时,与 Ruby 和 Groovy 有一点不同的地方,那就是 Scala 几乎支持函数语言中所有已知的功能,比如,模式匹配(Pattern matching)、延迟初始化(Lazy initialization)、偏函数(Partial Function)、不变性(Immutability),等等...即是说,认识到这样一个事实是非常重要的:Scala 的强大源自它对函数范式的支持,而后者令 Scala 成为一种高等级(high-level)的编程语言。对于高等级的编程语言,你只需关注 what(做什么)而不是如何做(how)。
下面,让我们看一个 Java 示例:
int[] x = {1,2,3,4,5,6}; ArrayList res = new ArrayList(); for (int v : x) { if (v % 2 == 1) res.add(new Integer(v)); } 仔细看一下上面这段示例代码,你会注意到,我想要做的“what”部分(过滤掉奇数值)仅出现在第四行中,而其余行则是“how”如何做的部分(结果变量的初始化以及一个循环操作)。如果我想要再写一个过滤器,用于筛选偶数值,那就需要再写五行代码,而使用一门像 Scala 这样的高等级语言,你只需编写“what”那部分的代码:
val x = Array(1,2,3,4,5,6) val res = x filter ( _ % 2 == 1 ) //过滤奇数值 val res2 = x filter ( _ % 2 == 0 ) //过滤偶数值 我们可以看到,相对于上文中的 Java 代码段,这段代码更加简洁,而且具有更好的可读性。
高效
Scala 是一种高效的编程语言,实际上,根据最新的 benchmark 性能测试,它几乎和 Java 一样快捷。在 JVM 上实现的 Scala 代码,可以编译为字节码,在这一过程中,代码通过优化阶段进行编译。尾递归优化是一个很好的示例,它可帮助用户专注于函数范式而无需以牺牲性能为代价。还有一个示例是,将 Scala 值类型对象转换为 Java 基本类型时进行的优化。
可扩展
Scala 语言本身的名字 Scala 来自 Scalable(可扩展的)一词,这意味着这种语言可以按照用户的需求进行扩展。因此,从根本上来讲,用户可以添加新的类型和控制结构。比如,我想要添加一个简单的“loop”控制结构:
// 一个简单的构建 def loop(range: Range)(op: Int=> Unit) { range foreach (op) } loop(1 to 5){println} // 1 2 3 4 5 loop(1 to 5){x => if (x % 2 == 0) println(x)} // 2 4 还有几个更为复杂的例子,Actor lib,它是作为扩展被添加到 Scala 这一语言中的,我们将在下文中对它展开讨论。
不过,Scala 之所以是可扩展的,在于互相关联的两点:它是真正的面向对象的语言和真正的函数式语言。
面向对象
Scala 中每个事物都是对象(对象的方法除外),因此,没有必要对基本(primitive)类型或引用类型进行区分,这就是所谓的:统一对象模型(Uniform Object Model)。但是,正如我之前在优化流程中所提到的,值类型对象被转换为 Java 基本类型,因此不必担心性能的问题。其内部还包含为类方法分组的单件对象(Singleton object)。
◆所有操作都是方法调用,+ - * ! / 都是方法,因此,没有必要进行操作符重载。
◆非常精细的访问控制,用户可以控制对某些包的某些方法的访问。
◆Scala 具有 trait,与 Ruby 中的 mixin 类似,就像 Java 中的 interfaces,但实现了某些它们的方法,因此,用户在箱体(box)之外拥有富封装器(wrapper)和富交互接口(interface)。
函数式语言
函数式语言具有很多特点,不过在扩展性这一语境中,我们所关心的是两个事实:
◆函数是第一等级(first-class)的值
这表示用户可以将函数作为值传递,也可以作为值返回。这样可以获得简洁而具有可读性的代码,正如上文中作为示例的过滤代码段。
◆纯函数(pure function)
Scala 支持没有副作用的纯函数,这意味着:如果你的输入相同,那么输出结果也总是相同。这样能够让代码更为安全,对代码测试也更为方便。
但是,Scala 是通过什么方式来支持纯函数的呢?通过不变性(immutability):偏向固定的引用(与 java 中的 final 或其他语言中的 constant 类似)以及具有不变的数据结构,一旦创建便不可修改。
不变性是拥有纯函数的安全保证,但并不是唯一的方式。没有不变性,你仍然可以编写安全的代码。这就是为什么 Scala 不是强制推行不变性而只是鼓励使用它。最终,你会发现 Scala 中许多数据结构具有了两种实现方式,一种是可变的,另一种是不可变的,不可变的数据结构是缺省导入的。
每当提到不变性时,有人就会开始担心性能的问题,对于某些情况,这种担忧并非毫无来由,但对于 Scala,最终结果却与这一担忧相反。不可变的数据结构相对于可变的数据结构,更有助于获得较高的效率。其原因之一在于强大的垃圾收集器(garbage collector),与 JVM 中的垃圾收集器类似。
更佳的并行模型
当涉及到线程这一问题时,Scala 支持传统的 shared data 模型。但是,使用这种模型较长一段时间之后,许多人发现使用这种模型编写代码,非常难以实现以及进行测试。你总是需要考虑死锁问题和竞争条件。因此,Scala 提供了另一个称为 Actor 的并行模型,其中,actor 通过它的收件箱来发送和接收非同步信息,而不是共享数据。这种方式被称为:shared nothing 模型。一旦你不再顾虑共享数据的问题,也就不必再为代码同步和死锁问题而头痛。
被发送信息的不变性本质以及 actor 中串行处理,这两者使得对于并行的支持更为简便。
有关 Scala 并行的问题,请参阅这篇文章,对于这个概念你会有更好的理解。
在讲述下一个要点之前,我需要提到这样一个事实,一些人将 Actor 的使用视为编程语言的一种进化。正如,Java 的出现,将程序员们从指针和内存管理的泥淖中拯救出来一样,Scala 的到来,让程序员们不必再为代码同步以及共享数据模型整天苦思冥想。
静态类型
当我想要讲述这一要点的时候,才发现,对于静态类型语言的正反两面,我试图给予同样的关注。事实上,关于这一话题的争论总是没完没了,但我要作出两点总结,而这两点是大多数人讨论的热点:
◆使用静态类型语言编写的代码更加健壮(robust)
TDD 的存在,让许多关于动态类型语言和健壮代码的讨论失去了意义,虽然这是正确的,当我们仍然不能忽视这样一个事实:对于动态类型语言,你需要编写更多的测试代码来检查类型,而在静态类型语言中,你可以将这些问题交给编译器处理。此外,还有一些人认为,使用静态类型语言,你的代码将具有更好的自我记录。
◆使用静态类型语言编写的代码过于严格和冗长
像我这样的动态类型语言的粉丝,认为通过鸭子类型(duck typing)可以写出更具动态性的代码结构。但同时他们还会抱怨,静态类型语言导致代码冗长。
关于静态类型与动态类型的争论,在51CTO之前发布的这篇文章中可以看到更多信息。
作为静态类型语言,Scala 具有第一条中提到的优点,但是,第二点呢?
Scala 具有一个灵活的类型系统,并且可能是这一类型中最好的。很多情况下,如果你没有指定类型,这一系统将能够对类型进行推断。
例如,你可以这样编写代码:
val list: List[String] = List("one", "two", "three") //list: List[String] = List(one, two, three) val s: String = "Hello World!" //s: java.lang.String = hello world! 但你也可以这样编写代码:
val list = List("one", "two", "three") //list: List[String] = List(one, two, three) val s = "Hello World!" //s: java.lang.String = hello world! 非常好,无论如何,它解决了代码冗长的问题。但像鸭子类型(duck typing)那样的问题,会怎样呢?
答案还是:Scala 的类型系统具有的某些灵活性,可以让你编写如下的代码:
def eat[T <: Animal](a: T) // whatever 其中,我们将类型 T 定义为 Animal 的子类型。还可以更加灵活:
def eat[T <: {def eat(): Unit}](a: T) // whatever 其中,我们将类型 T 定义为一个具有非法 eat 的类型。
事实上,Scala 的类型系统非常丰富,你可以在这里找到更多信息。
模式匹配
我必须坦白,在犹豫良久之后,我才决定写一写 Scala 的这一特点。事实上,我本来没有打算讨论 Scala 的函数功能,但看到一篇有关对象分支(switch)应用的文章后,我想,还是有必要聊聊这个特点。以下内容基本上都来自这篇博客文章:
模式匹配究竟是用来做什么的?它让你可以将一个值对多种情况(case)进行匹配,有点类似 Java 中的分支(switch)语句。但它不是仅仅匹配数字(这是分支语句的作用),而是用户能够对本质上为对象创建形式(creation form)的事物进行匹配。
以下示例也来自上文提到的博客:
x match { case Address(Name(first, last), street, city, state, zip) => println(last + ", " + zip) case _ => println("not an address") // 缺省情况 } 对于第一种情况,模式 Name(first, last) 嵌套在模式 Address(…) 中。 其中的 last 值,被传递到 Name 构造函数,然后进行提取,因此在箭头右侧的表达式中是可用的。
那么,
模式匹配的意义
为什么你需要模式匹配?我们都会有复杂的数据。如果我们坚持严格的面向对象编程,那么我们就不愿去关注数据树的内部情况。相反,我们想要调用方法,让方法来做这些事情。如果我们有能力完成这件事,就不会非常需要模式匹配,因为方法满足了我们的要求。但是,很多时候对象没有我们所需的方法,并且我们不能(或不愿)为对象添加新的方法。
因此,模式匹配被认为是一种获得扩张性的有效方法,并且,它还为该问题提供了一种不错的解决方案,访问者设计模式所导致的冗长除外。
不管怎样,强烈推荐你看看上面所提到的文章中”扩展性的两个方向“(Two directions of extensibility)那个小节。
简单的 DSL(特定领域语言)
编写 DSL,Scala 是一个很好的选择。事实上,Scala 适用于内部和外部 DSL。在这篇文章中,你可以找到一些使用 Ruby 和 Scala 编写内部 DSL 的特点比较。下面这篇文章也很棒,是关于使用 Scala 编写内部 DSL 的:Boolean Algebra Internal DSL in Scala (aka fun with Unicode names )。
此外,对于外部 DSL,Scala 也应该是首选语言,背后的原因是解析器组合子库(parser combinator lib),它让为新语言编写编译器成为一件很酷的事。
与 Java 代码之间的互操作性
在 JVM 上的实现 Scala 的程序可以无缝地与 Java 平台整合,很多 Scala 类型实际上都编译为 Java 类型,因此,用户可以放心地使用 Java 类型。而且,你也可以混合地使用 JVM 语言来编程,如:JRuby、Groovy、Clojure 等。这里有一篇不错的文章,提供了这种示例。
学习型语言
我有两个习惯,在 Scala 的学习过程中,我坚持了这两个习惯:
◆遇到新的技术术语,访问维基百科,理解更多信息;比如 Function literal(文本函数)、Referentially transparent(引用透明度)、Partial function(偏函数)、Currying(科里华),还有很多其他术语。
◆参考我对其他语言的理解,检查这些术语的涵义是否实现。
通过一些好的练习,如编写没有副作用的纯函数,将精力集中在代码中的“what”部分,而将“how”的部分交给语言处理;这两个习惯让我获得更多知识,也提高了代码的质量。
团队
Scala 由马丁·奥德斯基(Martin Odersky)设计,他是瑞士联邦理工学院洛桑分校(EPFL)编程方法实验室小组的管理者。奥德斯基曾受雇于 Sun 公司编写 Java 1.1 编译器,他还是 Java 1.1 到 Java 1.4 的 Javac 主要开发者。此外,他还是 Java Generics 的提出者。51CTO编辑曾通过电子邮件与奥德斯基就 Scala 的语言特性进行了交流,并得到了回复信件如下。
Scala 现在由奥德斯基和他在瑞士联邦理工学院洛桑分校的团队维护。不过,还有其他一些具有才华的开发者参与,通过多年的工作,他们共同打造出了 Scala 这一编程语言。
来源
Scala 受到了多种语言的启发:
◆大多数的句法来自 Java 和 C#。
◆其他一些元素也来自 Java,比如:基本类型(basic type)、类库,以及其运行模型。
◆它所用的统一对象模型是由 Smalltalk 最先使用的。
◆通用嵌套(universal nesting)的理念也出现在 Algol、Simula 中,而且最近还出现在 Beta 和 gbeta 中。
◆函数式编码的方法在精神上也与 ML 语言家族类似,该语言家族中包含 SML、OCaml,以及最主要的成员 F#。
◆Scala 标准库中的许多较高阶的函数,也出现在 ML 和 Haskell 中。
◆Scala 的隐式参数也是受到 Haskell 类型类的启发。Scala 基于 actor 的并行库主要是受到 Erlang 的启发。
◆将插入(infix)操作符视为函数,以及允许文本函数(或 block 区块)作为参数,以使库能够定义控制结构,这些特定的理念可以回溯至 Iswim 和Smalltalk。
专家观点
实际上,像詹姆士·斯特拉坎(James Strachan:编程语言 Groovy 的创始人)的这样的言语让人感到有点惊喜:
说实话,如果有人在 2003 年给我一本由马丁·奥德斯基(Martin Odersky)、莱克斯·斯彭(Lex Spoon)和比尔·文纳斯(Bill Venners)合著的《Programming in Scala》,我很可能不会再去创建 Groovy。
在结束之前,我做一下总结:
我喜欢 Scala,因为它是高效的、学习型的语言,具有较好的并行模型,以及非常适用于编写 DSL。