开发及演变历史
Erlang得名于丹麦数学家及统计学家Agner Krarup Erlang,同时Erlang还可以表示Ericsson Language。Erlang语言由瑞典爱立信电信公司的乔·阿姆斯特朗开始设计,开始于公元一九八零年代。最初是以Prolog程序设计语言为基础,几度改版之后,改成以Joe's Abstract Machine为基础的独立语言运行环境。虽然语言风格仍与Prolog相近,不过因Erlang语言设计的走向,Erlang成为具备函数语言特色的程序设计语言[2]。
发布版本
1998年起,Erlang发布开放源代码版本,称为开源电信平台。开源电信平台采用修改过的Mozilla公共许可证协议发放,同时爱立信仍然提供商业版本的技术支持。目前,Erlang最大的商业用户是爱立信,其他知名用户有北电网络、亚玛逊以及T-Mobile等[3]。
语言特色
- 并行程序设计 在语言中,可以借由spawn/*函数,将特定的函数设置为独立的进程,之后可以做跨进程通信。
- 函数式程序设计 由于Erlang早期以Prolog开发制成,受语言特性影响,即成为函数式语言。
- 单次赋值 每个变量只能跟数据绑一次,所以,不像一般程序设计语言的变量可以多次指定为不同的值。单次赋值的好处是状态单纯,使程序容易阅读。
- 及早求值或严格求值 Erlang基本求值策略为电脑语言中及早求值之特性。而且,可以借由明确使用无参数的λ表达式,将特定函数设置为惰性求值策略。
- 动态数据类型与类型系统 有编译时期的类型检查系统支持。
- 快速失败 在运行时期发生的错误,会由错误位置提交信息,发生错误的进程立刻停止执行。借由进程通讯机制,可以自动传递错误、捕捉错误,使其他进程能够帮助处理错误。
- 代码热更新 由于Erlang是函数语言,可以撰写特定的程序结构,制作实时更换新版函数的机制。
- 脚本语言 Erlang实现提供了脚本运行方式。
语言构成
Erlang程序结构以函数定义为主。函数是一组将输入分别对应到输出的规则,对应方式遵守数学函数的惯例。此外,Erlang语言由几项构句要素所组成,包括文字(或称原子)、数字、列表、值组、字符、字符串、二进制数据、模块、与特定用途的关键字如fun ... end, if ... end, case ... of ... end, spawn, !, receive ... end等等。以下段落分别列示并举例说明Erlang程序的基本构成部份,涵盖数据格式、表达式格式与内置函数。
数据格式
类型 | 意义与构词规则 | 例子 |
---|---|---|
原子 | 原子是基本数据单元,以一般文字构成。构词规则有:
|
|
数字 | 数字是基本数据单元,可以是整数或实数。
|
|
列表 | 列表是与链接串行相同的数据结构。任一列表大致区分为头部与尾部,头部是列表的第一项,尾部是列表除第一项之外的其他部份。
|
|
值组 | 值组是将二个、三个或多个数据放在一起的数据结构。
|
|
字符 | Erlang将字符存为32位的整数。
|
|
字符串 | Erlang将字符串视同一列整数列表。
|
|
二进制数据 | 以左边 << 、右边 >> 符号,包含由比特语法表示的数据。 |
|
函数识别项 | Erlang容许用文字表示函数识别项,使程序中可以对指定函数做函数调用,或者当做数据传递。函数识别项格式为:
|
用途见以下“函数式程序设计”小节。 |
程序代号 | Erlang容许以内置函数erlang:spawn/3、erlang:spawn/4、erlang:spawn/1、erlang:spawn/2等等,将指定函数启动为一个程序。程序启动之后,Erlang以左边 < 、右边 > ,包含一个数字和点号组成的编号,表示此程序代号。 | 见以下“平行式程序设计”小节。 |
模块 | Erlang容许将一些程序整理为一个模块。模块的设置,是在源码文件开头书写模块标记,格式为:
-module(模組名稱). -export( [ 函數名稱/參數數目 , 函數名稱/參數數目 , ... ] ). -import( 模組名稱, [ 函數名稱/參數數目 , 函數名稱/參數數目 , ... ] ). 模块名称和函数名称都是原子。 -module(模块名称) 定义模块的名字,要与文件名相同。 -export( ... ) 定义模块发布的函数,模块内的任何函数必须要发布才能让外部通过模块调用该函数。 -import( ... ) 定义本模块要从其他模块导入哪些函数,以便本模块自己使用。另外,为了方便程序的撰写并测试,还容许 -compile(export_all) 定义本模块的所有函数全部对外发布。 -compile(export_all). |
(略) |
宏 | 宏是将一项数据以另一个文字做为代名。
-define ( 代名 , 資料 ).
? 代名
?MODULE |
|
表达式格式
类型 | 构词规则 | 例子 | ||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
变量 |
变量是一种提供与数据绑定、赋值的词汇。Erlang的变量是单一赋值,一个变量只能赋值一次。
|
|
||||||||||||||||||||||||||||
样式匹配 |
|
|
||||||||||||||||||||||||||||
函数 |
函数是由一或多项对应规则组成。每一项规则是将一部份匹配样式的输入映射到相对的输出。
原子 ( 變數 , 變數 , ... ) -> 表達式 , 表達式 , ... 在 -> 左邊是函數名稱及搭配的參數列,右邊為函數本體。
規則 ; 規則 ; ... ; 規則 . 以分號分隔一或多項規則,並最後以句號結束。 同一函數的每一規則必須以相同的原子開頭,並接受相同數量的 參數列。 函数被调用时,会让调用方依序对被调用方的每一条函数规则做样式匹配,比对函数名称、参数数目、参数样式等等。首先完成匹配的函数规则会被运行,并且后面的函数规则会被忽略。 |
见以下“函数式程序设计”小节 | ||||||||||||||||||||||||||||
函数调用 | 格式为
原子 ( 資料 , 資料 , ... ) 表示函數名稱及搭配的參數列。呼叫符合函數名稱及 相同參數數目的函數。 函数调用时,所给予的参数可能是已赋值的变量。并且,如果参数是变量,必须是已赋值的变量。 |
见以下“函数式程序设计”小节 | ||||||||||||||||||||||||||||
真值比较 |
真值比较的结果,如果成功则传回true原子,失败则传回false原子。 请记得,Erlang是以true和false表示布尔数据类型。 |
(略) | ||||||||||||||||||||||||||||
运算符 | Erlang提供常用的运算符方便基本运算。运算符是用在中序的表达式里,包含 + - * / div(商) rem(余) 等。比特算算有 bnot, band, bor, bxor, bsl(算术左移), bsr(算术右移) 等。用于列表有 ++(列表衔接) --(列表剔除) 等。各种表达式皆可用 ( ) 调整运算优先级。 | (略) | ||||||||||||||||||||||||||||
防卫式 |
防卫式是接在when关键字之后的一组表达式,借由防卫式的真伪值做程控处理。 防卫式的原则如下方所述:
|
|
||||||||||||||||||||||||||||
受防卫式限制的函数 |
函数对应规则格式为: 原子 ( 變數 , 變數 , ... ) -> 表達式 , 表達式 , ... 若一条函数规则加上防卫式,此规则的处理范围会多一些限制。受防卫式限制的函数对应规则格式为: 原子 ( 變數 , 變數 , ... ) when 防衛式 -> 表達式 , 表達式 , ... |
|
||||||||||||||||||||||||||||
行后注解 | 任何 % 符号开头,往后到行尾的文字皆为注解文字。 | 'H.W.'. % Hello, World! | ||||||||||||||||||||||||||||
λ演算式 |
λ演算式是匿名函数,在Erlang以 fun ... end 关键字叙述。格式为: fun ( 變數 , 變數 , ... ) -> 表達式 , 表達式 , ... end 使用无参数的λ演算式,可以做出惰性求值的效果。 |
|
||||||||||||||||||||||||||||
因果式 |
使用 if ... end 关键字叙述条件判断原则。格式为: if 防衛式 -> 表達式, 表達式, ... ; 防衛式 -> 表達式, 表達式, ... ; ...... 防衛式 -> 表達式, 表達式, ... end |
|
||||||||||||||||||||||||||||
案例式 |
使用 case ... of ... end 关键字,根据一个变量的案例,带往相对的处理程序。格式为: case 表達式 of 樣式 -> 表達式, 表達式, ... ; 樣式 -> 表達式, 表達式, ... ; ...... 樣式 -> 表達式, 表達式, ... end
|
|
||||||||||||||||||||||||||||
试误 |
使用 try ... catch ... end 关键字叙述试误的情况与结果。格式为: try 表達式 of 樣式 -> 表達式, 表達式, ... ; 樣式 -> 表達式, 表達式, ... ; ...... 樣式 -> 表達式, 表達式, ... catch 樣式(例外) -> 表達式, 表達式, ... ; 樣式(例外) -> 表達式, 表達式, ... ; ...... 樣式(例外) -> 表達式, 表達式, ... after 表達式, 表達式, ... end
|
(略) | ||||||||||||||||||||||||||||
接收信息 |
每个Erlang程序运行时,都可以从自己程序的邮箱中取得由其他程序送到的信息。可以使用 receive ... end 关键字接收信息,格式为: receive 樣式 -> 表達式, 表達式, ... ; 樣式 -> 表達式, 表達式, ... ; ...... 樣式 -> 表達式, 表達式, ... end
|
|
||||||||||||||||||||||||||||
发送信息 |
Erlang容许向程序发送信息。使用 ! 关键字,格式为: 程序代號 ! 訊息
|
|
||||||||||||||||||||||||||||
列表解析 | 列表解析,是提供快速创建列表的语法。语法等同于集合建构式。格式为:
|
|
内置函数
开源电信平台包括一个Erlang解释器、一个Erlang编译器、程序节点通信协议、CORBA、一个分散式数据库Mnesia、以及许多程序库[4]。 内置函数涵盖了各种方面的功能,涵盖了系统命令、数据访问、格式转换、网络通信、图形接口、 ... 等。以下列表介绍几项常用的Erlang内置函数。(参阅文件或索引)
模块:函数名称 / 参数数目 | 用途 |
---|---|
c:cd / 1 |
切换到指定目录位置。 > c:cd("D:\code"). D:/code/ ok 当指定目录不正确时,则保持在原目录位置。 |
c:c / 1 |
编译指定的代码,之后加载新编译好的程序。 > c:c(test). % test.erl 必須存在於目錄位置 {ok, test} > c:c(test1). ./test1.erl:none: ... error |
io:format / 2 |
按照指定的格式文字将数据印在标准输出端口。 > io:format("~.8B, ~c, ~s, ~.2f~n", [32, $a, "hello", 3.1416]). 40, a, hello, 3.14 ok |
lists:sublist / 3 |
由列表中截取子列表。Erlang字符串是整数列表,于是本函数视同截取子字符串。 > lists:sublist("Hello, World!", 2, 2). "el" |
函数式程序设计
Erlang支持函数式程序设计的一般特色,特色包括单次赋值、递归定义、λ演算与高级函数等等。
Erlang函数大致写法如下,以整数阶乘模块为例:
-module(fact). -export([fac/1]). fac(N) when N > 1 -> N * fac(N-1); fac(1) -> 1.
以下是快速排序算法的Erlang实现:
%% quicksort:qsort(List) %% Sort a list of items -module(quicksort). -export([qsort/1]). qsort([]) -> []; qsort([Pivot|Rest]) -> qsort([ X || X <- Rest, X =< Pivot]) ++ [Pivot] ++ qsort([ Y || Y <- Rest, Y > Pivot]).
以下是费氏数列求解函数:
-module(example). -export([fibo/1]). fibo(N) when N > 1 -> fibo(N-1) + fibo(N-2); fibo(1) -> 1; fibo(0) -> 0.
> c(example). {ok,example} > lists:map(fun(X)->test:fibo(X) end, lists:seq(1,10)). [1,1,2,3,5,8,13,21,34,55]
函数式程序设计难免以递归计算,而消耗了大量递归堆栈空间。为了克服这个问题,一般使用累积参数与尾部递归等技巧节省递归数目:如以下例子。
-module(test). -export([fibo_accu/1]). fibo_accu(N) -> fibo(N, 0, 1). fibo(N, C1, C2) when N > 2 -> fibo(N-1, C2, C1+C2); fibo(0, _, _) -> 0; fibo(1, _, _) -> 1; fibo(_, C1, C2) -> C1+C2.
> c(example). {ok,test} > lists:map(fun(X)->test:fibo_accu(X) end, lists:seq(1,10)). [1,1,2,3,5,8,13,21,34,55]
函数式程序设计容许使用高级函数求解。以下例子说明Erlang实做复合函数。 ( f o g ,念作 f after g 。)
'After'(F, G) -> fun(X) -> erlang:apply(F, [erlang:apply(G, [X])]) end.
-
- 请注意after是Erlang关键字。因此,以上函数命名为′After′避开关键字。
> (example:'After'(fun test:show/1, fun test:parse/1))(3.1416). Real number 3.141600 is met. ok
平行式程序设计
Erlang最主要的特色是面向并发程序设计,强调多程序平行运作,并且以信息对彼此沟通。Erlang提供了spawn函数和 ! 、 receive ... end 等关键字,可以描述在Erlang/开源电信平台中的如何启动一些程序、并且如何让程序传递信息。此外,面向并发程序设计的精神还强调程序的容错处理,借由程序发生错误时的信息传递,使其他程序可以得知错误的发生,使方便于后续处理。以下分别介绍面向并发程序设计的一般程序撰写方式,以及错误处理的使用方式。
面向并发程序设计
基本的平行程序示范如下:
- 以下启动一个程序。
% create process and call the function web:start_server(Port, MaxConnections) ServerProcess = spawn(web, start_server, [Port, MaxConnections]),
- 以下是在任何程序中,对先前起动的程序送一则信息 {pause, 10} 。
% send the {pause, 10} message (a tuple with an atom "pause" and a number "10") % to ServerProcess (asynchronously) ServerProcess ! {pause, 10},
- 以下是一段接收信息的程序。每个程序都拥有一份邮箱,可伫留收到的信息; receive ... end 程序片断是从程序的邮箱中取出最早伫留的信息。
% receive messages sent to this process receive a_message -> do_something; {data, DataContent} -> handle(DataContent); {hello, Text} -> io:format("Got hello message: ~s", [Text]); {goodbye, Text} -> io:format("Got goodbye message: ~s", [Text]) end. 收到 a_message 結果就是 do_something ;收到 {data, DataContent} 結果會呼叫 handle(DataContent) ; 收到 {hello, Text} 結果教是印出 "Got hello message: ..." ,收到 {goodbye, Text} 結果是印出 "Got goodbye message: ..." 。
以下程序,示范产生一组环状传递信息的程序。
ring_proc(Funs) -> Ns = lists:seq(1, length(Funs)), [P|Pids] = [ spawn(?MODULE, lists:nth(Nth,Funs),[]) || Nth <- Ns ], [ Pid ! ToPid || {Pid, ToPid} <- lists:zip([P|Pids], Pids++[P]) ]. func() -> receive ToPid -> func_msg_(ToPid) end. func_msg_(ToPid) -> receive stop -> io:format("Stop process ~w~n", [self()]), ToPid ! stop; Message -> io:format("~w: transmit message to ~w~n", [self(), ToPid]), ToPid ! Message, func_msg_(ToPid) end. 接收stop訊息,就對下一個程序送stop訊息;接收到其他任何訊息,就對下一個程序送同樣的訊息。
如果发送任何其他信息,就会让所有的程序不断对下一个程序传递信息。而以下是测试发送stop信息的运行结果。
> [P|_] = example:ring_proc([func,func,func]). [<0.233.0>,<0.234.0>,<0.232.0>] > P ! stop. Stop process <0.233.0> stop Stop process <0.234.0> > Stop process <0.232.0> >
容错处理
Erlang容错处理机制,由二个步骤实现:一是将二个程序连接起来,二者之间存在一道通信管道,可提供错误信息的传递 ── 在此使用link/1函数;二是将程序回报错误的机制打开 ── 在此使用process_flag/2函数。
- 使用link(Pid)让程序连接到另一个程序。
-module(example). -compile(export_all). hello() -> Pid = spawn(?MODULE, world, []), link(Pid), ... . 執行時,以 Pid = spawn(example, hello, []) 啟動程序,此程序將啟動另一個程序,並且與它連接。
- 但以上程序还不会有错误信息的传递机制,因为回报错误的开关还没有打开。
- 打开程序回报错误机制。
以上 hello/0 函數前段使用process_flag/2函數,將trap_exit標籤打開,即可開啟程序回報錯誤機制。
hello() -> process_flag(trap_exit, true), Pid = spawn(?MODULE, world, []), link(Pid), ... .
于是,当程序退出时,会提交{'EXIT', From, Reason}数据。程序正常退出时,Reason为normal。
另外,spawn函数另外有程序连接版本,spawn_link函数,同时启动并连接到新程序。
分散式程序设计
Erlang提供分散式机制,能在另一台电脑启动一些Erlang程序,并由本机电脑对其他电脑的Erlang程序传递信息。
- 当启动Erlang环境时,加上一个网络节点名称,就进入分散式Erlang模式。节点可以使用端口号与其他节点通信。
$> erl -name node_1
- 在同一个域名中,网络节点名称可以使用短名。
$> erl -sname node_1
启动新的网络节点时,Erlang使用epmd (Erlang端口号对应管理系统) 指派端口号,提供节点使用。
当知道一个网络节点名称时,可以在该节点产生新程序。
- 在指定节点RemoteNode启动一个程序,spawn启动参数依序为节点名称、模块名称、函数名称、函数的参数表。
% create a remote process and call the function web:start_server(Port, MaxConnections) % on machine RemoteNode RemoteProcess = spawn(RemoteNode, web, start_server, [Port, MaxConnections]), 在遠端節點產生新程序之後,可以使用平行式程式設計的技巧,與遠端程序通訊。
Erlang / 开源电信平台提供的程序库,于分散式程序设计可以使用net_adm、net_kernel、slave、... 等模块,做网络通信[5]。
其他程序设计范型
惰性求值
Erlang程序员可以使用惰性求值。不过,必须使用λ演算式,才能做到惰性求值。
以下是惰性求值的一例:假設有個剖析器程式如下,由於及早求值特徵,本程式將不會求解。 expr() -> alt(then(factor(), then(literal($+), factor())), then(factor(), then(literal($-), factor()))). factor() -> alt(then(term(), then(literal($*), term())), then(term(), then(literal($/), term()))). term() -> alt(number(), xthen(literal($(), thenx(expr(), literal($))))). 此處使用λ演算式及適當使用函數名稱表示,就能進行求值。示例如下。 expr() -> fun () -> alt(then(fun factor/0, then(literal($+), fun factor/0)), then(fun factor/0, then(literal($-), fun factor/0))) end. factor() -> fun () -> alt(then(fun term/0, then(literal($*), fun term/0)), then(fun term/0, then(literal($/), fun term/0))) end. term() -> fun () -> alt(number(), xthen(literal($(), thenx(expr(), literal($))))) end.