在网络编程中,我们面对的不再是字符串,而是字节流,对于这些信息的处理,erlang提供了比特语法这样的工具。
废话少说,看例子:
- Eshell V5.8.4 (abort with ^G)
- 1> X = "hello".
先定义一个字符串变量X,下面把它变成二进制数据
- 2> BinX = list_to_binary("hello").
- <<"hello">>
这里的 list_to_binary 是erlang的内建函数,专业术语叫 BIF ( Build-in Function),通过它,我们得到了一个二进制数据 BinX 。
字节流实际上就是一个二进制比特数组,相对应,直接将binary数据变回来的函数叫 binary_to_list:
- 3> binary_to_list(BinX).
- "hello"
到此为止都很简单,下面看看 erlang 的魔力:
- 4> <<First:8,Body:24,Last:8>> = BinX.
- <<"hello">>
- 5> First.
- 104
- 6> Body.
- 6646892
- 7> Last.
- 111
仔细看看,这不就是二进制版的模式匹配么(变量后面用冒号分隔的是截取的二进制数据位长度 )。经过这个变化后,First就存放了第一个字符(二进制数据前八位) ”h” 的ascii码,Last存放了最后一个字符(二进制数据的后八位) “o” 的 ascii 码,Body 有些不同,它对应了中间的 24 位(8位一个字节,三个字节就是24位)数据,因此看起来不像是一个 ascii 编码范围内的整数
现在把它们转变成字符串——
- 8> binary_to_list(First).
- ** exception error: bad argument
- in function binary_to_list/1
- called as binary_to_list(104)
出现错误,为什么呢?
因为binary_to_list接受的是一个binary数据,而First本身已经是一个整数了,所以是参数错误,解决办法可以是这样
- 9> binary_to_list(<<First>>).
- "h"
这样很麻烦,实际上,更好的办法是在模式匹配的时候就说清楚我们需要的是一个binary而不是integer,这一点erlang已经想到了,重新做一下是这样的——
- 10> <<First2:1/binary,Body2:3/binary,Last2:1/binary>> = BinX.
- <<"hello">>
- 11> binary_to_list(First2).
- "h"
- 12> binary_to_list(Body2).
- "ell"
- 13> binary_to_list(Last2).
- "o"
这里表示长度的数字有些变化,对于binary,它表示的是二进制字节数(之前是比特数)。
模式匹配的时候,如果最后一个变量长度为一个字节,那么是可以省略的——
- 14> <<First3:8,Body3:24,Last3>> = BinX.
- <<"hello">>
另外补充一点:一开始使用比特匹配的时候常常会遇到下面的错误
- 15> <<First4:8, Body4:16, Last3:8>> = BinX.
- ** exception error: no match of right hand side value <<"hello">>
这是因为左侧的表达式总字节数与右侧不符(8+16+8 != 5 * 8 ),这一点需要多加注意,常见的情况是错误的估计了右侧变量的比特数。
- 附注:
- 完整的比特语法:
- <<>> %%表示一个空的二进制数据
- <<E1,E2,...,En>>
- 这里每一个 Ei 表示一个二进制数据区块。区块可能的形式有四种:
- Ei = Value |
- Value:Size |
- Value/TypeSpecifierList |
- Value:Size/TypeSpecifierList