Perl入门

Perl 是一门开源的脚本语言，由 Larry Wall 所创造，该语言以实用，快速开发为主要目标，与当前流行的面向对象结构化编程有些格格不入，但这并不妨碍 Perl 被广泛流传和使用，世界范围内围绕 Perl 建立起了非常活跃的社区，很多人在其中不断帮助完善文档，创建示例代码，提供一些第三库等等。具体可以浏览以下两个网页：www.cpan.org , www.perl.com.

Perl 最出名也最擅长的要数文本处理了，很多其它语言要花几十上百行代码才能完成的任务，Perl 可能只需要几行代码就能完成。但这些优势是有代价的，Perl 书写代码的风格有时常常被诟病，典型的面向过程式语言，各种眼花缭乱令人头疼的符号，甚至 Perl 一直以来所坚持的哲学：只要不引起冲突误解，代码可以写成多种形式（There's More Than One Way To Do It）。这导致 Perl 在语法上具有非常松散随意的特点：同一件事情常常有多种不同的写法，有些看起来还很奇特，体现在语法上，Perl 的符号特别多，让 Perl 在一定程度比较难学易忘。

本文主要简单介绍一下 Perl 的基本语法，目的是通过本文，你能了解 Perl 基本的写法，能够顺利的去读别人的代码。天下的语言在一定程度上是相通的，如果有一门语言的基础，去学另一本语言，入门基本不会太难（函数式除外吧。。。），但要用到熟，用到得心应手，第三库的使用等，这些就需要耐心以及假以时日了。本节主要介绍一下各种数据类型.

<一> 语句及注释:

Perl 语句以分号(;)结尾，用 # 作为一行的注释，没有其它语言中那种跨行的注释。代码块用大括号围起来，这个和 C 类似，但这个大括号在有些地方是强制要求，如在 if ,for，do, while 等语句中，它不像其它语言一样会用缩进来判断块。

<二> 变量: 标量(scalar) & 列表(list)

Perl把简单的数据类型，如字符串，数字等“单数”的东西统称为标量，与之相对的，就是“复数”的东西，如数组。标量的声明都是 $ 开始，如: $str = "abc"。多个标量也可以放一处一起声明：

($x, $y, $z) = (11, 22, "no", 4);

而数组的声明则是以@开头，如:@arr = ("abc","edf")。变量的声明和很多其它脚本语言一样，不需要指明类型，直接声明赋值就可以使用。如果只声明但不赋值，Perl 会默认给它赋值为:undef。

为了检查一个变量是否已被赋值，Perl 提供了一个操作符:defined，用于判断一个变量是否已经被赋值：

if( !defined( $myvar ) )

{

print "uninitialized variable";

}

<三> 字符串

(1) 基本语法

在 Perl 中，所有字符串都是双引号或单引号括起来的，如: "string" 'string'。这两种方式在很多时候相同，不同的是当字符串出现其它变量或转义符号的时候，双引号会将变量的内容展开，而单引号的不会，这和 shell script 是相似的，如：

$var = 234;

$str1 = "str1:$var"; # 打印出来得到-> str1:234

$str2 = 'str2:$var'; # 打印出来得到-> str2:$var

(2) 字符串拼接

点号(.)用于把字符串进行拼接，这个和其它一些语言直接把字符串连在一起就行不一样，要用点号把字符串连起来，如:

$str = "abc"."efg"; # abcefg

很巧，这个用法，和 shell script , vim script 也是一致的。

(3) 比较

这里需要强调的，字符串的比较要用：

lt 小于　(Less Than)
gt 大于　(Greater Than)
eq 等于 (Equal)

而不要用== , >= , <= ，这些符号是用来比较数值类型的。

<四> 数组

(1) 声明

如前所说，数组是一个复数(plaural）形式的变量，它的声明是以@开头的，后面跟着小括号放入初始值：

@arr = (12,34,56);

同一个数组里的元素类型不一定要一样，下面的写法也是合法的：

@arr = (12,"abc",'c');

当然，也可以声明空数组:

@arr = ();

声明字符串数组时，可以用 q,qq,qw 系列操作符简化操作。q 代表 quoted, qw 代表: quoted word.

@arr = qq(abc); # 等价于 ("abc")

@arr = qw(abc ef gg); # 等价于("abc","ef","gg")

@arr = q(abc); # 等价于('abc')

由上看出 qq 与 qw 的区别就在于，qq 是将括号中的整个内容当成一个整体加上双引号，而 qw 是以空格为分隔，如上第二个例子，abc, ef, gg 分别被加上了双引号，而 q 与 qq 相似。这几个操作符的好处在于，当你想在字符串加入转义符号，引号等符号时，会方便很多。

qq(abc) eq “\abc"

qq("abc") eq ”"abc""

(2) 数组访问，插入

如果想访问数组里的元素，就用中括号加下标的方法，和很多其它语言一样,perl的数组元素从0开始算：

print $arr[2];

有人可能注意到了，引用里面元素的时候，又用了$，而不是@。这里其实有一个原则，用@时，是表示整个数组，而引用其中的元素时，就用 $，后面将讲到hash类型数组，也是同样的原则。上面是一次访问一个元素，如果需要取出 sub array（切片）, 则应如下写:

@sub_arr = @arr[1,4];

Perl 中的数组是没有指定大小的，如果访问了没有定义的元素，就会返回 undef：

@arr = (1,2,3);

$ele = $arr[20]; # ele == undef

如果要往数组中加入新元素，也可以直接用中括号+下标：

$arr[4] = 4; #如果不存在第4个元素就插入，存在就覆盖。

(3) 转换

下面提一个很体现 Perl 风格的问题，前面说到，用@引用一个数组时，表示对整个数组的引用，但这种引用在不同场合下(context)是表示不同含义的：

@arr = ("abc", "ed");

print "arr: @arr" ;

上面的 print 会将 arr 中的元素一个个的提取出来展开打印，这个好理解，但如果我这样写呢：

$sz = @arr; #

把数组赋值给一个标量，Perl 会把数组的大小赋值给左边的变量，所以上面的例子里，$sz 等于2。如果Perl没法判断，当前上下文是标量还是数组，默认情况下，@arr 都会展开数组：

@arr2 = (1,2,@arr); # arr2 == (1,2,"abc","ed").

但如果这时候，我是想让 @arr 当作标量来处理，怎么办？上面的写法是不行的。Perl 规定，如果想要指明转换为标量类型，就需要加上关键字: scalar.

@arr2 = (1,2,scalar @arr); # arr2 == (1,2,2)

(4) sort 排序功能

Perl 为数组提供了排序操作符:sort。默认情况下，sort 对数组里的元素按字母排序，然后返回一个新的数组，旧数组不变。

@arr = ("abc","rsz","ef");

@newarr = sort(@arr);

# arr = abc rsz ef newarr = abc ef rsz.

如果数组里存的不是字符，或你不想按字符序排序, 可以指定按数字的方式排序。

sort ({$a <=> $b} @array)

大括号表示一个比较函数，<=> 是指数值比较，$a 和 $b 表示比较的两个数,这两个变量是语言预定义的变量不可以更改。如果把a,b的顺序调换一下，就表示反过来排序，如果用了数值排序，而数组中又有字符串元素，那字符串都被当作 0，如果有多个字符串，字符串之间仍按字母序来排序。如：

@arr = (22,44,33,-12,gg ,hh)

sort({$a<=>$b @arr); # 结果：-12 gg hh 22 33 44

(5) 插入，删除。

Perl 提供了 push, pop, shift, unshift 等函数对数组进行入栈出栈之类的操作。push 和 pop 作用在尾部，shift 与 unshift 作用在头部。

@arr = ("ab","bc","ee");

pop @arr; # 结果：("ab","bc")

push(@arr,"hh"); #结果: ("ab","bc","hh")

shift @arr; #结果: ("bc","hh")

unshift(@arr, "vv"); #结果: ("vv","bc","hh")

<五> hash 数组

(1) 声明与初化

Perl 里的 hash 数组类似于 python 里的 dict, c++ 中的 map。数组中保存的是 <key,value> 一对值。hash 数组用 % 来声明：

%hash = ("key1","value1","key2","value2");

print "v1:$hash{key1}"; #打印出:value1.

上面的初始化语句在 key,value 很多时可读性很差，因此，Perl 又提供了另一种写法：

%hash = ("key1"=>"value1","key2"=>"value2");

其中符号 => 与逗号的效果是完全一样，但这种写法看起来，就比较容易分辨别哪个是 Key, 哪个是 value.

(2) 插入，删除与修改

hash 的插入与修改在语法上是完全一样的。

$hash{"key"} = "value";

如果 hash 数组中原来没有 “key”，就插入；如果有"key"及相应"value"，如果原来有相应的 "key"，就修改相应的 value 为新的 “value"。与此同时，Perl 提供了一个 delete 操作符来删除 hash 中的元素，如： delete $hash{"key"};

(3) 获取 key 与 value.

Perl 提供了keys 和 values 这两个函数来获取 hash 中的全部 key，value。这两个操作符返回的是一个数组，如：

%hash = ("k1"=>"v1","k2"=>"v2");

@k = keys (%hash); #k == ("k1","k2")

@v = values(%hash); #v == ("v1","v2")

下面介绍一下分支循环控制及IO。

Perl中的分支循环在语法上和C家庭语言的语法很相似，关键字包括: If / else, for ,while 。

前面已经讲过，Perl中代码块用大括号{}围起来，表达式以分号结尾，这些都和C相似，但在Perl中，使用if for while时，大括号是强制要求的，这点与c不一样。细心的人可能会发现前一节讲数据类型的时候，并没有涉及到整形，浮点，bool什么的，只说到了一个标量，事实上在Perl里，这些基本数据类型并不严格区分，都可以归到Scalar里头去，这也大概算是脚本语言的一个通用做法， 弱化了基本类型。

其它先不提，分支循环在很多语言里有一个很关键的数据类型：bool。控制分支走向需要一个判断点，真要怎样做，假要怎样做，但在Perl里，没有一个具体的true,false类型，所以在做真假判断时，遵循以下原则：

如果是数据类型，0则为假，
如果是字符串，空字符串为假。
如果是集合，空集合为假。

这些都比较好理解。

(一) if / else

Perl中的if/else语法上和c语言一致，除了要求一定要有大括号。

逻辑判断操作：与(&&), 或(||)，非(!) 语法上也很和C是一致的。

$str = "abc";

@arr = (2,3,4);

if( $str && @arr == 3)

{

}

else

{

}

上面的例子是一种比较传统老式的写法，前面我说if / else 和C中的语法一致，其实也不大准确。

Perl自己还提供了一套与C不大一样的写法，风格上更像是自然语言一样。

$var = 2;

Print " hello world" if ($var > 0); #注意这行，等价于: if ($var > 0) { print "hello world";}

这种写法就像是自然语言里的倒序了。

像上面这种写法，还有另外一个关键字也是同样适用的: unless

Print " hello world" unless ($var > 0);

(二) 循环: for / while / foreach

for ($i=0; $i<100; $i++)

{

print "hello $i ";
}

while( $i < 100 )

{

print "hello $i ";

$i++;

}

上面两字例子演示了 for / while的写法，可见是和C 在语法上是一样的。

除了for / while ,Perl还提供了一个 foreach 专门用来处理数组。

@arr = (1,2,3,4,5);

foreach $item (@arr)

{

print "item: $item ";

}

注意foreach 那一行中的小括号是不能省的。

(三) I/O

Perl中进行I/O操作延用了unix中的IO概念，一切都抽象成文件。

所以，I/O操作都是对一个文件句柄(file handle)进行操作，包括标准输入标准输出。

(1) 标准输入，标准输出

前面示例代码中多次用到了print，在之前的写法这是标准输出，但它的功能却不仅限于标准输出，事实上它的准确原型是：

print <file handle> "hello world ";

如果省略了 file handle，默认情况下就是标准输出，标准输出的句柄 <STDOUT>

所以前面的print语句，事实上等价于：

print STDOUT "hello world ";

对应的标准输入是STDIN，这个两个变量是Perl预定义的。

可以看成是一个关键字一样，也不需要在这些变量前面加$,@这类的符号。

前面一直只示例了标准输出，没有提过标准输入。

标准输入语法上，也很简洁：

$line = <STDIN>; #read

用尖括号把文件句柄括起来，就相当于从里面读数据。

(2) 文件I/O

获取及关闭文件要用Open()/Close()函数。

$succ= open(fh，“~/myfile.log”);

if($succ)

{

$line = <fh>;#read one line.

@all = <fh>; #read the whole file.

print "@line ";

close(fh);

}

值得注意的是，文件句柄的声明是可以不用加$这种符号，直接写一个名字就够了，当然，你如果喜欢加上$，也是没问题的。

前面的示例演示了读入时的最基本的做法，Perl还提供了和C语言里类似的文件操作函数：seek, tell，

用来定位到文件的相应位置进行读写。

它们的用法和c语言很相似，具体使用方式，有兴趣的读者可以自己去查阅一下官方文档。

前面的open()函数示例了文件打开的最基本形式，事实上，这个函数l还支持设置访问模式。

文件访问模式：

访问模式例子说明

读(Read) open(FH，"< FileName")；从文件中读取

写(Write) open(FH，"> FileName")；向文件中写入，覆盖旧文件中的内容

追加(Append) open(FH，">> FileName")；向现有文件的尾部追加数据

读写(Read and Write) open(FH，"+< FileName")；读取和写入现有文件

写入程序 open(PIPEOUT，"| pipeout")；打开程序管道

读取程序 open(PIPEIN，"pipein |")；从程序或命令的输出中取得数据

如果打开的文件支持写操作，我们就可以用Print 函数往文件里写东西：

if(open(fh,">~/file.log"))

{

print fh "hello file ";

close(fh);

}

相关阅读:
使用 VBRichClient 库
提取文件夹目录的办法
编程语言转换
解决linux服务器上matplotlib中文显示乱码问题
动态规划 53：Maximum Subarray，152：Maximum Subarray，266. Palindrome Permutation 回文全排列
动态规划：494，576
ResourceExhaustedError 解决方案
周赛138场
leetcode 115
leetcode 372

原文地址：https://www.cnblogs.com/YINBin/p/6014211.html