一、为什么用quoting
前面说到,命令行在内容上主要由literal(一般文字)和meta(元字符)组成,而meta又由IFS、CR和其他字符组成(如=,$, > 等),通常这些原元字符都有其特殊功能,假如我们需要在命令行中将这些保留字符的功能关闭的话,就需要quoting处理了。
二、使用quoting的方法
在 bash 中,常用的 quoting 有如下三种方法:
-
hard quote:' ' (单引号),凡在hard quote中的所有meta均被关闭。
-
soft quote: " " (双引号),在soft quote中大部份meta都会被关闭,但某些则保留(如$ )。
-
escape : (反斜线),只有紧接在 escape (跳脱字符)之后的单一meta才被关闭。
三、 <Enter>键在不同情况下的解读
1 $ A='B 2 > C 3 > ' 4 $ echo "$A" 5 B 6 C
在上例中,由于被置于 hard quote 当中,因此不再作为 CR 字符来处理。
这里的<enter>单纯只是一个断行符号(new-line)而已,由于command line 并没得到 CR 字符,因此进入第二个shell prompt (PS2,以>符号表示),command line 并不会结束,直到第三行,我们输入的并不在hard quote 里面,因此并没被关闭,此时,command line 碰到CR字符,于是结束、交给shell来处理。上例的要是被置于soft quote 中的话, CR也会同样被关闭:
1 $ A="B 2 > C 3 > " 4 $ echo $A 5 B C
然而,由于 echo $A 时的变量没至于 soft quote 中,因此当变量替换完成后并作命令行重组时,会被解释为 IFS ,而不是解释为 New Line 字符。
$ A=B > C > $ echo $A BC
同样的,用 escape 亦可关闭 CR 字符:
上例中,第一个跟第二个均被escape字符关闭了,因此也不作为CR来处理,但第三个由于没被跳脱,因此作为CR结束 command line 。但由于<enter>键本身在shell meta中的特殊性,在跳脱后面,仅仅取消C功能,而不会保留其IFS能。
光是一个<enter>键所产生的字符就有可能是如下这些可能:
CR
IFS
NL(New Line)
FF(Form Feed)
NULL
四、 shell meta 与command meta的区分
前面我们提到的那些 meta ,都是在 command line 中有特殊用途的,比方说{ }是将其内一系列command line置于不具名的函式中执行(可简单视为command block),但是,awk 却需要用 { } 来区分出awk 的命令区段(BEGIN, MAIN, END)。若你在command line 中如此输入:
1 $ awk {print $0} 1.txt
由于{ }在shell中并没关闭,那shell就将{print $0}视为command block,但同时又没有";"符号作命令区隔,因此就出现 awk 的语法错误结果。要解决之,可用 hard quote :
1 $ awk '{print $0}' 1.txt
上面的 hard quote 应好理解,就是将原本的 {、、$(注三)、} 这几个 shell meta 关闭,避免掉在shell 中遭到处理,而完整的成为 awk 参数中的 command meta 。
( 注三:而其中的 $0 是 awk 内建的 field number ,而非awk的变量,awk 自身的变量无需使用$)
要是理解了 hard quote 的功能,再来理解 soft quote 与 escape 就不难:
1 awk "{print $0}" 1.txt 2 awk {print $0} 1.txt
然而,若你要改变 awk 的 $0 的 0 值是从另一个 shell 变量读进呢?
1 A=0 2 awk "{print $$A}" 1.txt 3 awk {print $$A} 1.txt 4 awk '{print $'$A'}' 1.txt 5 awk '{print $'"$A"'}' 1.txt # 注:"$A" 包在 soft quote 中
五、参考
1. 《shell十三问》
(完)