linux的tr命令

tr（translate缩写）主要用于删除文件中的控制字符，或进行字符转换。

语法

tr [ -c | -cds | -cs | -C | -Cds | -Cs | -ds | -s ] [ -A ] String1 String2

tr { -cd | -cs | -Cd | -Cs | -d | -s } [ -A ] String1

说明：

tr 命令从标准输入删除或替换字符，并将结果写入标准输出。根据由 String1 和 String2 变量指定的字符串以及指定的标志，tr 命令可执行三种操作:

1）转换字符

如果 String1 和 String2 两者都已指定，但无 -d 标志，则 tr 命令会在标准输入中将 String1 中所包含的每一个字符都替换成 String2 中相同位置上的字符，注意位置对应，String1中的第一个被String2中的第一个替换，

前后一一对应：

$ echo "aaabbbcccdddeeefffabc" | tr 'abd' 'xyy'
结果：xxxyyycccyyyeeefffxyc

如果个数不符合，则前后的多余字符分两种：

一，后面多无操作，只换前两个：

echo "hhhtttvvv" | tr 'hv' 'wpt'

结果：wwwtttppp。t字符没有操作。

二，前面多，则除了前面一一对应后，剩下的同意由string2最后一个字符替换：

echo "aaabbbcccdddeeefff" | tr 'abc' 'xy'
结果：xxxyyyyyydddeeefff

2）-d 标志为删除字符操作，tr 命令会在标准输入中删除 String1 中包含的每一个字符。没有则不操作。

3）用 -s 标志压缩重复字符串

-s 标志，会压缩字符串中的重复出现的字符，比如:

echo "aaabbbcccdddeeefffabc" | tr -s 'abd'
结果：abcccdeeefffabc

当有两个参数时，则先进行压缩，再进行替换：

echo "aaabbbcccdddeeefffabc" | tr -s 'acd' 'fy'
结果fbbbyeeefby

（注意，前多后少，所以除了一一对应的，string1多余的都是使用string2最后一个替换，如cd都用y。）

命令参数：

-t: truncate，将String1用String2转换，缺省为-t；默认tr执行转换命令

-d:delete，参数只有String1，进行删除
-s: squeeze-repeats，压缩重复出现的字符，并用2中的字符替换1中。

-c:complement，用String2替换Sring1中没有包含的字符

echo "aaabbbcccdddeeefffabc" | tr -c 'a' 'x'
结果：aaaxxxxxxxxxxxxxxxaxxx

-C man中说和-c功能一样。（网络上说：指定 String1 值用 String1 所指定的字符串的补码替换。String1 的补码是当前语言环境的字符集中的所有字符，除了由 String1 指定的字符以外。如果指定了 -A 和 -c 标志都已指定，则与所有 8 位字符代码集合有关的字符将被补足。如果指定了 -c 和 -s 标志，则 -s 标志适用于 String1 的补码中的字符。如果没有指定 -d 选项，则由 String1 指定的字符的补码将放置到升序排列的数组中（如 LC_COLLATE 的当前设置所定义）。）

-A 使用范围和字符类 ASCII 整理顺序、一个字节一个字节地执行所有操作，而不是使用当前语言环境整理顺序。

Strings are specified as strings of characters. Most represent themselves.
Interpreted sequences are:

NNN character with octal value NNN (1 to 3 octal digits)
\ backslash 转义字符
a audible BEL 警报铃
backspace 删除
f form feed
new line 回车换行
return
horizontal tab
v vertical tab
CHAR1-CHAR2 all characters from CHAR1 to CHAR2 in ascending order
[CHAR*] in String2, copies of CHAR until length of String1
[CHAR*REPEAT] REPEAT copies of CHAR, REPEAT octal if starting with 0
[:alnum:] all letters and digits 字符数字
[:alpha:] all letters字符
[:blank:] all horizontal whitespace 水平空格
[:cntrl:] all control characters控制符
[:digit:] all digits 数字
[:graph:] all printable characters, not including space
[:lower:] all lower case letters 小写
[:print:] all printable characters, including space
[:punct:] all punctuation characters
[:space:] all horizontal or vertical whitespace 横竖空白
[:upper:] all upper case letters 大写
[:xdigit:] all hexadecimal digits 16进制数
[=CHAR=] all characters which are equivalent to CHAR

以下引自网络：

表达字符串的特殊序列

String1 和 String2 变量中所包含的字符串可以使用以下的约定来表示：

C1-C2	指定了 C1 所指定的字符和 C2 所指定的字符之间（包括 C1 和 C2）进行整理的字符串。C1 所指定的字符必须整理放在由 C2 所指定的字符之前。注: 在使用本方法指定子范围时，当前语言环境对结果有重要影响。如果需要用命令来产生与语言环境无关的一致结果，则应该避免使用子范围。
[C*Number]	Number 是一个整数，它指定了由 C 所指定的字符的重复次数。除非其首位数字是 0，否则 Number 一律视为是十进制整数；如果首位数字是 0，则视为八进制整数。
[C*]	用 C 指定的字符填写字符串。该选项只用于包含在 String2 中的字符串末尾，它强制 String2 中的字符串具有与由 String1 变量所指定的字符串一样的字符数。*（星号）后面指定的任何字符都被忽略。
[ :ClassName: ]	指定由当前语言环境中的 ClassName 所命名的字符类中的所有字符。类名可以是下述名称中的任何一种： alnum lower alpha print blank punct cntrl space digit upper graph xdigit 除 [:`lower`:] 和 [:`upper`:] 转换字符类之外，其它字符类指定的字符都按未指定的顺序放入数组中。由于未定义字符类指定的字符的顺序，仅当目的为将多个字符映射为一个时才使用这些字符。转换字符类除外。有关字符类的详细情况，请参阅 ctype 子例程。
[ =C= ]	指定所有的字符具有与 C 所指定的字符相同的等价类。
Octal	指定字符，其编码由 Octal 所指定的八进制值表示。Octal 可以是 1 位、2 位或 3 位八进制整数。空字符可以用 `''` 表示，并可以像任何其它的字符那样进行处理。
ControlCharacter	指定与 ControlCharacter 所指定的值相应的控制字符。可以表示以下值： a 警告退格键 f 换页换行回车制表键 v 垂直制表键
\	规定 ""（反斜杠）就是作反斜杠使用，而无作为转义字符的任何特殊意义。
[	指定“[”（左括号）就作为左括号使用，而无作为特定字符串序列的开始字符的任何特殊意义。
-	指定“-”（负号）就作为负号使用，而无作为范围分隔符的任何特殊意义。

退出状态

该命令返回以下出口值：0，输入处理成功；>0 处理产生错误。

示例

若要将大括号转换为小括号，请输入：tr '{}' '()' < textfile > newfile
这便将每个 {（左大括号）转换成 (（左小括号），并将每个 }（右大括号）转换成 )（右小括号）。所有其它的字符都保持不变。
若要将大括号转换成方括号，请输入：tr '{}' '[]' < textfile > newfile
这便将每个 {（左大括号）转换成 [（左方括号），并将每个 }（右大括号）转换成 ]（右方括号）。左方括号必须与一个 ""（反斜扛）转义字符一起输入。
若要将小写字符转换成大写，请输入：tr 'a-z' 'A-Z' < textfile > newfile
若要创建一个文件中的单词列表，请输入：
```
tr -cs '[:lower:][:upper:]' '[
*]' < textfile > newfile
```
这便将每一序列的字符（除大、小写字母外）都转换成单个换行符。*（星号）可以使 tr 命令重复换行符足够多次以使第二个字符串与第一个字符串一样长。
若要从某个文件中删除所有空字符，请输入：
```
tr -d '' < textfile > newfile
```
若要用单独的换行替换每一序列的一个或多个换行，请输入：
```
tr -s '
' < textfile > newfile
```
或
```
tr -s '12' < textfile > newfile
```
若要以“？”（问号）替换每个非打印字符（有效控制字符除外），请输入：
```
tr -c '[:print:][:cntrl:]' '[?*]' < textfile > newfile
```
这便对不同语言环境中创建的文件进行扫描，以查找当前语言环境下不能打印的字符。
要以单个“#”字符替换 <space> 字符类中的每个字符序列，请输入：
```
tr -s '[:space:]' '[#*]'
```

一些不错的小例子
1、去除重复的字符
#将连续的几个相同字符压缩为一个字符
$ echo aaacccddd | tr -s [a-z]
acd
$ echo aaacccddd | tr -s [abc]
acddd

2、删除空白行
#删除空白行就是删除换行符/n
#注意：这些空白行上只有回车符，没有空格符，这里用换行符的转义字符
#注意：此处用-s删除了多余的换行符，如果用-d，则会删除所有的换行符
$ cat test.txt | tr -s [" "]

#也可以用八进制符12，12与都是换行符
$ cat test.txt | tr -s "[12]"

3、大小写相互转换
#将语句中所有的小写字母变成大写字母,其中-t可省略
$ echo "Hello World I Love You" |tr -t [a-z] [A-Z]
HELLO WORLD I LOVE YOU
#将语句中所有的大写字母变成小写字母
$ echo "Hello World I Love You" |tr [A-Z] [a-z]
hello world i love you
#也可以利用字符类进行转换
#[:lower:]代表小写字母，[:upper:]代表大写字母
$ echo "Hello World I Love You" |tr [:lower:] [:upper:]
HELLO WORLD I LOVE YOU

4、删除指定的字符
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#现在要删除处理星期之外的所有字符
#-d代表删除，[0-9]代表所有的数字，[: ]代表冒号和空格
$ cat test.txt | tr -d "[0-9][: ]"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday

5、利用-c进行补集的替换
#有时候在文本中我们只知道要保留的一些字符，其他字符种类繁多，就可以使用补集的替换
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#我们只需要星期，则思路就是除了字母，其他统统替换掉
#这里，-c：用换行符替换掉除了字母外的所有字符；-s：删除多余的换行符
cat test.txt|tr -cs "[a-z][A-Z]" " "
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday

相关阅读:
ValueStack、ActionContext
s debug
1923: [Sdoi2010]外星千足虫
 1013: [JSOI2008]球形空间产生器sphere
HDU 3923 Invoker
poj 1286 Necklace of Beads
HDU 3037:Saving Beans
2440: [中山市选2011]完全平方数
 1101: [POI2007]Zap
1968: [Ahoi2005]COMMON 约数研究
原文地址：https://www.cnblogs.com/riskyer/p/3299551.html