转载:http://blog.sina.com.cn/s/blog_ac9fdc0b0101lvdv.html
sed和awk是永远地痛,学了又忘,主要是木有横向对比过,所以总把握不到精髓。它可以完美的配合正则表达式(注意是正则表达式哈,不是通配符和字符串模板)。
*********************************************************************************************
命令格式
sed命令的格式如下:sed option script file,option如下:
(1)-e script:在处理输入时,将script中指定的命令添加到运行的命令中,实际上就是使用多个选项;
(2)-f file:在处理输入时,将file中指定的命令添加到运行的命令中;
(3)-n:不为每个命令生成输出,等待print来输出;
(4)-i: 将替换结果用于原文件
*********************************************************************************************
替换字符:s/pattern/replace/flags
替换文本内容,有4种可用的flags:
(1)默认是替换第一个匹配的字符;
(2)数字,表明新文本将替换第几处模式匹配的地方;
(3)g,表明替换所有的地方;
(4)p,表明原来的行内容要打印出来;
(5)w file,将替换结果写入原文件。
***************************************************************************************
移除字符:/pattern/d 移除pattern
很简单的移除空白行:
***************************************************************************************
使用地址
默认情况下,sed编辑器中使用的命令会作用与文本的所有行,如果只想将命令作用域特定某行,必须使用行寻址。在sed编辑器中有两种形式的行寻址:
(1)行的数字范围;
(2)用文本模式来过滤出某些行。
两种方法都使用相同的格式来指定地址:[address]command
===================================================================
数字方式的行寻址
当使用数字方式的行寻址时,可以用它们在文本流中的行位置来引用行。sed会将第一行分配为1,后面按顺序为新行分配行号。
-------------------------------
测试文件内容:
测试的命令如下:
注意两点:
(1)n,m表示的是n~m行;
(2)$表示的是结尾的行,2~$表示从第二行到结尾。
===============================================================================
文本模式过滤器
sed编辑器允许指定文本模式来过滤出命令要作用的行,格式如下:/pattern/command
很容易看懂,/2/用来匹配出现2的行,然后对该行作用命令s/chen/jiang/
================================================================================
组合命令
使用{}将多条命令组合在一起,可以在单行上执行多条命令。
****************************************************************************************
删除行
删除命令d名副其实,它会删除匹配指定寻址模式的所有行。
===============================================================================
(1)删除指定范围行
(2)删除匹配行
********************************************************************************************
插入和附加文本
(1)插入(insert)命令i会在指定行的前面增加一个新行;
(2)追加(append)命令a会在指定行的后面增加一个新行;
不能在单个命令上使用这两条命令,必须指定是要将行插入还是附加到另一行,格式如下:
sed '[address]command new line'
=========================================================
如果更加复杂的匹配如下:
***********************************************************************************************
修改行
修改允许修改数据中整行文本的内容,和插入附加的机制一样,如下:
***********************************************************************************************
字符映射
转换(y)命令是唯一可以处理单个字符的sed编辑命令。转换命令的格式如下:
[address]y/inchars/outchars/
转换命令会对inchars和outchars值进行一对一的映射。
**********************************************************************************************
回顾打印
有三种方式来打印数据流中的信息:
(1)p:打印文本行;
===============================================================================
(2)=:打印行号
===============================================================================
(3)l:列出行
列出命令l允许打印数据流中的文本和不可打印的ASCII字符。
*******************************************************************************************
多行命令
多行命令允许你跨越多行来执行特定的操作。sed编辑器包含了3个可用来处理多行文本的特殊命令。
(1)N:将数据流中的下一行加进来创建一个多行组的处理;
(2)D:删除多行组中的一行;
(3)P:打印多行组中的一行。
==============================================================================
next命令
------------------------------
单行next
小写n会告诉sed移动到数据流的下一行文本,而不用回到命令最开始再执行一遍。可以来感受下下面的区别。
================================================================================
合并文本行
===============================================================================
(6)& 代表已匹配的字符串
================================================================================
(7)子串匹配标记 (pattern)
,非常的重要
两个(pattern)之间需要空格 这个非常的重要,可以直接忽略一部分而只选择其中某一部分
===============================================================================
================================================================================
(9)引用 当使用变量是用双引号