- 论坛徽章:
- 1
|
shell基础67:执行顺序(||及&&,{}及())及正则表表达式
- " 匹配行首与行尾。
- " 匹配数据集。
- " 只匹配字母和数字。
- " 匹配一定范围内的字符串集。
复制代码
当从一个文件或命令输出中抽取或过滤文本时,可以使用正则表达式( R E),正则表达式是一些特殊或不很特殊的字符串模式的集合。
基本元字符集及其含义
原帖由 "网中人" 发表:
abc: 表示 abc 三個連續的字符, 但彼此獨立而非集合. (可簡單視為三個 char. set)
(abc): 表示 abc 這三個連續字符的集合. (可簡單視為一個 char. set)
a|b: 表示單一字符, 或 a 或 b .
(abc|xyz): 表示或 abc 或 xyz 這兩個 char. set 之一. (註二)
[abc]: 表示單一字符, 可為 a 或 b 或 c . (與 wildcard 之 [abc] 原理相同)
[^abc]: 表示單一字符, 不為 a 或 b 或 c 即可. (與 wildcard 之 [!abc] 原理相同)
. : 表示任意單一字符. (與 wildcard 之 ? 原理相同)
- ^ 只只匹配行首
- $ 只只匹配行尾
- * 只一个单字符后紧跟*,匹配0个或多个此单字符
- [ ] 只匹配[ ]内字符。可以是一个单字符,也可以是字符序列。可以使用-
- 表示[ ]内字符序列范围,如用[ 1 - 5 ]代替[ 1 2 3 4 5 ]
- \ 只用来屏蔽一个元字符的特殊含义。因为有时在s h e l l中一些元字符有
- 特殊含义。\可以使其失去应有意义
- . 只匹配任意单字符
- p a t t e r n \ { n \ } 只用来匹配前面p a t t e r n出现次数。n为次数
- p a t t e r n \ { n,\ } m 只含义同上,但次数最少为n
- p a t t e r n \ { n,m \ } 只含义同上,但p a t t e r n出现次数在n与m之间
- 现在详细讲解其中特殊含义。
复制代码
1、使用句点匹配单字符
例一:beng.n:以b e g开头,中间夹一个任意字符。
例二:. . . .X C. . . .:共10个字符,前四个之后为XC
例三:列出所有用户都有写权限的目录或文件 :
2、行首以^匹配字符串或字符序列
^只允许在一行的开始匹配字符或单词。
例如,使用ls -l命令,并匹配目录。
3、在行尾以$匹配字符串或字符
可以说$与^正相反,它在行尾匹配字符串或字符, $符号放在匹配单词后。
例一:列出文件httpd1.conf中所有以单词common结尾的行
- $grep common$ httpd1.conf
- 或
- $cat httpd1.conf | grep common$
复制代码
例二:匹配所有空行:^ $
例三:只返回包含一个字符的行:^.$
4、用\屏蔽一个特殊字符的含义
下列字符一般可以认为是特殊字符:
- $ . ' " * [] ^ | () \ + ?
复制代码如:
\ .
反斜杠后面的字符不再是特殊字符,而是一个普通字符,即句点。 假定要匹配包含^的各行,将反斜杠放在它前面就可以屏蔽其特殊含义:
\ ^
在正则表达式中匹配以* . p a s结尾的所有文件:
\ * \ . p a s
即可屏蔽字符*的特定含义。
5、使用\{\}匹配模式结果出现的次数
使用*可匹配所有匹配结果任意次,但如果只要指定次数,就应使用\ { \ },
此模式有三种形式,即:
pattern\{n\} 匹配模式出现n次。
pattern\{n,\} 匹配模式出现最少n次。
pattern\{n,m} 匹配模式出现n到m次之间,n , m为0 - 2 5 5中任意整数。
例一:匹配字母A出现两次,并以B结尾:
匹配值为A A B
例二:匹配A至少4次:
可以得结果A A A A B或A A A A A A A B,但不能为A A A B。
例三:如给出出现次数范围,例如A出现2次到4次之间:
则结果为A A B、A A A B、A A A A B,而不是A B或A A A A A B等。
例四:假定从下述列表中抽取代码:
1234XC9088
4523XX9001
0011XA9912
9931Xc3445
格式如下:前4个字符是数字,接下来是x x,最后4个也是数字,操作如下:
[ 0 - 9 ] \ { 4 \ }X X[ 0 - 9 ] \ { 4 \ }
具体含义如下:
1) 匹配数字出现4次。
2) 后跟代码x x。
3) 最后是数字出现4次。
结果如下
1234XC9088 -no match
4523XX9001 -match
0011XA9912 -no match
9931Xc3445 -no match
经常使用的正则表达式举例
- ^ 对行首
- $ 对行尾
- ^ [ t h e ] 对以t h e开头行
- [ S s ] i g n a [ l L ] 对匹配单词s i g n a l、s i g n a L、S i g n a l、S i g n a L
- [Ss]igna[lL]\. 对同上,但加一句点
- [ m a y M A Y ] 对包含m a y大写或小写字母的行
- ^ U S E R $ 对只包含U S E R的行
- [tty]$ 对以t t y结尾的行
- \ . 对带句点的行
- ^ d . . x . . x . . x 对对用户、用户组及其他用户组成员有可执行权限的目录
- ^ [ ^ l ] 对排除关联目录的目录列表
- [ . * 0 ] 对0之前或之后加任意字符
- [ 0 0 0 * ] 对0 0 0或更多个
- [ iI] 对大写或小写I
- [ i I ] [ n N ] 对大写或小写i或n
- [ ^ $ ] 对空行
- [ ^ . * $ ] 对匹配行中任意字符串
- ^ . . . . . . $ 对包括6个字符的行
- [a- zA-Z] 对任意单字符
- [ a - z ] [ a - z ] * 对至少一个小写字母
- [ ^ 0 - 9 \ $ ] 对非数字或美元标识
- [ ^ 0 - 0 A - Z a - z ] 对非数字或字母
- [ 1 2 3 ] 对1到3中一个数字
- [ D d ] e v i c e 对单词d e v i c e或D e v i c e
- D e . . c e 对前两个字母为D e,后跟两个任意字符,最后为c e
- \ ^ q 对以^ q开始行
- ^ . $ 对仅有一个字符的行
- ^\.[0-9][0-9] 对以一个句点和两个数字开始的行
- ' " D e v i c e " ' 对单词d e v i c e
- D e [ V v ] i c e \ . 对单词D e v i c e或d e v i c e
- [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 2 \ } - [ 0 - 9 ] \ { 4 \ } 对日期格式d d - m m - y y y y
- [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } \ . [ 0 - 9 ] \ { 3 \ } 对I P地址格式nnn. nnn.nnn.nnn
- [ ^ . * $ ] 对匹配任意行
复制代码 |
|