使用正则表达式来检索符合要求的字符串。
需要找出固定的字符位置与可变字符的规律,然后用正则表达式中的普通字符、特殊字符、限定符、定位符来描述对应的规律。
使用正则表达式描述
1、表达(xxx) xxx-xxxx
^\([0-9][0-9][0-9]\) [0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$
优化:
^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$
2、表达 xxx-xxx-xxxx
^[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]$
优化:
^[0-9]{3}-[0-9]{3}-[0-9]{4}$
3、同时表示xxx-xxx-xxxx和 (xxx) xxx-xxxx
^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$
grep
grep -P '^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$' file.txt
awk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt
gawk
gawk '/^([0-9]{3}-|\([0-9]{3}\) )[0-9]{3}-[0-9]{4}$/' file.txt
限定符前面字符的出现次数
限定符 | 表达含义 |
---|---|
* | 出现次数>=0 |
+ | 出现次数>=1 |
? | 出现次数 0 or 1, 等价{0,1} |
{n} | 出现次数=n |
{n,} | 出现次数>=n |
{n, m} | n=< 出现次数<= m |
定位符 | 表达含义 |
---|---|
^ | 字符串开始的位置 |
$ | 字符串结束的位置 |
\b | 限定单词(字)的字符,常用来确定一个单词,可以结合两个‘\b’使用 |
\B | 限定非单词(字)边界的字符,用的很少 |