正则表达式就是由一系列特殊字符组成的字符串,其中每个特殊字符都被称为元字符。这些元字符并不表示为它们字面上的含义,而会被解释为一些特定的含义。

一个正则表达式会包含下列一项或多项:

① 一个字符集。这里所指的字符集只包含普通字符,这些字符只表示它们的字面含义。正则表达式的最简单形式就是只包含字符集,而不包含元字符。

② 锚。锚指定了正则表达式所要匹配的文本在文本行中所处的位置。 5个锚定符:


行首锚定:^

行尾锚定:$

词首锚定:\<字符

词尾锚定:字符\>

单词锚定:\<字符\>

③ 修饰符。它们扩大或缩小(修改)了正则表达式匹配文本的范围,修饰符包含星号,括号和反斜杠。

点 -- .-- 用于匹配任意一个字符,除了换行符。

星号 -- *-- 用来匹配它前面字符的任意多次,包括0次。

脱字符号 -- ^-- 匹配行首,但是某些时候需要依赖上下文环境,在RE中,有时候也表示对一个字符集取反。

美元符 -- $-- 在RE中用来匹配行尾。

"XXX$" 匹配行尾的XXX

"^$" 匹配空行

标签: Linux, 正则表达式, 匹配, 字符, 元字符, 简单, 字符集, 锚定

相关文章推荐

添加新评论,含*的栏目为必填