常规表达式

所谓常规表达式就是指在文本当中一些字符组合的常见类型。当你在搜寻的过程中使用这些常规表达式可以帮助你描述一些搜寻概念,诸如 "sentences that begin with 'The'" (以 The 开头的句子) 和 "attribute values that contain a number." (包含有数字的属性值)等。下边的表格中列出了一些特殊字符的常规表达式,它们的意思,以及使用范例。

要搜寻包含有表格中的特殊字符的文本,就要通过在这些特殊字符前边加上反斜线符号的方法将其 "避开"。举例说,我们要在短语 some conditions apply* 搜寻星号,那么你所设定的搜寻类型就要是这样的:apply\*。如果你没有这样做,那么你将得到所有包含有 "apply" (以及 "appl","applyy",和 "applyyy") 的结果,而不仅仅是后边跟星号的。
字符 意义 范例

^

输入文字或者一行文字的开头。

^T 同 "This good earth" 中的 "T" 匹配,但不同 "Uncle Tom's Cabin" 中的 "T" 匹配。

$

输入文字或者一行文字的结尾。

h$ 同 "teach" 中的 "h" 匹配,但不同 "teacher" 中的 "h" 匹配。

*

星号前边的字符可以不出现,也可以多次出现。

um* 同 "rum" 中的 "um","yummy" 中的 "umm",和 "huge" 中的 "u" 都匹配。

+

加号前边的字符可以出现一次,也可出现多次。

um+ 同 "rum" 中的 "um","yummy" 中的 "umm" 匹配,但是不同 "huge" 中任何字符匹配。

?

问号前边的字符可有可无,但最多出现一次。

st?on 同 "Johnson" 中的 "son","Johnston" 中的 "ston" 匹配,但不同 "Appleton" 或 "tension" 中的任何字符匹配。

.

除了新的一行之外的任何的单一字符。

.an 同短语 "bran muffins can be tasty" 中的 "ran" 和 "can" 匹配。

x|y

或者 x 或者 y。

FF0000|0000FFBGCOLOR="#FF0000" 中的"FF0000" 和 FONT COLOR="#0000FF" 中的 "0000FF" 都匹配。

{n}

定义前边字符精确的出现次数。

o{2} 同 "loom" 中的 "oo" 和 "mooooo" 中的前两个 o 匹配。但不同 "money" 匹配。

{n,m}

前边的字符最少出现 n 次,最多出现 m 次。

F{2,4} 同 "#FF0000" 中的 "FF" 和 "#FFFFFF" 中的前四个字符匹配。

[abc]

括号中的任一个字符均可。使用连字号可以指定一个字符范围(例如,[a-f] 就相当于 [abcdef])。

[e-g] 同 "bed" 中的 "e","folly" 中的 "f" 和 "guard" 中的 "g" 匹配。

[^abc]

任何一个不包含在括号里的字符即可。使用连字号可以指定一个字符范围(例如,[^a-f] 就相当于 [^abcdef])。

[^aeiou] 同 "orange" 中的 "r","book" 中的 "b" 和 "eek!" 中的 "k" 匹配。

\b

单词的边界(如空格或者回车)。

\bb 同 "book" 中的 "b" 匹配,但不同 "goober" 或 "snob" 匹配。

\B

单词中的非边界字符。

\Bb 同 "goober" 中的 "b" 匹配,但不同 "book" 匹配。

\d

任何的数字符号,相当于 [0-9]。

\d 同 "C3PO" 中的 "3" 和 "apartment 2G" 中的 "2" 匹配。

\D

任何非数字符号。相当于 [^0-9]。

\D 同 "900S" 中的 "S" 和 "Q45" 中的 "Q" 匹配。

\f

换页。

\n

换行。

\r

回车。

\s

任何的单个空格字符,包括空格,制表符号,换页,换行。

\sbook 同 "blue book" 中的 "book" 匹配,但不同 "notebook" 匹配。

\S

任何单个的非空格字符。

\Sbook 同 "notebook" 中的 "book" 匹配,但不同 "blue book" 匹配。

\t

制表符。

\w

任何的文字和数字符号,包括下划线。相当于 [A-Za-z0-9_]。

b\w* 同 "the barking dog" 中的 "barking" 和 "the big black dog" 中的 "big" 与 "black" 匹配。

\W

任何的非文字和数字符号,相当于 [^A-Za-z0-9_]。

\W 同 "Jake & Mattie" 中的 "&", "100%" 中的 "%" 匹配。

Control+Enter 或 Shift+Enter (Windows), 或 Control+ Return 或 Shift+Return 或 Command+ Return (Macintosh)

回车符号。如果没有使用常规表达式,注意在进行这些搜索的时候不要取消选取 Ignore Whitespace Differences 选项。注意这是在寻找一个特定的符号,而不是普通的换行符号;例如,它并不和 <br> 标签或 <p> 标签匹配。回车符号在文档中表现为空格,而不是一个换行符号。


使用圆括号可以在常规表达式中进行分组以备以后使用;使用 $1, $2, $3 等(Find 填框或 Replace 填框均可)来作为第一,第二,第三和随后的插入分组。例如,搜索 (\d+)\/(\d+)\/(\d+) 并用 $2/$1/$3 进行替换,来替换用斜线分开的日期,(用来在美国和欧洲不同的日期表示方法之间进行转换)。