Javascript中正则表达式的用法


Javascript 中正则表达式 战法权 第 1 页 共 10 页 Javascript 中正则表达式的用法: 一、定义正则表达式字符串 语法: var 变量名 = /正则表达式字符串/; 注意,正则表达式字符串要放在/ 和/中间 如: var reg = /\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/; 上面是匹配 email 地址的正则表达式 二、调用正则表达式字符串的 test()方法检测输入的内容是否符合要求。 语法: 正则表达式变量.test(要验证的字符串) 如果要验证的字符串符合正则表达式的要求,返回为 true,否则返回 false。 常用方法: if(reg.test(要验证的字符串)) { //通过验证 } else { //没有通过验证 } 三、常用的一些正则表达式: 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 匹配空行的正则表达式:\n[\s| ]*\r 匹配 HTML 标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 匹配首尾空格的正则表达式:(^\s*)|(\s*$)(像 vbscript 那样的 trim 函数) 匹配 Email 地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 匹配网址 URL 的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)? 校验是否全由数字组成:^[0-9]{1,20}$ 校验登录名:只能输入 5-20 个以字母开头、可带数字、“_”、“.”的字串: ^[a-zA-Z]{1}([a-zA-Z0-9]|[._]){4,19}$ 校验普通电话、传真号码:可以“+”开头,除数字外,可含有“-”: ^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$ 校验手机号码:必须以数字开头,除数字外,可含有“-” ^[+]{0,1}(\d){1,3}[ ]?([-]?((\d)|[ ]){1,12})+$ 校验邮政编码:^[a-zA-Z0-9 ]{3,12}$ 匹配 IP 地址的正则表达式:(\d+)\.(\d+)\.(\d+)\.(\d+) 用正则表达式限制只能输入全角字符:[^\uFF00-\uFFFF] 四、正则表达式解析 正则表达式是一个描述字符模式的对象。 JavaScript 的 RegExp 对象和 String 对象定义了使用正则表达式来执行强大的模式 Javascript 中正则表达式 战法权 第 2 页 共 10 页 匹配和文本检索与替换函数的方法. 在JavaScript 中,正则表达式是由一个 RegExp 对象表示的.当然,可以使用一个 RegExp()构造函数来创建RegExp对象,也可以用JavaScript 1.2中的新添加的一个特殊语 法来创建 RegExp 对象.就像字符串直接量被定义为包含在引号内的字符一样,正则表达 式直接量也被定义为包含在一对斜杠(/)之间的字符.所以,JavaScript 可能会包含如下的 代码: var pattern = /s$/; 这行代码创建一个新的 RegExp 对象,并将它赋给变量 parttern.这个特殊的 RegExp 对象和所有以字母"s"结尾的字符串都匹配.用 RegExp()也可以定义一个等价的正则表达 式,代码如下: var pattern = new RegExp("s$"); 无论是用正则表达式直接量还是用构造函数 RegExp(),创建一个 RegExp 对象都是 比较容易的.较为困难的任务是用正则表达式语法来描述字符的模式.JavaScript 采用的 是 Perl 语言正则表达式语法的一个相当完整的子集. 正则表达式的模式规范是由一系列字符构成的.大多数字符(包括所有字母数字字 符)描述的都是按照字面意思进行匹配的字符.这样说来,正则表达式/java/就和所有包含 子串 "java" 的字符串相匹配.虽然正则表达式中的其它字符不是按照字面意思进行匹 配的,但它们都具有特殊的意义.正则表达式 /s$/ 包含两个字符. 第一个特殊字符 "s" 是按照字面意思与自身相匹配.第二个字符 "$" 是一个特殊 字符,它所匹配的是字符串的结尾.所以正则表达式 /s$/ 匹配的就是以字母 "s" 结尾 的字符串. 1.直接量字符 我们已经发现了,在正则表达式中所有的字母字符和数字都是按照字面意思与自身 相匹配的.JavaScript 的正则表达式还通过以反斜杠(\)开头的转义序列支持某些非 字母字符.例如,序列 "\n" 在字符串中匹配的是一个直接量换行符.在正则表达式中, 许多标点符号都有特殊的含义.下面是这些字符和它们的含义: 正则表达式的直接量字符 字符 匹配 ________________________________ 字母数字字符 自身 \ f 换页符 \ n 换行符 \ r 回车 Javascript 中正则表达式 战法权 第 3 页 共 10 页 \ t 制表符 \ v 垂直制表符 \ / 一个 / 直接量 \ \ 一个 \ 直接量 \ . 一个 . 直接量 \ * 一个 * 直接量 \ + 一个 + 直接量 \ ? 一个 ? 直接量 \ | 一个 | 直接量 \ ( 一个 ( 直接量 \ ) 一个 ) 直接量 \ [ 一个 [ 直接量 \ ] 一个 ] 直接量 \ { 一个 { 直接量 \ } 一个 } 直接量 \ XXX 由十进制数 XXX 指 定的 ASCII 码字符 \ Xnn 由十六进制数 nn 指定的 ASCII 码字符 \ cX 控制字符^X. 例如, \cI 等价于 \t, \cJ 等价于 \n ___________________________________________________ 如果想在正则表达式中使用特殊的标点符号,必须在它们之前加上一个 "\" . 2.字符类 将单独的直接符放进中括号内就可以组合成字符类.一个字符类和它所包含的任何 一个字符都匹配,所以正则表达式 / [abc] / 和字母 "a" , "b" , "c" 中的任何一个都匹配. 另外还可以定义否定字符类,这些类匹配的是除那些包含在中括号之内的字符外的所有 字符.定义否定字符尖时,要将一个 ^ 符号作为从左中括号算起的第一个字符.正则表达 式的集合是 / [a-zA-z0-9] / . 由于某些字符类非常常用,所以 JavaScript 的正则表达式语法包含一些特殊字符和 转义序列来表示这些常用的类.例如, \s 匹配的是空格符,制表符和其它空白符, \s 匹配的 则是空白符之外的任何字符. 正则表灰式的字符类 字符 匹配 ____________________________________________________ [...] 位于括号之内的任意字符 [^...] 不在括号之中的任意字符 . 除了换行符之外的任意字符,等价于[^\n] \w 任何单字字符, 等价于[a-zA-Z0-9] \W 任何非单字字符,等价于[^a-zA-Z0-9] Javascript 中正则表达式 战法权 第 4 页 共 10 页 \s 任何空白符,等价于[\ t \ n \ r \ f \ v] \S 任何非空白符,等价于[^\ t \ n \ r \ f \ v] \d 任何数字,等价于[0-9] \D 除了数字之外的任何字符,等价于[^0-9] [\b] 一个退格直接量(特例) ________________________________________________________________ 3.复制 用以上的正则表式的语法,可以把两位数描述成 / \ d \ d /,把四位数描述成 / \d \ d \ d \ d /.但我们还没有一种方法可以用来描述具有任意多数位的数字或者是一个 字符串.这个串由三个字符以及跟随在字母之后的一位数字构成.这些复杂的模式使 用的正则表达式语法指定了该表达式中每个元素要重复出现的次数. 指定复制的字符总是出现在它们所作用的模式后面.由于某种复制类型相当常用.所 以有一些特殊的字符专门用于表示它们.例如: +号匹配的就是复制前一模式一次或多次 的模式.下面的表列出了复制语法.先看一个例子: /\d{2, 4}/ //匹配 2 到 4 间的数字. /\w{3} \d?/ //匹配三个单字字符和一个任意的数字. /\s+java\s+/ //匹配字符串"java" ,并且该串前后可以有一个或多个空格. /[^"] * / //匹配零个或多个非引号字符. 正则表达式的复制字符 字符 含义 __________________________________________________________________ {n, m} 匹配前一项至少 n 次,但是不能超过 m 次 {n, } 匹配前一项 n 次,或者多次 {n} 匹配前一项恰好 n 次 ? 匹配前一项 0 次或 1 次,也就是说前一项是可选的. 等价于 {0, 1} + 匹配前一项 1 次或多次,等价于{1,} * 匹配前一项 0 次或多次.等价于{0,} ___________________________________________________________________ 4.选择,分组和引用 正则表达式的语法还包括指定选择项,对子表达式分组和引用前一子表达式的特殊 Javascript 中正则表达式 战法权 第 5 页 共 10 页 字符.字符| 用于分隔供选择的字符.例如: /ab|cd|ef/ 匹配的是字符串 "ab",或者是字符串 "cd",又或者 "ef". /\d{3}|[a-z]{4}/ 匹配的是要么是一个三位数,要么是四个小写字母.在 正则表达式中括号具有几种作用.它的主要作用是把单独的项目分组成子表达式,以便可 以像处理一个独立的单元那种用 *、+或? 来处理那些项目.例如: /java(script) ?/ 匹配的 是字符串 "java",其后既可以有 "script",也可以没有. /(ab|cd) + |ef) / 匹配的既可以是字 符串 "ef",也可以是字符串"ab" 或者 "cd" 的一次或多次重复. 在正则表达式中,括号的第二个用途是在完整的模式中定义子模式。当一个正则表 达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部 分.例如,假定我们正在检索的模式是一个或多个字母后面跟随一位或多位数字,那么我 们可以使用模式 / [a-z] + \ d+/.但是由于假定我们真正关心的是每个匹配尾部的数字,那 么如果我们将模式的数字部分放在括号中 (/ [a-z] + (\d+)/) ,我们就可以从所检索到的任 何匹配中抽取数字了,之后我们会对此进行解析的. 代括号的子表达式的另一个用途是,允许我们在同一正则表达式的后面引用前面的 子表达式.这是通过在字符串 \ 后加一位或多位数字来实现的.数字指的是代括号的子 表达式在正则表达式中的位置.例如: \1 引用的是第一个代括号的子表达式. \3 引用的 是第三个代括号的子表达式.注意,由于子表达式可以嵌套在其它子表达式中,所以它的 位置是被计数的左括号的位置. 例如:在下面的正则表达式被指定为 \2: /([Jj]ava([Ss]cript)) \sis \s (fun\w*) / 对正则表达式中前一子表达式的引用所指定的并不是那个子表达式的模式,而是与 那个模式相匹配的文本.这样,引用就不只是帮助你输入正则表达式的重复部分的快捷方 式了,它还实施了一条规约,那就是一个字符串各个分离的部分包含的是完全相同的字符. 例如:下面的正则表达式匹配的就是位于单引号或双引号之内的所有字符.但是,它要求 开始和结束的引号匹配(例如两个都是双引号或者都是单引号): /[' "] [^ ' "]*[' "]/ 如果要求开始和结束的引号匹配,我们可以使用如下的引用: /( [' "] ) [^ ' "] * \1/ \1 匹配的是第一个代括号的子表达式所匹配的模式.在这个例子中,它实施了一种规 约,那就是开始的引号必须和结束的引号相匹配.注意,如果反斜杠后跟随的数字比代括 号的子表达式数多,那么它就会被解析为一个十进制的转义序列,而不是一个引用.你可 以坚持使用完整的三个字符来表示转义序列,这们就可以避免混淆了.例如,使用 \044,而 不是\44.下面是正则表达式的选择、分组和引用字符: 字符 含义 ______________________________________ | 选择.匹配的要么是该符号左边的子表达式,要么它右边的子表达式 (...) 分组.将几个项目分为一个单元.这个单元可由 *、+、?和|等符号使用,而且还可以 记住和这个组匹配的字符以供此后引用使用 \n 和第 n 个分组所匹配的字符相匹配.分组是括号中的子表达式(可能是嵌套的).分组号 是从左到右计数的左括号数 Javascript 中正则表达式 战法权 第 6 页 共 10 页 ______________________________________ 5.指定匹配的位置 我们已经看到了,一个正则表达式中的许多元素才能够匹配字符串的一个字符.例如: \s 匹配的只是一个空白符.还有一些正则表达式的元素匹配的是字符之间宽度为 0 的空 间,而不是实际的字符例如: \b 匹配的是一个词语的边界,也就是处于一个/w 字字符和一 个\w 非字字符之间的边界.像\b 这样的字符并不指定任何一个匹配了的字符串中的字 符,它们指定的是匹配所发生的合法位置.有时我们称这些元素为正则表达式的锚.因为 它们将模式定位在检索字符串中的一个特定位置.最常用的锚元素是 ^, 它使模式依赖 于字符串的开头,而锚元素$则使模式定位在字符串的末尾. 例如:要匹配词 "javascript" ,我们可以使用正则表达式 /^ javascript $/. 如果我们想 检索 "java" 这个词自身 (不像在 "javascript" 中那样作为前缀),那么我们可以使用模 式 /\s java \s /, 它要求在词语 java 之前和之后都有空格.但是这样作有两个问题.第一: 如果 "java" 出现在一个字符的开头或者是结尾.该模式就不会与之匹配,除非在开头和 结尾处有一个空格. 第二: 当这个模式找到一个与之匹配的字符时,它返回的匹配的字 符串前端和后端都有空格,这并不是我们想要的.因此,我们使用词语的边界 \b 来代替真 正的空格符 \s 进行匹配. 结果表达式是 /\b java \b/. 下面是正则表达式的锚字符: 字符 含义 ____________________________________________________________________ ^ 匹配的是字符的开头,在多行检索中,匹配的是一行的开头 $ 匹配的是字符的结尾,在多行检索中,匹配的是一行的结尾 \b 匹配的是一个词语的边界.简而言之就是位于字符\w 和 \w 之间的位置(注意:[\b]匹 配的是退格符) \B 匹配的是非词语的边界的字符 _____________________________________________________________________ 6.属性 有关正则表达式的语法还有最后一个元素,那就是正则表达式的属性,它说明的是高 级模式匹配的规则.和其它正则表达式语法不同,属性是在 / 符号之外说明的.即它们不 出现在两个斜杠之间,而是位于第二个斜杠之后.javascript 1.2支持两个属性.属性 i 说明 模式匹配应该是大小写不敏感的.属性 g 说明模式匹配应该是全局的.也就是说,应该找 出被检索的字符串中所有的匹配.这两种属性联合起来就可以执行一个全局的,大小写不 敏感的匹配. 例如: 要执行一个大小不敏感的检索以找到词语 "java" (或者是 "java" 、"JAVA" 等) 的第一个具体值,我们可以使用大小不敏感的正则表达式 /\b java\b/i .如果要在一个 字符串中找到 "java" 所有的具体值,我们还可以添加属性 g, 即 /\b java \b/gi . 以下是正则表达式的属性: Javascript 中正则表达式 战法权 第 7 页 共 10 页 字符 含义 _________________________________________ i 执行大小写不敏感的匹配 g 执行一个全局的匹配,简而言之,就是找到所有的匹配,而不是在找到第一个之后就停 止了 _________________________________________ 除属性 g 和 i 之外,正则表达式就没有其它像属性一样的特性了.如果将构造函数 RegExp 的静态属性 multiline 设置为 true ,那么模式匹配将以多行的模式进行.在这种 模式下,锚字符 ^ 和 $ 匹配的不只是检索字符串的开头和结尾,还匹配检索字符串内部 的一行的开头和结尾.例如: 模式 /Java$/ 匹配的是 "Java",但是并不匹配"Java\nis fun" . 如果我们设置了 multiline 属性,那么后者也将被匹配: RegExp.multiline = true; 正则表达式(regular expression)对象包含一个正则表达式模式(pattern)。它具有用正 则表达式模式去匹配或代替一个串(string)中特定字符(或字符集合)的属性(properties)和 方法(methods)。要为一个单独的正则表达式添加属性,可以使用正则表达式构造函数 (constructor function),无论何时被调用的预设置的正则表达式拥有静态的属性(the predefined RegExp object has static properties that are set whenever any regular expression is used, 我不知道我翻得对不对,将原文列出,请自行翻译)。 • 创建: 一个文本格式或正则表达式构造函数 文本格式: /pattern/flags 正则表达式构造函数: new RegExp("pattern"[,"flags"]); • 参数说明: pattern -- 一个正则表达式文本 flags -- 如果存在,将是以下值: g: 全局匹配 i: 忽略大小写 gi: 以上组合 [注意] 文本格式的参数不用引号,而在用构造函数时的参数需要引号。如:/ab+c/i new RegExp("ab+c","i")是实现一样的功能。在构造函数中,一些特殊字符需要进行转意(在 特殊字符前加"\")。如:re = new RegExp("\\w+") 正则表达式中的特殊字符 字符 含意 \ 做为转意,即通常在"\"后面的字符不按原来意义解释,如/b/匹配 字符"b",当 b 前面加了反斜杆后/\b/,转意为匹配一个单词的边 界。 -或- 对正则表达式功能字符的还原,如"*"匹配它前面元字符 0 次或多 次,/a*/将匹配 a,aa,aaa,加了"\"后,/a\*/将只匹配"a*"。 ^ 匹配一个输入或一行的开头,/^a/匹配"an A",而不匹配"An a" Javascript 中正则表达式 战法权 第 8 页 共 10 页 $ 匹配一个输入或一行的结尾,/a$/匹配"An a",而不匹配"an A" * 匹配前面元字符 0 次或多次,/ba*/将匹配 b,ba,baa,baaa + 匹配前面元字符 1 次或多次,/ba*/将匹配 ba,baa,baaa ? 匹配前面元字符 0 次或 1 次,/ba*/将匹配 b,ba (x) 匹配 x 保存 x 在名为$1...$9 的变量中 x|y 匹配 x 或 y {n} 精确匹配 n 次 {n,} 匹配 n 次以上 {n,m} 匹配 n-m 次 [xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符) [^xyz] 不匹配这个集合中的任何一个字符 [\b] 匹配一个退格符 \b 匹配一个单词的边界 \B 匹配一个单词的非边界 \cX 这儿,X 是一个控制符,/\cM/匹配 Ctrl-M \d 匹配一个字数字符,/\d/ = /[0-9]/ \D 匹配一个非字数字符,/\D/ = /[^0-9]/ \n 匹配一个换行符 \r 匹配一个回车符 \s 匹配一个空白字符,包括\n,\r,\f,\t,\v 等 \S 匹配一个非空白字符,等于/[^\n\f\r\t\v]/ \t 匹配一个制表符 \v 匹配一个重直制表符 \w 匹配一个可以组成单词的字符(alphanumeric,这是我的意译,含 数字),包括下划线,如[\w]匹配"$5.98"中的 5,等于[a-zA-Z0-9] \W 匹配一个不可以组成单词的字符,如[\W]匹配"$5.98"中的$,等 于[^a-zA-Z0-9]。 说了这么多了,我们来看一些正则表达式的实际应用的例子: E-mail 地址验证: function test_email(strEmail) { var myReg = /^[_a-z0-9]+@([_a-z0-9]+\.)+[a-z0-9]{2,3}$/; if(myReg.test(strEmail)) return true; return false; } HTML 代码的屏蔽 Javascript 中正则表达式 战法权 第 9 页 共 10 页 function mask_HTMLCode(strInput) { var myReg = /<(\w+)>/; return strInput.replace(myReg, "<$1>"); } 正则表达式对象的属性及方法 预定义的正则表达式拥有有以下静态属性:input, multiline, lastMatch, lastParen, leftContext, rightContext 和$1 到$9。其中 input 和 multiline 可以预设置。其他属性的值 在执行过 exec 或 test 方法后被根据不同条件赋以不同的值。许多属性同时拥有长和短 (perl 风格)的两个名字,并且,这两个名字指向同一个值。(JavaScript 模拟 perl 的正则 表达式) 正则表达式对象的属性 属性 含义 $1...$9 如果它(们)存在,是匹配到的子串 $_ 参见 input $* 参见 multiline $& 参见 lastMatch $+ 参见 lastParen $` 参见 leftContext $’ 参见 rightContext constructor 创建一个对象的一个特殊的函数原型 global 是否在整个串中匹配(bool 型) ignoreCase 匹配时是否忽略大小写(bool 型) input 被匹配的串 lastIndex 最后一次匹配的索引 lastParen 最后一个括号括起来的子串 leftContext 最近一次匹配以左的子串 multiline 是否进行多行匹配(bool 型) prototype 允许附加属性给对象 rightContext 最近一次匹配以右的子串 source 正则表达式模式 lastIndex 最后一次匹配的索引 正则表达式对象的方法 方法 含义 compile 正则表达式比较 exec 执行查找 test 进行匹配 toSource 返回特定对象的定义(literal representing),其值可用来创建一个 新的对象。重载 Object.toSource 方法得到的。 toString 返回特定对象的串。重载 Object.toString 方法得到的。 Javascript 中正则表达式 战法权 第 10 页 共 10 页 valueOf 返回特定对象的原始值。重载 Object.valueOf 方法得到 五、的
还剩9页未读

继续阅读

下载pdf到电脑,查找使用更方便

pdf的实际排版效果,会与网站的显示效果略有不同!!

需要 20 金币 [ 分享pdf获得金币 ] 0 人已下载

下载pdf

pdf贡献者

xiandan

贡献于2010-11-13

下载需要 20 金币 [金币充值 ]
亲,您也可以通过 分享原创pdf 来获得金币奖励!
下载pdf