javascript 正则表达式入门基础—由浅入深

openkk 12年前
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">  <html>   <head>    <title> javascript 正则表达式 </title>    <meta name="Generator" content="EditPlus">    <meta name="Author" content="">    <meta name="Keywords" content="">    <meta name="Description" content="">   <script type="text/javascript">  //javascript正则表达式的基本知识        //声明javascript 正则表达式       var reCat = new RegExp("cat");      //你也可以        var reCat = /cat/;      //Perl 风格   (推荐)     //学习最常用的 test exec match search  replace  split 6个方法       //1) test  检查指定的字符串是否存在           var data = "123123";         var reCat = /123/gi;         alert(reCat.test(data));  //true                //检查字符是否存在  g 继续往下走  i 不区分大小写      //2) exec 返回查询值           var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";         var reCat = /cat/i;         alert(reCat.exec(data));  //Cat         //3)match  得到查询数组           var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";         var reCat = /cat/gi;         var arrMactches = data.match(reCat)           for (var i=0;i < arrMactches.length ; i++)         {              alert(arrMactches[i]);   //Cat  cat         }         //4) search  返回搜索位置  类似于indexof           var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";         var reCat = /cat/gi;         alert(data.search(reCat));  //23          //5) replace  替换字符  利用正则替换           var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";         var reCat = /cat/gi;         alert(data.replace(reCat,"libinqq"));        //6)split   利用正则分割数组           var data = "123123,213,12312,312,3,Cat,cat,dsfsdfs,";         var reCat = /\,/;         var arrdata = data.split(reCat);           for (var i = 0; i < arrdata.length; i++)         {              alert(arrdata[i]);         }     //学习下  简单类   负向类  范围类  组合类        //简单类         var data = "1libinqq,2libinqq,3libinqq,4libinqq";         var reCat = /[123]libinqq/gi;         var arrdata = data.match(reCat);           for (var i = 0; i < arrdata.length; i++)         {              alert(arrdata[i]);  // 1libinqq 2libinqq  3libinqq         }           //负向类         var data = "alibinqq,1libinqq,2libinqq,3libinqq,4libinqq";  //\u0062cf         var reCat = /[^a123]libinqq/gi;         var arrdata = data.match(reCat);           for (var i = 0; i < arrdata.length; i++)         {              alert(arrdata[i]);  //4libinqq         }           //范围类         var data = "libinqq1,libinqq2,libinqq3,libinqq4,libinqq5";  //\u0062cf         var reCat = /libinqq[2-3]/gi;         var arrdata = data.match(reCat);           for (var i = 0; i < arrdata.length; i++)         {              alert(arrdata[i]);   // libinqq2  libinqq3         }           //组合类        var data = "a,b,c,w,1,2,3,5";  //\u0062cf         var reCat = /[a-q1-4\n]/gi;         var arrdata = data.match(reCat);           for (var i = 0; i < arrdata.length; i++)         {              alert(arrdata[i]);  // a b c 1 2 3         }         //以上为 js正则 最基本的使用方法   </script>   </head>     <body>    <!-- javascript正则表达式 进阶篇  -->    <!-- javascript  正则表达式是分组知识  -->    <script language="JavaScript">      /*正则表达式  简单的分组      举例 我们要查找字符串 MouseMouse        var reCat = /MouseMouse/gi;             尽管这是可以的,但是有点浪费。如果不知道Mouse 在字符串中到底出现几次时该怎么办,如果重复多次呢。      var reCat = /(mouse){2}/gi;    括号的意思列Mouse 将在一行连续出现2次。        */              var data = "Ah-mousemouse";        var reCat = /(mouse){2}/gi;         var arrdata = data.match(reCat);        for (var i = 0; i < arrdata.length; i++)      {          alert(arrdata[i]);      }       </script>      <script language="JavaScript">      /*正则表达式  复杂的分组           ?   零次 或 一次      *   零次 或 多次      +   最少一次 或 多次      */              var data = "bb ba da bad dad aa ";        var reCat = /([bd]ad?)/gi;   // 匹配出 ba da bad  dad      var arrdata = data.match(reCat);        for (var i = 0; i < arrdata.length; i++)      {          alert(arrdata[i]);      }                  // 同时 也不介意将分组放在分组中间      // var re = /(mom( and dad)?)/;    匹配出 mom  或  mon and daa    </script>      <script language="JavaScript">      /*正则表达式  反向引用*/        var sToMatch = "#123456789";      var reNumbers = /#(\d+)/;      reNumbers.test(sToMatch);      alert(RegExp.$1);        /*         这个例子尝试匹配后面跟着几个或多个数字的镑符合,并对数字进行分组        以存储他们。在调用 test 方法后,所有的反向引用都保存到了 RegExp 构造函数中        从 RegExp.$1(它保存了第一个反向引用)开始,如果还有第二个反向引用,就是        RegExp.$2,如果还有第三个反向引用存在,就是 RegExp.$3.依此类推。因为该组        匹配了 “123456780”,所以 RegExp.$1 中就存储了这个字符串。        */          var sToChange = "1234 5678";      var reMatch = /(\d{4}) (\d{4})/;      var sNew = sToChange.replace(reMatch,"$2 $1");      alert(sNew);        /*        在这个例子中,正则表达式有两个分组,每一个分组有四个数字。在 replace() 方法的第二个参数        中,$2 等同于 “5678” ,而 $1 等同于 “1234”,对应于它们在表达式中的出现顺序。      */    </script>     <script language="JavaScript">      /*正则表达式  候选 */      var sToMatch1 = "red";      var sToMatch2 = "black";      var reRed = /red/;      var reBlack = /black/;        alert(reRed.test(sToMatch1) || reBlack.test(sToMatch1));      alert(reRed.test(sToMatch2) || reBlack.test(sToMatch2));        /*       这虽然能完成任务,但是十分沉长,还有另一种方式就是正则表达式的候选操作符。      */        var sToMatch1 = "red";      var sToMatch2 = "black";      var reRedOrBlack = /(red|black)/;      alert(reRedOrBlack.test(sToMatch1));      alert(reRedOrBlack.test(sToMatch2));    </script>    <script language="JavaScript">      /*正则表达式  非捕获性分组            如果要创建一个非捕获性分组,只要在左括号的后面加上一个问号和一个紧跟的冒号:      */        var sToMatch = "#123456789";      var reNumbers = /#(?:\d+)/;      reNumbers.test(sToMatch);      alert(RegExp.$1);        /*      这个例子的最后一行代码输出一个空字符串,因为该组是非捕获性的,      */        var sToMatch = "#123456789";      var reNumbers = /#(?:\d+)/;      alert(sToMatch.replace(reNumbers,"abcd$1"));        /*      正因如此,replace()方法就不能通过 RegExp.$x 变量来使用任何反向引用,这段代码      输出的“abcd$1”而不是abcd123456789, 因为$1 在这里并不被看成是一个反向引用。      */    </script>     <script language="JavaScript">      /*正则表达式  前瞻      前瞻 就和它名字一样,它告诉正则表达式运算器向前看一些字符而不是移动位置      */            var sToMatch1 = "bedroom";        var sToMatch2 = "bedding";        var reBed = /bed(?=room)/;         alert(reBed.test(sToMatch1));  //true        alert(reBed.test(sToMatch2));  //false           //负向前瞻              var sToMatch1 = "bedroom";        var sToMatch2 = "bedding";        var reBed = /bed(?!room)/;         alert(reBed.test(sToMatch1)); //false        alert(reBed.test(sToMatch2)); //true    </script>       <script language="JavaScript">      /*正则表达式  边界      ^     行开头      $     行结尾      \b    单词的边界      \B    非单词的边界      */          var sToMatch = "Important word is the last one.";        var reLastWord = /(\w+)\.$/;         reLastWord.test(sToMatch);        alert(RegExp.$1);  //one        /*      假如想查找一个单词,但要它只出现在行尾,则可以使用美元符号 ($)来表示它:      */              var sToMatch = "Important word is the last one.";        var reLastWord = /^(\w+)/;         reLastWord.test(sToMatch);        alert(RegExp.$1);  //Important        /*      在这个例子中,正则表达式查找行起始位置后的一个或多个单词字符。如果遇到非单词字符      匹配停止,返回 Important。 这个例子也可以用单词边界实现。      */             var sToMatch = "Important word is the last one.";        var reLastWord = /^(.+?)\b/;         reLastWord.test(sToMatch);        alert(RegExp.$1);  //Important            /*      这里,正则表达式用惰性量词来制定在单词边界之前可以出现任何字符,且可以出现一次或      多次(如果使用贪婪性量词,表达式就匹配整个字符串)。      */        var data = " First second thind fourth fifth sixth ";        var reCat = /\b(\S+?)\b/g;         var arrdata = data.match(reCat);        for (var i = 0; i < arrdata.length; i++)      {          alert(arrdata[i]);      }           /*      使用单词边界可以方便地从字符串中抽取单词。      */    </script>        <script language="JavaScript">      /*正则表达式  多行模式             要制定多行模式,只要在正则表达式想要匹配的行末的一个单词      */              var data = " First second\n thind fourth\n fifth sixth";        var reCat = /(\w+)$/g;         var arrdata = data.match(reCat);        for (var i = 0; i < arrdata.length; i++)      {          alert(arrdata[i]);      }              /*        上面只返回一个单词 sixth,因为换行符阻挡了匹配,只能匹配行末的一个单词,      当然也可以使用 split() 方法将字符串分割成数组,但就得对每一行进行单独匹配。        以前不好好看书经常半吊子,看一半就仍了,导致用了好多 split, 其实很简单如下面      例子 只需要 m 参数进行多行匹配。        */        var data = " First second\n thind fourth\n fifth sixth";        var reCat = /(\w+)$/gm;         var arrdata = data.match(reCat);        for (var i = 0; i < arrdata.length; i++)      {          alert(arrdata[i]);      }      </script>   </body>  </html>