首页 > 编程 > Regex > 正文

经典JavaScript正则表达式实战(附pdf)

2020-03-16 21:10:29
字体:
来源:转载
供稿:网友
本文不是使用Dreamweaver编辑,以下测试代码可能已经在赋值粘贴的过程做了一些调整,可能执行失效。可以参看
 
 
关于测试代码 
本文不是使用Dreamweaver编辑,以下测试代码可能已经在赋值粘贴的过程做了一些调整,可能执行失效。可以参看本文的pdf版本。 

匹配结尾的数字 
如 
复制代码代码如下:

30CAC0040 取出40 
3SFASDF92 取出92 

正则如下://d+$/g 

统一空格个数 

字符串内字符键有空格,但是空格的数量可能不一致,通过正则将空格的个数统一变为一个。 

例如:蓝 色 理 想 

变成:蓝 色 理 想 

aobert的正则: 
复制代码代码如下:

<script type="text/javascript"> 
var str="蓝 色 理 想" 
var reg=//s+/g 
str = str.replace(reg," ") 
document.write(str) 
</script> 

判断字符串是不是由数字组成 
来源:有没有简单的方法判断字符串由数字组成? 

这个正则比较简单,写了一个测试 
复制代码代码如下:

<script type="text/javascript"> 
function isDigit(str){ 
var reg = /^/d*$/; 
return reg.test(str); 

var str = "7654321"; 
document.write(isDigit(str)); 
var str = "test"; 
document.write(isDigit(str)); 
</script> 

电话号码正则 

:求一个验证电话号码的JS正则 
复制代码代码如下:

/^/d{3,4}-/d{7,8}(-/d{3,4})?$/区号必填为3-4位的数字,区号之后用“-”与电话号码连接 

^/d{3,4}-电话号码为7-8位的数字 

/d{7,8}分机号码为3-4位的数字,非必填,但若填写则以“-”与电话号码相连接 

(-/d{3,4})?手机号码正则表达式 

正则验证手机号,忽略前面的0,支持130-139,150-159。忽略前面0之后判断它是11位的。 

cloeft的正则: 
复制代码代码如下:

/^0*(13|15)/d{9}$/^0*匹配掉开头任意数量的0。 

武林网发布的手机号码 
复制代码代码如下:

function checkMobile(){ 
var sMobile = document.mobileform.mobile.value 
if(!(/^1[3|4|5|8][0-9]/d{4,8}$/.test(sMobile))){ 
alert("不是完整的11位手机号或者正确的手机号前七位"); 
document.mobileform.mobile.focus(); 
return false; 


由于手机号码是13任意数字9位,和15任意数字9位,所以可以用(13|15)/d{9}匹配。 

测试代码如下: 
复制代码代码如下:

function testReg(reg,str){ 
return reg.test(str); 

var reg =/^1[3|4|5|8][0-9]/d{4,8}$/; 
var str = '13889294444'; 
var str2 = '12889293333'; 
var str3 = '23445567'; 
document.write(testReg(reg,str)+'<br />'); 
document.write(testReg(reg,str2)+'<br />'); 
document.write(testReg(reg,str3)+'<br />'); 

使用正则表达式实现删除字符串中的空格: 
来源:请问js中有没有去掉空格的函数 

代码以及测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
//删除字符串两侧的空白字符。 
function trim(str){ 
return str.replace(/^/s+|/s+$/g,''); 

//删除字符串左侧的空白字符。 
function ltrim(str){ 
return str.replace(/^/s+/g,''); 

//删除字符串右侧的空白字符。 
function rtrim(str){ 
return str.replace(//s+$/g,''); 

//以下为测试代码 
var trimTest = " 123456789 "; 
//前后各有一个空格。 
document.write('length:'+trimTest.length+'<br />'); 
//使用前 
document.write('ltrim length:'+ltrim(trimTest).length+'<br />'); 
//使用ltrim后 
document.write('rtrim length:'+rtrim(trimTest).length+'<br />'); 
//使用rtrim后 
document.write('trim length:'+trim(trimTest).length+'<br />'); 
//使用trim后 
</script> 

测试的结果如下: 

length:11 
ltrim length:10 
rtrim length:10 
trim length:9限制文本框只能输入数字和小数点等等 
来源:文本框输入限制的问题???? 

只能输入数字和小数点 
复制代码代码如下:

var reg = /^/d*/.?/d{0,2}$/开头有若干个数字,中间有0个或者一个小数点,结尾有0到2个数字。 

只能输入小写的英文字母和小数点,和冒号,正反斜杠(:.//) 
复制代码代码如下:

var reg = /[a-z/.////:]+/;a-z包括了小写的英文字母,/.是小数点,//和//分别是左右反斜线,最后是冒号。整个组成一个字符集和代码任一均可,最后在加上+,1或者多个。 

替换小数点前内容为指定内容 

请问 怎么把这个字符串的小数点前面的字符替换为我自定义的字符串啊? 
例如:infomarket.php?id=197 替换为 test.php?id=197 
应该可以把第一个点“.”之前的所有单词字符替换为test就可以了。我写的正则如下: 
复制代码代码如下:

<script type="text/javascript"> 
var str = "infomarket.php?id=197"; 
var reg = /^/w*/ig; 
//匹配字符串开头的任意个单词字符 
str = str.replace(reg,'test'); 
document.write(str); 
</script> 

原帖的有点复杂,没太看明白。 

只匹配中文的正则表达式 

前两天看的《JavaScript开发王》里恰好有中文的unicode范围,正则如下: 

/[/u4E00-/u9FA5/uf900-/ufa2d]/写了一个简单的测试,会把所有的中文替换成“哦”。 
复制代码代码如下:

<script type="text/javascript"> 
var str = "有中文?and English."; 
var reg = /[/u4E00-/u9FA5/uf900-/ufa2d]/ig; 
str = str.replace(reg,'哦'); 
document.write(str); 
</script> 

返回字符串的中文字符个数 


一般的字符长度对中文和英文都是不分别的 如JS里的length,那么如何返回字符串中中文字符的个数呢?guoshuang老师在原帖中给出了解决方案,我又没看懂…… 

不过我自己也想到了一个办法:先去掉非中文字符,再返回length属性。函数以及测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function cLength(str){ 
var reg = /[^/u4E00-/u9FA5/uf900-/ufa2d]/g; 
//匹配非中文的正则表达式 
var temp = str.replace(reg,''); 
return temp.length; 

var str = "中文123"; 
document.write(str.length+'<br />'); 
document.write(cLength(str)); 
</script> 

结果: 


2中文两个,数字三个,正确。 

下面的测试也正确。 
复制代码代码如下:

var str = "中文123tets@#!#%$#[][{}"; 
document.write(str.length+'<br />'); 
document.write(cLength(str)); 

正则表达式取得匹配IP地址前三段 
来源:如何用正则取IP前3段 

192.168.118.101,192.168.118.72, 192.168.118.1都替换成:192.168.118 

只要匹配掉最后一段并且替换为空字符串就行了,正则如下: 

//./d{1,3}$/匹配结尾的.n,.nn或者.nnn。 

测试代码如下: 
复制代码代码如下:

function replaceReg(reg,str){ 
return str.replace(reg,'') 

var reg = //./d{1,3}$/; 
var str = '192.168.118.101'; 
var str2 = '192.168.118.72'; 
var str3 = '192.168.118.1'; 
document.write(replaceReg(reg,str)+'<br />'); 
document.write(replaceReg(reg,str2)+'<br />'); 
document.write(replaceReg(reg,str3)+'<br />'); 

相似的有,这个帖子里有一个验证IP地址的方法:求检验MAC地址的正则表达例子 

匹配<ul>与<ul>之间的内容 
<ul>safsf<ul>safsf</ul><ul>safsf</ul></ul> 

用正则可以得到 <ul>起到下个<ul> 之间的内容。 

正则如下: 
复制代码代码如下:

/<ul>[/s/S]+?<ul>/i 

首先匹配两侧的ul标签,中间的[/s/S]+?可以匹配一个或者多个任意字符,一定要非贪婪,否则会匹配<ul>safsf<ul>safsf</ul><ul>。 

用正则表达式获得文件名 

c:/images/tupian/006.jpg 

可能是直接在盘符根目录下,也可能在好几层目录下,要求替换到只剩文件名。 

xlez的正则如下: 
复制代码代码如下:

/[^////]*[////]+/g 

首先匹配非左右斜线字符0或多个,然后是左右斜线一个或者多个。形如“xxx/”或者“xxx/”或者“/”或者“/” 

函数以及测试代码: 
复制代码代码如下:

<script type="text/javascript"> 
function getFileName(str){ 
var reg = /[^////]*[////]+/g; 
//xxx/或者是xxx/ 
str = str.replace(reg,''); 
return str; 

var str = "c://images//tupian//006.jpg"; 
document.write(getFileName(str)+'<br />'); 
var str2 = "c:/images/tupian/test2.jpg"; 
document.write(getFileName(str2)); 
</script> 

注意,/需要转义。 

绝对路径变相对路径 
来源:讨论一个正则 

将<IMG height="120" width="800" src="http://23.123.22.12/image/somepic.gif">转换为:<IMG height="120" width="800" src="/image/somepic.gif">。 

其中网址可能改变,例如http://localhost等等。 

cloudchen的正则: 

/http:////[^//]+/首先是http://,然后[^//]+找过1个或者多个非/字符,因为遇到第一个/表示已经到目录了,停止匹配。 

测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
var str = '<IMG height="120" width="800" / 
src="http://23.123.22.12/image/somepic.gif">'; 
var reg = /http:////[^//]+/; 
str = str.replace(reg,""); 
alert(str) 
</script> 

用户名正则 

用于用户名注册,,用户名只 能用 中文、英文、数字、下划线、4-16个字符。 

hansir和解决方案弄成正则: 
复制代码代码如下:

/^[/u4E00-/u9FA5/uf900-/ufa2d/w]{4,16}$/ 

中文字符或者单词字符,4到16个。实现4到16结成到正则里的关键就是开始^和结束$,这就等于整个字符串只能有这些匹配的内容,不能有多余的。 

函数和测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function isEmail(str){ 
var reg = /^[/u4E00-/u9FA5/uf900-/ufa2d/w]{4,16}$/; 
return reg.test(str); 

var str = '超级无敌用户名regExp'; 
var str2 = '捣乱的@'; 
var str3 = '太短' 
var str4 = '太长longlonglonglonglonglonglonglong' 
document.write(isEmail(str)+'<br />'); 
document.write(isEmail(str2)+'<br />'); 
document.write(isEmail(str3)+'<br />'); 
document.write(isEmail(str4)+'<br />'); 
</script> 

匹配英文地址 
来源:-求助- 正则问题 

规则如下: 
包含 "点", "字母","空格","逗号","数字",但开头和结尾不能是除字母外任何字符。 

[/.a-zA-Z/s,0-9]这个字符集就实现了字母,空格,逗号和数字。最终正则如下: 

/^[a-zA-Z][/.a-zA-Z/s,0-9]*?[a-zA-Z]+$/ 
开头必须有字母,结束也必须是一个以上字母。测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function testReg(reg,str){ 
return reg.test(str); 

var reg = /^[a-zA-Z][/.a-zA-Z/s,0-9]*?[a-zA-Z]+$/; 
var str = 'No.8,ChangAn Street,BeiJing,China'; 
var str2 = '8.No,ChangAn Street,BeiJing,China'; 
var str3 = 'No.8,ChangAn Street,BeiJing,China88'; 
document.write(testReg(reg,str)+'<br />') 
document.write(testReg(reg,str2)+'<br />') 
document.write(testReg(reg,str3)+'<br />') 
</script> 

正则匹配价格 

价格的格式应该如下: 

开头数字若干位,可能有一个小数点,小数点后面可以有两位数字。hansir给出的对应正则如下: 

/^(/d*/./d{0,2}|/d+).*$/ 
hansir给出的测试代码如下: 
复制代码代码如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head> 
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> 
<title>无标题文档</title> 
<script type="text/javascript"> 
function checkPrice(me){ 
if(!(/^(?:/d+|/d+/./d{0,2})$/.test(me.value))){ 
me.value = me.value.replace(/^(/d*/./d{0,2}|/d+).*$/,'$1'); 


</script> 
</head> 
<body> 
<input type="text" onkeyup="checkPrice(this);"/> 
</body> 
</html> 

身份证号码的匹配 
来源:关于正则的,大家帮帮忙,急,在线等 

身份证号码可以是15位或者是18位,其中最后一位可以是X。其它全是数字,正则如下: 

/^(/d{14}|/d{17})(/d|[xX])$/开头是14位或者17位数字,结尾可以是数字或者是x或者是X。 

测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function testReg(reg,str){ 
return reg.test(str); 

var reg = /^(/d{14}|/d{17})(/d|[xX])$/; 
var str = '123456789012345';//15位 
var str2 = '123456789012345678';//18位 
var str3 = '12345678901234567X';//最后一位是X 
var str4 = '1234';//位数不对 
document.write(testReg(reg,str)+'<br />'); 
document.write(testReg(reg,str2)+'<br />'); 
document.write(testReg(reg,str3)+'<br />'); 
document.write(testReg(reg,str4)+'<br />'); 
</script> 

要求文本有指定行数 

匹配至少两行的字符串,每行都为非空字符。 

只要匹配到[/n/r]就表示有换行了,再保证换行的两段都不是空字符就可以了。正则如下: 

//S+?[/n/r]/S+?/i 
这个正则的应用应该是用在textarea里,如果是如下要求:可以支持所有字符,中间可带空格,可以包括英文、数字、中文、标点 

这样的话,只要针对空格再改一下就行了。(按照非空的要求,上面有不能匹配“字符+空格+换行+字符”的字符串)。修改如下: 

//S+?/s*?[/n/r]/s*?/S+?/i 
单词首字母大写 
来源:求个正则,处理英文单词或词组的 

每单词首字大写,其他小写。如blue idea转换为Blue Idea,BLUE IDEA也转换为Blue Idea 

cloeft的正则: 
复制代码代码如下:

//b(/w)|/s(/w)/g 

所谓“首字母”包括两种情况:第一种是边界(开头)的单词字符,一种是空格之后的新单词的第一个字母。测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function replaceReg(reg,str){ 
str = str.toLowerCase(); 
return str.replace(reg,function(m){return m.toUpperCase()}) 

var reg = //b(/w)|/s(/w)/g; 
var str = 'blue idea'; 
var str2 = 'BLUE IDEA'; 
var str3 = 'Test /n str is no good!'; 
var str4 = 'final test'; 
document.write(replaceReg(reg,str)+'<br />'); 
document.write(replaceReg(reg,str2)+'<br />'); 
document.write(replaceReg(reg,str3)+'<br />'); 
document.write(replaceReg(reg,str4)+'<br />'); 
</script> 

正则验证日期格式 

yyyy-mm-dd格式 

正则如下: 
复制代码代码如下:

/^/d{4}-/d{1,2}-/d{1,2}$/ 

4位数字,横线,1或者2位数字,再横线,最后又是1或者2位数字。 

测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function testReg(reg,str){ 
return reg.test(str); 

var reg = /^/d{4}-/d{1,2}-/d{1,2}$/; 
var str = '2008-8-8'; 
var str2 = '2008-08-08'; 
var str3 = '08-08-2008'; 
var str4 = '2008 08 08'; 
document.write(testReg(reg,str)+'<br />'); 
document.write(testReg(reg,str2)+'<br />'); 
document.write(testReg(reg,str3)+'<br />'); 
document.write(testReg(reg,str4)+'<br />'); 
</script> 

第二种格式:来源:求一正则表达式 
yyyy-mm-dd 
或 
yyyy/mm/dd 

用“或”简单地修改一下就行了。 

/^/d{4}(-|//)/d{1,2}(-|//)/d{1,2}$/去掉文件的后缀名 
来源:求一个正则 

www.abc.com/dc/fda.asp变为www.abc.com/dc/fda 

如果文件后缀已知的话这个问题就非常简单了,正则如下: 

//.asp$/匹配最后的.asp而已,测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function delAspExtension(str){ 
var reg = //.asp$/; 
return str.replace(reg,''); 

var str = 'www.abc.com/dc/fda.asp'; 
document.write(delAspExtension(str)+'<br />'); 
</script> 

如果文件名未知的话就用这个正则://./w+$/,测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function delExtension(str){ 
var reg = //./w+$/; 
return str.replace(reg,''); 

var str = 'example.com/dc/fda.asp'; 
document.write(delExtension(str)+'<br />'); 
var str2 = 'test/regular/fda.do'; 
document.write(delExtension(str2)+'<br />'); 
var str3 = 'example.com/dc/fda.strange_extension'; 
document.write(delExtension(str3)+'<br />'); 
</script> 

验证邮箱的正则表达式 
来源:找javascript写的表单检查代码! 

fuchangxi的正则: 

/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(/.[a-zA-Z0-9_-])+/开始必须是一个或者多个单词字符或者是-,加上@,然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合,可以有一个或者多个组合。 
复制代码代码如下:

<script type="text/javascript"> 
function isEmail(str){ 
var reg = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(/.[a-zA-Z0-9_-])+/; 
return reg.test(str); 

var str = 'test@hotmail.com'; 
document.write(isEmail(str)+'<br />'); 
var str2 = 'test@sima.vip.com'; 
document.write(isEmail(str2)+'<br />'); 
var str3 = 'te-st@qq.com.cn'; 
document.write(isEmail(str3)+'<br />'); 
var str4 = 'te_st@sima.vip.com'; 
document.write(isEmail(str4)+'<br />'); 
var str5 = 'te.._st@sima.vip.com'; 
document.write(isEmail(str5)+'<br />'); 
</script> 

我不太了解邮箱的具体规则。感觉这个正则比较简单,EMAIL校验 正则 讨论 求解里有比较详细的邮箱正则讨论。 

匹配源代码中的链接 
来源:正则 

能够匹配HTML代码中链接的正则。 

原帖正则: 

/<a href=".+?">.+?<//a>/g感觉有点严格,首先要<a href="".+?">有,而且href属性可以是一个或者多个除换行外任意字符(非贪婪)。后面是.+?<//a>,一个或者多个除换行外任意字符(非贪婪),再加上结束标签。

有个问题,如果a的起始标签最后有空格,或者除了href还有其它属性的话,上面的正则就不能匹配这个链接了。 

例如: 

<a href="asdfs" >……多了个空格。 

<a id="xx" href=""asdfs">……前面有属性。 

…… 

重写正则: 

/<a/s(/s*/w*?=".+?")*(/s*href=".+?")(/s*/w*?=".+?")*/s*>[/s/S]*?<//a>/ 
思路如下:首先要有<a和一个空格。/<a/s/ 

第一个(/s*/w*?=".+?")* 

可以匹配一个属性,属性前面可能有或者没有多余的空格,用/s*匹配;属性名肯定是单词字符,用/w*?匹配;=".+?"就是匹配属性值了非换行字符若干个;整个括号外面加个*表示可能有任意多个属性。 

(/s*href=".+?") 

匹配href,它也是一个属性,所以只要把上面子正则表达式中的/w修改为href=就行了。 

(/s*/w*?=".+?")*重复第一个子正则表达式,再次接受任意个属性。 

/s*>,属性最后再加上若干个空格和>。 

[/s/S]*?,链接的文字,可能有任何字符组成,若干个,非贪婪。 

<//a>最后是结束标签。 

补充:属性名和=之间,以及=和属性值之间也可能有空格。所以要再加上几个/s*。 

最后的实例代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function findLinks(str){ 
var reg = /<a/s(/s*/w*?/s*=/s*".+?")*(/s*href/s*=/s*".+?")(/s*/w*?/s*=/s*".+?") 
*/s*>[/s/S]*?<//a>/g; 
var arr = str.match(reg); 
for(var i=0;i<arr.length;i++){ 
//alert(arr[i]); 
document.write('link:'+arr[i]+'<br />'); 


var str = '<p>测试链接:<a id = "test" href="http://bbs.blueidea.com" style="border-left-color: rgb(0, 153, 204); border-left-width: 1px; border-left-style: solid; padding: 0px 3px; margin: 3px auto 0px; width: 640px; background-color: rgb(242, 246, 251); clear: both; border-top-color: rgb(0, 153, 204); border-top-width: 1px; border-top-style: solid; border-right-color: rgb(0, 153, 204); border-right-width: 1px; border-right-style: solid;"> 复制代码代码如下:

<script type="text/javascript"> 
function anchorText(str){ 
var reg =/<a/s(?:/s*/w*?/s*=/s*".+?")*(?:/s*href/s*=/s*".+?")(?:/s*/w*?/s*=/s*".+?")*/s*> 

([/s/S]*?)<//a>/; 
str = str.replace(reg,'$1'); 
return str; 

var str = '<a id = "test" href="http://bbs.blueidea.com" style="border-left-color: rgb(0, 153, 204); border-left-width: 1px; border-left-style: solid; padding: 0px 3px; margin: 3px auto 0px; width: 640px; background-color: rgb(242, 246, 251); clear: both; border-top-color: rgb(0, 153, 204); border-top-width: 1px; border-top-style: solid; border-right-color: rgb(0, 153, 204); border-right-width: 1px; border-right-style: solid;"> 复制代码代码如下:

<channel> 
<title>蓝色理想</title> 
</channel> 
<item> 
<title>界面设计测试规范</title> 
</item> 
<item> 
<title>《古典写实美女》漫画教程</title> 
</item> 
<item> 
<title>安远――消失的光年</title> 
</item> 
<item> 
<title>asp.net 2.0多语言网站解决方案</title> 
</item> 

要求匹配item里的title而不匹配channel里的title。 

基本正则: 

/<title>[/s/S]*?<//title>/gi 
首先是title标签,内容为任意字符若干个,然后是title结束标签。这个正则已经能匹配到所有的title标签。 

首先,我简单地修改了一下原正则: 

/<title>[^<>]*?<//title>/gi,因为title里面不应该再嵌有其它标签,这个正则同样是匹配所有标题的内容,最后再加上不去匹配channel中的title。整个正则如下: 

/<title>[^<>]*?<//title>(?!/s*<//channel>)/gi(?!/s*<//channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。 

原帖里有很方便的测试工具,这里就不给测试代码了。 

正则判断是否为数字与字母的混合 
来源:关于正则 

不能小于12位,且必须为字母和数字的混合。 

验证字符串包含数字简单,验证字符串包含字母也简单,验证字符串不包含其它字符也简单,可以用这三个正则分别检查一次字符串,逻辑运算出最终结果。 

但是怎么能把这些功能写进一个正则表达式里呢?这个问题真有点伤脑筋。 

下面是lexrus的正则: 

/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig思路非常的清晰啊: 

[a-z]+(?=[0-9]) 

字母开头,后面必须紧跟着数字。 

[0-9]+(?=[a-z] 

数字开头,后面必须紧跟着字母。 

[a-z0-9]+ 

后面的字符只要是数字或者字母就可以了。经过测试,发现不好使,123dd会被识别为不合法,dd123则为合法,可见“数字开头,紧跟字母”的正则没有起作用。测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function istrue(str){ 
var reg=/^([a-z]+(?=[0-9])|[0-9]+(?=[a-z]))[a-z0-9]+$/ig; 
return reg.test(str); 

var str? = 'AaBc'; 
var str2 = 'aaa123'; 
var str3 = '123dd'; 
var str4 = '1230923403982'; 
document.write(istrue(str)+'<br />'); 
document.write(istrue(str2)+'<br />'); 
document.write(istrue(str3)+'<br />'); 
document.write(istrue(str4)+'<br />'); 
</script> 

结果为: 

false,true,false,false 

结果中的第三个,将'123dd'判断为非法是错误的。刚开始以为是g的问题,去掉了还是不好使。应该是浏览器bug,我认为lexrus的正则是正确的,可能是浏览器无法处理或”|”的两边都包含正向预查(?=)。 

修改之后的正则如下: 

/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i意思和上面差不多,但是没有使用正向预查,测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function istrue(str){ 
var reg=/^(([a-z]+[0-9]+)|([0-9]+[a-z]+))[a-z0-9]*$/i; 
return reg.test(str); 

var str? = 'AaBc'; 
var str2 = 'aaa123'; 
var str3 = '123dd'; 
var str4 = '1230923403982'; 
document.write(istrue(str)+'<br />'); 
document.write(istrue(str2)+'<br />'); 
document.write(istrue(str3)+'<br />'); 
document.write(istrue(str4)+'<br />'); 
</script> 

结果为 

false,true,true,false 

正确。 

空格与英文同时存在 
来源:正则问题请指教啊! 

匹配英文以及空格,要求必须既有英文字母又有空格。 

这个思路和上面的差不多,只要把数字改成空格就可以了。正则如下: 

/^(([a-z]+/s+)|(/s+[a-z]+))[a-z/s]*$/i英文开头加空格,或者是空格开头加英文,后面可以是英文或者空格。测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function istrue(str){ 
var reg=/^(([a-z]+/s+)|(/s+[a-z]+))[a-z/s]*$/i; 
return reg.test(str); 

var str? = 'asdf'; 
var str2 = 'sadf sdf'; 
var str3 = 'asdf '; 
document.write(istrue(str)+'<br />'); 
document.write(istrue(str2)+'<br />'); 
document.write(istrue(str3)+'<br />'); 
</script> 

利用这个思路也可以实现英文空格英文,英文单词多于两个的匹配。同样,也可以把英文字母换成单词字符/w。 

显示或者保存正则表达式匹配的部分内容 
有如下电话号码: 

13588888333 
13658447322 
13558885354 
13587774654 
13854554786 

要求,要求只匹配135开头的电话,但是匹配结果只保留135后面的数字。 

由于JavaScript里的正则不支持(?=xx)xxx的模式,只支持xxx(?=xx)的模式。所以只能将135后面的内容作为一个子正则表达式匹配的内容,然后再在后面引用。 

Carl给出的函数如下: 
复制代码代码如下:

function f(phoneNumber) { 
var pattern = /^(135)(/d{8})$/; 
if(pattern.test(phoneNumber)) 
return phoneNumber.replace(pattern,"$2"); 
else 
return "不是135打头的手机号码!"; 

/^(135)(/d{8})$/ 正则中,135作为开头表示第一个子正则表达式,第二个括号内的子正则表达式则匹配后面的8个数字,然后在replace中使用$2就可以引用这个子正则表达式匹配的内容了。测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function f(phoneNumber) { 
var pattern = /^(135)(/d{8})$/; 
if(pattern.test(phoneNumber)) 
return phoneNumber.replace(pattern,"$2"); 
else 
return "不是135打头的手机号码!"; 

var arr = new Array( 
"13588888333", 
"13658447322", 
"13558885354", 
"13587774654", 
"13854554786" 
); 
for(var i = 0; i < arr.length; i++) 
document.write(f(arr[i])+'<br />'); 
</script> 

正则表达式替换变量 
来源:求教正则 

有一个数组: 

var _A = ['A','B','C','D']; 

有一个有“变量”的字符串。 

var _B = '<ul><li>$0$</li><li>$1$</li><li>$2$</li><li>$3$</li></ul>'; 

说是变量,其实只是字符串中的特殊字符,例如$0$,就称这个为伪变量吧。 

最后的要求就是使用正则获得下面这样一个字符串: 

_C = '<ul><li>A</li><li>B</li><li>C</li><li>D</li></ul>'; 

IamUE给出了代码: 
复制代码代码如下:

<script type="text/javascript"> 
var _A = ['A','B','C','D']; 
var _B = '<ul><li>$0$</li><li>$1$</li><li>$2$</li><li>$3$</li></ul>'; 
var reg=//$/d+/$/ig; 
C=_B.replace(reg,function($1){ 
var indexnum=$1.replace(//$/ig,""); 
if (indexnum<_A.length) 
{return _A[indexnum];} 
else{return ""} 
}); 
alert(C); 
</script> 

代码分析:看到代码之后感觉有点晕,首先,正则reg中没有任何的括号,应该是没有捕获内容的,那么后面怎么又使用$1了引用了呢?通过alert测试,发现它是整个正则匹配的内容,而且不一定要写作$1,可以写为$0,甚至是写为x都没关系,它总是整个匹配。 

第一次,$1匹配到_B中的“$0$”,匿名函数中将它的$去掉,变成了0,检查是否越界之后,用这个0作为下标去访问数组_A。 

由于正则reg定义了g属性,所以会继续替换$1$、$2$等等。步骤都和上面一样。 

正则替换指定属性中的文本 
来源:怎样用正则来查找替换? 

有如下代码: 

<td align="center"><img src="../photo/ccg/thumbnails/O'Malley's West_jpg.gif" border="0" onClick="MM_openBrWindow('../photo/ccg/pages/O'Malley's West_jpg.htm','BE','width=386,height=306')"><br> 
O'Malley's West</td> 

要求将所有onclick属性中的'替换成/',也就是将单引号转义。 

首先,需要匹配onclick属性: 

/onclick/s*=/s*".+?"/ig然后再将所有的'都替换成/'就可以了。 

将阿拉伯数字替换为中文大写形式 
来源:正则问题 

将123替换成壹贰叁。 

只要匹配一个数字就可以了,测试代码如下(如果显示为乱码就调整一下浏览器的字符编码): 
复制代码代码如下:

function replaceReg(reg,str){ 
return str.replace(reg,function(m){return arr[m];}) 

arr=new Array("零","壹","贰","叁","肆","伍","陆","柒","捌","玖"); 
var reg = //d/g; 
var str = '13889294444'; 
var str2 = '12889293333'; 
var str3 = '23445567'; 
document.write(replaceReg(reg,str)+'<br />'); 
document.write(replaceReg(reg,str2)+'<br />'); 
document.write(replaceReg(reg,str3)+'<br />'); 

替换文本中的URL为链接 
来源:求一链接替换正则 

将一个用户输入的一段文字中的url替换成可以点击的link地址。例如:http://www.blueidea.com可以替换成 [url]http://www.cctv.com[/url] 

或<a href="http://www.cctv.com">http://www. blueidea.com</a>. 

这个正则的关键就在于匹配链接,匹配之后,在两边加上a标签和属性不是问题。 

/http:////[/w-]*(/.[/w-]*)+/ig首先匹配http://。 

[/w-]*是可能的www和bbs等。 

/.[/w-]*匹配.xxx形式,至少有一个。 

测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function replaceReg(reg,str){ 
return str.replace(reg,function(m){return '<a href="'+m+'">'+m+'</a>';}) 

var reg = /http:////[/w-]*(/.[/w-]*)+/ig; 
var str = '将一个用户输入的一段文字中的url替换成可以点击的link地址。/ 
测试一下:http://www.blueidea.com紧接着中文,还有http://bbs.blueidea.com / 
is very good!http://blueidea.com!最后在看看带.cn的:http://www.sina.com.cn呵呵。'; 
document.write(replaceReg(reg,str)+'<br />'); 
</script> 

从HTML代码段删除指定标签极其内容 
来源:关于正则的问题 

在一段代码中去除<script ...... /script>, <head>...</head>,<%.....%>等代码块 

隆的正则: 

/<(script|meta|%)[/s/S]*?//(script|meta|%)>/试了一下,匹配如下文本正常: 
复制代码代码如下:

<script type="text/javascript"> 
我是要被删除的脚本 
</script> 

哎。就剩下我了。但是,如果使用类似的正则: 

/<(script|head|%)[/s/S]*?//(script|head|%)>/ig 

匹配有嵌套的标签: 
复制代码代码如下:

<head> 
<script type="text/javascript"> 
我是要被删除的脚本 
</script> 
</head> 

哎。就剩下我了。实际匹配的内容是: 
复制代码代码如下:

<head> 
<script type="text/javascript"> 
我是要被删除的脚本 
</script> 

这是因为[/s/S]*?里的非贪婪造成的。可以使用JavaScript正则里的反向引用来解决这个问题,如果起始标签匹配了head,那么结束标签也必须是head。最后的正则如下: 

/<(script|head|%)[/s/S]*?///1>/ig用正则给文本分段 
来源:怎样用正则分段落 

原代码:[title]标题一[/title]内容一232323sdfga [title]标题二[/title]内容二2232323 [title]标题三[/title]内容三2232323 

要把文本分段成如下格式: 
一、[title]标题一[/title]内容一232323sdfga 
二、[title]标题二[/title]内容二2232323 
三、[title]标题三[/title]内容三2232323 

只要用正则匹配title就可以了,所以正则比较简单 

//[title/]/ig 
至于开始的的汉字序号,只要一个数组就解决了,最终代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function replaceReg(reg,str){ 
var mark =0; 
return str.replace(reg,function(m){mark++;return '<br />'+arr[mark]+'、'+m;}) 

var arr = ["零","壹","贰","叁","肆","伍","陆","柒","捌","玖"]; 
var reg = //[title/]/ig; 
var str = '[title]标题一[/title]内容一232323sdfga / 
[title]标题二[/title]内容二2232323 [title]标题三[/title]内容三2232323'; 
document.write(replaceReg(reg,str)+'<br />'); 
</script> 

转换源代码中的标签 
来源:一个正则上的问题 

将代码中的HTML标签img转换为[img]url[/img]。 

/<img(?:/s*/w*?/s*=/s*".+?")*?/s*src/s*=/s*"(.+?)"(?:/s*/w*?/s*=/s*".+?")*/s*>/ig 

这段正则和匹配链接标签的正则基本一样,修改如下,标签名img,没有结束标签而是>结束。 

测试代码如下: 
复制代码代码如下:

<script type="text/javascript"> 
function replaceReg(reg,str){ 
return str.replace(reg,'[img]$1[/img]') 

var reg = 
/<img(?:/s*/w*?/s*=/s*".+?")*?/s*src/s*=/s*"(.+?)"(?:/s*/w*?/s*=/s*".+?")*/s*>/ig; 
var str = '我就是传说中的图片了<img src="URL">哎。'; 
document.write(replaceReg(reg,str)+'<br />'); 
</script> 

第二个是替换object代码嵌入的flash代码替换为
Flash动画
经典JavaScript正则表达式实战(附pdf)在线播放
 
。 

针对原文的正则如下: 

/<object[/s/S]*?src=([/s/S]+?)(?=/s)[/s/S]*<//object>/i 
如果是所有的属性都有双引号的话正则也需要修改。 

测试如下: 
复制代码代码如下:

<script type="text/javascript"> 
function replaceReg(reg,str){ 
return str.replace(reg,'
Flash动画
经典JavaScript正则表达式实战(附pdf)在线播放
 
') 

var reg = /<object[/s/S]*?src=([/s/S]+?)(?=/s)[/s/S]*<//object>/i; 
var str = '<object classid=clsid:D27CDB6E-AE6D-11cf-96B8-444553540000 / 
codebase=http://download.macromedia.com/pub/shockwave/cabs/flash// 
swflash.cab#version=5,0,0,0 width=255 height=250><param name=movie / 
value=url><param name=quality value=high><embed src=url quality=high / 
pluginspage=http://www.macromedia.com/shockwave/download/index.cgi?/ 
P1_Prod_Version=ShockwaveFlash type=application/x-shockwave-flash / 
width=255 height=250></embed></object>'; 
document.write(replaceReg(reg,str)+'<br />'); 
</script> 

给属性添加双引号 
来源:请教正则表达式高手 

给HTML标签中的属性添加双引号。 

<a href=xxx>改为:<a href="xxx"> 

LeXRus的第一个正则如下: 

/(?!/</w+)(/s+/w+)/=([^>/"/s]+)/ig第一个括号没看明白,JS应该是不支持。所以我擅自给删掉了,剩下的正则如下: 

/(/s+/w+)/=([^>/"/s]+)/ig第一个括号里的/s+/w+匹配的是属性名。 

然后是=,不用转义。 

第二个括号里的[^>/"/s]+匹配属性值。不匹配>”和空格。这里的引号不用转义。在意思不改变的情况下,稍微改了改,正则如下: 

/(/s+/w+)=([^>"/s]+)/ig需要注意的是这个正则不匹配=两边有空格的属性,例如href = xxx。相匹配的话就改成: 

/(/s+/w+)/s*=/s*([^>"/s]+)/ig代码: 

str=str.replace(/(?!/</w+)(/s+/w+)/=([^>/"/s]+)/ig,'$1="$2"'); 
其中'$1=”$2”'就实现了给属性值添加上双引号。不过ncs指出了这个正则替换的几个问题,一是上面的空格问题,二是如果非标签内部有等号,且前面又恰巧有空白字符的话,它将会被误识别为属性,例如: 

<a href=xxx target=yyy style="border-left-color: rgb(0, 153, 204); border-left-width: 1px; border-left-style: solid; padding: 0px 3px; margin: 3px auto 0px; width: 640px; background-color: rgb(242, 246, 251); clear: both; border-top-color: rgb(0, 153, 204); border-top-width: 1px; border-top-style: solid; border-right-color: rgb(0, 153, 204); border-right-width: 1px; border-right-style: solid;"> 复制代码代码如下:

<script type="text/javascript"> 
function rp(str,trg){ 
var reg1 = /(/s+/w+)/s*=/s*([^<>"/s]+)(?=[^<>]*>)/ig 
var reg2 = /"'([^'"]*)'"/ig; 
str=str.replace(reg1,'$1="$2"').replace(reg2,'/"$1/"'); 
trg.value=str; 

</script> 
<textarea id="sou" style="width:100%"> 
<a href = xxx name=aaa target=_blank style="border-left-color: rgb(0, 153, 204); border-left-width: 1px; border-left-style: solid; padding: 0px 3px; margin: 3px auto 0px; width: 640px; background-color: rgb(242, 246, 251); clear: both; border-top-color: rgb(0, 153, 204); border-top-width: 1px; border-top-style: solid; border-right-color: rgb(0, 153, 204); border-right-width: 1px; border-right-style: solid;"> 复制代码代码如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/2000/REC-xhtml1-20000126/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head> 
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> 
<META name="Author" content="Sheneyan" /> 
<script type="text/javascript"> 
function encode(s){ 
return s.replace(/&/g,"&").replace(/</g,"<").replace(/>/g,">").replace(/([///./*/[/]/(/)/$/^])/g,"//$1"); 

function decode(s){ 
return s.replace(///([///./*/[/]/(/)/$/^])/g,"$1").replace(/>/g,">").replace(/</g,"<").replace(/&/g,"&"); 

function highlight(s){ 
if (s.length==0){ 
alert('搜索关键词未填写!'); 
return false; 

s=encode(s); 
var obj=document.getElementsByTagName("body")[0]; 
var t=obj.innerHTML.replace(/<span/s+class=.?highlight.?>([^<>]*)<//span>/gi,"$1"); 
obj.innerHTML=t; 
var cnt=loopSearch(s,obj); 
t=obj.innerHTML 
var r=/{searchHL}(({(?!//searchHL})|[^{])*){//searchHL}/g 
t=t.replace(r,"<span class='highlight'>$1</span>"); 
obj.innerHTML=t; 
alert("搜索到关键词"+cnt+"处") 

function loopSearch(s,obj){ 
var cnt=0; 
if (obj.nodeType==3){ 
cnt=replace(s,obj); 
return cnt; 

for (var i=0,c;c=obj.childNodes[i];i++){ 
if (!c.className||c.className!="highlight") 
cnt+=loopSearch(s,c); 

return cnt; 

function replace(s,dest){ 
var r=new RegExp(s,"g"); 
var tm=null; 
var t=dest.nodeValue; 
var cnt=0; 
if (tm=t.match(r)){ 
cnt=tm.length; 
t=t.replace(r,"{searchHL}"+decode(s)+"{/searchHL}") 
dest.nodeValue=t; 

return cnt; 

</script> 
<style type="text/css"> 
.highlight{background:green;font-weight:bold;color:white;} 
</style> 
</head> 
<body> 
<form onsubmit="highlight(this.s.value);return false;"> 
<p><input name="s" id="s" title="搜索内容:"/><input type="submit" value="搜索"/></p> 
</form> 
<div id="content"> 
测试高亮的代码。很长很长的代码…………………… 
</div> 
</body> 
</html> 

删除标签 
来源:如何使用正则表达式去除大部分HTML标记? 

删除除了<img>、<br>、<p>之外所有的标签。子虚乌有给出代码中关键的一句: 

o.innerHTML.replace(/(<//?(?!br|p|img)[^>//]*)//?>/gi,''); 
刚开始没反应过来,后来才想起来,这个正则不用区分起始和结束标签。 

<//?(?!br|p|img) 

匹配除了保护标签外标签的起始标签或者是结束标签的一部分。 

[^>//]* 

匹配到>或者/就结束。 

//?> 

起始标签或者结束标签的结尾。

上一篇:php 正则表达式的子模式详解

下一篇:正则表达式常用元字符整理小结

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
学习交流
热门图片

新闻热点

疑难解答

图片精选

网友关注