首页 > 编程 > Regex > 正文

收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)

2020-03-16 21:04:48
字体:
来源:转载
供稿:网友

正则表达式用于字符串处理,表单验证等场合,实用高效,应用广泛,但用到时总是不太把握,以致往往要上网查一番资料,下面把我搜素资料加工整理分享给大家,需要参考的朋友可以借鉴下

正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。

匹配中文字符的正则表达式: [/u4e00-/u9fa5]

匹配双字节字符(包括汉字在内):[^/x00-/xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

 

 
  1. String.prototype.len=function(){return this.replace([^/x00-/xff]/g,"aa").length;} 

匹配空行的正则表达式:/n[/s| ]*/r

匹配HTML标记的正则表达式:/<(.*)>.*<///1>|<(.*) //>/

匹配首尾空格的正则表达式:(^/s*)|(/s*$)

 

 
  1. String.prototype.trim = function() 
  2. return this.replace(/(^/s*)|(/s*$)/g, ""); 

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

 

 
  1. function IP2V(ip) 
  2. re=/(/d+)/.(/d+)/.(/d+)/.(/d+)/g //匹配IP地址的正则表达式 
  3. if(re.test(ip)) 
  4. return RegExp.1∗Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3∗255+RegExp.4*1 
  5. else 
  6. throw new Error("Not a valid IP address!"

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

 

 
  1. var ip="10.100.20.168" 
  2. ip=ip.split("."
  3. alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1)) 

匹配Email地址的正则表达式:/w+([-+.]/w+)*@/w+([-.]/w+)*/./w+([-.]/w+)*

匹配网址URL的正则表达式:http://([/w-]+/.)+[/w-]+(/[/w- ./?%&=]*)?

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]

 

 
  1. var s="abacabefgeeii" 
  2. var s1=s.replace(/(.).*/1/g,"$1"
  3. var re=new RegExp("["+s1+"]","g"
  4. var s2=s.replace(re,"")  
  5. alert(s1+s2) //结果为:abcefgi 

===============================

如果var s = "abacabefggeeii"

结果就不对了,结果为:abeicfgg

正则表达式的能力有限

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

 

 
  1. s="http://www.9499.net/page1.htm" 
  2. s=s.replace(/(.*//){0,}([^/.]+).*/ig,"$2"
  3. alert(s) 

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:

 

 
  1. onkeyup="value=value.replace(/[^/u4E00-/u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/u4E00-/u9FA5]/g,''))" 

用正则表达式限制只能输入全角字符:

 

 
  1. onkeyup="value=value.replace(/[^/uFF00-/uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/uFF00-/uFFFF]/g,''))" 

用正则表达式限制只能输入数字:

 

 
  1. onkeyup="value=value.replace(/[^/d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))" 

用正则表达式限制只能输入数字和英文:

 

 
  1. onkeyup="value=value.replace(/[/W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^/d]/g,''))" 

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

 

 
  1. /** 
  2. * 计算字符串长度,将非宽字符计算为半个字符 
  3.  
  4. * @param str 
  5. * @returns 
  6. */ 
  7. function gbLength(str) { 
  8. return typeof str === "string" ? str.length + str.replace(/[/x00-/x7f]/g, '').length + 1 >> 1 : 0; 
  9.  
  10. /** 
  11. * 获取字符串的指定长度的子串,将非宽字符计算为半个字符 
  12.  
  13. * @param str 
  14. * @param length 
  15. * @returns 
  16. */ 
  17. function gbSubstr(str, length) { 
  18. if (typeof str !== "string"
  19. return str; 
  20. length += length; 
  21. for ( var n = 0, L = str.length; n < L && length > 0; n++){ 
  22. length -= str.charCodeAt(n) > 127 ? 2 : 1; 
  23. return str.substr(0, n); 
  24. /** 
  25. * 切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加... 
  26.  
  27. * @param str 
  28. * @param len 
  29. * @returns 
  30. */ 
  31. function fit_length(str, len){ 
  32. len = len || 16; 
  33. if (typeof str !== "string" || str.length <= len || gbLength(str) <= len){ 
  34. return str; 
  35. var ret = gbSubstr(str, len - 2); 
  36. return ret + '..'
  37. var replaceCJK = /[^/x00-/xff]/g, 
  38. testCJK = /[^/x00-/xff]/; 
  39.  
  40. cjkLength: function(strValue){ 
  41. return strValue.replace(replaceCJK, "lv").length; 
  42. }, 
  43. isCjk: function(strValue){ 
  44. return testCJK.test(strValue); 
  45. }, 
  46. cutString: function(str,len,suffix,slen){ 
  47. suffix = suffix || ''
  48. slen = slen || suffix.length; 
  49. if(str.length > len){ 
  50. str = str.substr(0,len - slen) + suffix; 
  51. return str; 
  52. }, 
  53. cutCjkString: function(str,len,suffix,slen){ 
  54. suffix = suffix || ''
  55. slen = slen || suffix.length; 
  56. len -= slen; 
  57. if(this.cjkLength(str) <= len){ 
  58. return str; 
  59. var s = str.split(''),c = 0,tmpA = []; 
  60. for(var i=0;i<s.length;i+=1){ 
  61. if(c < len){ 
  62. tmpA[tmpA.length] = s[i]; 
  63. if(this.isCjk(s[i])){ 
  64. c += 2; 
  65. }else
  66. c += 1; 
  67. return tmpA.join('') + suffix; 

以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~),希望大家喜欢。欲了解更多,请持续关注本站。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表