首页 > 编程 > regex > 正文

过滤所有HTML代码和CSS,JS

2020-01-20 22:29:36
字体:
来源:转载
供稿:网友
复制代码 代码如下:

Function RemoveHTML(strHTML)    '过滤HTML代码的函数包括过滤CSS和JS


StrHtml = Replace(StrHtml,vbCrLf,"")

StrHtml = Replace(StrHtml,Chr(13)&Chr(10),"")

StrHtml = Replace(StrHtml,Chr(13),"")

StrHtml = Replace(StrHtml,Chr(10),"")

StrHtml = Replace(StrHtml," ","")

StrHtml = Replace(StrHtml,"    ","")


 Dim objRegExp, Match, Matches 

 Set objRegExp = New Regexp

 

 objRegExp.IgnoreCase = True

 objRegExp.Global = True


 '取闭合的<>

 objRegExp.Pattern = "<style(.+?)/style>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


  '取闭合的<>

 objRegExp.Pattern = "<script(.+?)/script>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


  '取闭合的<>

 objRegExp.Pattern = "<.+?>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


 RemoveHTML=strHTML

 Set objRegExp = Nothing

End Function

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表