首页 > 编程 > regex > 正文

去html代码的正则 推荐

2020-01-20 22:28:54
字体:
来源:转载
供稿:网友
复制代码 代码如下:

'==================================================
'函数名:ScriptHtml
'作  用:过滤html标记
'参  数:ConStr ------ 要过滤的字符串
'==================================================
Function ScriptHtml(Byval ConStr,TagName,FType)
    Dim Re
    Set Re=new RegExp
    Re.IgnoreCase =true
    Re.Global=True
    Select Case FType
    Case 1
       Re.Pattern="<" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    Case 2
       Re.Pattern="<" & TagName & "([^>])*>.*?</" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    Case 3
       Re.Pattern="<" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
       Re.Pattern="</" & TagName & "([^>])*>"
       ConStr=Re.Replace(ConStr,"")
    End Select
    ScriptHtml=ConStr
    Set Re=Nothing
End Function

1 content=ScriptHtml(content,"br",1) ‘去掉所有<br>HTML标记

2 content=ScriptHtml(content,"a",2) ‘去掉所有<a></a>和两个标记之间的内容 
如  <a href=www.126.com>www.126.com</a>  把这一段全去了

3  content=ScriptHtml(content,"td",3) ‘去掉<td>和</td>HTML标记
如  <td>士大夫撒</td>  把<td> </td> 去掉了 但士大夫撒还保留

依次类推把其他HTML标记都过滤了 div objdect什么的 自己看吧
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表