首页 > 网站 > WEB开发 > 正文

正则表达是解析HTML元素的代码记录

2024-04-27 15:11:05
字体:
来源:转载
供稿:网友

                如果我们要解析一个html,想要得到界面里的某个标签值,那么用正则表达式比较方便。

                比如,我们获得了一个html界面,想获得某个标签的值(这个标签有唯一属性比如id=xxx,如果该类标签没有唯一属性的话,那么将会得到该类标签所有值),

                代码展示如下:

                 PRivate string GetValue(string data)                   {                         string returnStr = "";                              MatchCollection mc = Regex.Matches(data, "<td id='cur_no2' .*?>.*?</td>");  //做一个要匹配的正则表达式, .*?表示所有的元素                        foreach (Match m in mc)               //遍历匹配好的标签                        {                           string str = m.Value.Replace("</td>", "");   //去掉标签后缀,用“”代替</td>                           str = Regex.Replace(str, "<.*?>", "");         // 去掉标签前缀,用“”代替<.*?>                           returnStr += str;          //如果匹配多个标签,那么标签里面的值拼接                        }                                 return returnStr;                     }

               


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表