如果我们要解析一个html,想要得到界面里的某个标签值,那么用正则表达式比较方便。
比如,我们获得了一个html界面,想获得某个标签的值(这个标签有唯一属性比如id=xxx,如果该类标签没有唯一属性的话,那么将会得到该类标签所有值),
代码展示如下:
PRivate string GetValue(string data) { string returnStr = ""; MatchCollection mc = Regex.Matches(data, "<td id='cur_no2' .*?>.*?</td>"); //做一个要匹配的正则表达式, .*?表示所有的元素 foreach (Match m in mc) //遍历匹配好的标签 { string str = m.Value.Replace("</td>", ""); //去掉标签后缀,用“”代替</td> str = Regex.Replace(str, "<.*?>", ""); // 去掉标签前缀,用“”代替<.*?> returnStr += str; //如果匹配多个标签,那么标签里面的值拼接 } return returnStr; }
新闻热点
疑难解答