之前一直在关注句子迷这个网站,在里面可以找到自己喜欢的名人的金典语录。 每一次都去打开,再去翻页查看太烦,有没有什么方法可以把网站中的句子直接抓出来,保存到本地txt文件中? 然后在网上查看了一些资料,自己动手写了一个控制台应用程序。
步骤1:通过HttpWebResponse发送一个请求,将整个HTML页面请求过来,将全部数据读入StreamReader中,下图html代码 步骤2:将读入流中的数据进行处理,只取包含句子的文本,这里面需要查询页面的中html。 在取文本的过程中,使用正则表达式,取出想要的数据
///正则表达式 Regex regText = new Regex(@"<div/s+class/=/""views-field-phpcode-1/"">([/S/s]*?)</div>", RegexOptions.IgnoreCase);步骤3:对上面的标签,在进一步进行提取
Regex objRegExp = new Regex("<(.|/n)+?>");本地保存路径,及打开文件效果:
新闻热点
疑难解答