首页 > 编程 > C# > 正文

c#使用nsoup解析html乱码解决方法分享 nsoup教程

2020-01-24 02:54:35

字体：大中小

来源：转载

供稿：网友

下载地址：http://nsoup.codeplex.com/

简单用法如下：

复制代码代码如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

处理网络上的页面：

复制代码代码如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("//www.VeVB.COm/").Get();

但是遗憾的是NSoup默认的编码是UTF-8，处理中文有乱码（对于编码是UTF-8的自然不会有乱码，但是有些GB2312的就可能有乱码，谢谢 forhells的提醒）。

目前我找到两种解决办法：

1.下载网页源代码再处理

复制代码代码如下:

WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("//www.VeVB.COm"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

2.获得网页的流

复制代码代码如下:

WebRequest webRequest=WebRequest.Create("//www.VeVB.COm");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");

第二种用着比较方便，但是我觉得第一种比较合适，毕竟NSoup是个Html解析类，下载网页代码这种事情本来不应该交给它。

上一篇：c#泛型学习详解创建线性链表

下一篇：C#中的值传递和引用传递详细解析

学习交流

罗技g502鼠标灵敏度怎么设置?

罗技g502鼠标灵敏度怎么设置?...

热门图片

猜你喜欢的新闻

猜你喜欢的关注

新闻热点

谷歌CEO：AI给人类文明带来的影响将比火或电更深刻

2020-01-22 22:00:12

特斯拉市值首破1000亿美元马斯克成全美薪酬最高CEO

2020-01-22 21:50:38

刘炽平亲述腾讯投资风向小程序生态影响投资决策

2020-01-21 18:21:45

达沃斯前瞻：阿里巴巴董事局主席张勇谈平台经济普惠之道

2020-01-21 18:18:31

脱离小米成立独立公司 POCOX2新机即将上市

2020-01-20 19:58:55

李大脑门过安检搞笑视频各种姿势演绎默剧精彩

2020-01-15 23:11:38

疑难解答

图片精选

网友关注