nsoup

[ASP.NET]强大的网页处理类NSoup

徘徊边缘 提交于 2020-08-20 05:25:07
我们如果在项目中碰到要处理HTML,如果是.NET程序员的话,强烈推荐使用NSoup,不然的话截取字符串是在是太痛苦了。NSoup是一个开源框架,是JSoup的.NET移植版本,使用方法基本一致!NSoup 点击下载 获取网页的html代码 处理网页html [csharp] view plain copy print ? <span style= "font-family: Arial, Helvetica, sans-serif;" >NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect( "http://blog.csdn.net/dingxiaowie2013" ).Get();</span> 或者是自定义html,生成html页面 [csharp] view plain copy print ? NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString); 但是很遗憾NSoup默认的是UTF-8,处理中文会有乱码(对于编码是UTF-8自然会正常,但是有些是GB2312的就可能有乱码) 解决NSoup解析HTML乱码的办法 1.下载网页源代码再处理 [csharp] view plain copy print ? //下载网页源代码 WebClient