c#抓取网页数据(谁能给个C#的网页数据(抓取源代码)(组图) )
优采云 发布时间: 2021-12-09 07:11c#抓取网页数据(谁能给个C#的网页数据(抓取源代码)(组图)
)
求一个C#网页数据抓取源码 谁能抓取C#网页数据源码,最好是完整的,可以直接运行抓取,VS2008开发
最近想做这个,很烦恼。希望好心人能给我一些现成的参考!
邮件:
先感谢您。求一个C#网页数据捕获源码--------------------编程问答--------------- ---
<p><br />
#region 范例<br />
//抓取的就是这个地址http://www.baidu.com/s?ie=utf-8&bs=aa&f=8&rsv_bp=1&rsv_spt=3&wd=%E7%88%B1%E7%BE%8E%E4%B8%BD&rsv_sug3=8&rsv_sug=0&rsv_sug1=7&rsv_sug4=272&inputT=3873 这个百度搜索结果页面的如【imis.tmall.com/ 20小时前】中的URL的集合。 <br />
public static IList GetUrls()<br />
{<br />
WebClient MyWebClient = new WebClient();<br />
MyWebClient.Credentials = CredentialCache.DefaultCredentials;//获取或设置用于向Internet资源的请求进行身份验证的网络凭据<br />
Byte[] pageData = MyWebClient.DownloadData("http://www.baidu.com/s?ie=utf-8&bs=aa&f=8&rsv_bp=1&rsv_spt=3&wd=%E7%88%B1%E7%BE%8E%E4%B8%BD&rsv_sug3=8&rsv_sug=0&rsv_sug1=7&rsv_sug4=272&inputT=3873"); //从指定网站下载数据<br />
//string pageHtml = Encoding.Default.GetString(pageData); //如果获取网站页面采用的是GB2312,则使用这句 <br />
string pageHtml = Encoding.UTF8.GetString(pageData); //如果获取网站页面采用的是UTF-8,则使用这句<br />
string test = @"(?isx)]*class=""g"">(?>(?)|(?)|(?:(?!