c#抓取网页数据(谁能给个C#的网页数据(抓取源代码)(组图) )

优采云 发布时间: 2021-12-09 07:11

  c#抓取网页数据(谁能给个C#的网页数据(抓取源代码)(组图)

)

  求一个C#网页数据抓取源码 谁能抓取C#网页数据源码,最好是完整的,可以直接运行抓取,VS2008开发

  最近想做这个,很烦恼。希望好心人能给我一些现成的参考!

  邮件:

  先感谢您。求一个C#网页数据捕获源码--------------------编程问答--------------- ---

<p><br />

#region 范例<br />

//抓取的就是这个地址http://www.baidu.com/s?ie=utf-8&bs=aa&f=8&rsv_bp=1&rsv_spt=3&wd=%E7%88%B1%E7%BE%8E%E4%B8%BD&rsv_sug3=8&rsv_sug=0&rsv_sug1=7&rsv_sug4=272&inputT=3873 这个百度搜索结果页面的如【imis.tmall.com/ 20小时前】中的URL的集合。 <br />

public static IList GetUrls()<br />

{<br />

   WebClient MyWebClient = new WebClient();<br />

   MyWebClient.Credentials = CredentialCache.DefaultCredentials;//获取或设置用于向Internet资源的请求进行身份验证的网络凭据<br />

   Byte[] pageData = MyWebClient.DownloadData("http://www.baidu.com/s?ie=utf-8&bs=aa&f=8&rsv_bp=1&rsv_spt=3&wd=%E7%88%B1%E7%BE%8E%E4%B8%BD&rsv_sug3=8&rsv_sug=0&rsv_sug1=7&rsv_sug4=272&inputT=3873"); //从指定网站下载数据<br />

    //string pageHtml = Encoding.Default.GetString(pageData);  //如果获取网站页面采用的是GB2312,则使用这句            <br />

    string pageHtml = Encoding.UTF8.GetString(pageData); //如果获取网站页面采用的是UTF-8,则使用这句<br />

   string test = @"(?isx)]*class=""g"">(?>(?)|(?)|(?:(?!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线