asp.net 抓取网页数据(本篇内容主要讲解“”,感兴趣的朋友不妨来看看)

优采云 发布时间: 2021-12-03 22:29

  asp.net 抓取网页数据(本篇内容主要讲解“”,感兴趣的朋友不妨来看看)

  本文主要讲解《如何实现基于ASP.NET网页的C#数据采集》,有兴趣的朋友不妨看看。本文介绍的方法简单、快捷、实用。下面就让小编带你学习《如何实现基于ASP.NET网页的C#数据采集》!

  C#数据采集大致可以分为两部分:

  一首歌:

  因为我们要采集其他人网页上的内容,所以首先要获取采集网页上的html代码。获取html代码比较简单。使用WebClient的DownloadData(url)取一个字节数组,然后将其转换为字符串字符串。

  具体代码如下:

  ///  ///获取网页源代码  ///  ///URL路径  ///编码方式  publicstringGetHTML(stringurl,stringencoding)  {  WebClientweb=newWebClient();  byte[]buffer=web.DownloadData(url);  returnEncoding.GetEncoding(encoding).GetString(buffer);  }

  两个步骤:

  现在我们有了目标页面的html代码,我们要扣除一开始我们想要的数据。扣除数据无疑会使用强大的正则表达式。使用正则表达式匹配得到我们想要的内容,这里我们可以过滤掉做出来的html代码,剩下的就是内容了。

  C#data采集的具体代码如下:

  Htmlhtml=newHtml();  //得到指定页面的html代码,***个参数为url(貌似都知道),第二个是目标网页的编码集  stringhtmlCode=html.GetHTML("http://gvod.tom59.cn/List.asp?ClassId=3","gb2312");  //正则表达式  Regexregexarticles=newRegex("(?.+)</a>.*");  //所有匹配表达式的内容  MatchCollectionmarticles=regexarticles.Matches(htmlCode);  ///遍历匹配内容  foreach(Matchminmarticles)  {  Console.Write("标题:"+m.Groups["title"].Value+"\n");  Console.Write("id:"+m.Groups["id"].Value+"\n");  Console.Write("\n");  }

  说到这里,相信大家对《如何实现基于ASP.NET网页的C#数据采集》有了更深的了解,一起来看看吧!这里是一宿云网站,更多相关内容,可以进入相关频道查询,关注我们,持续学习!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线