asp.net 抓取网页数据(本篇内容主要讲解“”,感兴趣的朋友不妨来看看)
优采云 发布时间: 2021-12-03 22:29asp.net 抓取网页数据(本篇内容主要讲解“”,感兴趣的朋友不妨来看看)
本文主要讲解《如何实现基于ASP.NET网页的C#数据采集》,有兴趣的朋友不妨看看。本文介绍的方法简单、快捷、实用。下面就让小编带你学习《如何实现基于ASP.NET网页的C#数据采集》!
C#数据采集大致可以分为两部分:
一首歌:
因为我们要采集其他人网页上的内容,所以首先要获取采集网页上的html代码。获取html代码比较简单。使用WebClient的DownloadData(url)取一个字节数组,然后将其转换为字符串字符串。
具体代码如下:
/// ///获取网页源代码 /// ///URL路径 ///编码方式 publicstringGetHTML(stringurl,stringencoding) { WebClientweb=newWebClient(); byte[]buffer=web.DownloadData(url); returnEncoding.GetEncoding(encoding).GetString(buffer); }
两个步骤:
现在我们有了目标页面的html代码,我们要扣除一开始我们想要的数据。扣除数据无疑会使用强大的正则表达式。使用正则表达式匹配得到我们想要的内容,这里我们可以过滤掉做出来的html代码,剩下的就是内容了。
C#data采集的具体代码如下:
Htmlhtml=newHtml(); //得到指定页面的html代码,***个参数为url(貌似都知道),第二个是目标网页的编码集 stringhtmlCode=html.GetHTML("http://gvod.tom59.cn/List.asp?ClassId=3","gb2312"); //正则表达式 Regexregexarticles=newRegex("(?.+)</a>.*"); //所有匹配表达式的内容 MatchCollectionmarticles=regexarticles.Matches(htmlCode); ///遍历匹配内容 foreach(Matchminmarticles) { Console.Write("标题:"+m.Groups["title"].Value+"\n"); Console.Write("id:"+m.Groups["id"].Value+"\n"); Console.Write("\n"); }
说到这里,相信大家对《如何实现基于ASP.NET网页的C#数据采集》有了更深的了解,一起来看看吧!这里是一宿云网站,更多相关内容,可以进入相关频道查询,关注我们,持续学习!