asp.net 抓取网页数据( EXCEL教程EXCEL函数EXCEL透视表EXCEL实用技巧EXCEL2010-04-0811)
优采云 发布时间: 2022-03-05 22:03asp.net 抓取网页数据(
EXCEL教程EXCEL函数EXCEL透视表EXCEL实用技巧EXCEL2010-04-0811)
ASP 网页抓取
网络抓取也称为网络爬虫。我们用它来获取target网站和target模块的最新动态,可以直接抓取。我们提供爬取目标的url地址,然后编写一个方法来爬取目标url。
//获取某个URL下的内容
public string getContextByUrl(string url)
{
WebRequest request = WebRequest.Create(url);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Stream dataStream = response.GetResponseStream();
StreamReader reader = new StreamReader(dataStream,Encoding.Default);
string result = reader.ReadToEnd();
reader.Close();
dataStream.Flush();
dataStream.Close();
response.Close();
return result; }
然后我们调用这个方法
string result = getContextByUrl(url);
string name = result.Substring(result.IndexOf("tb-detail-hd"), 450);
string aa = name.Substring(name.IndexOf(""), 50);
string price = null;
if (url.Contains("detail"))
{
price = result.Substring(result.IndexOf("<strong>"), 50);
}
else if (url.Contains("item"))
{
price = result.Substring(result.IndexOf("<strong class>"), 50);
}
Label1.Text = aa;
Label2.Text = price;
来源链接:
张贴@2013-04-08 11:40Jason.Lau 阅读(665)评论(0)编辑