asp.net 抓取网页数据(ASP.NET中抓取网页内容-保持登录状态利用Post数据成功登录服务器应用系统)
优采云 发布时间: 2021-09-25 06:19asp.net 抓取网页数据(ASP.NET中抓取网页内容-保持登录状态利用Post数据成功登录服务器应用系统)
在中抓取网页内容非常方便,解决了中困扰我们的编码问题
1、抓取一般内容
需要三个类:webrequest、webresponse和StreamReader
必需的命名空间:系统。Net,系统。木卫一
核心代码:
webrequest类的创建是一个静态方法,参数是要捕获的网页的网址
编码指定编码。在编码中,有通用编码属性,如ASCII和utf32、utf8,但没有编码属性GB2312。因此,我们使用getencoding来获得GB2312编码
2、抓取图片或其他二进制文件(如文件)
需要四个类:webrequest、webresponse、stream和FileStream
必需的命名空间:系统。Net,系统。木卫一
核心代码:用流读取
3、捕获web内容的post方法
在捕获网页时,有时需要通过post将一些数据发送到服务器。将以下代码添加到网页捕获程序,以将用户名和密码发布到服务器:
4、抓取web内容-防止重定向
抓取网页时,成功登录服务器应用系统后,应用系统可能会通过响应重定向网页。重新使用如果我们不需要对这个重定向做出响应,我们就不会给读者任何提示。Readtoend()返回响应。写
5、获取web内容-保持登录状态
使用post数据成功登录到服务器应用系统后,我们可以抓取页面进行登录,因此我们可能需要在多个请求之间保持登录状态