asp.net 抓取网页数据(ASP.NET中抓取网页内容-保持登录状态利用Post数据成功登录服务器应用系统)

优采云 发布时间: 2021-09-25 06:19

  asp.net 抓取网页数据(ASP.NET中抓取网页内容-保持登录状态利用Post数据成功登录服务器应用系统)

  在中抓取网页内容非常方便,解决了中困扰我们的编码问题

  1、抓取一般内容

  需要三个类:webrequest、webresponse和StreamReader

  必需的命名空间:系统。Net,系统。木卫一

  核心代码:

  webrequest类的创建是一个静态方法,参数是要捕获的网页的网址

  编码指定编码。在编码中,有通用编码属性,如ASCII和utf32、utf8,但没有编码属性GB2312。因此,我们使用getencoding来获得GB2312编码

  2、抓取图片或其他二进制文件(如文件)

  需要四个类:webrequest、webresponse、stream和FileStream

  必需的命名空间:系统。Net,系统。木卫一

  核心代码:用流读取

  3、捕获web内容的post方法

  在捕获网页时,有时需要通过post将一些数据发送到服务器。将以下代码添加到网页捕获程序,以将用户名和密码发布到服务器:

  4、抓取web内容-防止重定向

  抓取网页时,成功登录服务器应用系统后,应用系统可能会通过响应重定向网页。重新使用如果我们不需要对这个重定向做出响应,我们就不会给读者任何提示。Readtoend()返回响应。写

  5、获取web内容-保持登录状态

  使用post数据成功登录到服务器应用系统后,我们可以抓取页面进行登录,因此我们可能需要在多个请求之间保持登录状态

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线