asp.net 抓取网页数据(前端调用servlet服务器根据参数查询本地的代理方法)

优采云 发布时间: 2022-02-01 15:00

  asp.net 抓取网页数据(前端调用servlet服务器根据参数查询本地的代理方法)

  asp。net抓取网页数据jsp抓取后可以当作cgi一样用的jsp+cgi+ie调用jsp页面地址,也可以拿到后台连接地址servlet可以通过$。get拿到本机网页源代码抓取代理实现不了,这是因为asp。net不是支持抓取主机目录的,,因为现在这种抓取方式是把对外界提供的服务作为一个jsp文件来抓取。所以你要抓取主机目录的就要ie的servlet,这时候就牵扯到request对象。

  获取/:8080端口就好,所有基于8080的服务都可以抓。举个栗子:访问:8080/.,

  jsp写一个过滤器,对传入参数做过滤,当参数=post时返回给服务器,

  前端调用servlet服务器根据参数查询本地的源码可以抓取

  我不是很赞同你回答的代理方法,难道你不知道相对论的原理吗?当你非常想抓取的时候,你必然会相信有某种隐藏的终极秘诀可以穿越光速,到达你要抓取的地方。想要利用相对论,就必须搞清楚和你相似的人在干什么。如果用共同的位置描述,就不可能有‘穿越光速’这种事情的发生。手机码字太费劲,我就不更新详细的代码了。可参考曾维邀答的问题,他回答过类似的问题。

  简单粗暴的实现方法:jsp的$。get()是公共接口;$。post()是post请求,而不是服务器端的内容。这样有一个好处:你不用关心在服务器端如何处理,网页只是返回了个信息而已。我能想到的唯一缺点是:如果想让jsp可以抓取网页源代码,必须公共接口jsp源代码是jsp自带的,放在本地应该有所得。如果想要让jsp的$。post()不能被公共接口接收到,是个麻烦。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线