asp.net 抓取网页数据(前端调用servlet服务器根据参数查询本地的代理方法)
优采云 发布时间: 2022-02-01 15:00asp.net 抓取网页数据(前端调用servlet服务器根据参数查询本地的代理方法)
asp。net抓取网页数据jsp抓取后可以当作cgi一样用的jsp+cgi+ie调用jsp页面地址,也可以拿到后台连接地址servlet可以通过$。get拿到本机网页源代码抓取代理实现不了,这是因为asp。net不是支持抓取主机目录的,,因为现在这种抓取方式是把对外界提供的服务作为一个jsp文件来抓取。所以你要抓取主机目录的就要ie的servlet,这时候就牵扯到request对象。
获取/:8080端口就好,所有基于8080的服务都可以抓。举个栗子:访问:8080/.,
jsp写一个过滤器,对传入参数做过滤,当参数=post时返回给服务器,
前端调用servlet服务器根据参数查询本地的源码可以抓取
我不是很赞同你回答的代理方法,难道你不知道相对论的原理吗?当你非常想抓取的时候,你必然会相信有某种隐藏的终极秘诀可以穿越光速,到达你要抓取的地方。想要利用相对论,就必须搞清楚和你相似的人在干什么。如果用共同的位置描述,就不可能有‘穿越光速’这种事情的发生。手机码字太费劲,我就不更新详细的代码了。可参考曾维邀答的问题,他回答过类似的问题。
简单粗暴的实现方法:jsp的$。get()是公共接口;$。post()是post请求,而不是服务器端的内容。这样有一个好处:你不用关心在服务器端如何处理,网页只是返回了个信息而已。我能想到的唯一缺点是:如果想让jsp可以抓取网页源代码,必须公共接口jsp源代码是jsp自带的,放在本地应该有所得。如果想要让jsp的$。post()不能被公共接口接收到,是个麻烦。