抓取jsp网页源代码(spring的实现机制和对比a的区别和方法设计)

优采云 发布时间: 2022-03-13 18:04

  抓取jsp网页源代码(spring的实现机制和对比a的区别和方法设计)

  (2)比较支柱

  一种。核心控制器:spring mvc核心控制器为Servlet,Struts2为Filter。

  湾。控制器实例:Spring Mvc 会比 Struts 快。Spring Mvc 是基于方法设计的,而 Sturts 是基于对象的。每次发出请求时,都会实例化一个动作,并为每个动作注入属性。Spring更像Servlet,只有一个实例,每个请求都执行对应的方法。能。

  C。管理方式:大部分公司的核心架构都使用spring,而spring mvc是spring中的一个模块,所以spring对spring mvc控制器的管理更加简单方便,并且提供了完整的注解方式进行管理,各种功能的注解比较全面好用,而struts需要使用很多XML配置参数来管理。

  d。参数传递:Struts2本身提供了多种参数来接受,其实是通过(ValueStack)传递和赋值的,SpringMvc是通过方法的参数来接收的。

  e. *敏*感*词*实现机制:struts有自己的*敏*感*词*机制,spring mvc使用独立的AOP方式。这样一来,struts的配置文件量还是比spring mvc大,虽然struts的配置可以继承,所以我觉得在使用方面,spring mvc更加简洁,spring的开发效率mvc高于struts2。

  F。spring mvc处理ajax请求,直接通过返回数据,使用方法中的注解@ResponseBody,spring mvc自动将我们的对象转换为JSON数据。

  2. 自由标记

  (1)FreeMarker 是一个模板引擎:即基于模板和要更改的数据生成输出文本(HTML 页面、电子邮件、配置文件、源代码等)的通用工具。它是不适用于最终用户,它是一个 Java 类库,程序员可以嵌入到他们开发的产品中的组件。

  (2)比较jsp

  一种。内置了很多常用功能,例如:html过滤、日期和金额格式化等,使用起来非常方便。

  湾。宏定义比jsp方便。

  C。支持jsp标签

  d。可以实现严格的MAC分离

  e. 在复杂的页面上,freemarker 表现最好

  2.5 系统实现功能的具体说明

  1.“新浪微博”:

  (1)经过多次搜索,发现wap版新浪微博存在权限bug。利用这个bug,无需登录即可搜索微博内容,获取微博上的相应评论,从而避免了PC端的访问限制和API应用困难等问题。

  (2)方法:本系统使用Apache HttpClient模拟http请求,爬取微博时直接向官方存在bug的请求地址发送请求,获取所需数据并解析数据格式构造所需内容由系统获取(默认获取微博前10页,每条微博评论前10页)。

  (3)具体解析规则:

  1、默认获取的第一页内容为html+data。html内容毫无意义。我们需要做的是从html中获取需要的数据字符串。在这里,我们使用正则表达式来匹配捕获的数据;

  2.从第二页开始,请求直接返回需要的json字符串格式数据

  3.使用alibaba fastjson将数据转成json格式,获取需要的字段值

  4.同理,获取评论请求地址数据并解析

  5.然后将解析后的数据存入数据库,微博内容存入article表,回复信息存入article_reply表

  2、“天涯论坛”:

  因为天涯论坛不限制登录权限,所以爬取天涯论坛的数据比较简单。下面对天涯论坛的抓取做一个简单的说明:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线