抓取jsp网页源代码(spring的实现机制和对比a的区别和方法设计)
优采云 发布时间: 2022-03-13 18:04抓取jsp网页源代码(spring的实现机制和对比a的区别和方法设计)
(2)比较支柱
一种。核心控制器:spring mvc核心控制器为Servlet,Struts2为Filter。
湾。控制器实例:Spring Mvc 会比 Struts 快。Spring Mvc 是基于方法设计的,而 Sturts 是基于对象的。每次发出请求时,都会实例化一个动作,并为每个动作注入属性。Spring更像Servlet,只有一个实例,每个请求都执行对应的方法。能。
C。管理方式:大部分公司的核心架构都使用spring,而spring mvc是spring中的一个模块,所以spring对spring mvc控制器的管理更加简单方便,并且提供了完整的注解方式进行管理,各种功能的注解比较全面好用,而struts需要使用很多XML配置参数来管理。
d。参数传递:Struts2本身提供了多种参数来接受,其实是通过(ValueStack)传递和赋值的,SpringMvc是通过方法的参数来接收的。
e. *敏*感*词*实现机制:struts有自己的*敏*感*词*机制,spring mvc使用独立的AOP方式。这样一来,struts的配置文件量还是比spring mvc大,虽然struts的配置可以继承,所以我觉得在使用方面,spring mvc更加简洁,spring的开发效率mvc高于struts2。
F。spring mvc处理ajax请求,直接通过返回数据,使用方法中的注解@ResponseBody,spring mvc自动将我们的对象转换为JSON数据。
2. 自由标记
(1)FreeMarker 是一个模板引擎:即基于模板和要更改的数据生成输出文本(HTML 页面、电子邮件、配置文件、源代码等)的通用工具。它是不适用于最终用户,它是一个 Java 类库,程序员可以嵌入到他们开发的产品中的组件。
(2)比较jsp
一种。内置了很多常用功能,例如:html过滤、日期和金额格式化等,使用起来非常方便。
湾。宏定义比jsp方便。
C。支持jsp标签
d。可以实现严格的MAC分离
e. 在复杂的页面上,freemarker 表现最好
2.5 系统实现功能的具体说明
1.“新浪微博”:
(1)经过多次搜索,发现wap版新浪微博存在权限bug。利用这个bug,无需登录即可搜索微博内容,获取微博上的相应评论,从而避免了PC端的访问限制和API应用困难等问题。
(2)方法:本系统使用Apache HttpClient模拟http请求,爬取微博时直接向官方存在bug的请求地址发送请求,获取所需数据并解析数据格式构造所需内容由系统获取(默认获取微博前10页,每条微博评论前10页)。
(3)具体解析规则:
1、默认获取的第一页内容为html+data。html内容毫无意义。我们需要做的是从html中获取需要的数据字符串。在这里,我们使用正则表达式来匹配捕获的数据;
2.从第二页开始,请求直接返回需要的json字符串格式数据
3.使用alibaba fastjson将数据转成json格式,获取需要的字段值
4.同理,获取评论请求地址数据并解析
5.然后将解析后的数据存入数据库,微博内容存入article表,回复信息存入article_reply表
2、“天涯论坛”:
因为天涯论坛不限制登录权限,所以爬取天涯论坛的数据比较简单。下面对天涯论坛的抓取做一个简单的说明: