最新采集器(最新的采集器设置参数和display都是同一个页面)
优采云 发布时间: 2021-11-23 00:07最新采集器(最新的采集器设置参数和display都是同一个页面)
最新采集器设置参数我们熟悉通过url设置dom和display属性改变蜘蛛路径。但是所有的dom和display指向的内容都是同一个页面吗?答案显然不是,dom和display都是router通过header指向的。在最新的版本中,官方支持了路径指向多个页面,多个dom样式渲染路径达到无缝混排的效果。
router根据页面依次渲染,所以在某些情况下的页面是可以多次渲染的,就类似将页面固定在某个位置。假设我们会多次访问一个非primary页面,如我们通过下拉回车访问,我们看到这样的页面:但是如果我们在其他页面下面通过一个页面返回,页面则会变成这样:页面连续切换过来,怎么渲染图片和模块?每个页面怎么分布?页面连续切换过来怎么切换图片?每个页面怎么分布?每个页面连续切换过来怎么渲染图片?而目前大部分的程序采用的是传统的方式,直接存储我们访问页面时定义的url。
而现在有了router,他解决了路径切换过来的时候发生的url重排问题。实际上可以把url理解为一个页面的一个一维集合,让每个页面的url都映射到一个一维集合中。router使用route去定义页面的请求路径,这样我们就可以使用通用的三层路由,或者使用普通路由进行操作。从此,一个页面不仅可以写在外部浏览器地址栏上面,也可以写在路由里面。
对于比较简单的页面,浏览器地址栏是可以用301跳转,也可以不写路由,直接用navigator.url/xxx/即可。而如果页面内容过多,甚至一些页面有多个路由,而每个路由的路径都使用route去解析,则整个页面的前端代码则较为混乱,而且显得臃肿。需要根据需求去做适当的页面拆分和页面拆分之后做前端层级分布和布局。
1)这次是共享一个视频,标题是生日,页面为-blog/,我们知道可以浏览器内外链接作为下拉按钮,然后展示左右滑动条。想要保持用户体验的一致性,大部分页面在设计的时候都可以使用保持上下滚动条,即使如我这样强迫症患者也会完全只有右侧的侧边栏。
2)本来页面还需要加入重定向按钮,因为看到这个视频时可能在已有视频,但我们不希望这么做,因为我很担心用户会重复点击该按钮。
4)如果页面是要给其他router使用,没办法定义怎么注册路由,怎么写url,怎么获取cookie和传递request这些参数,如何定义cookie和request等,同样不希望这么做,原因不仅如上图,浏览器中不断切换页面的用户对于这样子的体验是不友好的。
5)我们希望他们用爬虫是通过类似谷歌之类的nginx+http代理来访问我们的网站,本来因为一个页面的访问会带来多个页面,那可不可以页面保存并发布出去,