nodejs抓取动态网页(动态页面静态化的方案与方案)
优采云 发布时间: 2021-10-09 08:31nodejs抓取动态网页(动态页面静态化的方案与方案)
动态页面静态
首先我们需要了解两个概念,静态页面和动态页面
静态页面
最早的时候,网站的内容是通过在宿主空间放置大量静态网页来实现的
静态网页的最大缺点是每个人看到的都一样。
网站对于静态网页最大的难点在于每次都需要更新和重新上传网站的内容。
动态页面
动态页面是网页框架和内容本身的抽象分离
动态页面是通过执行asp、php、jsp、.net等程序访问数据库并生成客户端web代码的网页。
动态页面通常可以通过网站后台管理系统对网站的内容进行更新和管理
静止的
但是为什么将动态网页发布为静态网页呢?
一个很重要的原因是因为搜索引擎。所谓面向搜索引擎优化,包括访问地址的改写,让动态网页看起来像静态网页,让越来越多的搜索引擎可以收录,从而最大化内容自己有针对性地获得机会。
另一个重要原因是提高程序性能。很多大网站一进门就看着自己很复杂的页面,但是加载的时间并不长。除了其他必要的原因,我认为静态化也是必须考虑的技术之一。
她在用户之前获取资源或数据库数据,然后通过静态处理生成静态页面。每个人都访问这个静态页面。静态页面本身的访问速度比动态页面快很多倍,所以程序的性能会降低。有很大的改进。
总之,页面静态体现为:访问速度加快,用户体验显着提升;在后台具体体现为:访问与数据库分离,减少了数据库访问的压力。
动态页面静态
动态页面非常易于管理。但是,在访问网页时,程序需要先对其进行处理,因此访问速度相对较慢。静态页面访问速度快,但不易管理。那么静态动态页面就可以将两种页面的优点结合起来。
静态页面的解决方法:
1、使用文件读写功能生成静态页面
2、 使用nosql从内存中读取内容(其实这个不是静态的而是缓存的),比如redis,虽然没有纯静态快,但是比查询数据库快很多
静态解决方案需要注意的问题:
1、静态页面中的动态(即时)数据问题。可以通过ajax解决
2、静态内容,一旦改变,静态页面需要重新生成。
伪静态
伪静态是相对真实的静态。通常,为了增强搜索引擎的友好性,我们会生成带有文章内容的静态页面,但有些朋友会实时显示一些信息。或者你想使用动态脚本来解决一些问题。网站 的内容不能静态显示。
但这失去了搜索引擎的友好性。如何找到介于两者之间的中间方法?这产生了伪静态技术。
它以html等静态页面URL的形式显示,但实际上是由ASP等动态脚本处理的。
综上,在SEO方面,伪静态页面和静态页面的功能是一样的,但是伪静态本质上是动态页面,所以资源消耗和动态页面是一样的,而且因为Rewrite服务器还需要消耗额外的资源