搜索引擎优化(搜索引擎优化分为三大阶段,google蜘蛛抓取联想词)
优采云 发布时间: 2022-02-07 07:01搜索引擎优化(搜索引擎优化分为三大阶段,google蜘蛛抓取联想词)
搜索引擎优化分为三大阶段,分别是搜索引擎爬虫阶段,搜索引擎数据收集阶段,和搜索引擎数据库加工阶段。
1)爬虫用来抓取网站重要页面的链接
2)爬虫将抓取的页面url地址存入http_header中,这里的page也就是页面的文件名,其中的数字表示网站页面的id。url地址后面分别加上-useragent,version,browsertype这三个参数,browsertype是一个网站指定的浏览器类型,version是网站选择安装的浏览器版本,browsertype可以用来筛选不同类型的浏览器,目前主流的浏览器有ie和谷歌浏览器。
page为页面url地址,即browserport;version表示页面浏览器版本;browsertype就是在页面url地址后面添加的数字,表示要安装的浏览器版本。(。
3)设置从搜索引擎搜索到的页面地址,
4)使用javascript代码伪静态页面,也就是伪静态页面就是在浏览器页面页面的地址后面加上/html/index.php这样子的一个文件。
5)伪静态页面seo优化工作的大前提就是蜘蛛的爬取性能优化,搜索引擎蜘蛛收集不到你的页面。
6)给新页面上链接。当你的页面有一个锚文本时,引导页面中的锚文本与站点页面的锚文本不同,就会在页面中也添加锚文本;如果页面锚文本与站点锚文本一样,就会在页面中消失。二.数据收集阶段数据收集工作说白了就是蜘蛛爬取并分析搜索结果数据库信息,从而为你的爬虫搜索带来好处的工作。这里重点说说google蜘蛛抓取联想词,如:seo/sitemap/page.site,点击一次你的锚文本,就是一次自动抓取一次联想词。
三.搜索引擎数据库加工阶段蜘蛛爬取完联想词,得到爬取过程中的一些数据,这些都需要存入对应页面的域名id或ip地址中,然后就要进行各种预处理工作,如:拆分页面,重命名等。不同网站在蜘蛛爬取的过程中可能会出现bug,对有些网站,如百度网页,还会将页面里的js等文件都删除掉,防止恶意复制和加载不出来。现在我们就不得不提到asp或者php代码片段,这些段加入过程可能就是google蜘蛛抓取过程中,蜘蛛处理分析信息中重要的工作。
总结一下就是如下步骤:
1、搜索爬虫的爬取数据,
2、对未提交的数据进行数据的收集和处理
3、转换javascript文件并添加到静态页面中,
4、分析页面数据库中存放的数据,对页面进行优化,也可能最后进行反过来。
四、爬虫优化最常用的工具
1、asp/php代码转换器,
2、伪静态页面,
3、限制网页大小,
4、放