seo-网站搜索引擎优化视频教程(最值得学习的不是视频中的知识,而是讲者的这几句话)
优采云 发布时间: 2021-09-04 10:28seo-网站搜索引擎优化视频教程(最值得学习的不是视频中的知识,而是讲者的这几句话)
首先,最值得学习的不是视频中的知识,而是演讲者的这几句话
1. 本视频涉及SEO的方方面面。只是听听会增加你的知识,但你需要花更多的时间去挖掘更多的知识和系统化知识。这对于所有的知识学习当然非常有意义
2.SEO 是一个前卫且非常活跃的主题。它的价值在于新的、经验的积累和及时的信息。很多计算机软件知识都是这样的。一方面要打好基础,另一方面也不要忘记跟上知识的更新。
以下笔记很不完整,所以想要系统的学习SEO知识,需要通过各种方式主动学习搜索引擎的原理和爬虫的工作原理……更多拓展知识
SEO:搜索引擎优化
SEO 的最大好处:流量。在互联网上寻找信息时,越来越多的人使用搜索引擎。 80%的人只看搜索结果的第一页,40%的人只看第一页的前四项,只有20%左右。以后要翻几页,如果你的网站搜索结果比较晚,那么你的网站流量会受到很大的影响
SEO目的:让网友更容易找到你的网站或网页
总体介绍:开场;搜索引擎介绍(重点是谷歌);搜索引擎优化(解释搜索引擎爬虫如何抓取互联网;搜索引擎如何对搜索结果进行排序;什么是可取的 SEO,什么是不受欢迎的 SEO;自然排名和竞价排名的比较)
优化策略:关键词;关键词工具;网页分析;搜索引擎提交
备注:域名、链接、使用Flash、CSS;结束
使用谷歌搜索时的搜索规则和提示:+、-、“”的使用
!谷歌创始人撰写的论文《The Anatomy of a Large-Scale Hypertextual Web Search Engine》解释了搜索引擎的奥秘,一定会让你受益匪浅
! Google 的排名方法,PageRank
黄页和搜索引擎:黄页人工编译,更新慢,搜索引擎自动抓取;搜索引擎检索网页,黄页检索网站;与搜索引擎收录相比,被黄页收录的门槛比较高;黄页为搜索引擎提供数据,做黄页收录好很好,很多人还在用黄页。所以SEO不能忽视黄页问题
内容广告和搜索广告:
搜索引擎爬虫:
网页快照:
搜索引擎如何对网页进行排名。它主要看三件事:1.web 内容; 2.关键词的频率和集中度; 3.网站流行度
白帽 SEO:仔细查看 Google 的 网站Admin 支持中心,它会不断更新。一些不该做的事情会影响网站的搜索排名
黑帽SEO:使用作弊方法优化搜索引擎排名,不要这样做
什么是关键字:搜索时,输入框输入的内容就是关键字;对于网站,你网站的内容最相关最简洁的描述就是关键字
关键词选择建议:先列出一些你认为的关键词;检查您的网站statistics 或服务器日志;参考其他人的意见(潜在客户、同事...);使用优化工具
停用词:过于常用、没有明确含义、会被搜索引擎忽略的词,例如the、that...
长尾理论
关键字工具:wordtracker 工具,关键字发现工具,
HTML 和 SEO 密切相关:
1. 网页的标题,也就是标签,对SEO来说是最重要的。尝试收录此页面的关键字并告诉其他人该网页是关于什么的。它不能太长或太短。 intitle: 操作员
2.META标签的关键字和描述,因为很多人滥用这两个标签,里面写的东西太多,所以搜索引擎越来越不认识这两个东西
3.网页比...更重要,这些对SEO很重要,很容易被搜索引擎爬虫抓到
4.网页正文中收录的关键字越多越好,在不影响人们阅读的情况下越多越好
5.网页中的图片
提交网站网址到搜索引擎;提交网站网址到黄页
如何选择域名
1.如果域名收录关键词,会大大提高排名
搜索反向链接:Google 的链接:关键字;链接调查软件
!对于动态网站网页,应尽量避免在网页地址中出现?、=、&符号,将动态网站默认网址形式编程为对搜索引擎有利的格式
robot.txt文件放在网站的根目录下,告诉搜索引擎爬虫这个网站不想爬到目录和内容
转载《讲解搜索引擎的工作原理》
合格的 seo 工程师肯定会了解搜索引擎的工作原理。百度和谷歌的原理差不多,但是有些细节是不一样的,比如分词技术,因为国内搜索一般都是百度,所以我们会所有课程都会针对百度,当然基础课程是仅适用于 Google!
搜索引擎的工作原理其实很简单。首先,搜索引擎大致分为4个部分。第一部分是蜘蛛爬虫,第二部分是数据分析系统,第三部分是索引系统,第四部分是数据分析系统。就是查询系统,当然,这只是最基本的4个部分!
下面说说搜索引擎的工作流程:
什么是搜索引擎蜘蛛,什么是爬虫程序?
搜索引擎蜘蛛程序实际上是搜索引擎的自动应用。它的功能是什么?事实上,这很简单。就是浏览互联网上的信息,然后抓取搜索引擎服务器上的所有信息,然后建立索引库等等,我们可以把搜索引擎蜘蛛当作一个用户,然后这个用户访问我们的网站,然后把我们网站的内容保存在我的电脑上!更容易理解。
搜索引擎蜘蛛如何抓取网页?
找到某个链接→下载这个网页→添加到临时库→从网页中提取链接→下载网页→循环
首先,搜索引擎蜘蛛需要找到链接。至于怎么找,很简单,就是通过链接链接。搜索引擎蜘蛛找到链接后,会下载该网页并将其存储在临时库中。当然,同时它会提取到这个页面的所有链接,然后就是一个循环。
搜索引擎蜘蛛几乎24小时不停(我觉得这里很悲剧,没有假期。哈哈。)那么蜘蛛下载的网页呢?这就需要第二个系统,即搜索引擎的分析系统。
搜索引擎蜘蛛会定期抓取网页吗?
这是个好问题,那么搜索引擎蜘蛛会定期抓取网页吗?答案是肯定的!
如果蜘蛛不分青红皂白地抓取网页,那会很累的。 Internet 上的网页数量每天都在增加。蜘蛛怎么能爬过去?所以蜘蛛爬网页也是有规律的!
蜘蛛爬取网页策略一:深度优先
什么是深度优先?简单地说,搜索引擎蜘蛛在一个页面上找到一个链接,然后向下爬取该链接,然后在下一页上找到另一个链接,然后向下爬行并抓取所有链接。这就是深度优先的爬取策略。大家看下图
上图是深度优先*敏*感*词*。假设网页A在搜索引擎中的权限最高,如果D网页的权限最低,如果搜索引擎蜘蛛按照深度优先的策略抓取网页,则反之,即D的权限网页成为最高,深度优先!
蜘蛛爬取网页策略2:宽度优先
广度优先更容易理解,即搜索引擎蜘蛛先抓取整个页面的所有链接,然后再抓取下一页的所有链接。
上图是宽度先行*敏*感*词*!这其实就是大家通常所说的扁平化结构。你可能会在一个神秘的角落看到一个文章。我警告你,网页的级别不能太多。太多的话收录就很难了,这就是处理搜索引擎蜘蛛的广度优先策略,其实就是这个原因。
蜘蛛爬取网页策略3:权重优先
如果说宽度优先比深度优先好,那也不是绝对的。只能说各有千秋。现在搜索引擎蜘蛛一般会同时使用两种爬取策略,即深度优先+广度优先。 ,并且在使用这两种策略进行捕获时,应该参考此连接的权重。如果这个连接的权重好,那么先使用深度,如果这个连接的权重很低,那么先使用宽度!
那么搜索引擎蜘蛛是如何知道这个链接的权重的呢?
这里有两个因素:1、的等级多,少; 2、本次连接的外链数量和质量;
那么如果链接太多,会不会被抓取?这不是绝对的。这里有很多因素需要考虑。我们将在后面的推进中归结为逻辑策略。到时候我会详细告诉你!
蜘蛛爬取网页策略4:重温爬取
我认为这更容易理解。例如,昨天的搜索引擎蜘蛛抓取了我们的网页,今天我们在这个页面上添加了新的内容,那么搜索引擎蜘蛛今天就会抓取新的内容。内容,这是重访爬行! Revisit fetching也分为两种,如下:
1、Revisit all
所谓revisit all是指蜘蛛上次爬过的那个链接,然后在一个月的某一天,都revisit了又爬了一遍!
2、single revisit
单次重访通常针对更新频率相对较快且稳定的页面。如果我们有一个页面,它不会每个月更新一次。
然后搜索引擎蜘蛛第一天就这样来了,第二天就这样搜索引擎蜘蛛第三天就不来了。它每隔一次就会来一次,比如每隔一天。每个月来一次,或者当所有这些都被重新访问时更新一次。
以上是搜索引擎蜘蛛抓取网页时使用的一些策略!正如我们上面所说,当搜索引擎蜘蛛抓取一个网页时,第二部分就开始了,这是数据分析的部分。
数据分析系统
数据分析系统是对搜索引擎蜘蛛抓取的网页进行处理,所以数据分析部分分为以下几部分:
1、网页结构
简单来说,就是把那些html代码全部删除,然后提取内容。
2、消除噪音
去噪是什么意思?在网页结构中,html代码已被删除,文本被保留。那么降噪是指留下网页的主题内容,删除无用的内容,比如版权!
3、查重
重复检查比较容易理解,就是搜索引擎寻找重复的页面和内容,如果发现重复的页面,就会被删除。
4、分词
分词呢?也就是搜索引擎蜘蛛已经进行了前面的步骤,然后提取了文本的内容,然后将我们的内容分成N个词,然后排列好存储在索引库中!它还计算该词在此页面上出现的次数。
5、link 分析
这一步是我们平时做的烦人的工作。搜索引擎会查询该页面的反向链接数量,导出链接和内部链接的数量,以及该页面的权重。
数据索引系统
执行上述步骤后,搜索引擎会将处理后的信息放入搜索引擎的索引库中。那么这个索引库大致分为以下两个系统:
前排索引系统
什么是正指数?简单的说就是搜索引擎给所有的网址加上一个数字,然后这个数字就对应了网址的内容,包括网址的外链,关键词密度等数据。
搜索引擎简单工作原理概述
搜索引擎蜘蛛找到连接→根据蜘蛛的抓取策略抓取网页→然后交给分析系统→分析网页→建立索引库
好的,这节课结束了。这是不容易的。今天我只是简单的讲一下搜索引擎的工作,因为搜索引擎这个非常复杂的系统,不可能在几十分钟的时间里四面八方说完。我们在高级或高级教程。我慢慢讲!