汇总:一个纯采集站长的SEO、采集、运维总结
优采云 发布时间: 2020-09-06 13:11SEO 采集,纯采集网站管理员的操作和维护摘要
我是一个纯粹的采集网站管理员。下面的摘要,一些关于SEO,一些关于采集和操作与维护,是非常基本的个人观点,仅供分享,请标识自己真实的知识来自实践。
原创更好还是采集更好?
原创当然很好,因为百度是这样说的,他被称为裁判。
为什么我原创有很多文章,但仍然没有收录? 收录没有排名?
搜索引擎,其核心价值是为用户提供他/她最需要的结果。搜索引擎具有有关网民需求的统计信息。对于几乎没有或几乎没有网民需求的内容,即使您是原创,搜索引擎也可能会忽略您,因为它不想在无意义的内容上浪费资源。
收录对于网民需求较高的内容应该越来越多。但是,因为收录较多,所以即使您是原创,也可能难以挤入排名。
在搜索引擎统计信息中,互联网用户的需求是什么?
关键词。当每个人搜索关键词时,表明他/她需要与单词相关的内容。此外,使用搜索引擎的人通常会有疑问和答案以及搜索查询。当然,搜索引擎内部必须有一个非常大的分析系统才能准确定位这些需求。有关详细信息,请参见百度索引。例如,搜索的关键词是“手机”,您可能想购买手机或查看某个型号的价格,或者您只想下载精美的壁纸。但是,如果您想要墙纸,则会有一个更准确的关键词“手机墙纸”,它将以下拉框或相关搜索的形式显示。
原创很好,为什么要采集?
1.尽管原创很好,但只要该方法合适,采集的效果就不会比原创差很多,甚至比那些尚未掌握该方法的原创更好。
2.的能量有限,并且原创难以保证大量的长期更新。如果您询问编辑器,则输入/输出比可能为负。
市场上有很多采集器,我应该使用哪一个?
每个采集器有其唯一性,所谓的存在是合理的。请根据需要选择。我的采集器由我自己开发。在开发过程中考虑了以下方面。其他采集器也可以用作参考:
1.直接提供了大量的分类的关键词,这些关键词是百度计数的并且具有网民需求(带有百度索引)的单词,或者这些单词的长尾单词,百度下拉框或相关搜索中。
2.直接按关键词 采集,智能分析网页文本进行爬网,无需自己编写采集规则。
3.提取的文本已通过标准标签清除,所有段落均标记为
显示标签,并清除所有乱码。
4.根据采集的内容自动排列图片,并且图片必须与内容非常相关。以这种方式替换伪原创不会影响可读性,但也会使文章的图片和文字丰富,使其比原创提供的信息更丰富。
主体内容中的
5. 关键词自动加粗,还可以自定义要插入的关键词。但是没有所谓的“ 伪原创”功能会影响可读性,例如句子重新排列和段落重新排列。
6.可以直接使用关键词和相关单词的组合作为标题,或获取登录页面的标题。
7.可以执行微信文章 采集。
8.不需要触发或挂断。
9.集成百度网站管理员平台以积极推动以加快收录。
不同的网站程序,例如织梦,WordPress,dz,zblog,帝国cms或其他程序,它们对SEO有什么影响?
理论上没有效果。因为搜索引擎不知道您是什么程序,或者可以通过某些规则识别它,所以程序本身不可能影响其判断。
那么什么会影响SEO?答案是模板。因为这些程序基本上具有模板机制,所以同一程序可以输出不同的页面,并且不同的程序也可以输出相同的页面。这是一个模板。确定模板后,将根据此框架输出每个页面,也就是说,整个html结构都已确定。这些html是搜索引擎应重点关注的内容,它必须从这些html中获取所需的信息。因此,一套好的模板非常重要。
模板设计中应注意哪些细节?
1.权重结构的顺序。在整个页面的html中(请注意,它是html,而不是显示的布局),位置越高,权重越高。通过扩展,三个标签“标题”,关键字和描述具有最高的权重,因为它们是最高级的。第二个通常是导航,它基本上是最高的,并且重量也很高。同样,它是文章标题和文本。这是根据html排序的。
2.因为搜索引擎必须首先遵循W3C标准,所以W3C定义的某些标签最初是用来表示重要信息的,它们的权重自然更高。例如,特别是h1,它用来表示当前页面中最重要的部分。通常,每页只能有一个信息。权重估计等于标题,通常用于放置当前页面的标题。当然,要增加主页的重量,可以使用h1放置徽标或主页链接。另外,还有诸如em和strong的标签,用于指示重点。通常认为,强权重高于标签,这也是大胆的效果,但是我们认为,从SEO角度来看,体重没有增加。
3. CSS或js代码通常对搜索引擎而言毫无意义,请尝试使用单独的文件进行存储,或者在允许的情况下将其放在html的末尾
网站结构规划中应注意哪些问题?
1. URL设计。网址也可以收录关键词。例如,您的网站与计算机有关,并且您的URL可以收录“ PC”,因为在搜索引擎看来,它通常是“计算机”的同义词。 URL不能太长,级别不能超过4个级别。
2.列设计。列通常与导航相关联。设计时应考虑网站的总体主题。用户可能感兴趣的内容。列名最好是网站的几个主要关键词,这也便于导航。的重量。
3. 关键词布局。从理论上讲,每个内容页面都应具有其核心关键词,并且同一列下的文章应尽可能分散在列关键词周围。一种简单而粗鲁的方法是直接使用列关键词中的长尾单词。
动态,伪静态,静态,这三个中哪一个更好?
这不能一概而论,建议使用伪静态或静态。两者之间的区别在于是否生成静态文件以及URL格式是否动态。生成静态文件本质上是为了提高访问速度并减少数据库查询,但是它将继续增加所占用的空间。伪静态仅通过URL重写来修改URL,实际上,它仍然需要进行程序计算,每次查询数据库并输出页面。它对加速访问完全无效。动态和伪静态之间的唯一区别是带有问号和参数的URL。
因此只需注意两点:网站开门速度是否足够快?您需要节省服务器空间吗?
不同的网站程序可能具有不同的数据库操作效率。一般而言,如果内容页面的数量少于10,000,则页面打开速度相对较快,并且数据量更大,达到50,000、100,000甚至更多。通常,考虑静态化。
提高访问速度的方法有哪些?
1.上面已经提到的静态化。
2.通常,许多网站模板具有随机调用文章或类似的部分。实际上,随机性是数据库的较重负担。模板中的随机性应最小化。 文章致电。如果不可避免,请考虑从数据库进行优化。带索引的字段排序通常比不带索引的字段排序要快得多。
3.将图片,js,css和其他不经常修改的文件放在专用静态服务器上。如果可以合并多个js或CSS,请尽可能将它们合并到一个文件中,以减少http连接的数量。
4.使用各种云加速产品。对于普通网站,可以免费使用百度云加速或360云加速。
文章,网站有很多是静态打开的,但是更新整个站点需要很长时间,我该怎么办?
我的方法是使用缓存机制。我只在这里提供一个想法,我可能需要自己发展。
网站设置为伪静态。当每个请求到达时,程序都会检查是否存在相应的缓存的html文件。如果文件是数小时或数天前生成的,我们确定需要对其进行更新。此时,执行正常过程,程序将查询数据库,生成html,将其写入高速缓存文件,然后将其输出到客户端。
下次访问(例如1分钟后访问同一页)时,请再次检查缓存文件时间。可以从文件是非常新的时候就判断出来,根本不需要更新,可以直接读取文件的内容并将其输出到客户端。这样,可以自动生成每个页面,只有第一个访问者会感觉很慢,后续访问等效于静态访问,而且速度非常快。
如果它是独立服务器,则还可以考虑自动检测服务器负载。如果负载已经很高,则判断它需要更新,并且不是临时更新,而是直接输出。
图片应该引用远程URL还是将其放在自己的服务器上?
这也有其优点和缺点。引用远程URL可以节省您自己的带宽,但是由于另一方的服务器速度慢,资源被删除或防盗链被阻止,因此可能无法显示图片。如果您下载到自己的服务器上,当然所有内容都在您自己的控制之下,但是图片将占用大量空间,并且可能会比生成的静态内容占用更多的空间。如果流量很大,图片将占用最多带宽。
网站应如何优化内部链?
内部链是百度正式推荐的优化方法之一,因此必须做到这一点。通常的表达方式是某个关键词出现在文本中,并向该关键词添加一个链接,以指向恰好与此关键词相关的另一页。因此,诞生了一些所谓的优化技术,它们在文本中强行插入一些关键词和链接,以便执行类似于相互推送的操作。其他人,为了增加主页的权重,在每个地方都放置网站名称,并建立主页链接,认为这样做可以增加目标页面的权重。但是这些可能会适得其反,因为搜索引擎将计算每个链接的点击率。如果单击突出位置的几个链接,则可能被判定为作弊行为。因此,请仅在文本中已经存在的关键词上执行内部链接。
段落重新排列,句子重新排列和同义词替换这些伪原创技术是否很好?
不好。因为搜索引擎已经很聪明,所以它不再是简单的数据库搜索。它将执行自然语义分析(有关详细信息,请搜索“ NLP”)。语义分析困难的任何句子或段落都可以判断为可读性差,因此我认为这些“ 伪原创”可能很聪明。
评论模块基本上未使用,我应该这样做吗?
是的。评论模块最麻烦的是它是垃圾邮件。通常,很少有实际说话的访客,并且有很多垃圾评论。他们整日与市场营销软件作战。这是我已实施的计划,可能对收录有用(无根据,仅是猜测):
保留评论框,但禁用评论。所有注释均由我们自己的网站程序生成。如前所述,搜索引擎将执行自然语义分析。重要能力之一是情绪判断。搜索引擎将计算每次评论的情感价值,无论是正面还是负面,以及特定趋势是10%还是90%。如果评论的内容表达了积极的情感,则可以在文本中添加点,反之亦然。至于如何自动产生积极的评论,让八仙神越过海展现他们的魔力。
这是社交网络发展后的必然趋势。这样,可以反映页面的用户体验。同样,也有分享,喜欢等。原理相似。
采用绿色萝卜算法后,是否可以使用外部链接?
有用。请参阅搜索引擎三定律的相关性定律。既然是法律,它就不会改变。经常引用谁的内容是权威。在主动推送出现之前,外部链接应被视为蜘蛛识别页面内容的第一个通道。
外部链接必须固定还是裸露?
不。搜索引擎负有发现真正有价值的东西并排除那些不有价值的东西的重任。因此,您直接提交的链接可能没有收录,您只是在其他人的地方发送了纯文本URL,它被它发现,并且还计算了加分。
除了锚文本和裸链接之外,您还可以发送关键词 + URL形式的纯文本。这样,URL前面的关键词将自动与URL关联。
此外,尽管某些链接添加了nofollow属性,但是当百度计算外部链接时,它们仍将被计算。
收录与索引之间是什么关系?
收录表示蜘蛛已爬网并进行了分析。该指标表明,经过蜘蛛分析后,认为内容具有一定的价值。仅输入索引的内容可能会出现在搜索结果中并显示给用户。换句话说,只有索引的内容才有机会带来流量。