seo伪原创检测(SEO第七章网站网址链接路径优化网站的网址路径(图) )
优采云 发布时间: 2022-03-19 13:04seo伪原创检测(SEO第七章网站网址链接路径优化网站的网址路径(图)
)
搜索引擎优化第 7 章
网站URL链接路径优化
网站的URL路径分为相对路径和绝对路径
绝对路径:绝对路径是一条完整的路径,不仅可以在车站打开,也可以在其他地方打开。
相对路径:不是完整的路径,这种路径只能在站点内打开,复制到其他地方的URL不能打开。
百度喜欢绝对路径。
动态和静态页面
什么是动态页面?
动态站点是指以网站为背景和数据库的站点,是通过动态语言开发的站点。
今天的企业基本上是动态网站。
因为动态站点便于用户管理。
动态 URL 将收录一些特殊符号,? =&***等字符。
动态网址百度也是收录,但是收录的效果不如静态。
什么是静态页面?
静态 URL 是指没有背景的站点和用 html 编写的页面。URL 不收录特殊字符,通常是以 .htm 或 .html 结尾的链接。静态网站不方便用户管理,但静态URL更适合收录。
两者的区别:
静态方便蜘蛛收录,因为静态链接比较直接,而且静态链接一般每个页面都会生成一个静态页面,这样蜘蛛抓取比较省力,所以对于SEO来说,静态网站@ >更适合蜘蛛 收录 和 网站 优化。
动态链接没有固定页面,而动态url的生成是采集数据库的内容,所以无法保证网页内容的稳定性和链接的持久性,所以动态url不利于搜索引擎 收录。
现在很多站点都是动态站点,动态的url不适合收录,我们在做seo的时候,网站还是动态的网站,但是我们把它的url转换成表达式,变成静态 URL 的形式。我们称这种方法为伪静态。
织梦 的站点 URL 已经是静态的形式,所以不需要单独设置伪静态。
并非所有 网站 后端都可以直接生成静态 URL。这时候我们需要对网站做伪静态处理。
服务器的主机必须支持伪静态功能。
本课程的目标:
掌握网站的robots文件的编写
掌握 网站 的内容优化
网站 机器人文件是什么?(重点!!!)
机器人文件,全名robots.txt,文件名小写。本文档是我的网站 和搜索引擎之间的协议。
当搜索引擎爬取我们的 网站 时,它必须首先阅读这个协议。这个文件主要告诉搜索引擎哪些文件可以被爬取,哪些文件不能被爬取。
网站为什么要阻止蜘蛛访问某些文件收录?
因为不是一个网站的所有文件都可以参与排名,所以我们会屏蔽一些不能参与排名的文件,提高搜索引擎蜘蛛的爬取效率,让蜘蛛爬取更多有用的可以参与的文件在排名中。
robots.txt 文件的位置
该文件必须存放在网站的根目录下,并且文件必须是小写的。搜索引擎蜘蛛在抓取网站时,会先检测你的根目录下是否有这个文件。如果有,它会根据文件给出的爬取方式来爬取你的网站。
如何编写 robots.txt 文件
User-agent:后跟蜘蛛的名字
一般来说,对于公司网站或个人网站,我们用*来代替所有的搜索引擎蜘蛛。
用户代理:*
User-agent:baiduspider 百度蜘蛛
用户代理:googlebot 谷歌机器人
360:360蜘蛛
搜狗:sogospider
Disallow:禁止来自搜索引擎的文件
禁止所有搜索引擎抓取 1.html 这个文件
用户代理:*
禁止:/1.html
禁止所有搜索引擎爬取a目录下的1.html文件
用户代理:*
禁止:/a/1.html
禁止所有搜索引擎爬取a目录下的所有内容
用户代理:*
禁止:/a
防止蜘蛛爬取我们的 网站 后端
用户代理:*
禁止:/dede
允许蜘蛛爬行 允许
一般情况下,我们的很多网站页面都想被爬取收录,所以我们在写robots文件的时候不需要一一写出来,只需要写出来禁止爬行只是参加。
允许:/sitemap.html
网站地图:
4)* 通配符:告诉蜘蛛匹配任何字段字符
$wildcard:告诉蜘蛛匹配 url 末尾的字符
disallow:/a/*.html 禁止蜘蛛爬取a目录下的所有html文件
Dsiallow:*.jpg$ 禁止蜘蛛抓取所有以 jpg 结尾的图片
Disallow:*?* 禁止抓取所有动态 URL 链接
Disallow:/a/*.htm$ 1.html 不起作用
禁止:/a/*.htm* 1.html 有效
禁止抓取 网站 所有以 .png 结尾的文件
禁止:*.png$
如何将 robots 文件添加到我自己的 网站 中?
转到您的根目录并找到 robots.txt 文件
屏蔽后台的登录路径
掩码数据库目录
块成员管理目录
阻止安装文件
阻止 404 页面
允许抓取站点地图
二、网站 的内容优化
SEO文章 编辑器主要围绕网站 的关键词 编写。
为 网站 创建内容的三种方式
抄袭 (采集)
伪原创
原创
采集
织梦 自带 采集 函数
批量向网站添加内容的好处是可以快速向网站添加内容。缺点是采集的内容重复性高,对收录不利。
采集适合大型网站网站,栏目多,版块多,内容需求量大。
织梦采集 的使用:
采集-采集节点管理
添加新节点 - 正常 文章 - OK
节点基本信息-节点名称-编码格式(根据采集的网站的编码)
手动指定 URL
文章匹配规则
截取你要采集离他最近的内容的开头部分的唯一码和结尾部分的唯一码。
进入文章内容页面,找到文本的开头和结尾,找到离它们最近的唯一码,在文章内容匹配规则中写上[content]
始终保存以进行下一步。开始 采集
采集完成后需要生成内容,然后修改内容,去掉不必要的文字和图片。
2)网站内容采集器
优采云, 优采云
注意:采集文章不能完全复制,采集的内容要修改,特别是网站的标题和正文的第一段。
如果不是织梦的系统,可以使用优采云采集器,但不能盲目使用。如果网站是企业站点,内容要求不是很大,不要使用采集。
原创
原创 是什么?
从 SEO 的角度来看,蜘蛛没有看到的任何内容都是 原创。
原创文章 提示
从离线图书中扫描或复制
底部有著名作家和书名
英译中
注意:英文翻译成中文后,需要通读翻译内容,修改逻辑不同,词错。
原创文章有什么好处?
可以增加网站的权重
改进 网站 的 收录
良好的用户体验
原创文章的编写过程:
选择准确的长尾关键词写标题
如何写标题?
数字类型 - 100 个网络营销技巧
悬念——99%的人都不知道的XXXXX
修辞上——你为什么还没有女朋友?为什么你不是百万富翁?
夸张——XXX震惊了10亿人,你为什么不看呢?
文章 符号
首末段落必须加一次关键词,且文章首末段落不少于100字。
关键词 自然地出现在内容中。
建议将文章分成段落,并根据段落编写副标题。
发到网站的时候,尽量把文章更新到首页,一旦原创文章变成收录,就重新发。
伪原创
所谓伪原创是指修改别人的内容。重点是围绕 网站 的 关键词 创建内容。SEO中最常用的内容创建是伪原创。
伪原创怎么写?
第一个地方:修改文章的标题
文章 的标题最好是唯一的。最好在百度搜索框中搜索一下,看看有多少类似的标题。如果标题完全是红色,则表示标题重复。
第二点:修改文章的第一段,建议第一段完全是原创,自己写。锚文本也可以布置在文章的第一段,锚文本可以加粗强调。
第三处:修改中间段落。一般文章的中间段落可以拆分一些内容,或者去其他文章摘录一些段落组合成一个新的内容。
中间段落也可以布置锚文本。
第四位:文章的最后一段,首尾相呼应,也是最好的原创,一句话概括,最后一段也要布局关键词 .
文章修改后可以找到一些伪原创检测工具进行检测,原创的度数是多少。建议大家原创达到80%。
生成伪原创工具:奶盘、肉盘
检测伪原创工具:
注意:使用伪原创 工具后,请通读伪原创 的内容。,请确保 文章 属于同一类别。
内容发布需要注意使用四字写文章。
1、 文章标题、首末段落、正文都需要布局关键词,锚文本要合理使用,关键词的密度要合理。
2、 文章在标题中使用 h1.
3、您可以通过站长平台提交网站到百度。