关键句采集 原创( 数据库与内容整合的关系与目的(1)(组图))
优采云 发布时间: 2021-09-10 01:21关键句采集 原创(
数据库与内容整合的关系与目的(1)(组图))
数据库和内容整合的关系和目的:利用有限的数据,用一些方法创建大量符合SEO的页面
采集强相关的凉风算法:
1.Title 原则
网站应保证站点下的每个页面都有指定的标题,同一个站点的不同页面使用不同的标题;
>>>不同的页面,不同的标题
页面标题要准确概括页面内容,避免含糊不清、不相关的描述;
>>>标题与网页内容相关
页面标题要简洁,避免使用冗长的标题,避免关键词stacking;
>>> 关键词stacking 很有用
页面标题符号使用正确,建议参考百度推荐的标题符号用法
>>> 跟着我走
采集强相关的飓风算法:
类型一:采集有明显痕迹
详细说明:本站内容大量转自其他网站或公众号采集,信息未整合,版面混乱,部分功能缺失或文章可读性差,存在很明显采集的痕迹,用户的阅读体验很差。
示例:采集文章存在超链接无法访问、内容功能缺失等问题,采集有明显痕迹
>>> 删除采集tracks
类型二:内容拼接
详细说明:采集多篇文章和不同的文章拼接在一起,整体内容没有形成完整的逻辑。存在阅读不一致、文章不连贯等问题,无法满足用户需求。
例子:内容不相关,逻辑不连贯
>>>拼接标题关键词相关内容
类型 3:网站上有大量采集 内容
详细说明:网站内容下大部分内容为采集,网站无内容生产力或内容生产能力差,网站内容质量低。
建议:我们鼓励网站制作原创 内容。如转载请注明出处。 (如转载标注新闻、政策等来源的内容,将不被视为采集内容)
>>>减少百度收录的内容比例。
类型 4:跨域采集
详细说明:本站依赖采集大量与本站域名不一致的内容获取流量。
示例:教育网站发布与食品相关的内容
>>>同类型2,采集和关键词相关内容
功耗降低的形式:
按目录降权,按URL格式降权,按模板降权
通过子域名减少权限
按主域名右下(按K)
总而言之,我们必须处理这个:
采集文章,分成多个目录存放,分散风险
文章在每个目录下,尽可能使用独立的模板和独立的URL格式,再次分散风险
分为两个模板,每个模板对应不同的URL格式
关键词可以堆叠,但堆叠的词需要与内容完全正相关
编辑标题(必填)
3 种方式:
关键词查找标题(通过搜索实现)
{原标题} ---> {新关键词}_{原标题}
{原标题} ---> {new关键词}_{修改原标题}
找到标题关键词(通过提取标题的主要部分,可读性不好,适合长标题,相似度最低)
硬插(简单易实现)
综合策略(视情况而定):
在标题前直接插入主关键词
原标题切分后,取出名词,到收录该名词的主关键词,随机选择一个,插入原标题前
准备一个关键词列表来存放大量的master关键词
主关键词可以过滤一批,比如百度搜索,Top10搜索结果,完全匹配主关键词的数量>5,这个词可以扔掉,重复度太高
内容源尽量找一些百度无法抓取的内容(如微信公众号)或新鲜内容(当天的新闻),并与采集内容混合。比例越大越安全。
内容处理
随机排列段落
在句首和句尾添加ASCII码
插入文章生成的其他摘要
在段落前后插入主要关键词和相关关键词(如帖子搜索词等)
插入图片(可以使用“XX壁纸/屏保”搜索图片,会匹配图片大小)
采集源的网站姓名、网址
HTML 冗余代码
处理:
排除采集features(必须做)
文本处理(可选)
3)原创content
图像到文本:
语气转文字:
外文转中文
百度不是收录
应用程序
海外网站
……
4)无能就是规律,无限就是有限---李小龙
做流量:没有绝对的规则和套路,只有适应的绝对规则和调整套路
抄袭是一个很好的哲学:抄别人的内容,抄别人的模板
5)template
5.1)什么时候改模板
当整个目录没有流量时,或者当流量几乎用完时
流量稳定时不要出错,可以适当添加模块,但不允许修改
没有绝对好的模板,好的模板来自A/B Test
5.2)copy 模板
资源:tap high quality网站
观察是学习SEO最好的方法,搜索排名Top 10的站都是现成的可以学习的对象
通过top10网站,我找到了SEO套路
通过阅读百度专利和搜索引擎知识找到套路的理论解释
看标题是怎么写的,标题中的关键词是哪里来的,顺序是什么?
看模板,里面有哪些模块,每个模块对应什么数据,调用规则是什么
看内容,内容从何而来,如何处理
看布局,标题关键词出现在网页的什么地方
看外部链接,有什么外部链接,我能得到吗(在ahrefs)
看规模、数据量、目录量
看看与你自己的比例相匹配的车站。如果您是“混凝土挖掘机”企业站,请不要参考1688
查看 50 多个电台
5.3)大站SEO精准流量武器:专页
专题搜索页面模板示例:
模块可配置
增加
删除
动态模块
静态模块
模块可定制
随机
发布时间
观看次数
权重值(自行设置)
相关性(通过MySQL字段相关,或者提前跑遍搜索,写入缓存)
发布 --> 动态模块
新闻 --> 动态模块
问答 --> 动态模块
论坛 --> 动态模块
视频 --> 动态模块
图片 --> 动态模块,静态模块
手工编写 --> 静态模块
友情链接 --> 静态模块