技巧:文章内容采集实战运用操作细节
优采云 发布时间: 2022-12-11 08:57技巧:文章内容采集实战运用操作细节
在这个文章中我们主要讲的内容是采集。在我们讲之前,我们需要解释一下内容采集学习之后,你必须练习。学习采集主要分为三个步骤:
1.工具选择
市场上有许多采集工具。比如我们在百度上搜索[采集tools],就会有很多这样的软件,但其实我们只需要满足这几点:第一,操作简单;二是实用性。另外就是尽量避免代码知识,因为不是每个做SEO的人都熟悉代码。
这里我建议大家使用优采云universal文章采集,这个软件不用配置任何代码就可以去采集,因为它可以自动识别网页内容然后抓住采集。
比如优采云这类软件,不像网站,需要自己配置网站对应的爬虫版块,比较麻烦。
2. 采集 的类型
一般我们做采集两种,一种是随机的文章采集;另一个是精准的行业内容采集。
随心所欲文章主要关注各种新闻,而精准行业采集的内容是根据你想从事的行业,然后你可以找到更多相关的内容到采集操作。
3. 采集的步骤
教程:SEO丨网站优化实操基础:SEO优化框架与前期准备
■■
第33期乐股类别票据
课程时间:2019/7/9,周二,20:00-20:30
课程名称:网站SEO优化基本功
讲座群友:@ICER,甲方市场负责人,SEO&SEM领域资深人士,6个月为网站引流24万+
课件采集:本课件为付费课件,需支付59元采集。课件内容包括讲座PPT+讲座录音+本图文版课程笔记。获取方式见文末。本课件已获得老师独家授权
■■
PART 1 网站SEO的必要性丨框架图
第 2 部分 网站 SEO 准备
1.301重定向
2.死链接优化
3.目录文件结构
4.404页面优化
5.机器人文件设置
6.伪静态设置
7. 网站地图设置
8.页面关键词设置
第 3 部分 网站 SEO 优化内容
1.现场优化丨案例
1.1 搜索引擎抓取网站流程
1.2 页面关键词设置方法
2.站外优化
2.1 友情链接
2.2 外链优化
第 4 部分 SEO 实务守则
- 文本 -
图 1 框架
那我就直接开始了,大家晚上好。
今天跟大家分享的是SEO优化,也就是我们所说的网站搜索引擎优化。
第1部分
网站SEO的必要性
首先我们要明确,我们为什么要做网站SEO优化?
首先,SEO优化相对于竞价广告来说,对于点击是免费的,所以我们不用担心恶意点击和高昂的日常费用。
其次,只要我们通过正常的手段而不是作弊手段进行SEO优化,其效果是可以长期有效维持的。
图 2
那么SEO优化能给我们带来什么呢?
首先,SEO可以增加网站页面的整体曝光率,从而增加我们网站的整体流量。
对于业务网站,SEO可以整体提升我们整个网站页面的曝光度和流量,进而可以增加我们业务网站的一些转化。(图二)
第2部分
网站 SEO 准备
我们如何优化网站?
首先,让我们做一些SEO优化前的准备工作。
图 3
上图(图3)是SEO拦截整体框架图的一部分。
1. 301重定向
图 4
301 重定向是将网页中的一个 URL 永久转移到另一个 URL。
我们可以通过301重定向的设置,将我们网站中所有带www的域名转为不带www的网址。(图4)
这样做有两个好处:
对于搜索引擎,这有效地减少了整个网站页面的重复收录。因为这两个网站页面是相同的两个URL。
对于用户来说,可以直接进入我的页面,不用输入www。这样更方便快捷,从而提升用户的整体体验。
301重定向还有另外一个作用。
当域名发生变化时,我们可以通过301重定向的设置,将原来的网站的权重整体转移到另一个新的域名上。这样可以保证我们的网站体重不会改变,也不会因为我们的网站域名的变化而导致网站体重下降。
2.死链接优化
图 5
网站难免会时不时出现一些打不开的死链接,这就需要我们定期检查和优化。
对于死链接的查询方法,我们可以在站长工具中进行查询。如图(图5)
3.目录文件结构
图 6
我们要规范的显示网站页面结构。这样更有利于搜索引擎抓取整个网站页面。(图 6)
这里所说的标准化,是指我们整个目录结构的组织和层次比较清晰。
4. 404页面优化
图 7
当访问者浏览网站时,会出现一些无法打开的死链接,此时出现的页面就是网站404页面。(图7)
我们优化了网站错误页面,使其更贴近用户体验,从而减少用户的流失,从而降低网站的整体跳出率。
图 8
如图(图8)所示是我在制作网站错误页面时需要注意的一些关键点。
5.机器人文件设置
图 9
Robots 文件是搜索引擎在抓取和访问 网站 时首先访问的文件。
我们可以在这个文件上设置一个搜索引擎。设置哪些页面可以被搜索引擎抓取,哪些页面不可以被搜索引擎抓取。
如果是个人网站,涉及个人隐私的部分可以设置不被搜索引擎抓取。这样它就不会在 网站 中被搜索和检查。
如果是一般业务网站,我们会设置为抓取所有页面。
如图(图9)所示,这是写文件时常用的一些写法。其中的*表示全部,如果后面是空格,不写则表示无。
6.伪静态页面设置
网站的页面一般分为静态页面和动态页面。
对于搜索引擎来说,更倾向于抓取静态页面。但是我们现在的网站中的大部分页面都是动态的,所以为了让搜索引擎更好的抓取网站页面,我们可以将页面设置为伪静态。
最简单的方法之一是使指向页面的链接以 .html 结尾。
当然,我只提到了其中一个。还有很多伪静态的设置方法,大家可以自己去挖掘。
这样做的目的是让我们 网站 更容易被搜索引擎抓取。
7. 网站地图设置
图 10
设置网站地图的作用是让用户和搜索引擎更直观、更清晰地在我们的网站中找到相应的栏目、内容和分类。
上图是网站制图工具(图10)。在这里,我们建议您使用第一种和第二种方法,它们是一些建站系统自带的地图制作工具。
不推荐大家使用第三个程序员写工具,因为涉及到网站的一些代码,不是很专业的人可能一下子看不懂,前两个工具是我们在做的背景 可以直接生成和设置。
8.页面关键词设置
通常 网站 分为三个页面级别:
第一层是网站首页;
第二层是网站栏目页;
第三层是 网站文章 页面。
我们将为 网站 中的每个页面设置 关键词。
关键词设置原则如下:
第一条原则:将每页关键词的个数设置在3到5之间;
原则二:栏目页设置的关键词为扩展关键词和次级关键词;
第三原则:文章页面设置的关键词是长尾关键词和文章关键词。
完成这些准备工作后,我们就可以优化网站的整体SEO了。
第三部分
网站 SEO 优化内容
总体优化操作分为两类:
第一步是现场优化;
第二步是站外优化。
1、现场优化
首先,让我们谈谈站内优化。
下面说说搜索引擎爬取我们的页面,被用户看到的过程。
1.1 搜索引擎抓取网站流程
图 11
首先,我们的页面被搜索引擎文章抓取和收录。
然后,当我们设置的某个页面关键词与用户搜索的某个搜索关键词一致时,搜索结果就会显示网站页面,吸引用户点击和点击从页面进入我们的网站。
比如上图(图11)所示的北京美味学院的例子:
用户在PC端百度搜索Delicious Academy时,会出现很多带有关键词的Delicious Academy页面。
我们可以看到,当Delicious Academy的搜索关键词与网站页面关键词重合时,关键词会变成红色,也就是字体会变成红色。
这说明我们设置的页面关键词是起作用的,换句话说,这就是网站SEO优化的效果。
1.2 页面关键词设置方法
让我与您分享如何设置关键词 页面。
图 12
图 13
我们需要在网站页面进行TDK设置(图12):
T为Title,即页面的标题;
D是Discription,也就是页面描述;
K是Keywords,即页面关键词。
上图(图13)可以看到,我在图中的页面代码中用红色箭头标出了页面(网站首页)的TDK,即Title-page title, Description - 页面描述,关键字 - 页面 关键词 所在的位置。
让我们回到前面提到的“北京美味学院”的例子。(图11)
美味学院四个字是Keywords关键词;
北京美味学院六个字是我们页面的标题;
标题下方的小字是北京美味学院...美味学习与分享,也就是页面说明。
在上面的框架图中(图12),我们还可以看到(网站主页)TDK设置规范和原则。设置方法是在页面代码中设置。(图13)
我想补充一点,注意不要堆积恶意重复关键词。
通常,我们将关键词密度控制在每页 3% 到 8% 之间。
当关键词密度达不到上述数据时,需要注意的一点是,千万不要反复恶意堆砌关键词,也就是一直把我们的关键词写在某个特定的地方地方。这对用户体验和搜索引擎抓取都是非常不友好的。
那么当我们的 关键词 密度不够时我们该怎么办?
其实我们还有很多地方可以加关键词,比如:
1.整个页面首页的上半部分
2.页面底部标签
3.轮播(横幅)
4.标志
5.首页图片
在这些地方加上关键词可以避免恶意堆积关键词。
此外,我们还可以在页面中添加一篇文章文章,让文章增加其关键词的密度。
图 14
那么,如何查询 关键词 密度?
关键词密度查询方法可以通过站长工具实现。(图14)
当我们输入网站域名进行SEO综合查询时,查询结果会显示关键词密度的数据。推荐的 关键词 密度在 2% 到 8% 之间。我的工作经验告诉我,最佳选择是在 3% 到 8% 之间。
说个题外话。
为什么不恶意堆积关键词?
因为恶意积累关键词是一种SEO黑帽技术。
有两种类型的 SEO 技术,白帽技术和黑帽技术。
以上我教给大家的方法都是SEO白帽技术,也就是不违反搜索引擎的合规技术。
黑帽技术则相反。
恶意积累关键词和链接等属于违规行为。这些方法确实可以在短时间内提高网站的排名,但是一旦搜索引擎发现这些恶意方法(黑帽技术),就会对网站进行惩罚。惩罚手段有很多种。其中最主要的是 网站 不会被抓取。
让我们回到网站页面关键词设置方法。
之前在网站首页的框架图中给大家分享了搭建TDK的方法和原理。您已经了解到 网站 具有三层页面。其实二级页面的子栏目页面和三级页面的文章页面的TDK设置规则和首页没有区别。
接下来,我想强调设置 文章 页面 关键词 的注意事项。
图 15
有三点:(图15)
第一点,文章最好是原创文章,原创度最好在50%左右;
如果 文章原创 太低,搜索引擎会认为我们的 文章 是抄袭,可能不会抓取我们的页面。
第二点,确保处处用到这个词;
首先,关键词应该出现在网页的Title标签中;
其次,网页上的Discripiton和Keywords应该出现关键词;
第三,页面文字中关键词的密度最好控制在3-5之间,第一个关键词要加粗,提醒用户;
第四,关键词也应该出现在其他页面的锚文本中,实现两个文章之间的相互链接,让我们的用户访问更多的页面,提升用户体验。
第三点合理设置文章页内链接;
文章与首页,文章与栏目,文章与URL标签,只需要将其中的部分链接起来,合理设置即可实现文章的相互跳转文章 页。
以上就是页面关键词的优化方法和每一级的优化原则。我们每增加一个页面,都要按照这个方法来设置。
2.站外优化
2.1 友情链接
图 16
上图(图16)是新东方官网的一个页面。
友好链接是显示在我们的 网站 中的外部 网站 链接。一般设置在首页底部,会有专门的友情链接栏目。
图 17
选择友情链接有两个原则:(图17)
第一,对方的网站必须和这个网站的内容有一定的关联;
保证通过友情链接进入的访客与我们自己的网站具有相同或相似的浏览或访问目的。
第二,对方的权重比这个网站高。
与权重高于我们的网站的友情链接,可以有效增加这个网站的整体权重。
同时友情链接有两种:
一种是纯友情链接;
通过一些朋友或您认识的人交换纯友谊链接。
一是定期购买友情链接;
那么对方的网站权重一定要高于自己的网站,才值得购买。
友情链接也是我们整体SEO优化中非常重要的一部分。因此,我们会定期检查附属链接。
再来说说友情链接的nofollow属性。
图 18
nofollow 是 网站 代码中 a 标签的一个属性。nofollow的作用是保证链接中的所有内容都不会占据这个网站的整体权重。(图18)
因此,对于友情链接的优化,我们需要做四个检查:
第一个任务:对方是否与我们交换过友情链接;
第二个任务:在我们的友情链接部分,对方是否添加了nofollow属性。如果添加了,它们的网站权重不会分配给我们,也就是不会带动我们网站整体权重的增加;
第三个任务:观察对方网站是否有违规内容;
第四个任务:网站历史是否被K过,即网站是否被搜索引擎杀死,即没有被搜索引擎和收录抓取。
如果以上四项出现问题,需要及时与对方网站沟通。
2.外链优化
外链优化是指向第三方平台发送链接,如百度知乎、天涯、豆瓣、搜搜、问问、微博、知乎等内容媒体。
通过第三方平台点击的链接可以有效地为我们的网站带来流量。
需要注意的是,我们在第三方平台发布外链时,需要设置tracking标签,以便统计时识别引流效果好的平台。
我们可以使用网站中安装的一些统计工具来监测哪些平台对我们有很好的引流效果。
推荐一些工作中常用的网站流量监控工具,比如cmcc、51、百度统计等,比如通过百度统计安装统计代码,就可以检测到流量数据整个 网站 和 网站 页面的动态。
以上就是本课的核心分享内容:
网站SEO整体优化框架图
八准备
两个核心操作
SEO优化是一个长期的过程。如果要做SEO优化,就需要根据SEO优化框架图(图1)进行长期不间断的维护和优化。
在课程的最后,我会发给大家一份关于SEO优化人员应该遵守的工作原则的文档。
第四部分
SEO 实务守则
网站SEO(搜索引擎优化)在过去两年发展迅速,需求量很大。然而,目前SEO从业者的水平参差不齐。因此,SEO行业标准的制定,有利于SEO企业之间的公平竞争,同时可以保障SEO客户的权益:
1、SEO从业者一定不能对不同的客户区别对待,每个客户的利益是一致的、平均的。所有客户享有同等待遇,获得相同或可比的搜索引擎优化权利。
2、SEO从业人员不得冒用他人成果,包括将他人成果,如SEO案例、文案等,视为自己的作品,擅自使用他人资料等。
3、SEO从业者不得在宣传中夸大或虚构其能力、*敏*感*词*、培训、业绩、认证、合作伙伴、技术实力和经验,禁止对同行业SEO从业者进行恶意攻击和侮辱。与行为。
4、在接受SEO业务时,SEO从业人员应采取相应的分析措施,看客户的网站是否存在欺骗行为。一旦发现,他们可以与客户协调解决问题。如果欺骗没有结束,SEO从业者有权无条件拒绝。
5、SEO从业人员应对客户负责,确保客户信息的权益。未经客户同意,SEO服务案例不得向他人公开,对客户要求保密的信息,严守纪律,诚信待人,确保客户信息不被泄露。
6、SEO从业人员不得故意误导、伤害来访用户。合理、正确地向搜索引擎提供相关内容,不得使用桥接页面、欺骗页面、诱饵页面等方式欺骗搜索引擎和用户。
7、SEO从业人员不得故意违反搜索引擎禁止规则。搜索引擎算法排名规则调整时,SEO从业者应及时修复客户网站存在的问题。网站修改前,SEO从业人员应及时向客户反馈,征得客户同意后合理调整网页。
8、SEO从业人员不得违反任何法律法规,禁止接受制作、推广马克六、淫秽、盗版等非法网站优化网站。
九、SEO从业者应尽最大努力促进客户网站,客户为SEO优化人员的服务付费,SEO优化人员使用适当合理的搜索引擎规则来改善或保证客户网站的相应在搜索引擎中的位置。
10. SEO从业者不得向用户做出不切实际的承诺,包括关键词排名位置的确定、关键词排名的确切数字、搜索引擎算法日新月异,也包括不诚实等作为保证固定排名的承诺。SEO从业者应为客户提供明确的优化修改方法,包括网站内容、构建、美化、增加用户体验、合理的推广建议,经客户同意后,获得相应权限。网站输入合理修改,不得擅自窃取客户源代码和内容。
我想在这里鼓励大家,谢谢大家的聆听。
口语:群友@ICER
作者/编辑/艺术家:认真的戴哥
图:Unsplash/CC0协议
- 结束 -
■获取方式■
联系易记君领取课件和录音
■您好,这里是易记社区■
易记职场知识社区由教育行业市场人士易记君和戴哥发起。归纳整理了921个行业,超过2500G的研究报告、案例模板、技能工具等职场学习资料;BAT、京东、浪潮等知名企业中高层4000人来到易记社区分享学习资料,开设自己的专业课程传授经验、交流观点、对接网络资源. 在职场上,专业能力是资产,人脉是信心。专业深度决定专业高度,与专业人共同成长。我们在这里等你。点击,社区表格:
■ 公众号数据入口■
行动研究报告→洞悉趋势,不误入歧途
丨丨丨丨丨丨丨丨丨丨丨
案例模板→10000小时经验浓缩
丨丨丨丨丨丨丨丨丨丨丨
■ 公众号体验入口■
专业课→老师是群友
丨丨丨丨丨丨丨丨
实证视角 → 职场实用指南
丨丨丨丨丨
后台回复“进群”,与4000名高管一起学习
■版权声明■
原版课件和录音版权归老师(易记群友)所有。易记职场知识社区(以下简称“易记社区”)享有课程笔记的改编和整理版权。易记社区发布的所有课件/录音资料均由老师(易记群友)独家授权。它们是易记社区的独家内容,易记社区对其独家/专有内容拥有知识产权。以上信息仅供个人学习研究使用,不得用于其他用途。