seo文章采集工具(建站系统推荐使用linux系统+宝塔(BT)建站 )
优采云 发布时间: 2021-10-01 14:30seo文章采集工具(建站系统推荐使用linux系统+宝塔(BT)建站
)
前言:SEO常用工具建站文章内容来源于近期建站的操作经验。后面会推荐其他常用的SEO工具,分享一下我写的工具。欢迎关注。
内容概要:
建站系统
建议使用linux系统+宝塔(BT)搭建网站。linux系统与win相交,可以提高网站的安全等级,但是linux是命令行系统,很多同学不会用,所以推荐使用BT。服务器运维面板的安装和使用非常简单。
更棒的是,免费功能基本可以满足大部分建站需求。我的很多服务器都是使用宝塔面板,搭建容易,维护方便,占用服务器资源少。
Key 关键词 挖掘和布局
网站关键词的关键点是业务流量的基础,必须控制。我在建网站的时候,这个作品的过程是这样的:
批量挖掘关键词->分析关键词性价比->选择高流量&性价比关键词
前面用到的工具内容介绍:
挖矿行业工具推荐关键词及重点关键词:如何挖矿行业关键词、词挖掘策略、工具推荐
性价比高的过滤工具关键词:关键词如何优化难度分析?退伍军人如何一键选择优质关键词
有了关键词,我们还需要分析关键词的TDK和内容是怎么写的,如何得到更好的排名,这里面涉及到tf-idf算法和bm25算法中的搜索原理引擎。
这里不详细分析算法,只简单讨论一下原理。
tf-idf可以分析内容的词频和关键词分值,通过分值可以知道当前标题的核心词,通过修改可以更加集中TDK主题;
bm25在tf-idf的基础上分析多个内容,预测文章在某个关键词中的当前排名。我的操作流程和使用的工具如下:
基于关键词写TDK+首页内容->分析内容词频+TITLE分析->内容在线
词频分析使用自己开发的软件,通过获取模板关键词的前20个百度搜索结果的平均词频来指导我的内容的词频分布。
这个截图是我的网站的一个案例。现在可以分析我的内容的前20个平均词频和词频分布。但是,开发尚未完成。建议您可以使用代码保密的摩天大楼内容助手。原理类似。
除了词频分析,关键内容还需要tf-idf测试。我使用Orange SEO的主题检测和内容检测。这个检测主要是通过tf-idf计算,通过这个算法可以得到当前的TDK和内容。是否符合算法?
【主体检测截图】
【内容检测截图】
内容采集和发布
我自己的很多网站都是通过采集维护的。使用的主要工具有优采云、优采云和python。这里我简单介绍一下前两个。
优采云采集器:老软件,功能强大易用采集软件,内容采集和数据导入功能可以导入采集的任意网页数据发布到远程服务器,有伪原创 插件可用。但是,这是一个需要长期启动的本地软件,而且很多插件也需要付费,而且有一定的入门门槛。
优采云:之前常用的软件,在线配置,无需客户端安装,采集和发布配置非常简单,还支持SEO工具;不过免费版的限制比较多,可以酌情购买付费版。
市面上的软件方便好用,但是很难高度定制化,所以最近改用python自动采集并生成内容,比如关键词关键词auto采集 百度知道,搜狗问+行业问答平台,然后自动生成内容(如下图),有编程能力的同学还是可以考虑自己写爬虫。
内部链监控
网站上线后,需要检查是否有死链接或外链。我一般会使用站长工具或者爱站的友情链接监控功能来检查首页是否有死链,或者意外的外链。
同时为了避免网站中的错误链接,如动态链接入口、测试链接入口等,一般使用爱站工具箱做一个网站地图爬取进行故障排除和清理。错误 URL 和错误 URL 条目。
日志监控工具
网站 在建设初期,百度蜘蛛的爬取状态可以反映网站的百度评分现状,所以需要定期检查,方便SEOer对SEO方式的判断和调整。下面我介绍几种我日常使用的查看日志的方法:
爱站 工具箱:免费用户支持20M,数据更详细,但是每次需要登录BT面板下载日志文件,比较麻烦。
BT插件,付费,1元/月,可在线查看,无需下载日志文件分析,更方便。
zblog插件是付费的,一次性收费,可以在多个网站中使用,登录zblog系统后台即可查看,非常方便。
百度站长工具,需要等到第二天才能看到昨天的抓取次数,可以看到抓取次数,还有抓取时间。官方数据最可信,不会被假蜘蛛忽悠,使用方便,但是功能太少,看不到具体爬取的网址。
百度站长工具
新站除了检查爬行情况外,推荐使用百度站长工具的链接提交功能和爬行分析功能。可以提高网站的收录的速度。
网站速度测试
网站速度是重要的SEO指标之一。网站上线后,测速,每次优化速度。一般测速有两种,一种是测试网站页面的下载速度,另一种是测试网站页面上所有内容的加载速度。
测试网站页面下载速度的工具有很多。这个网站测速工具的特点是只下载当前页面,不进行页面分析,不加载页面中的css、js、图片文件。类似蜘蛛爬行的操作,百度可以搜索到很多网站测速工具,这里不再介绍。
测试网站页面所有内容的加载速度。本次测速会继续分析页面打开后加载js、css、图片所用的时间。这个速度更接近用户体验。一般使用百度统计的网站速度诊断来完成。