文章网站自动采集发布(网站采集配置自动化配置SEO定时发布网站网站发布配置详解)
优采云 发布时间: 2021-12-20 18:24文章网站自动采集发布(网站采集配置自动化配置SEO定时发布网站网站发布配置详解)
优采云采集平台支持自动采集文章,采集完成后的SEO处理,提升收录和文章@网站权重有很重要的作用,自动或定期发布到对应的一个或多个网站,实现文章搜索采集,SEO内容优化,发布< @网站*敏*感*词*自动化,减少了每天机械化的重复操作。
使用步骤:网站采集配置自动化配置SEO配置定时发布网站网站发布配置
1. 网站采集 配置:一个小概念:
大多数 网站 以列表页面和详细信息页面的层次结构组织。比如我们进入新浪新闻频道的时候,有很多标题链接,可以看作是列表页。点击标题链接进入详情页。
使用数据采集工具的一般目的是大量获取详情页中的具体内容数据,并利用这些数据进行各种分析,发布自己的网站等。
列表页:指栏目或目录页,一般收录多个标题链接。例如:网站首页或栏目页为列表页。主要功能:可以通过列表页面获取多个详情页面的链接。
详情页:收录特定内容的页面,如网页文章,收录:标题、作者、发布日期、正文内容、标签等。
首先,请登录“优采云控制面板”:
采集详细使用步骤:创建采集任务完成列表页智能提取结果(可选)完善详情页智能提取结果(可选)并开始运行
第一步:创建采集任务
点击左侧菜单按钮“创建采集任务”,输入采集任务名称和采集“列表页”URL,如:(这里首页为列表页:内容收录多个详情页即可),详情页链接可以留空,系统会自动识别。
如下所示:
输入后点击“下一步”。
第二步:改进列表页的智能提取结果(可选)
系统会先通过智能算法获取需要采集的详情页链接(多个),用户可以双击打开查看,如果不需要数据,可以点击“列表提取器”来手动指定它,只需在可视化界面中用鼠标单击它。
智能采集的结果如下:
另外:在上述结果中,系统还智能发现了翻页规则,用户可以设置采集的页数。您也可以稍后在任务“基本信息和门户网址”--“根据规则生成网址”项中进行配置。
列表提取器打开如下:
第三步:完善详情页智能提取结果(可选)
上一步获取多个详情页链接后,继续下一步。系统会使用其中一个详情页链接,智能提取详情页数据(如:标题、作者、发布日期、内容、标签等)
详情页智能提取结果如下:
如果智能提取的内容不是您想要的,您可以打开“详细信息提取器”进行修改。
如下所示:
您可以修改、添加或删除左侧的字段。
您还可以对每个字段进行详细设置或数据处理(双击该字段):替换、提取、过滤、设置默认值等,
如下所示:
第 4 步:启动并运行
1完成后,即可启动运行,进行数据采集了:
2
3
采集 数据出结果后,在采集任务“结果数据&发布”中,可以在这里修改数据或者直接导出excel或者发布你的网站(WordPress、织梦@ >DEDE、HTTP 接口、数据库等)。
2.自动采集配置
定时采集与自动发布功能配合使用,用户不再需要时刻关注任务采集和发布情况,省时、省力、高效。
还有一种自动发布的方式:定时自动发布,可以指定一定时间发布数据,而不是在采集之后立即发布数据。详情请参考定时发布&站群发布章节。
3.SEO配置
优采云采集 提供强大灵活的SEO优化工具,对提升文章的收录和网站的权重起到了非常重要的作用。
优采云SEO工具策略主要包括:正文插入动态段落(强烈推荐)、标题插入关键词、正文插入段落和标题自动关键词、自动内链、同义词替换、简繁体转换 。
文章在正文前后插入内容后,对于搜索引擎来说相当于一个完全不同的文章,有利于收录,不影响用户阅读(段落可以通过背景颜色区分)。
4.定时发布网站
定时自动发布,可以设置定时自动发布数据,站群发布可以使用【每条数据仅一个域名】和【每条数据只能发送到所选目标中的1个】发布方式,将数据随机发布到某个域名或某个发布目标;建议同时使用定时发布和定时采集,实现网站内容的定时定量更新,可以有效提升网站的收录。(定时发布和定时采集独立运行,定时设置的时间互不影响)
5.网站发布配置
采集 结果数据可以发布到:各种cms系统(WordPress、织梦@>DEDEcms、Empire、zblog、Deston、Discuz、Typecho、Emlog、Mipcms、苹果cms、Phpcms、易友cms、米拓cms、云游cms、Phpwind、Pbootcms等.)、自定义http接口等。
数据导出格式目前支持csv和sql(mysql)等类型,后续会继续添加类型,如有急需请联系(QQ)3043176563;
发布到 cms 有三个主要步骤:
一、在用户中安装并发布插件网站(安装插件市场或复制文件到目录)
二、在优采云控制台任务的“发布目标配置”项中添加发布目标
三、 在任务的“Result Data & Publish”列表中发布数据
详细操作请看各种cms发布目标: