自动采集发布系统(优采云采集平台新一代的网站文章采集和发布平台(组图))

优采云 发布时间: 2021-08-29 13:10

  自动采集发布系统(优采云采集平台新一代的网站文章采集和发布平台(组图))

  优采云采集平台是新一代网站文章采集及发布平台,完全在线配置,使用云端采集,功能强大,操作简单,配置快捷高效。 优采云不仅提供网页文章采集、数据批量修改、定时采集、定时定量自动发布等基础功能,还集成了强大的SEO工具,接入多个原创API,实现创新智能规则抽取引擎、采集书签一键发布等功能大大提高了采集的配置和发布效率。 采集简单、更轻松的发布:支持一键发布到WorpPress、Empire、织梦、ZBlog、Discuz、Deston、Typecho、Emlog、Mipcms、米拓、易友cms、Applecms 、PHPcms、Pbootcms等cms网站系统,也可以发布到自定义的Http接口。此外,它还支持特定文章的“一键quick采集”,包括:微信公众号文章、今日头条、新闻pan采集。

  下面介绍使用优采云采集平台进行文章采集再原创处理发布的网站方法。

  一个小概念:

  大多数网站 以列表页面和详细信息页面的层次结构组织。比如我们进入新浪新闻频道,有很多标题链接,可以认为是列表页。点击标题链接进入详情页。

  使用data采集工具的一般目的是在详情页获取大量特定内容的数据,并利用这些数据进行各种分析,发布自己的网站等。

  列表页:指栏目或目录页,一般收录多个标题链接。例如:网站home 页或栏目页为列表页。主要功能:可以通过列表页获取多个详情页的链接。

  详情页:收录特定内容的页面,如网页文章,收录:标题、作者、发布日期、正文内容、标签等。

  首先,请登录“优采云控制面板”:

  详细使用步骤:访问原创API数据并发布到网站

  第一步:创建采集task

  点击左侧菜单按钮“创建采集task”,输入采集task名称和采集的“列表页”网址,如:(这里首页为列表页:内容收录多个详情页是),详情页链接可以留空,系统会自动识别。

  如下图:

  

  输入后,点击“下一步”。

  第2步:改进列表页的智能提取结果(可选)

  系统会先通过智能算法获取需要采集的详情页链接(多个)。用户可以双击打开支票。如果不需要数据,可以点击“List Extractor”手动指定,只能在可视化界面用鼠标点击。

  智能获取的结果如下图所示:

  

  另外:在上面的结果中,系统还智能发现了翻页规则,用户可以设置采集要翻多少页。您也可以稍后在任务“基本信息和门户网址”-“根据规则生成网址”项中进行配置。

  打开列表提取器后如下图:

  

  第三步:完善详情页的智能提取结果(可选)

  上一步获取多个详情页链接后,继续下一步。系统会使用其中一个详情页链接,智能提取详情页数据(如:标题、作者、发布日期、内容、标签等)

  详情页智能提取结果如下:

  

  如果智能提取的内容不是您想要的,您可以打开“详细信息提取器”进行修改。

  如下图:

  

  您可以修改、添加或删除左侧的字段。

  还可以对每个字段进行详细设置或数据处理(双击字段):替换、提取、过滤、设置默认值等,

  如下图:

  

  第 4 步:启动并运行

  完成后,即可启动运行,进行数据采集了:

  

  采集之后的数据结果,在采集任务的“Result Data & Release”中,可以在这里修改数据或者直接导出到excel或者发布你的网站(WordPress, 织梦DEDE 、HTTP 接口、数据库等)。

  

  第五步:访问原创API

  优采云采集支持调用第三方原创API接口处理采集数据内容和标题;

  目前支持的第三方 API 访问:

  【5118一键智能改词API】【5118一键智能改词API】【5118智能标题生成API】【奶锅API】【优采云API】【爱写作API】【写作*敏*感*词*API】 ] 第六步:发布数据到网站

  采集 结果数据可以发布到:各种cms 系统(WordPress、织梦DEDEcms、Empire、zblog、Destoon、Discuz、Typecho、Emlog、Mipcms、Applecms 、Phpcms、Yiyoucms、米拓cms、Yunyoucms、Phpwind、Pbootcms等)、自定义http接口等

  数据导出格式目前支持csv和sql(mysql)等类型,后续会继续添加,如急需请联系(QQ)3043176563;

  发布到cms有三个主要步骤:

  一、在user网站安装并发布插件(安装插件市场或复制文件到目录)

  二、在优采云console 任务的“发布目标配置”项中添加发布目标

  三、在任务的“结果数据&发布”列表中发布数据

  详细操作请看cms发布目标:

  完成,数据采集+原创processing + 发布到网站就是这么简单! ! !

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线