能够自动发布文章的自动采集器(智能文章采集系统教程软件官方网址:/新增任务)
优采云 发布时间: 2021-09-07 02:10能够自动发布文章的自动采集器(智能文章采集系统教程软件官方网址:/新增任务)
Intelligent文章采集System Tutorial优采云Software官网:/添加新任务,打开新任务设置窗口1:分类页面URL提取设置1.首先填写唯一的任务名称(一般为按网站栏目或分类名称,也可以自己取,主要是为了方便识别)2.设置网页代码,在目标网页的源码中查看网页代码,选择对应的代码(只要代码正确,任何语言都可以识别)3.生成分类网址列表,也可以添加单个网址,也可以将多个网址整理成TXT批量导入一行二:详细页面提取URL设置块起始字符对应网页中列表URL的头部字符,如区域块的结束字符对应网页中列表URL的底部字符。例如,按“提取测试”按钮尝试获取详细页面 URL。如果有非详细页面URL,可以在过滤器URL中设置过滤器,必须收录URL,只保留需要的详细页面URL 如果要自己添加详细页面URL,可以添加、导入或在点击的按钮中批量删除。三:网页内容提取设置 在浏览器中,点击栏目中任意设置的类别或详细页面,如:/jokehtml /bxnn/20628.htm 软件会自动识别提取的文本和标题内容。如果它收录一些不需要的内容,您可以设置过滤器,然后单击保存任务,任务就设置好了。启动采集选择新添加的任务,选择线程数和采集方法,点击“start采集”执行采集,点击stop终止采集。可同时查看多个任务采集数据管理 点击“采集数据管理”如上图打开“采集数据管理”窗口“已经采集数据管理”选项卡,点击选择一行,编辑查看文章Content,勾选行进行批量删除操作。 “数据批量修改导出”选项卡启用伪原创processing 插入关键词/anchor链接,可以在文章中文中随意插入关键词或锚链接替换同义词,可以替换内容或标题中的同义词,可以选择对应的词库,支持英文TBS词库,自带中文词库。发布设置1:接口生成,选择对应的cms类型,填写密码,生成接口文件(本地程序目录“jiekou”文件夹下),将生成的接口文件上传到网站root目录。 二:数据发布设置,填写第一步上传的接口文件的URL和密码,填写要发布的数据的列/类别ID到cms,即可发布