优采云采集可按关键词泛采集通过搜索引擎(百度)搜索关键词

优采云 发布时间: 2021-08-26 22:15

  优采云采集可按关键词泛采集通过搜索引擎(百度)搜索关键词

  优采云采集可以按关键词泛采集搜索关键词的信息文章,采集搜索结果链接内容(系统会智能识别标题和正文,日期等),使用方法很简单,输入对应的关键词即可。

  使用步骤:

  1. 任务创建和配置:

  任务创建入口在控制台左侧的【采集Task管理】列表中,点击【关键词泛采集(Search Engine)】;

  

  任务配置:

  2. 数据处理配置(可选)

  如果不需要处理文章可以跳过这一步!

  我。数据处理入口

  点击【配置数据替换、填充、删除等】按钮,进入数据处理配置页面;

  

  二、数据处理配置

  这个功能类似于细节提取器的配置。可以为每个字段设置删除、填充、替换、过滤功能,点击不同的字段可以切换对应的字段数据处理配置;

  注意:此字段的数据处理设置保存后,对新的采集入站数据生效,之前的入站数据将失效;

  

  三。图片下载配置

  关键词泛采集的原图可能无法正常显示(防盗链接)。如需图片请在“图片下载配置”中选择临时存储优采云或阿里云OSS或七。牛储存;

  3.采集Result:

  默认采集 字段:

  标题、内容、发布时间、作者、标签、分类、描述、关键词、网站域名(x_id);

  

  注意事项:

  4.百度高级搜索说明和技巧

  关键词泛采集支持百度高级搜索命令:

  我,采集designated网站

  采集文章网站指定的指令:site:

  采集指定网站指定关键词的文章指令(注意关键词和site指令之间有一个空格):关键词site:或site:关键词

  比如采集博客园有php关键词文章:php站点:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线