优采云导航:优采云采集器优采云关键词关键词泛采集(搜索引擎)

优采云 发布时间: 2021-08-26 04:06

  优采云导航:优采云采集器优采云关键词关键词泛采集(搜索引擎)

  优采云Navigation: 优采云采集器 优采云控制台

  关键词泛采集(搜索引擎)

  关键词泛采集 通过搜索引擎搜索关键词、采集搜索结果链接内容(系统会智能识别标题、正文、日期等),使用方法非常很简单,输入对应的关键词OK即可。

  使用步骤:

  1. 任务创建和配置:

  任务创建入口在控制台左侧的【采集Task管理】列表中,点击【关键词泛采集(Search Engine)】;

  

  任务配置:

  2. 数据处理配置(可选)

  如果不需要处理文章可以跳过这一步!

  我。数据处理入口

  点击【配置数据替换、填充、删除等】按钮,进入数据处理配置页面;

  

  二、数据处理配置

  这个函数其实就是明细提取器的字段数据处理配置。在采集之前,您可以为每个字段设置删除、填充、替换等功能。点击不同的字段名称可以切换对应的字段数据处理配置,采集 时会自动执行已经设置好的数据处理。详情请参考extractor字段的数据处理配置详情。设置完成后记得点击右上角保存;

  注意:该字段的数据处理设置对新的采集入站数据有效,之前入站的数据无效;

  

  三、图片下载配置

  关键词泛采集的原图可能无法正常显示。如需保证图片显示或保存图片到服务器,请在“图片下载配置”中选择临时存储优采云或阿里云OSS或七牛存储;

  3.采集Result:

  默认采集 字段:

  标题、内容、发布时间、作者、标签、分类、描述、关键词、网站域名(x_id);

  

  注意事项:

  4. 高级搜索说明和技巧

  关键词泛采集支持高级搜索命令:

  我,采集designated网站

  采集文章网站指定的指令:site:

  采集指定网站指定关键词的文章指令(注意关键词和site指令之间有一个空格):关键词site:或site:关键词

  比如采集博客园有php关键词文章:php站点:

  

  优采云Navigation: 优采云采集器 优采云控制台

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线