采集工具(自荐一下优采云采集平台,优采云导出文件(图) )

优采云 发布时间: 2021-10-02 04:00

  采集工具(自荐一下优采云采集平台,优采云导出文件(图)

)

  自行推荐优采云采集平台,优采云采集在网络上易于可视化和操作,功能强大,无论是导出文件(excel、CSV、sql)或者发布到wordpress,zblog、织梦等主流cms系统都非常方便。优采云采集 有免费版,无限制导出和发布。有需要的同学可以查看快速入门文档,体验一下。

  优采云采集不仅可以在处理数据的过程中对数据进行处理和过滤采集,还有对采集结果进行批量数据修改的工具,可以对数据进行更多的处理结合需求,下面简单介绍一下数据处理过滤功能:

  一、字段数据处理配置

  

  常用删除和填充:支持快速删除图片或链接,填充字段前后内容(如版权声明),也可以引用相同数据的其他字段。字符替换:主要功能是替换或删除字符,支持正则语法。HTML标签删除:用于删除HTML标签,可以指定位置和数量,支持保留文本。常用截取提取:使用正则表达式提取或替换内容,内置常用正则表达式提取,如:日期、数字、URL、数字、截取前X个字符并获取第二张图片链接等随机值& 固定值:可以为字段设置固定值或随机值,包括随机数、随机时间、随机字符串等。内容过滤:根据采集结果的内容或文本长度判断数据是否存入数据库采集;HTML标签过滤:可以过滤指定的HTML标签,如table、hr、img等(提醒:用户一般不需要配置,优采云已经默认过滤不常用的标签);高级提取:高级提取可以设置采集不在页面上显示内容,比如获取URL、图片链接、HTML标签某个属性的值等;用户一般不需要配置,优采云已经默认过滤掉不常用的标签);高级提取:高级提取可以设置采集不在页面上显示内容,比如获取URL、图片链接、HTML标签某个属性的值等;用户一般不需要配置,优采云已经默认过滤掉不常用的标签);高级提取:高级提取可以设置采集不在页面上显示内容,比如获取URL、图片链接、HTML标签某个属性的值等;

  二、结果数据批量修改工具

  对于采集结果数据,系统提供灵活的数据二次处理,快速批量完成一些耗时的操作。数据替换、填充、拦截、删除等批量操作。

  输入一个任务,切换到“Result Data & Release”选项卡,点击“Batch Edit Tool”,选择需要批量处理的函数,如下图:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线