优采云采集器,标签编辑使用教学,帮助大家更好的使用

优采云 发布时间: 2021-07-30 18:03

  优采云采集器,标签编辑使用教学,帮助大家更好的使用

  优采云采集器是一款专业的互联网数据采集、处理、分析、挖掘软件,多数据库支持,用户可以保存和发布多种类型的Access/MySQL/MsSQL/Sqlite/Oracle数据库,功能是内容丰富,实用且易于操作。它支持各种文件数据格式。可以轻松下载任何格式的文件,例如图片、压缩文件和视频。兼容性极强。适用于各种微软系统,运行流畅,完美匹配。多种搜索引擎,强大的数据搜索能力,行业领先,用户无需下载其他搜索软件,今天小编为大家带来优采云采集器,标签编辑与使用教学,助您更好的使用本篇软件!

  

  优采云采集器标签编辑使用教学图1

  优采云采集器tag 编辑

  编辑数据内容标签定义,数据获取方式如下

  A)。从源代码中获取数据

  B)。生成固定格式数据

  C)。已经有标签组合

  A)。从源码中获取数据:可以从源码中准确设置标签的来源,返回默认页面的头信息和网页地址,

  或分页、循环块、多页。

  数据提取方法包括:

  A.a)捕获前后

  A.b)。定期提取

  交流)。文本提取

  A.d).Xpath 提取

  A.e).JSON 提取

  B)。生成固定格式数据:可生成固定字符串、系统时间、随机字符串、随机数、系统时间戳、随机抽取信息

  C)。现有标签组合:可以组合现有标签生成新的标签内容

  A.a)。捕获前后

  通过设置开始和结束字符串来获取中间的字符,可以在开始和结束字符串中设置通配符(*)

  A.b)。定期提取

  支持两种正则,一种是纯正则,一种是参数正则化。

  先介绍纯正则,例如

  如:前串(?[\s\S]*?)后串,这个正则表达式的效果其实和截取前后一样,

  如果需要得到所有的代码,就是^(?[\s\S]*?)$。该功能的使用需要一定的规律性。

  关于参数的规律性,内容是通过参数组合生成的。

  例如标题为“新用户注册”,作者为“神秘嘉宾”,代码如下:

  新用户注册

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线