优采云采集器,标签编辑使用教学,帮助大家更好的使用
优采云 发布时间: 2021-07-30 18:03优采云采集器,标签编辑使用教学,帮助大家更好的使用
优采云采集器是一款专业的互联网数据采集、处理、分析、挖掘软件,多数据库支持,用户可以保存和发布多种类型的Access/MySQL/MsSQL/Sqlite/Oracle数据库,功能是内容丰富,实用且易于操作。它支持各种文件数据格式。可以轻松下载任何格式的文件,例如图片、压缩文件和视频。兼容性极强。适用于各种微软系统,运行流畅,完美匹配。多种搜索引擎,强大的数据搜索能力,行业领先,用户无需下载其他搜索软件,今天小编为大家带来优采云采集器,标签编辑与使用教学,助您更好的使用本篇软件!
优采云采集器标签编辑使用教学图1
优采云采集器tag 编辑
编辑数据内容标签定义,数据获取方式如下
A)。从源代码中获取数据
B)。生成固定格式数据
C)。已经有标签组合
A)。从源码中获取数据:可以从源码中准确设置标签的来源,返回默认页面的头信息和网页地址,
或分页、循环块、多页。
数据提取方法包括:
A.a)捕获前后
A.b)。定期提取
交流)。文本提取
A.d).Xpath 提取
A.e).JSON 提取
B)。生成固定格式数据:可生成固定字符串、系统时间、随机字符串、随机数、系统时间戳、随机抽取信息
C)。现有标签组合:可以组合现有标签生成新的标签内容
A.a)。捕获前后
通过设置开始和结束字符串来获取中间的字符,可以在开始和结束字符串中设置通配符(*)
A.b)。定期提取
支持两种正则,一种是纯正则,一种是参数正则化。
先介绍纯正则,例如
如:前串(?[\s\S]*?)后串,这个正则表达式的效果其实和截取前后一样,
如果需要得到所有的代码,就是^(?[\s\S]*?)$。该功能的使用需要一定的规律性。
关于参数的规律性,内容是通过参数组合生成的。
例如标题为“新用户注册”,作者为“神秘嘉宾”,代码如下:
新用户注册