jQuery选择器的采集规则和替换规则有什么区别?
优采云 发布时间: 2021-07-10 07:10jQuery选择器的采集规则和替换规则有什么区别?
采集rules:
{
'规则名':['jQuery选择器','要采集的属性'],
'规则名2':['jQuery选择器','要采集的属性']
}
规则库是用jQuery选择器编写的,规则名称有自己的定义,对应返回的key。例如:
{
//采集id为one这个元素里面的纯文本内容
'text' : ['#one','text'],
//采集class为two下面的超链接的链接
'link' : ['.two>a','href'],
//采集class为two下面的第二张图片的链接
'img' : ['.two>img:eq(1)','src'],
//采集span标签中的HTML内容
'other' : ['span','html']
};
切片选择器:
切片选择器也称为“区域选择器”,意思是按照规则对HTML内容进行切片,然后分别在这些切片中进行相关选择。 采集列表时,建议设置该参数。
// 切片选择器
'.items-area>.item'
替换规则:
用于全局替换对应的内容,如下
解决乱码:
乱码问题很多,一般可以通过设置输入输出参数来解决。常见的网页编码有:utf-8、gbk、gb2312、iso-8859-1、big5、euc-krd等
基于querylist实现,本工具仅供学习,参考使用!