云端采集器(如何使用ChromeF12方式进行采集(图)技术? )
优采云 发布时间: 2022-04-11 20:17云端采集器(如何使用ChromeF12方式进行采集(图)技术?
)
前提
采集使用POST方式,首先需要学习抓包技术,使用Chrome F12(开发者工具->网络)或Fiddler工具抓包。
第一步是设置POST请求
创建一个新任务。第一步,选择POST请求,出现POST请求数据的设置。
通过前面的抓包工作,定位到我们需要的POST请求,复制POST请求的URL和POST数据。一般来说,我们直接复制整个请求(包括URL、Header、POST Body),然后点击按钮从剪贴板粘贴Header,一键复制请求数据。
复制完成后,需要分析POST数据找到参数,如分页、查询关键词等,使用批量URL参数进行处理。
第二步,配置抓包数据
大多数情况下,POST请求的返回数据是JSON格式的。第二步,我们可以直接将引擎切换到JSON引擎。其余可以参考JSON数据采集
标题设置
在使用POST方式采集的时候,往往需要处理Header,因为有些网站或者APP会在Header里面放一些验证,比如常见的Auth。
这些可以在第 3 步 -> 指定标题设置中进行修改。包括UA、Cookie等Header。