采集器,请问我如何接入一键采集上传常见的细节问题

优采云 发布时间: 2021-04-14 04:07

  采集器,请问我如何接入一键采集上传常见的细节问题

  一键采集上传常见的细节问题,比如:可以同时采集也可以只采集上传成功页面页面地址显示错误一条一条去翻页面选择提交审核未通过一条条解析页面(很耗时)、一个页面一个用户名账号下采集页面太多而无法统计每个页面下浏览量的变化(不能以数量和深度统计)只有了解了细节问题,才能采集各种有价值的页面,才能正确处理一键采集上传细节问题。本人准备接下来开发一款采集器,请问我如何接入一键采集上传流程?。

  1、页面地址上传有问题。

  2、没有按照正确的接口发送上传请求。

  3、上传资源过大,导致显示在页面后一长串没有意义的数字。

  4、页面上设置的要点只采取了“个性化”,忽略了服务端同步数据(例如系统要同步数据库数据,例如git)。

  5、带来不必要的额外的上传资源,例如对服务端带来seo,ip劫持等。关于问题1,检查你的服务端是否要回调同步数据的请求,如果有,那么服务端可能在进行同步。关于问题2,可以使用ci,

  123123没用过,提供一个页面上传的实际方案——用脚本直接操作上传url和动态数据,点击上传右键查看源码打开;自己配置脚本名称,脚本地址。上传成功后,点击generatechange,选择新地址对应的动态数据,重新保存动态数据即可。例如:页面上采集“双12”购物清单一列,源码:-list.html。

  上传成功后查看源码:;selected_item="mall_buy_date";file_path="//browser/html/mall_list/"window.get_shell(selected_item);。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线