如何利用采集器采集的平台的url下载采集文件目录

优采云 发布时间: 2021-08-06 18:01

  如何利用采集器采集的平台的url下载采集文件目录

  利用采集器采集的平台的url,下载采集的文件,然后去放置java后台的目录找下,index目录一般就是本地文件目录。建议你自己先动手,最起码了解一下采集器,或者多问问牛人。

  应该是那个excel下面的“simulation”文件夹,本地的应该也是那个project,可以自己建一个脚本,把url抓过来,然后直接放到java脚本里。

  lz学学爬虫吧。简单来说就是selenium。

  前端爬虫发,后端app的话,

  需要读懂中cookie的实现原理,把url的httpget拿过来,然后做一个简单的模拟登录,然后直接把获取的信息放到爬虫里面去,你得说清楚,

  你好,这是java后端基础中的模拟登录功能,自己封装一个小功能用于管理和统计:然后集中挂机工作,每天登录过的url,更新的url,需要的工具,都记录进行统计吧。

  不考虑学习的可能。如果是要爬取手机号码码段的话就不需要爬取相关的固定url,如果觉得手机号难道就是空格?那是没有抓到核心需求,那么可以做个模拟登录的功能,获取账号密码为核心如果有变量需要填写,可以参考requests或aiohttp的define方法方法。前端可以用jquery来实现。有些技术在学习中可能比实际工作需要多一些,但是一旦掌握,非常有用,做项目就可以解决。比如前端中的ajax的使用。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线