抓取网页数据工具(模拟器逍遥安卓模拟器官网下载好之后打开如下图图)

优采云 发布时间: 2022-03-05 13:01

  抓取网页数据工具(模拟器逍遥安卓模拟器官网下载好之后打开如下图图)

  刚接触爬虫的时候,我们通常使用浏览器的开发工具——F12中的NetWork来抓取网页,但这有个缺点,就是如果网页加载了很多乱七八糟的东西,比如广告,各种js之类的,NewWork好像有点难,需要用更强大的工具抓包,我个人比较喜欢用Fiddler,毕竟免费好用,还有朋友用喜欢它的查尔斯也可用,仅在有限的时间内免费。

  下载链接放在这里:

  Fiddler官网下载

  查尔斯官网下载

  fiddler 在这里测试。

  安装完成后,我们打开fiddler,然后打开浏览器,可以看到现在fiddler代替了我们的开发者工具,爬取了http请求。这时候我们需要做一些设置,让它可以抓取https请求。

  

  注意

  如果您要捕获应用程序,请从仅浏览器更改为从所有进程。

  以下是应用捕获的配置。

  

  

  接下来,您需要使用真机或模拟器。这里我们推荐一个模拟器,MEO Android Emulator。

  传送门 --> MEMO Android 模拟器

  下载后打开图片如下图。

  

  这时候就需要配置模拟器了,真机也是一样的步骤~!

  

  打开cmd输入ipconfig可以查看代理服务器的主机名。代理服务器的端口号与您的提琴手的代理端口号相对应。完成此步骤后,点击保存。

  但是仍然无法捕获移动应用程序,需要安装证书。这时候打开手机自带的浏览器,在地址栏输入你的代理服务器名称+端口号,如下图

  

  点击 FiddlerRoot 证书下载并安装证书。

  你已经完成了

  现在我们可以抓取应用了,以酷航应用为例:

  

  可以看到我们已经抓取了Scoot App的查询请求,你可以重新发送,进行各种花哨的操作~

  但是如果你需要进一步了解,比如Scoot app会生成一个wtoken参数,这个参数就像网页中的js加密一样,是在apk的底部生成的,我们需要捕获它以备不时之需模拟生成,因为这会在服务器上进行验证,网页上的js加密token是一样的,需要Android****和反编译。有兴趣的童鞋也可以了解一下,需要一定的java基础!

  需要帮助的童鞋们可以留言讨论,一起学习进步~!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线