qq空间文章采集软件(Linux+Chrome火狐+phantomjs驱动+requests+火狐驱动)

优采云 发布时间: 2022-01-01 05:13

  qq空间文章采集软件(Linux+Chrome火狐+phantomjs驱动+requests+火狐驱动)

  一个。功能需求分析:

  很多情况下,我们需要做这样的事情:我们想下载我们QQ专区相册的高清图片,怎么做?在网上找软件?答案是不。原因一:网上很多软件不知道有没有病毒。其次,它可能会捆绑很多不必要的软件,这对我们不友好,有些需要成本。我该怎么办?没有什么可做的吗?答案是不。我们可以利用爬虫技术完成一个QQ或者微信相册空间下载器。根据不同的功能需求,我们可以对其进行改进,使其成为可批量下载的QQ空间下载器,或者使其成为多线程和图形化的。*敏*感*词*界面采集器

  两个。环境设置:

  Window+Chrome Firefox浏览器+Firefox驱动+请求/Linux+phantomjs+phantomjs驱动+请求

  三个。技术点分析:

  QQ空间是腾讯的产品。通过浏览器F12解析请求我们得到专辑相关的ajax链接:

  通过实验,我们得到了几个与数据请求成功相关的参数:

  g_tk,uin,hostUin,pageNum,pagestart, topicId

  hostuin是要下载的QQ号,因为要先登录才能下载相册,所以uin是你自己的QQ,topicid是可以通过第一个链接获取的QQ相册id,g_tk是一个数字QQ加密算法生成的字符串,用户获取登录状态后必须添加g_tk才能正确返回数据,然后通过获取的图片链接下载图片

  一个。技术难点分析:

  其他参数很容易获得。这个g_tk困扰了我很久。后来通过分析请求,在网上找资料,终于解决了问题。首先,由于Firefox的控制台功能,我们需要了解g_tk是如何计算的。还不够,这里我们用Firefox+Firebug来做,其他浏览器也应该有相应的插件F12打开Firebug控制台,登录QQ空间后刷新界面,然后点击“脚本”

  功能(一){

  a=QZFL.util.URI(a);

  变量 b;

  a&&(a.host&&0

  a.host&&0

  b||(b=QZFL.cookie.get("skey")||QZFL.cookie.get("rv2"));

  a=5381;

  for(var c=0,d=b.length;c

  a+=(a

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线