网页数据抓取([讲堂]前端使用JavaScript耍花样)

优采云 发布时间: 2021-10-25 09:16

  网页数据抓取([讲堂]前端使用JavaScript耍花样)

  出处,忘记复制地址:cry:

  [大小=中等]

  第一个技巧:判断访问是来自浏览器,还是直接跳转到网站的一些与数据无关的页面。

  这一招后不久,人们就开始模仿谷歌、百度等浏览器或爬虫。套路已经过时了。

  第二招:设置登录,需要登录才能看到有用的数据。但很快有人在爬行之前模拟了登录程序。套路失败了。

  第三招:设置验证码,不利于用户体验。为了弥补,在输入验证码之前将验证码设置为访问N次以上。

  没过多久,人们就开始寻找代理 IP 并设置 IP 阵列,动态循环。套路失败了。

  第四招:此招的效果与第二招基本相同。它监控一段时间内某个 IP 的访问次数。

  如果访问次数超过N,则会跳转到错误页面或提醒访问过于频繁。由于第二招被打破,它失败了。

  第五招:利用cookies记录用户访问信息,在用户访问过于频繁时给出验证码。

  不过最后我想出了另外一个办法,就是用按钮精灵控制360定时删除cookie。我认为这个技巧不安全,所以我考虑了其他技巧。

  第六招:将数据中的重要信息加密或转化为图片,然后对别人加密的数据和图片数据进行分析。还是不够安全。

  技巧七:前端用JavaScript玩花样[/size]

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线