网页手机号抓取程序(免费的临时手机号,告别垃圾短信骚扰!(组图))

优采云 发布时间: 2022-02-05 07:08

  网页手机号抓取程序(免费的临时手机号,告别垃圾短信骚扰!(组图))

  注:本文提供的思路和代码仅用于个人测试和研究,不对目标网站造成实质性干扰,所有细节已通知网站的开发者,也请不要用于恶意目的。

  在我的微信公众号“免费临时手机号”,有了这些公众号,你可以注册一些好玩的(或者你知道的)网站和APP,不用担心个人信息泄露。免费临时手机号不,告别垃圾邮件骚扰!

  这个网站的域名是:

  有了这些临时手机号,您可以: 对于需要注册下载资料的论坛,只需使用临时手机号注册,完成后离开,无需担心个人手机号泄露。

  接收信息需要填写手机号什么的,可以使用临时手机号进行验证,收到信息后就不会接到商家的电话了~

  很多网站或APP不支持注销账号。此时,您可以将绑定的手机号码替换为临时手机号码。同时,不要忘记更改密码并清除其中的所有痕迹。我不再与自己有任何关系。

  有了这些匿名的公共手机号码,网友们用它们做什么?

  只需点击一个手机号码的短信接收页面,就可以看到有各种来源的短信验证码。我们可以很容易的看到这个手机号注册了哪些网站和APP,然后用手机验证码登录这些网站或者APP,说不定还能看到很多有趣的内容哟。

  让我吃惊的是,这个手机号的短信有23000多页。如果每页有 10 条消息,则有超过 230,000 条短信。整个网站有这么多手机号。,应该有大量的短信存储在服务器上。强烈建议网站开发者可以删除很久以前的记录,只保留最近几天的记录。一方面可以缓解服务器的压力,也可以防止一些无聊的人(比如我?)用爬虫爬取数据。什么,哈哈~

  那就对了!为了看看大家用这个手机号注册了哪些网站或者APP,我用Python写了一个爬虫脚本,它会自动翻页抓取一些短信,然后解析出信息的来源(通常第一个大括号[])中的内容,分析频率,说不定还能找到一些网站或者你没听说过的APP,哈哈。

  以下是完整代码,附上一些注释,理解无压力:

  # 自动抓取云端短信网页上的验证码短信并分析来源

  # 青2019.03.21

  #

  重新*敏*感*词*

  *敏*感*词*时间

  导入请求

  从 bs4 导入 BeautifulSoup

  def get_page_info(链接,f):

  header={ # 假标题

  'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/4< @6.0.2490.80 Safari/537.36',

  '推荐人':'',

  }

  r = requests.get(链接,标头=标头)

  汤 = BeautifulSoup(r.content, "html.parser")

  table = soup.find_all("div", class_="sms-content-table") # 有两个sms-content-table表,第一个是最新的4条信息,第二个是所有信息.

  infos = table[1].select('tbody tr')

  信息中的信息:

  content = info.find_all("td")[2].text[1:-1] # 去掉开头和结尾的空格,这是每条短信的内容,可以写入文件。

  打印(内容)

  print("-"*30)

  from_name = re.match(r'[(.*?)]', content) # 第一个大括号通常是源名称,(.*?) 用于最短匹配,否则默认(.*)是贪心匹配。

  如果(从名称):

  from_name = from_name.group(0)[1:-1] # 去掉开头和结尾的大括号 []

  # 打印(from_name)

  f.write(from_name + '\n') # 逐行写入txt文档。事实上,没有必要写文件。这里的主要目的是方便您自己查看。

  def sort_result(文件名):

  result = [] # 逐行读取文本文档中的源名称并生成列表

  使用 open(filename,'r') 作为 f:

  对于 f 中的行:

  result.append(line.strip('\n').split(',')[0])

  name_count = {} # 定义一个元组,key为列表中的元素,key为出现次数

  for i in set(result): # set 用于删除重复元素。

  name_count[i] = result.count(i)

  sorted_dict = sorted(name_count.items(), key=lambda d:d[1], reverse = True) # 按键值从大到小排序字典。

  对于 sorted_dict 中的项目:

  打印(项目 [0] + ':' + str(项目 [1]))

  如果 __name__ == '__main__':

  filename = "info.txt" # 指定一个文本文件来保存数据

  f = 打开(文件名,'w')

  for i in range(1,101): # 自动翻页,这里可以设置抓取多少页(例如100页)

  print("\n页 %s\n" % i)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线