网页手机号抓取程序(免费的临时手机号，告别垃圾短信骚扰！(组图))

优采云发布时间: 2022-02-05 07:08

　　注：本文提供的思路和代码仅用于个人测试和研究，不对目标网站造成实质性干扰，所有细节已通知网站的开发者，也请不要用于恶意目的。

　　在我的微信公众号“免费临时手机号”，有了这些公众号，你可以注册一些好玩的（或者你知道的）网站和APP，不用担心个人信息泄露。免费临时手机号不，告别垃圾邮件骚扰！

　　这个网站的域名是：

　　有了这些临时手机号，您可以：对于需要注册下载资料的论坛，只需使用临时手机号注册，完成后离开，无需担心个人手机号泄露。

　　接收信息需要填写手机号什么的，可以使用临时手机号进行验证，收到信息后就不会接到商家的电话了~

　　很多网站或APP不支持注销账号。此时，您可以将绑定的手机号码替换为临时手机号码。同时，不要忘记更改密码并清除其中的所有痕迹。我不再与自己有任何关系。

　　有了这些匿名的公共手机号码，网友们用它们做什么？

　　只需点击一个手机号码的短信接收页面，就可以看到有各种来源的短信验证码。我们可以很容易的看到这个手机号注册了哪些网站和APP，然后用手机验证码登录这些网站或者APP，说不定还能看到很多有趣的内容哟。

　　让我吃惊的是，这个手机号的短信有23000多页。如果每页有 10 条消息，则有超过 230,000 条短信。整个网站有这么多手机号。，应该有大量的短信存储在服务器上。强烈建议网站开发者可以删除很久以前的记录，只保留最近几天的记录。一方面可以缓解服务器的压力，也可以防止一些无聊的人（比如我？）用爬虫爬取数据。什么，哈哈~

　　那就对了！为了看看大家用这个手机号注册了哪些网站或者APP，我用Python写了一个爬虫脚本，它会自动翻页抓取一些短信，然后解析出信息的来源（通常第一个大括号[])中的内容，分析频率，说不定还能找到一些网站或者你没听说过的APP，哈哈。

　　以下是完整代码，附上一些注释，理解无压力：

　　# 自动抓取云端短信网页上的验证码短信并分析来源

　　# 青2019.03.21

　　#

　　重新*敏*感*词*

　　*敏*感*词*时间

　　导入请求

　　从 bs4 导入 BeautifulSoup

　　def get_page_info（链接，f）：

　　header={ # 假标题

　　'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/4< @6.0.2490.80 Safari/537.36',

　　'推荐人':'',

　　}

　　r = requests.get（链接，标头=标头）

　　汤 = BeautifulSoup(r.content, "html.parser")

　　table = soup.find_all("div", class_="sms-content-table") # 有两个sms-content-table表，第一个是最新的4条信息，第二个是所有信息.

　　infos = table[1].select('tbody tr')

　　信息中的信息：

　　content = info.find_all("td")[2].text[1:-1] # 去掉开头和结尾的空格，这是每条短信的内容，可以写入文件。

　　打印（内容）

　　print("-"*30)

　　from_name = re.match(r'[(.*?)]', content) # 第一个大括号通常是源名称，(.*?) 用于最短匹配，否则默认(.*)是贪心匹配。

　　如果（从名称）：

　　from_name = from_name.group(0)[1:-1] # 去掉开头和结尾的大括号 []

　　# 打印（from_name）

　　f.write(from_name + '\n') # 逐行写入txt文档。事实上，没有必要写文件。这里的主要目的是方便您自己查看。

　　def sort_result（文件名）：

　　result = [] # 逐行读取文本文档中的源名称并生成列表

　　使用 open(filename,'r') 作为 f：

　　对于 f 中的行：

　　result.append(line.strip('\n').split(',')[0])

　　name_count = {} # 定义一个元组，key为列表中的元素，key为出现次数

　　for i in set(result): # set 用于删除重复元素。

　　name_count[i] = result.count(i)

　　sorted_dict = sorted(name_count.items(), key=lambda d:d[1], reverse = True) # 按键值从大到小排序字典。

　　对于 sorted_dict 中的项目：

　　打印（项目 [0] + '：' + str（项目 [1]））

　　如果 __name__ == '__main__'：

　　filename = "info.txt" # 指定一个文本文件来保存数据

　　f = 打开（文件名，'w'）

　　for i in range(1,101): # 自动翻页，这里可以设置抓取多少页（例如100页）

　　print("\n页 %s\n" % i)

0

2022-02-05

网页手机号抓取程序

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

网页手机号抓取程序(免费的临时手机号，告别垃圾短信骚扰！(组图))

0 个评论

发起人