网页手机号抓取程序(免费的临时手机号,告别垃圾短信骚扰!(组图))
优采云 发布时间: 2022-02-05 07:08网页手机号抓取程序(免费的临时手机号,告别垃圾短信骚扰!(组图))
注:本文提供的思路和代码仅用于个人测试和研究,不对目标网站造成实质性干扰,所有细节已通知网站的开发者,也请不要用于恶意目的。
在我的微信公众号“免费临时手机号”,有了这些公众号,你可以注册一些好玩的(或者你知道的)网站和APP,不用担心个人信息泄露。免费临时手机号不,告别垃圾邮件骚扰!
这个网站的域名是:
有了这些临时手机号,您可以: 对于需要注册下载资料的论坛,只需使用临时手机号注册,完成后离开,无需担心个人手机号泄露。
接收信息需要填写手机号什么的,可以使用临时手机号进行验证,收到信息后就不会接到商家的电话了~
很多网站或APP不支持注销账号。此时,您可以将绑定的手机号码替换为临时手机号码。同时,不要忘记更改密码并清除其中的所有痕迹。我不再与自己有任何关系。
有了这些匿名的公共手机号码,网友们用它们做什么?
只需点击一个手机号码的短信接收页面,就可以看到有各种来源的短信验证码。我们可以很容易的看到这个手机号注册了哪些网站和APP,然后用手机验证码登录这些网站或者APP,说不定还能看到很多有趣的内容哟。
让我吃惊的是,这个手机号的短信有23000多页。如果每页有 10 条消息,则有超过 230,000 条短信。整个网站有这么多手机号。,应该有大量的短信存储在服务器上。强烈建议网站开发者可以删除很久以前的记录,只保留最近几天的记录。一方面可以缓解服务器的压力,也可以防止一些无聊的人(比如我?)用爬虫爬取数据。什么,哈哈~
那就对了!为了看看大家用这个手机号注册了哪些网站或者APP,我用Python写了一个爬虫脚本,它会自动翻页抓取一些短信,然后解析出信息的来源(通常第一个大括号[])中的内容,分析频率,说不定还能找到一些网站或者你没听说过的APP,哈哈。
以下是完整代码,附上一些注释,理解无压力:
# 自动抓取云端短信网页上的验证码短信并分析来源
# 青2019.03.21
#
重新*敏*感*词*
*敏*感*词*时间
导入请求
从 bs4 导入 BeautifulSoup
def get_page_info(链接,f):
header={ # 假标题
'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/4< @6.0.2490.80 Safari/537.36',
'推荐人':'',
}
r = requests.get(链接,标头=标头)
汤 = BeautifulSoup(r.content, "html.parser")
table = soup.find_all("div", class_="sms-content-table") # 有两个sms-content-table表,第一个是最新的4条信息,第二个是所有信息.
infos = table[1].select('tbody tr')
信息中的信息:
content = info.find_all("td")[2].text[1:-1] # 去掉开头和结尾的空格,这是每条短信的内容,可以写入文件。
打印(内容)
print("-"*30)
from_name = re.match(r'[(.*?)]', content) # 第一个大括号通常是源名称,(.*?) 用于最短匹配,否则默认(.*)是贪心匹配。
如果(从名称):
from_name = from_name.group(0)[1:-1] # 去掉开头和结尾的大括号 []
# 打印(from_name)
f.write(from_name + '\n') # 逐行写入txt文档。事实上,没有必要写文件。这里的主要目的是方便您自己查看。
def sort_result(文件名):
result = [] # 逐行读取文本文档中的源名称并生成列表
使用 open(filename,'r') 作为 f:
对于 f 中的行:
result.append(line.strip('\n').split(',')[0])
name_count = {} # 定义一个元组,key为列表中的元素,key为出现次数
for i in set(result): # set 用于删除重复元素。
name_count[i] = result.count(i)
sorted_dict = sorted(name_count.items(), key=lambda d:d[1], reverse = True) # 按键值从大到小排序字典。
对于 sorted_dict 中的项目:
打印(项目 [0] + ':' + str(项目 [1]))
如果 __name__ == '__main__':
filename = "info.txt" # 指定一个文本文件来保存数据
f = 打开(文件名,'w')
for i in range(1,101): # 自动翻页,这里可以设置抓取多少页(例如100页)
print("\n页 %s\n" % i)