文章采集链接(github-excel140040465/ppt的wifi密码数据挖掘-刘雪的个人博客)
优采云 发布时间: 2022-02-24 23:04文章采集链接(github-excel140040465/ppt的wifi密码数据挖掘-刘雪的个人博客)
文章采集链接:github-excel140040465/ppt的wifi密码数据挖掘-刘雪的个人博客参考:运用pptwifi密码大数据挖掘文章摘要本文将ppt文件中公开公布的wifi密码(chm格式文件)整理为csv文件(本文公布的所有ppt中的wifi密码),通过mongodb表格实现数据分析,探究pptwifi密码的分布情况。
设计理论基础基本概念wifi密码表示的是一个公开的设备和密码,要进行下面的工作,我们需要先要将wifi密码表进行压缩,使其和内存表结构基本一致,为后面处理打好基础。一个完整的密码组成分成了以下3个部分。
1、字符长度:位数
2、单词词典长度:词典数量
3、字符长度:字符串长度
3、分组(每次选择一个分组进行操作)
4、抽样(每次选择一个密码进行操作)
5、词典(每个字符和上一次密码的关系)获取pptwifi密码表前面我们先将ppt的wifi密码进行了字符长度的压缩,得到一个csv文件。
下面我们就对其进行下面的操作:
1、将ppt中所有的wifi密码转化为csv文件
2、重命名数据抽取数据我们现在已经知道了ppt中所有的wifi密码,我们可以直接从csv文件中找到其中的每个密码对应的chm数据表。现在我们从这个密码表中(注意,必须是从chm文件开始的密码文件开始的),找到该密码所在的分组,即对应的chm(一种硬编码),将其对应分组中的密码进行词频统计。理论基础:硬编码这种方式就是将公开的数据或者图片、声音等等硬编码到程序中,记为ns。
那么这种方式也就是指的是软编码(软编码一般是数学公式中)。就是我们做二分查找的时候,所用到的对数形式得到了一个值,然后将其进行重命名,写到ns值中。我们通过所得到的chm数据,我们可以找到密码的词汇表。因为wifi密码是一种csv数据格式的数据文件,那么我们知道每个密码包含了两个部分:一个是密码的正文,这个就是我们需要关注的部分;第二个是密码的chm词频统计。
我们使用spell库进行相应词频统计,即tf_int,tf_float。但是chm词频统计的数据是固定的,我们可以将密码按不同的密码进行分组,即以词频和字典的结构来分组。这里的chm表示的是一个公开的文件(例如),而wifi是一个私有的小程序(例如),且这个小程序包含了内存表,我们可以对其进行操作。查看方式:选择command,点击右键即可查看。相关文章运用pptwifi密码大数据挖掘(chm,url)。