python网页数据抓取(如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化)
优采云 发布时间: 2021-09-09 04:12python网页数据抓取(如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化)
前几天跟大家分享了如何使用Python词云和wordart可视化工具将朋友圈数据可视化,使用Python网络爬虫抓取微信好友数和男女微信好友比例,并使用Python网络爬虫捕捉微信好友的省市分布及其可视化。感兴趣的朋友可以点击进入查看详情。内容不难。即使你是新手,也可以通过代码爬取。今天小编继续跟大家分享如何使用Python网络爬虫抓取微信好友的签名以及他们的视觉展示。具体教程如下图。
1、代码实现还是基于itchat库。关于这个神奇的库,我在之前的文章中提到过,不再赘述。下图中代码的作用是实现签名捕获和数据提取。然后将捕获的数据写入本地文件。
2、程序运行完毕后,得到一个文本文件,内容如下图。
第一行的第一个签名是编辑自己的,博学的,审问的,细心的,有洞察力的,有责任心的。后续签名按照微信*敏*感*词*中名片的先后顺序呈现。如果好友有微信签名,则会被抓取,如果没有签名,则忽略。
3、 随机验证一个微信好友的签名,然后以编辑主题的微信签名为例。她的签名是“要安全,要失去,要冷静,要顺其自然,要无可避免!” ”,在TXT文件中搜索后,可以看到签名确实在里面,如下图所示。
4、接下来,我们将这个文件的词云可视化。继续写代码,如下图所示。
代码的关键部分是需要底图和字体。底图的编辑器使用路飞。注意使用带有白色底图的图片,否则词云可视化效果不好。
需要提前下载字体。可视化也可以参考这个文章:如何使用Python词云和艺术字可视化工具来可视化Moments数据。
5、程序运行后,还需要扫码授权。程序运行如下图所示。
红色代码部分在之前的文章文章中已经有详细说明,不再赘述。
经过6、后我们可以看到展现在我们面前的美丽的词云图片,如下图所示。
根据词云的可视化,关键词:生命、努力、时间、我们、哈哈哈……词出现的频率更高。能感受到编辑的微信朋友们的签名基本突出了积极、乐观、珍惜时间、努力工作的特点。
说服国王拿下金榛子,说服他在他十几岁的时候拿回来。花可以折直,一定要折,没有花的不能折。祝大家周末愉快,人生苦短,我用Python~~