python抓取网页数据(如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化)

优采云 发布时间: 2022-03-21 05:12

  python抓取网页数据(如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化)

  前几天给大家分享了如何使用Python词云和wordart可视化工具对朋友圈数据进行可视化,使用Python网络爬虫抓取微信好友数量和微信男女比例好友,并使用Python网络爬虫抓取微信好友位置、省市分布及其可视化。感兴趣的朋友可以点击查看详情。内容不难。即使你是新手,也可以通过代码来抓取。今天小编就继续和大家分享如何使用Python网络爬虫抓取微信好友的签名并进行可视化展示。具体教程如下。

  1、代码实现还是基于itchat库。关于这个神奇的库,在之前的文章中已经提到过,不再赘述。下图中代码的作用是实现签名抓取和数据提取。然后将捕获的数据写入本地文件。

  

  2、程序运行后,得到一个文本文件,如下图。

  

  第一行第一个签名是小编自己的,博学,审问,缜密,有洞察力,敬业。后续签名按照微信*敏*感*词*中名片的顺序呈现。朋友有微信签名会被抓取,没有签名则会被忽略。

  3、 随机验证微信好友的签名。我们以小编的微信签名为例。她的签名是“得自在,失自在,自在,顺其自然,为之奋斗!” ,然后在TXT文件中搜索,可以看到它的签名确实存在,如下图所示。

  

  4、下一步是可视化这个文件的词云。继续写代码,如下图所示。

  

  代码的关键部分是需要底图和字体。底图编辑器使用 Luffy。小心使用带有白色底图的图片,否则词云可视化效果不佳。

  

  对于字体,您需要提前下载它们。可视化展示也可以参考这篇文章:如何使用Python词云和wordart可视化工具可视化朋友圈数据。

  5、运行程序后,还需要扫码授权。程序运行如下图所示。

  

  红色代码部分在上一篇文章文章中已经详细说明,不再赘述。

  6、之后,我们可以看到一个漂亮的词云图像显示在我们面前,如下图所示。

  

  根据词云的可视化效果,关键词:生命、努力、时间、我们、哈哈哈等词出现的频率更高。可以感觉到,我的微信朋友们的签名,基本都突出了积极、乐观、珍惜时间、努力工作的特点。

  劝你吸收金袍,劝你珍惜青春。花可以折直,一定要折,不要等花空了才折断枝条。祝你周末愉快,人生苦短,我用Python~~

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线