总结:用 R 收集和映射推特数据的初学者向导
优采云 发布时间: 2022-11-29 19:13总结:用 R 收集和映射推特数据的初学者向导
学习使用 R 的 twitteR 和 leaflet 包,您可以映射任何主题的推文位置。——多里斯·斯科特
文章导航
学习使用 R 的 twitteR 和 leaflet 包,您可以映射任何主题的推文位置。
当我开始学习 R 时,我还需要学习如何采集
推特数据并将其映射以用于研究目的。尽管网上有很多关于此主题的信息,但我发现很难理解与采集
和映射 Twitter 数据相关的内容。我不仅是 R 的新手,而且对各种教程中的技术术语也不熟悉。但是,尽管困难重重,我还是做到了!在本教程中,我将介绍如何采集
Twitter 数据并将其以新手程序员可以理解的方式显示在地图上。
创建应用程序
如果您没有 Twitter 帐户,首先您需要注册一个[1]。然后,转至 [2] 创建一个允许您采集
Twitter 数据的应用程序。别担心,创建应用程序非常简单。您创建的应用程序将与 Twitter 应用程序编程接口 (API) 连接。Imagine API 是一个*敏*感*词*电子个人助理。您可以使用 API 让其他程序为您做事。通过这种方式,您可以访问 Twitter API 来采集
数据。请确保不要请求太多,因为推文数据请求的数量是有限的 [3]。
有两个 API 可用于采集
推文。如果您想一次性采集
推文,请使用 REST API。如果您想在特定时间段内连续采集
,可以使用流式 API。在本教程中,我主要使用 REST API。
创建应用程序后,转到密钥和访问令牌选项卡。您需要 Consumer Key (API key)、Consumer Secret (API secret)、Access Token 和 Access Token Secret 来访问您在 R 中的应用程序。
采集
推特数据
接下来就是打开R,准备写代码了。对于初学者,我推荐 RStudio [4],它是 R 的集成开发环境 (IDE)。我发现 RStudio 在解决问题和测试代码时非常有用。R 有一个用于访问此 REST API 的包,称为 twitteR[5]。
打开 RStudio 并创建一个新的 RScript。这样做之后,您需要安装并加载 twitteR 包:
<p>install.packages("twitteR")
#安装 TwitteR
library (twitteR)
#载入 TwitteR</p>
安装并加载 twitteR 包后,您必须输入上述应用程序的 API 信息:
<p><p>api_key