关键词采集器(2021年苹果AppStore投入开销,进行一下统计并回顾)

优采云 发布时间: 2022-02-20 03:07

  关键词采集器(2021年苹果AppStore投入开销,进行一下统计并回顾)

  背景概述

  年底,我想回顾一下2021年苹果App Store的支出情况,做个统计,回顾一下哪些应用是值得的,哪些是不值钱的。购买记录分布在mac store和app stroe中。只需从Apple id关联的邮件账单中直接快速提取本年度的计费邮件,通过网页采集工具简单配置规则,即可实现邮件中的回执。快速采集 凭据并导出到本地 Excel。

  准备材料

  所有 Apple 发送的收据电子邮件

  优采云采集器客户端

  操作流程

  0)去优采云采集器官网下载客户端并安装

  

  流程参考官方文档

  1)邮箱放在计费文件夹中

  创建一个新的“Apple Billing 2021”文件夹

  在邮箱中搜索关键词“Apple 提供的收据”>选择所有匹配的文档和邮件移动到“Apple 2021 bills”

  

  2)选择“流程图模式”

  这种模式比较灵活,适用于不需要打开新页面的邮箱等网页数据采集

  

  3)设置邮件页面地址

  

  我使用的阿里企业邮箱需要预登录才能直接进入邮箱列表页面。

  

  也可以直接在右上角输入预登录,输入邮箱账号密码完成登录。

  4)根据点击操作配置对应的流程图

  总共有四个操作。具体操作和方法请参考官网视频教程:数据采集教程流程图模式第一采集案例_优采云采集器()

  点击1:打开网页

  点击2:“Apple Billing 文件夹”

  循环栏点击:创建邮件列表点击循环

  插入 3 秒“定时等待”

  5)设置提取数据,修改字段名

  在消息详情页面手动选择需要 采集 的每个字段

  

  我将购买平台、支付日期、金额、购买的应用内容、应用图标、下次续订时间设置为采集内容。

  对所有需要 采集 的字段进行统一名称修改

  

  最终采集流程脚本配置效果

  

  6)运行采集脚本

  

  7)导出采集数据内容

  选择保存文件位置并将其导出。

  注意默认文件名可能太长无法保存,本地找不到文件或者有bug,修改文件名后不会出现这种现象。

  经验和经验

  如果没有设置延迟,可能会在页面还没有跳过的时候循环进入第二封邮件,导致上一封邮件的内容和信息被采集重复。

  谷歌邮箱在这个浏览器中根本无法登录,icloud邮箱也无法登录,会提示浏览器安全性太低,服务异常。

  如果你使用icloud邮箱或者谷歌邮箱,建议在使用谷歌内核浏览器的情况下使用webscraper插件,会更加方便友好,直接在当前默认主流浏览器上运行采集@ >。操作方法请参考豆瓣爬取教程:“零码”编写爬虫下载你所有的豆瓣影评

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线