关键词采集器(2021年苹果AppStore投入开销,进行一下统计并回顾)
优采云 发布时间: 2022-02-20 03:07关键词采集器(2021年苹果AppStore投入开销,进行一下统计并回顾)
背景概述
年底,我想回顾一下2021年苹果App Store的支出情况,做个统计,回顾一下哪些应用是值得的,哪些是不值钱的。购买记录分布在mac store和app stroe中。只需从Apple id关联的邮件账单中直接快速提取本年度的计费邮件,通过网页采集工具简单配置规则,即可实现邮件中的回执。快速采集 凭据并导出到本地 Excel。
准备材料
所有 Apple 发送的收据电子邮件
优采云采集器客户端
操作流程
0)去优采云采集器官网下载客户端并安装
流程参考官方文档
1)邮箱放在计费文件夹中
创建一个新的“Apple Billing 2021”文件夹
在邮箱中搜索关键词“Apple 提供的收据”>选择所有匹配的文档和邮件移动到“Apple 2021 bills”
2)选择“流程图模式”
这种模式比较灵活,适用于不需要打开新页面的邮箱等网页数据采集
3)设置邮件页面地址
我使用的阿里企业邮箱需要预登录才能直接进入邮箱列表页面。
也可以直接在右上角输入预登录,输入邮箱账号密码完成登录。
4)根据点击操作配置对应的流程图
总共有四个操作。具体操作和方法请参考官网视频教程:数据采集教程流程图模式第一采集案例_优采云采集器()
点击1:打开网页
点击2:“Apple Billing 文件夹”
循环栏点击:创建邮件列表点击循环
插入 3 秒“定时等待”
5)设置提取数据,修改字段名
在消息详情页面手动选择需要 采集 的每个字段
我将购买平台、支付日期、金额、购买的应用内容、应用图标、下次续订时间设置为采集内容。
对所有需要 采集 的字段进行统一名称修改
最终采集流程脚本配置效果
6)运行采集脚本
7)导出采集数据内容
选择保存文件位置并将其导出。
注意默认文件名可能太长无法保存,本地找不到文件或者有bug,修改文件名后不会出现这种现象。
经验和经验
如果没有设置延迟,可能会在页面还没有跳过的时候循环进入第二封邮件,导致上一封邮件的内容和信息被采集重复。
谷歌邮箱在这个浏览器中根本无法登录,icloud邮箱也无法登录,会提示浏览器安全性太低,服务异常。
如果你使用icloud邮箱或者谷歌邮箱,建议在使用谷歌内核浏览器的情况下使用webscraper插件,会更加方便友好,直接在当前默认主流浏览器上运行采集@ >。操作方法请参考豆瓣爬取教程:“零码”编写爬虫下载你所有的豆瓣影评