关键词自动采集生成内容系统-无需任何打理(同花顺基金净值采集结果采集场景进入同花顺查询地址-上海怡健 )
优采云 发布时间: 2021-10-19 10:07关键词自动采集生成内容系统-无需任何打理(同花顺基金净值采集结果采集场景进入同花顺查询地址-上海怡健
)
采集场景
进入同花顺基金净值查询页面:,输入查询时间和搜索,搜索后得到采集多个基金净值数据。
采集字段
序号、基金代码、基金代码链接、基金名称、基金链接、相关内容、相关内容链接、单位净值、累计净值、增长值、增长率、申购状态、赎回状态、当前采集时间和其他领域。
点击查看高清大图,下方其他图片同理
采集结果
采集 结果可以导出为Excel、CSV、HTML、数据库等格式。导出到 Excel 示例:
教程说明
本文制作时间:2020/8/26 优采云 版本:V8.1.22
如因网页改版导致网址或步骤无效,目标数据无法为采集,请联系官方客服,我们会及时更正。
采集步骤
步骤一、打开网页
步骤二、输入时间搜索
步骤三、创建【循环提取数据】,采集表中所有数据
步骤 四、 编辑字段
Step 五、 设置滚动加载更多数据
步骤六、开始采集
步骤一、打开网页
在首页【输入框】输入目标网址,点击【开始采集】,优采云会自动打开网页。
特别说明:
一种。打开网页后,如果开启【自动识别】,请点击【不再自动识别】或【取消识别】将其关闭。因为本文不适合使用【自动识别】。
湾 【自动识别】适用于自动识别网页列表、滚动、翻页。识别成功后可以直接启动采集获取数据。详情请点击查看【自动识别】教程。
步骤二、输入时间搜索
1、 创建[输入文本]的步骤
打开网页后,选择净值日期搜索框,在操作提示框中点击【输入文字】,输入要搜索的时间,示例中输入的是2020-8-22,点击【确定】保存.
输入时间后,网页会自动开始搜索,等待一段时间后,就会出现目标数据。
2、设置等待
进入【输入文本】设置页面,设置【执行前等待】3s,让网页有足够的加载时间。
特别说明:
一种。执行前等待,即等待一段时间后再执行,可以有效避免网页卸载导致的数据泄露。详情请点击查看执行前等待的使用场景及设置方法
步骤三、创建【循环列表】,采集搜索结果列表中的所有数据
表格是列表数据的一种特殊形式。通过以下4步,就可以创建一个【循环提取数据】,让优采云自动识别并采集表中的所有字段。
①首先选中页面第一行数据的第一个单元格,然后点击提示框右下角的TR按钮选择整行
② 在*敏*感*词*操作提示框中,点击【选择子元素】
③ 点击【全选】
④ 点击【采集数据】
特别说明:
一种。经过以上4个连续的步骤,就完成了【Cycle-Extract Data】的创建。[Loop]中的项目对应页面上的所有行数据,[Extract data]中的字段对应每行中的每个字段。启动采集后,优采云会在循环中按顺序依次提取表中每一行的字段。
湾 为什么我们可以通过以上4个步骤来设置【循环-提取数据】?详情请点击查看采集表数据。
步骤 四、 编辑字段
在【当前页面数据预览】面板中,可以删除冗余字段、修改字段名称、移动字段顺序等。
Step 五、 设置滚动加载更多数据
此页面向下滚动页面,可以加载更多的基金净值数据,也需要在优采云中滚动设置。
因为这个网页是特殊的——[输入文字]后可以自动搜索数据,无需点击搜索等操作,但[输入文字]步骤不支持设置向下滚动。
因此,我们需要在【输入文本】的步骤之后新建一个【点击元素】的步骤,并为【点击元素】的步骤设置滚动来完成页面滚动。
1、新建一个【点击元素】步骤
① 选择页面空白处,在操作提示框中选择【点击元素】,生成【点击元素】步骤。
② 将【点击元素】步骤拖到【输入文本】处。
③ 进入【点击元素】设置页面,将AJax超时设置为7秒,等待15秒后执行,让数据完全加载。
特别说明:
一种。这里新增的【点击元素】步骤是为了滚动页面,不是为了点击。因此,您可以选择任何空白页面来创建点击。
湾 对于使用Ajax技术的网页,优采云会自动判断并设置一定的【Ajax超时】。如果系统自动设置的【Ajax timeout】太短,可以根据采集的需求和网页加载情况进行调整。详情请点击查看Ajax教程。
C。执行前等待,即等待一段时间后再执行,可以有效避免网页卸载导致的数据泄露。详情请点击查看执行前等待的使用场景及设置方法
2、设置滚动
再次进入【点击元素】设置页面,点击【页面加载后】,设置【页面加载后向下滚动】,滚动方式为【向下滚动一屏】,【滚动次数】为10次, 【每个时间间隔】】2秒,设置后点击【应用】保存。
特别说明:
一种。设置中的滚动次数和时间间隔,请根据采集要求和网页加载条件进行设置,它们不是一成不变的,详情请点击查看处理滚动加载数据的网页教程
步骤六、开始采集
1、 单击 [采集] 和 [启动本地采集]。启动优采云后自动采集数据。
2、采集 完成后,选择合适的导出方式导出数据。支持导出到 Excel、CSV、HTML、数据库等。这里导出到 Excel。
样本数据: