关键词自动采集生成内容系统-无需任何打理(同花顺基金净值采集结果采集场景进入同花顺查询地址-上海怡健 )

优采云 发布时间: 2021-10-19 10:07

  关键词自动采集生成内容系统-无需任何打理(同花顺基金净值采集结果采集场景进入同花顺查询地址-上海怡健

)

  采集场景

  进入同花顺基金净值查询页面:,输入查询时间和搜索,搜索后得到采集多个基金净值数据。

  采集字段

  序号、基金代码、基金代码链接、基金名称、基金链接、相关内容、相关内容链接、单位净值、累计净值、增长值、增长率、申购状态、赎回状态、当前采集时间和其他领域。

  

  点击查看高清大图,下方其他图片同理

  采集结果

  采集 结果可以导出为Excel、CSV、HTML、数据库等格式。导出到 Excel 示例:

  

  教程说明

  本文制作时间:2020/8/26 优采云 版本:V8.1.22

  如因网页改版导致网址或步骤无效,目标数据无法为采集,请联系官方客服,我们会及时更正。

  采集步骤

  步骤一、打开网页

  步骤二、输入时间搜索

  步骤三、创建【循环提取数据】,采集表中所有数据

  步骤 四、 编辑字段

  Step 五、 设置滚动加载更多数据

  步骤六、开始采集

  步骤一、打开网页

  在首页【输入框】输入目标网址,点击【开始采集】,优采云会自动打开网页。

  

  特别说明:

  一种。打开网页后,如果开启【自动识别】,请点击【不再自动识别】或【取消识别】将其关闭。因为本文不适合使用【自动识别】。

  湾 【自动识别】适用于自动识别网页列表、滚动、翻页。识别成功后可以直接启动采集获取数据。详情请点击查看【自动识别】教程。

  步骤二、输入时间搜索

  1、 创建[输入文本]的步骤

  打开网页后,选择净值日期搜索框,在操作提示框中点击【输入文字】,输入要搜索的时间,示例中输入的是2020-8-22,点击【确定】保存.

  输入时间后,网页会自动开始搜索,等待一段时间后,就会出现目标数据。

  

  2、设置等待

  进入【输入文本】设置页面,设置【执行前等待】3s,让网页有足够的加载时间。

  

  特别说明:

  一种。执行前等待,即等待一段时间后再执行,可以有效避免网页卸载导致的数据泄露。详情请点击查看执行前等待的使用场景及设置方法

  步骤三、创建【循环列表】,采集搜索结果列表中的所有数据

  表格是列表数据的一种特殊形式。通过以下4步,就可以创建一个【循环提取数据】,让优采云自动识别并采集表中的所有字段。

  ①首先选中页面第一行数据的第一个单元格,然后点击提示框右下角的TR按钮选择整行

  ② 在*敏*感*词*操作提示框中,点击【选择子元素】

  ③ 点击【全选】

  ④ 点击【采集数据】

  

  特别说明:

  一种。经过以上4个连续的步骤,就完成了【Cycle-Extract Data】的创建。[Loop]中的项目对应页面上的所有行数据,[Extract data]中的字段对应每行中的每个字段。启动采集后,优采云会在循环中按顺序依次提取表中每一行的字段。

  湾 为什么我们可以通过以上4个步骤来设置【循环-提取数据】?详情请点击查看采集表数据。

  步骤 四、 编辑字段

  在【当前页面数据预览】面板中,可以删除冗余字段、修改字段名称、移动字段顺序等。

  

  Step 五、 设置滚动加载更多数据

  此页面向下滚动页面,可以加载更多的基金净值数据,也需要在优采云中滚动设置。

  因为这个网页是特殊的——[输入文字]后可以自动搜索数据,无需点击搜索等操作,但[输入文字]步骤不支持设置向下滚动。

  因此,我们需要在【输入文本】的步骤之后新建一个【点击元素】的步骤,并为【点击元素】的步骤设置滚动来完成页面滚动。

  1、新建一个【点击元素】步骤

  ① 选择页面空白处,在操作提示框中选择【点击元素】,生成【点击元素】步骤。

  ② 将【点击元素】步骤拖到【输入文本】处。

  ③ 进入【点击元素】设置页面,将AJax超时设置为7秒,等待15秒后执行,让数据完全加载。

  

  特别说明:

  一种。这里新增的【点击元素】步骤是为了滚动页面,不是为了点击。因此,您可以选择任何空白页面来创建点击。

  湾 对于使用Ajax技术的网页,优采云会自动判断并设置一定的【Ajax超时】。如果系统自动设置的【Ajax timeout】太短,可以根据采集的需求和网页加载情况进行调整。详情请点击查看Ajax教程。

  C。执行前等待,即等待一段时间后再执行,可以有效避免网页卸载导致的数据泄露。详情请点击查看执行前等待的使用场景及设置方法

  2、设置滚动

  再次进入【点击元素】设置页面,点击【页面加载后】,设置【页面加载后向下滚动】,滚动方式为【向下滚动一屏】,【滚动次数】为10次, 【每个时间间隔】】2秒,设置后点击【应用】保存。

  

  特别说明:

  一种。设置中的滚动次数和时间间隔,请根据采集要求和网页加载条件进行设置,它们不是一成不变的,详情请点击查看处理滚动加载数据的网页教程

  步骤六、开始采集

  1、 单击 [采集] 和 [启动本地采集]。启动优采云后自动采集数据。

  

  2、采集 完成后,选择合适的导出方式导出数据。支持导出到 Excel、CSV、HTML、数据库等。这里导出到 Excel。

  

  样本数据:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线