网站自动采集系统(使用网页自动操作通用工具中的刷新提取网页中内容)

优采云 发布时间: 2022-01-01 06:20

  网站自动采集系统(使用网页自动操作通用工具中的刷新提取网页中内容)

  批量采集自动提取和保存网页内容这是本教程使用的网页:本教程是教大家使用通用工具中的刷新工具进行网页自动操作,对网页内容进行刷新和提取网页。从(网页)批量获取姓名、电话、职业等信息,并将结果保存到文件中。以下是本教程的开始。先看软件的总界面: 然后需要先添加网址,点击“添加”按钮,输入需要刷新提取信息的网址,然后点击“自动获取”按钮。如下图所示: 下一步,我们设置刷新间隔。刷新间隔可以在网页自动刷新监控操作中设置。在这里,我将其设置为每 10 秒刷新一次。如果删除选中的刷新限制,它将是无限制的。在本教程中,每次刷新都需要保存更改的网页信息,所以在“其他监控”中,需要设置“无条件启动监控报警”。 (查看各自需求的设置) 然后设置需要保存的网页信息。在“监控设置”中,添加“报警提示动态内容”---然后自动获取。如下图: 点击自动获取后,会打开之前添加的网址。页面加载完成后选择需要获取的信息--右键--获取元素--自动提取元素标识--添加元素。如下图操作: 这里的元素属性名称使用值。这里需要注意的是,有些网页需要延迟打开才能开始监控,否则会失效。所以这里设置了“*敏*感*词*前的延迟等待时间为3秒”。 (同时监控多个网页) 该版本的自动网页操作通用工具可以保存三种格式,分别是csv文件、txt文件和每个动态元素分别保存为一个文件,在“报警提醒”中” “可以设置类型。以下是监控网页后保存的各种文件格式。第一个是将每个元素保存在一个单独的txt文件中:第二个是将所有元素保存在一个txt文件中:第三个是将所有元素另存为csv文件:本教程结束,欢迎大家搜索:木头软件。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线