优采云基本流程教程(完整).docx 8页

优采云 发布时间: 2020-08-08 23:33

  优采云·Cloud 采集 Web爬网程序软件优采云基本过程教程在优采云 采集 Principles中,我们已经讨论过它. 优采云模拟人们浏览Web进行数据采集的行为,例如打开网页,单击某些按钮等. 在优采云采集器客户端中,我们需要自己配置这些流程. 优采云数据采集通常具有以下基本过程,其中打开网页和提取数据是必不可少的,可以根据自己的需要添加或删除其他过程. 1.打开网页. 此步骤根据设置的URL打开网页,这通常是打开指定网站或网页的网页采集过程的第一步. 如果需要打开多个相似的URL来执行相同的采集过程,则应将它们放在循环中作为第一步. 单击元素此步骤对网页上的指定元素执行左键单击操作,例如单击按钮,单击超链接等. 3.输入文本. 在此步骤的输入框中输入指定的文本,例如输入搜索关键字,输入帐号等. 输入设置?文字输入网页上的输入框,例如在使用搜索引擎时输入关键字. 4.循环此步骤用于重复一系列步骤. 根据不同的配置,支持多种循环方法. 1)循环单元素: 循环单击页面上的一个按钮; 2)循环固定元素列表: 循环处理网页中固定数量的元素; 3)循环非固定元素列表: 循环处理网页中数目不固定的元素; 4)循环URL列表: 循环打开一批具有指定URL的网页,然后执行相同的处理步骤; 5)循环文本列表: 循环输入一批指定的文本,然后执行相同的处理步骤.

  5. 提取数据此步骤根据提取的数据模板的配置从网页提取数据. 同时,您还可以添加特殊字段: 当前时间,固定字段,添加空字段,添加当前网页URL等. 此外,优采云的规则市场具有许多已建立的规则,可以直接下载并导入到优采云中用来. 1.如何下载采集规则优采云采集器具有内置的规则市场,用户可以共享配置的采集规则以互相帮助. 使用规则市场下载规则,因此您无需花费时间研究和配置采集过程. 可以在规则市场中搜索许多网站的采集规则,并且可以在下载并运行后对其进行采集. 有三种下载规则的方法: 打开优采云官方网站()->爬虫规则;打开优采云采集器客户端->市场->爬虫规则;在浏览器规则中直接访问树多多官方网站()->采集器. 2.如何使用规则通常,从规则市场下载的规则是带有.otd后缀的规则文件,下载的规则文件将在4. *更高版本中自动导入. 在以前的版本中,您需要手动导入下载的规则文件. 将下载的规则保存到相应位置. 然后打开优采云客户端->任务->导入->选择任务. 从电子邮件或其他即时消息软件接收的规则是相同的. 相关集合教程: 优采云使用功能点视频教程/ tutorial / videotutorial / videognd 优采云爬虫软件入门准备/ tutorial / xsksrm / rmzb 优采云爬虫软件功能用法教程/ tutorial / gndajax Web数据捕获/ tutorial / gnd / ajaxlabel特殊页面翻页操作/ tutorial / gnd / teshufanye网页数据导出/ tutorial / gnd / dataexport云采集功能点描述/ tutorial / gnd / yuncaiji 优采云-90万用户选择的Web数据采集器.

  1. 该操作很简单,任何人都可以使用: 不需要技术背景,并且可以通过浏览Internet进行采集. 完全可视化该过程,单击鼠标以完成操作,您可以在2分钟内快速上手. 2.强大的功能,可以在任何网站上采集: 单击,登录,翻页,识别验证码,瀑布流,Ajax脚本异步加载数据页,所有这些都可以通过简单的设置进行采集. 3. ??采集,关闭也是可能的. 配置采集任务后,可以将其关闭,并可以在云中执行该任务. 庞大的云采集集群不间断运行24 * 7,因此无需担心IP被阻塞和网络中断. 4.免费功能+增值服务,可以按需选择. 免费版具有所有功能,可以满足用户的基本采集需求. 同时,建立了一些增值服务(例如私有云)以满足高端付费企业用户的需求.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线