优采云采集器
优采云 发布时间: 2020-06-11 08:02下载安装优采云采集器目前只支持安装在 windows 操作系统上,为了确保稳定运行并达到最好性能,建议您开启 windows 自动更 新,并且升级 window 系统到最新版本,本系统须要.Net Framework 的支持,请确保您的系统早已安装了.Net Framework, 具体请参考以下提示: 本软件须要.NET3.5 SP1 支持,Win 7 已经外置支持,XP 系统须要安装,软件会在安装时手动检查是否安装了.NET 3.5 SP1, 如果没有安装则会手动从谷歌官方在线安装,国内在线安装速率太慢,建议先从下载页面的云盘下载链接安装.NET 3.5 SP1,然后再安装优采云采集器. 如果您下载的是压缩文件,请先解压缩,您将见到如下图所示安装文件,在安装前请先仔细阅读“安装前必看.txt”,然 后双击 setup.exe,一般情况下,选择默认设置,点几次下一步,即可完成安装。 如果您的操作系统缺乏.NET Framework,则会提示安装,这会须要等待一段时间,如果您希望能快速安装,请依照以上提 示,先自行安装.NET Framework,再安装优采云采集器。如何启动完成安装后,您可以在桌面或则开始菜单找到如下图所示快捷方法,双击即可启动优采云采集器。
注册帐号第一次打开优采云采集器,会打开登陆界面,如果您还没有注册“视界”通行证,那么须要点击登陆界面上的“免费注 册”链接,完成帐号注册,注册过程中,请注意必须提供真实正确的 Email 地址,这个邮箱将用于接收帐户激活电邮,也 是您忘掉密码时拿来寻回密码的惟一途径。注册完成后,登录您的邮箱就可以收到一份激活电邮,如果您没有看见,请 检查您的垃圾邮箱,您的邮箱有可能会制止激活短信的接收。如果确信没有收到激活电邮,请打开视界科技网站: ,登录您刚注册的帐号,登陆后,点击自己的名子转到用户中心,可以重发激活电邮。点击激活电邮中的 链接,将会手动激活您的帐号。这时候,您就可以使用该帐号登入优采云采集器了。优采云采集器界面介绍倘若您是第一次使用优采云采集器,系统会手动播放使用手册,主要是介绍界面构成,以及主要的使用流程,该手册仅 在第一次使用时播放一次,所以假如您是第一次使用,请勿必仔细看完。这里也将对手册中的内容作一个详尽的介绍。导航菜单县介绍: 菜单导航分辨三部份,快速开始:用来创建新采集任务,点击快速开始,再点击上面的创建任务就可以创建一个新的采 集任务。我的任务:您所创建的所有任务都可以在我的任务下边找到,在我的任务列表上面,鼠标左键单击可以选中一 个任务,双击即可打开这个任务。
任务状态:可以查看正在执行的任务,等待执行的任务,以及执行完成和中止的任务, 还可以启动,停止任务,对于采集完成的任务八爪鱼采集器教程,还可以导入采集到的数据。视频教程县:这里有最简单的介绍视频,还有从采集一个简单网页到循环采集,再到中级设置等好多从入门到精通所需 要了解的视频知识,对于菜鸟来说八爪鱼采集器教程,先看视频,再跟随视频进行练习,是学习优采云采集器最快最好的方式,特别是对 于一些使用过其他采集器的用户来说,优采云采集器是全新的,其操作方法和内部原理,和通常的采集器有特别大的不 同,使用过其他采集器所产生的思维模式和经验,不仅不能直接用在优采云采集器上,反而可能影响快速把握优采云的 使用,所以建议你们一定要仔细跟随视频进行练习,再开始自己配置采集任务。对于一些顾客,特别是企业顾客而言,时间就是金钱,效率就是生命,另*敏*感*词*等也有比通常顾客更高的要求,我们对此,提供了各种各样的服务: 1. 2. 定制化数据需求: 客户只须要告诉我们您须要的数据, 以及具体的各项要求, 我们都会在一两天之内提供您要的数据。 获取数据包:有些数据属于好多顾客都须要的数据,如企业名录,行业数据,等等,对于早已采集好的数据,特别是 不随时间变化的数据,我们都有完整的数据包可供顾客直接下载。
3. DataAPI:很多企业顾客也会有自己的内部系统,希望能和数据采集系统手动对接,以便实现数据的自动化采集,同 步,企业数据服务(DataAPI)就是为企业量身定制的数据插口,利用 DataAPI,数据可以全手动步入企业内部系统, 并且提供愈发稳定的数据支持,比如采集网站改版,网站不稳定等诱因也不会影响数据插口的稳定性。 4. 获取采集规则: 我们搜集整理了好多网友写好的采集规则, 这样假如有人跟您有一样或则类似的需求而且早已写好了 规则,您就可以直接导出该规则来使用,而不用花时间自己配置采集规则,这将节约好多时间,另外假如规则稍为不 同,也可以通过对导出的规则适当更改来实现自己的需求。 5. 如果使用过程中有任何问题,可以随时到峰会求援。活动县:优采云团队将不断推出各类帮助用户的活动,参与活动可以轻松地获取积分等奖励,例如每晚点一下签到,或 者推荐好友注册使用优采云采集器,不仅自己可以获取积分奖励,被推荐的好友也能获取积分奖励。优采云采集器使用方式使用优采云采集器,最常用的就是配置采集任务,配置一个采集任务,只须要简单的 4 个步骤。按照前面介绍的,先点 击快速开始,然后点击新建任务,系统将会打开新建任务向导。
第一步:设置基本信息 这一步主要是输入任务的名子,新建或则选择一个任务分组,然后输入一些备注信息,备注信息可以为采集的网址,或 者任何一段有助于您晓得这个任务用途的话,分组,名字,备注用以辅助用户对任务进行管理。可以把采集一类信息的 任务放在一个分组上面,在备注里写上采集的网站地址,再加上一些文字,说明采集了什么样的数据。这样之后随时打 开这个任务就晓得是做哪些的了。在任务比较多的时侯,这些信息用途很大。第二步:设计工作流程优采云工作原理和人的思维模式太相像,所以设计优采云采集器的工作流程显然就相当于把人采集一个网站数据的过程 分成一些动作和步骤,把这种步骤组织上去能够完成采集工作。比如,如果一个人去一个网页上采集一些数据,通常的 做法是:先打开网页,等待网页加载完毕以后,选中要采集的数据,然后键盘右键复制,或者按住 Ctrl+C 复制。如果用 优采云采集器来做这件事情也是一样,第一步,从右侧的工具条中拖动“打开网页”这个步骤,拖动到流程设计器中间, 当出现一个可以释放的标志后,松开键盘左键,该步骤都会弄成流程的第一个步骤,如上图所示,然后选中该步骤,在 流程设计器左侧,每当选中一个步骤时,这里将显示选中步骤的一些具体配置信息,比如选中打开网页以后,将会听到 设定要打开的网页的地址(URL)的输入框,在这里输入要打开的 URL,点保存,在任何一个步骤被保存的时侯,优采云 采集器会在下边的浏览器中模拟执行该步骤。
另外,选中一个流程步骤的时侯,打开下边的“工作流程帮助”将会听到 这个步骤的说明,以及每位配置项怎样配置的帮助信息。打开网页以后,当滑鼠在下边的浏览器上联通时,可以看见有 个颜色会选中一些页面元素,并且随着键盘联通,在须要采集的数据上点击,就会打开一个选项对话框,选择提取文字, 就会采集选中的元素的文本。其它选项也是类似的原理和操作方法。在提取一个数组以后,系统会手动降低一个提取数 据的步骤,如果采集多个数组,这些数组会出现在该采集步骤的配置项中(参考上图)。第三步:设置执行计划 当设定好采集规则以后,便可以选择执行计划,如果只是一次性采集数据,那么就可以选择自动,或者一次,手动的话 可以进行单机采集,也可以进行云采集,单机采集就是借助本地计算机进行采集,云采集就是不用本地计算机,利用八 爪虾的云采集服务器采集,这样除了可以实现定时采集,还有好多优势,比如采集速度最快可以加速 100 倍,不用害怕 IP 被封,网络不稳定等,还可以关闭自己笔记本,优采云云采集服务器集群将为您完成所有的采集工作。 关于云采集和单机采集的区别,以及各个定时选项的用法,可以键盘联通起来,会有详尽的提示,这里就不重复描述了。
第四步:完成配置 其实经过以上三步,采集任务就配置好了,第四步,主要是拿来测试配置是否正确,第一个选项,检查任务,将打开任 务测试界面,点击开始测试按键,即可开始测试,同时,测试跟单机采集其实是同一个界面,如果测试过程发觉没有按 照期望运行,或者网站出现没有预想的问题,比如采集的数组不存在,网页款式有很大变化等,都可以随时停止测试, 继续更改任务配置,然后重新进行测试,在经过几次测试更改以后,如果确定任务早已没有问题,就可以点击完成。进 入任务列表,选中配置好的任务,进行采集了。如果是单机采集,则采集将立刻开始在本地计算机执行,采集完成后会 有提示完成,点击导入数据按键即可导入所有采集到的数据。如果在执行计划界面选择了自动启动,并且点击了云采集, 则任务会立刻在云采集服务器上启动执行,如果执行计划选择的是定时手动启动,则不需要自动启动,到了指定的时间 该任务都会手动启动。更多使用说明本文档是对优采云采集器一个简单的介绍,主要适用于刚开始学习使用优采云采集器的用户,当然优采云采集器还有太 多更强大的功能没在本文档中讲解,关于更多使用说明请查看视频教程及其他文档。 如果您还没有看完视频教程,我们强烈建议您接下来就仔细把官方视频教程都看一遍,只需半个小时,您很快能够学会。