优采云采集器 v2.7.3[下载地址]
优采云 发布时间: 2020-08-10 08:31支持丰富的数据导入方法,可以导入为txt文件、html文件、csv文件、excel文件,也可以导入到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方法简单映射数组,即可轻松导入到目标网站数据库中。
优采云采集器软件优势
可视化向导
所有采集元素,自动生成采集数据
计划任务
灵活定义运行时间,全自动运行
多引擎支持
支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎
智能辨识
可手动辨识网页列表、采集字段和分页等
拦截恳求
自定义拦截域名,方便过滤站外广告,提高采集速度
多种数据导入
可导入为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等
优采云采集器使用方法
1、查询关键词一行一个填写
2、查询延时单位为微秒,既1000=1秒
3、点击开始后采集的关键词将以日期为文件夹名称生成在软件Data目录下,以MDB数据库保存
4、导出关键词功能可对先前任何时侯采集的关键词进行导入,按导入关键词后选择你想导入的关键词数据库
优采云采集器软件测评
一款十分实用的网页信息采集工具,该工具界面整洁、操作简单、功能强悍,有了它,我们就可以采集到自己须要的网页上的所有信息,零门槛,小白用户都可使用。
优采云采集器常见问题
采集时如何防止重复到重复数据?
在运行某个采集任务时,如果该任务之前有采集过数据,那么采集前假如没有清空原有数据的话,会以追加的方式将新采集数据添加到本地采集库中,这样就可能出现个别已采集过的数据再度重复采集入库,还有,如果目标网页本身也重复的数据,也可能导致数据重复,那么如何防止采集的数据出现重复呢?
方法很简单,我们希望哪一个数组内容不容许出现重复,只要点击该数组表身上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了
如何自动生成主键?
点击“增加数组”按钮
点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可
当点击的是网页链接时,会提示是否用时要抓取链接地址
如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否,这里我们点“是”
系统会手动生成标题和链接地址数组,并在数组列表中显示出提取到的数组内容,当点击顶部表格数组标题时,会在网页上以黑色背景高亮显示出匹配的内容。
如何还有标记列表中的其他数组,点击新增数组,重复以上操作即可。
怎样自动生成列表?
点击“查找列表”按钮,选择“手动选择列表”
按提示,用键盘左键点击网页列表中的第一行数据
点完第一行,再按提示点击第二行或其他相像的行
点击完列表里的任意两行后,整个列表就高亮显示下来了,同时该列表里的数组也会数组生成,如果生成的数组不对,点击去除数组,把下边的数组全部去除掉