数据智能采集软件
优采云 发布时间: 2020-08-25 12:29数据智能采集软件
数据智能采集软件是一款功能全面、准确、稳定、易用的网路信息采集软件。它可以轻松将你想要的网页内容(包括文字、图片、文件、HTML源码等)抓取出来。采集到的数据可以直接导入到EXCEL、也可以根据你定义的模板保存成任何格式的文件(如保存成网页文件、TXT文件等)。也可以在采集的同时,实时保存到数据库、发送到网站服务器、保存到文件。
软件特色:
1.图形化的采集任务定义界面你只需在软件内嵌的浏览器内用滑鼠点选你要采集的网页内容即可配置采集任务,无需象其它同类软件一样面对复杂的网页源码去找寻采集规则。可以说是所见即所得的采集任务配置界面。
2.创新的内容定位方法,定位更准确、稳定同类软件基本上都是依照网页源码中的前导标记和结束标记进行内容定位,这样一来,用户就不得不自己去面对网页制做人员才须要面对的HTML代码,付出更多额外的学习时间能够把握软件的使用。同时,只要网页内容稍有变更(简单的如改变一下文字的颜色)定位标记即极有可能失效,导致采集失败。我们经过艰辛的技术攻关,实现了全新的定位方法:结构定位和相对标志定位。大家都晓得,一个网站的风格基本上是固定的,其同类网页内容的编排布局基本相同。这就是结构定位可行之处。当然基本相同不等于100%相同,不过,我们攻破了技术难关,消除了这种障碍。我们的定位方法的优势在于:1.用户只需用滑鼠点击就可以配置采集任务,实现所见即所得的采集任务配置界面;2.网页内容的变化(如文字增减、变更,文字颜色、字体的变化等)不会影响采集的准确性。
3.支持任务嵌套,可采集无限级的页面内容只需在当前任务的页面中选择指向你要采集的下级页面的链接,即可构建嵌套任务,采集下级页面的内容,且嵌套级数不限。这种便利都得益于我们全新的内容定位方法和图形化的采集任务配置界面。
4.可同时采集任何内容不仅最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等。
5.强大的信息手动再加工能力你可以在配置任务的时侯,指定对采集到的内容进行任何的替换、筛选。
6.可对采集到的内容进行手动排序
7.支持采集结果保存到EXCEL和任意格式的文件支持自定义文件模板。
8.支持实时保存到数据库支持ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支持更多类型的数据库)。
9.支持实时上传到网站服务器支持POST和GET方法,可自定义上传参数,模拟人工递交。
10.支持实时保存到任意格式的文件支持自定义模板,支持按记录保存和将多个记录保存到单个文件,支持大纲、明细式的保存(所有记录的个别内容保存到一个大纲文件中,然后每条记录又单独保存到一个文件。
11.支持多种灵活的任务调度方法,实现无人值守采集
12.支持多任务,支持任务导出和导入