下载了Kucai信息采集系统的人也下载了它
优采云 发布时间: 2020-08-07 23:48酷!它是一款功能强大的软件产品,可以采集和挖掘Internet信息并同时更新数据库. 它使我们摆脱了许多简单而繁琐的复制和粘贴工作,并使我们能够在短时间内拥有大量数据.
支持多种编码: GBK,BIG5,UNICODE和UTF8.
支持多种网站类型: 包括HTML,Rss和Ajax.
网站登录验证: 支持网站登录和网站Cookie,即使需要验证码才能登录的网站也可以轻松通过.
自定义采集规则: 通过采集规则的定义,您几乎可以从所有网站搜索所需的任何内容.
智能采集和识别: 系统将识别网页上的图片,FLASH,PDF,MP3,视频,JavaScript链接,电子邮件,电话号码等,并将其下载或保存到库中.
任务计划和信息监视: 可以定期启动系统以完成采集工作;您还可以锁定某个网页,并仅在找到必要的链接以实现信息监视功能时采集.
条件采集: 可以在采集过程中设置某些条件或关键字. 也就是说,需要的东西被采集了,不需要的东西没有被采集.
分页采集: 它可以采集分页的网页,并合并多个页面的内容以进行处理.
数据自动重新加权: 默认情况下,系统将处理重复的网页,您还可以自定义其他字段的重新加权设置.
数据格式处理: 可以保留或删除所采集内容的段落格式,并且可以更改所收录图片或附件的路径(例如将下载的图片路径更改为本地路径)
多线程和多任务: 可以同时启动多个线程,并且多个任务可以协同工作而不会相互干扰;可以根据系统性能随时添加或减少线程数,以最大化其工作效率.
所见即所得: 您可以实时查看采集的数据,错误信息和线程工作信息.
<p>自动数据保存: 实时构建采集的数据并将其保存在系统自己的数据库中(用户也可以自定义数据库,但是表和字段的创建由系统完成),而无需手动设置...