网络蜘蛛从用户设定的网站抓取数据,形成数据包-Spider

优采云 发布时间: 2021-08-23 06:13

  网络蜘蛛从用户设定的网站抓取数据,形成数据包-Spider

  产品介绍

  KLAND-Spider网络信息资源采集系统是一套网络信息资源开发、利用和整合系统,可用于定制跟踪和采集互联网实时信息,建立可重复使用的信息服务系统。 KLAND-Spider可以自动对采集用户从各种网络信息源,包括网页、BLOG、论坛等感兴趣的特定信息进行分类处理,并以多种形式提供给终端用户。

  KLAND-Spider 能够快速及时地捕捉到用户需要的市场情报、政策法规、行业资讯、热点新闻等网络信息内容。可广泛应用于企业门户网站建设、情报采集、舆情分析、网络敏感等领域。信息监控等方面。

  产品特点

  KLAND-Spider网络信息资源采集系统由采集navigator、网络蜘蛛、数据处理器和发布系统四个子系统组成。

  采集navigator 用于自定义采集的目标。网络蜘蛛从用户设置的网站中抓取数据,形成数据包(数据表)发送给数据处理器,数据处理器对捕获的数据进行分析过滤,根据site、channel、关键词, 或其他分类模型自动对数据进行分类,保存在本地数据库中,通过发布系统以选定的格式或样式发布,方便用户使用。

  产品特点

  采集方法的灵活性,采集来源的多样性,采集数据的准确性,采集增量的自动化。

  *支持多种形式的网页表达:静态网页、动态网页、文档网页(Word、EXCEL、PDF等);

  *支持导航页和内容翻页;

  *支持采集embedded form;

  *支持文章的附件采集和分析(Word、EXCEL、PDF等);

  *采集元数据自动测试分析结果;

  *采集结果去重;

  *采集target网站自动更新信息(时间间隔可设置)。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线