网页flash抓取器 7.0(web基础蜘蛛网页文章采集器.2.zip)
优采云 发布时间: 2021-09-21 12:20网页flash抓取器 7.0(web基础蜘蛛网页文章采集器.2.zip)
网络基金会蜘蛛网页文章 采集器v3.2.zip
Web basic spider网页文章采集器,英文名称fast_spider,一个爬行动物程序,用于直接从指定的网站采集站点处理垃圾Web信息文章. 它只保存精华文章的读取值和浏览值,并自动执行HTM-TXT转换。这个软件是绿色软件。你可以解压并使用它。WebBasic spider的网页文章采集器功能如下:(1)此软件采用北京大学天网的MD5指纹复制算法。对于类似和相同的网页信息,不会重复保存。(2)采集information含义:[[HT]]表示网页标题,[[HA]]表示文章title,[[HC]]表示10个权重关键字,[[ur]]表示网页中的图片链接,文本在[[TXT]之后。(3)spider performance:此软件启动300个线程以确保采集efficiency.Pass采集100万精文章进行压力测试,以普通网民的联网电脑为参考标准,一台电脑可以在一天内浏览200万页。采集20万香精文章,百万essence文章只需5天即可完成采集.(4)官方版本和免费版本的区别在于,官方版本允许您自动保存采集文章数据的精华以访问数据库。Web basic spider网页文章采集器操作步骤(1)在使用1)之前必须确保您的计算机可以连接到网络,并且防火墙不应阻止该软件。setup2.Exe安装操作系统system32支持库。(3)run spider.Exe,输入URL条目,单击“手动添加”按钮,然后单击“开始”启动按钮采集.关于使用Web基本蜘蛛网页文章采集器(1)爬网深度:填写0以获得无限爬网深度;填写3以捕获第三层。(2)通用蜘蛛模式和分类蜘蛛模式之间的区别:假设URL条目为“”),如果选择了通用蜘蛛模式,则“”中的每个网页将被遍历;如果选择分类蜘蛛模式,则只遍历“”中的每个网页。(3)按钮“从MDB导入”:将从task.MDB批量导入网址条目。(4)此软件的采集原则是不跨站。例如,如果给定条目为“”(5)在软件的采集过程中,偶尔会弹出一个或多个“错误对话框”。请忽略它。如果关闭“错误对话框”,则采集软件将挂起。(6)用户如何选择采集主题:例如,如果您想要采集stock文章,您只需要将这些“stock”网站用作网站门户
现在下载