文章在线采集器(2020-01-10红叶文章采集器下载软件简介(图))
优采云 发布时间: 2021-11-02 05:05文章在线采集器(2020-01-10红叶文章采集器下载软件简介(图))
宏业文章采集器 3.6 绿色版详细介绍 资源大小:5.03 MB 月下载量:48次 软件属性:简体中文免费软件系统平台:Win7/ WinVista /Win2003/WinXP/Win2000/Win8/Win10兼容软件更新时间:2020-01-10
鸿业文章采集器下载软件介绍
超级强大的网站文章采集器,这个软件的全名是鸿业文章采集器,英文名是Fast_Spider,是一个蜘蛛爬虫程序,用于指定网站采集大量精华文章,垃圾网页信息将被直接丢弃,只有具有阅读价值和浏览价值的精华文章才会被保存,HTM-TXT 转换会自动实现。
软件特点
本软件采用北大天网的MD5指纹重复算法,不会重复保存相似、相同的网页信息。
采集信息含义:[[HT]]代表网页标题,[[HA]]代表文章标题,[[HC]]代表10个网站权重关键词,[[UR]]表示网页图片的链接,[[TXT]]后面的文字。
蜘蛛性能:本软件开启300个线程,保证采集效率。压力测试通过采集百万精华文章进行。以普通网民的联网电脑为参考标准,单台电脑一天可以遍历200万个网页和采集20万个精华。文章,100万个精华文章只需要5天时间完成采集。
正式版和免费版的区别在于,正式版允许采集的精华数据自动保存为ACCESS数据库。购买正式版请联系QQ。
操作方法
在使用之前,您需要确保您的计算机可以连接到互联网并且防火墙没有阻止该软件。
运行SETUP.EXE和setup2.exe安装操作系统system32支持库。
运行spider.exe,输入URL入口,先点击“手动添加”按钮,再点击“开始”按钮启动采集。
需要注意
抓取深度:填0表示抓取深度不受限;填3表示捕获第三层。
通用蜘蛛模式和分类蜘蛛模式有什么区别:假设URL入口为“”,如果选择通用蜘蛛模式,会遍历“”中的每一个网页;如果选择分类蜘蛛模式,则只会遍历“”中的每个网页。
“从 MDB 导入”按钮:从 TASK.MDB 批量导入 URL 条目。
本软件采集的原则是不越界。例如,如果给定的条目是“”,则只会在百度网站内部进行抓取。
本软件采集在运行过程中,偶尔会弹出一个或多个“错误对话框”。请忽略它们。如果关闭“错误对话框”,采集 软件就会挂断。
用户如何选择采集的主题:例如,如果你想采集“股票”文章,你只需要将那些“股票”网站作为URL条目。
鸿业文章采集器 3.6 绿色版下载地址可直接获取
相关信息