Hongye 文章采集器 3.6 Free Edition

优采云 发布时间: 2020-08-07 18:24

  红叶文章采集器是一个超级强大的网站文章采集器. 英文名称为Fast_Spider,属于蜘蛛采集器程序. 它用于从指定网站采集大量基本文章,并将直接丢弃垃圾邮件网络信息. 阅读价值精髓和浏览价值文章,自动执行HTM-TXT转换,并在必要时下载和使用.

  红叶文章采集器软件的功能

  (1)该软件使用北京大学天网的MD5指纹重复算法,因此相似和相同的网页信息将不会重复保存.

  (2)所采集信息的含义: [[HT]]代表网页的标题,[[HA]]代表文章的标题,[[HC]]代表10个加权关键字,[[UR] ]]表示网页链接上的图片,[[TXT]]后的文字.

  (3)Spider性能: 该软件打开300条线程以确保采集效率. 压力测试是通过采集一百万个基本物品进行的. 以普通网民的互联网计算机为参考标准,单台计算机一天可以浏览200万个网页,采集20万条基本文章,而仅5天就可以采集100万条基本文章.

  (4)正式版与免费版的区别在于,正式版允许将采集的基本商品数据自动保存为ACCESS数据库.

  关于使用红叶采集器的注意事项

  1. 抓取深度: 填写0表示捕获深度不受限制;填写3表示已捕获第三层.

  2. 普通蜘蛛模式和分类蜘蛛模式之间的区别: 假设URL条目为“”,如果选择了普通蜘蛛模式,则将遍历“”中的每个网页;如果选择了分类蜘蛛模式,则每个网页仅会遍历“”.

  3. 按钮“从MDB导入”: URL条目是从TASK.MDB批量导入的.

  4. 该软件采集的原则是不越站. 例如,如果条目为“”,则只会在百度站点内捕获它.

  5. 在采集该软件的过程中,偶尔会弹出一个或几个“错误对话框”. 请忽略它们. 如果关闭“错误对话框”,则采集软件将挂断. 如果软件挂断,先前采集的信息将不会丢失. 再次启动该软件进行采集时,以前采集的信息将不再被采集,可以实现良好的增量采集.

  6. 用户如何选择采集主题: 例如,如果要采集“股票”文章,则只需使用这些“股票”网站作为URL条目.

  

  PC正式版

  Android官方移动版

  IOS官方移动版

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线