文章在线采集器(欢迎使用不受目标语言限制、不选存储对象(组图))

优采云 发布时间: 2022-04-13 05:28

  文章在线采集器(欢迎使用不受目标语言限制、不选存储对象(组图))

  欢迎使用在线采集器,不受目标语言限制,不选择存储对象数据库。它在谷歌和百度搜索中排名第一。它是完全免费的,可以放心使用。

  " \( L* ~: We" @, p" p" ?9 N- w% o: I4 v5 m* F/ B

  软件应用环境:WEB系统支持PHP+Mysql+ZEND Optimizer) J' y1 }$ W# y- p+ x2 Q^/ v

  当前版本:V1.928 发布时间:06.09.28 13:11( K3 g; K- o' r, C: t

  老版本用户请参考升级文件目录下的说明文件操作!!!

  $ L0 ^" z4 B; c8 ED1 m" r $ Y3 [0 N/ |

  发行说明:

  ) |' s5 B4 L& O: o- C$ [/ O* iV1.928 释放时间: 06.09.28 13:11. C7 A3 h) y%吨$ C

  1、文章采集 模块增加了“链接区域”设置,可以用来缩小链接识别的范围,特别是针对一些CSS+DIV布局目标。

  2 d1 H* g8 t8 e& Y2 R+ l0 n2、Fix文章采集模块“多个特殊链接”功能缺陷 5 \& U$ S) m+ o2 A$ [" f ' c) 吨 $ 米

  3、优化文章采集模块规则设计步骤

  3 \: J4 \5 b9 U4 }u4、编辑数据库直接规则数据表结构显示缺陷*o'Y%B7]0 s%b

  5、调整文章模块采集规则导出/导入功能

  !W3 y5 ~5 X0 a4 ^9 M6、鉴于本系统功能逐步完善,取消新版本强制升级限制,不再要求老版本在此版本和后续版本中升级。

  * k- u[& n1 Q8 p

  " B' M2 F+ H6 \4 g. n$ q4 Q" `' ~% R 范围:

  8L"@:S&c%`:@${2o1、采集目标不限,HTML、PHP、ASP、JAVA页面无所谓;s"s$ F% c( \0 ~& U3 l

  2、采集对象支持:文章、图片、Flash;

  , y6 Q, ]( a+ I3、内容存储的完美解决方案,小蜜蜂采集器提供两种存储方式:数据库直接提交和模拟提交。

  _# J1 _3 b1 O6 u) \6 R&P, l1)数据库直导完美支持任何基于Mysql数据库存储信息的内容管理系统,包括多表/多字段联动系统导库;2 w7 n' L9 c1 }0 _3 @" }

  2)模拟提交指导库理论上支持任意目标,不受目标编程语言和数据库类别的限制;实际使用效果受目标应用影响。( m( p!O4 ^# M+ t7 C" y$ f5 u!s

  /A( O7 y; [( U[, ] 每个采集模块功能介绍:

  ( j8 c; z2 |$ T" R$ y" m1、 文章采集模块特定的采集文章/图片,还有采集@ > 文章 中收录的 flash 不如 Flash采集 模块强大; 8 Y!s+ w6 r, [6 G( J

  2、 BBS 论坛采集 模块专用于采集BBS 论坛内容;

  + ?4 A8 s- u: ~& y; 3、 Flash采集 模块专门用于采集flash 小游戏,非常适合采集 缩略图和游戏介绍;ba8 @ + @$ Q8 |, 你

  $ u4 y2 f) p' @! m7 E9 J( k7 d

  采集内容导入库介绍:采集各个模块的内容可以自由导入WEB应用系统。&W:g9 s3 \2 B0 r。e*`; p

  7 L( S-ou6 T# y8 J

  特征:

  & E$ ~- c: X( z; O2 Q" H# e1、支持文章内容分页采集;

  0 ]7 w/ u+ e& V$ B& k: @2、支持论坛采集: r- _3 [: M9 |4 w' c

  3、支持UTF-8转GB2312,采集内容字符格式为UTF-8目标;

  4 \) V+ ​​n( q4 s2 b9 z4、支持将文章的内容保存到本地;

  7 n/s: L- Gs: I5、支持站点+栏目管理,采集管理一目了然;

  !u' y% P3 ^7 a# ~1 |' S6、支持链接替换,分页链接替换,破解部分JS/后台程序设置的反挖矿功能;

  1 i, q- K' l5 Y- u! v5 S0 T7、支持采集器设置无限滤波功能;$ B+ y+ d% E, J

  8、支持图片采集保存在本地,自动替换文件名,避免重复;

  6 y% t- ^7 f# f1 V' x9、支持FLASH文件采集保存到本地,自动替换文件名,避免重复;

  , ?+ X0 Q# Y( k* Z/ |3 g- i4 I10、支持限制PHP FOPEN和FSOCKET功能的虚拟主机;

  * H% ~) B' v- o( W; b11、 支持手动过滤采集结果,并提供快速过滤和删除“空标题,空内容”; & ^/ ]。 G/ ]9 R/ X# n

  12、支持Flash Professional Station采集,特别的采集flash小游戏,非常适合采集缩略图,游戏介绍;)k&O;w3 我* b# \

  13、支持整站配置规则的导入导出;

  8 G7 e(O) f。M6 \6 i& d0 g+ `( a14、支持列配置规则导入导出,并提供规则复制功能,简化设置;D, ?6 F' B, S1 @( w+ a0 w$ y

  15、提供库规则的导入导出;; V" h-L;`6 N

  16、支持自定义采集间隔时间,避免被误认为是DDOS攻击而拒绝响应,可以采集设置防DDOS攻击网站;

  !C$ X& R1 J1 _8 U17、支持自定义存储间隔时间,避免并发虚拟主机数限制;1个;i0 @+ p+ e

  18、支持自定义内容写入,用户可以设置任意内容(如自己的链接、广告代码),并写入采集的内容:正面、背面,或随机写入;导入库的时候会自动带上要写的内容,不用修改你WEB系统的模板。

  ; 五、v7 C&c6 c19、支持采集内容替换功能,用户可以设置替换规则随意替换;

  # Z( h- _' n* \# N6 j; I" J* [20、支持html标签过滤,允许采集只保留必要的html标签,甚至不保留任​​何html标签plain文本;

  6 U) v4 z5 M" X; h" `6 f21、支持多个cms库如:PHPcms V2/V3、Dedecms (织梦) V2/V3、PHP168 cms、mephpcms、曼波cms、Joomlacms、多迅cms、 SupeSite、cmsware、Empire Ecms、新宇东网(XYDW)cms导库、东一cms、风讯cms系统导库;用户还可以设计适合自己系统的引导库功能。- D" A+ C1 o9 S# A) w

  22、支持PHPWIND、Discuz论坛导库,包内含2大论坛导库规则和操作指南说明;2 o' S' B* g# H: j: \

  23、附有数据库优化工具,减少频繁的采集数据碎片,降低数据库性能。5 G2 X. b9 是的!9米

  /D3 Z(a:a/H2~!|以下特殊功能仅对“小蜜蜂采集器”可用:

  !N5 !W# X. P& ~# d) f1、支持采集进程断点连续采样功能,不受浏览器误关闭影响,重启后不再重复采集;

  % s0 V9 T, i:a4 V4 I1 J2、支持自动比较过滤功能,对于已经采集的联动系统不会重复采集和存储;

  8 T( f. p0 T+ e# E! x0 l/ W, X 以上两个函数可以大大减少采集时间,降低系统负载。' M# \% U" P9 o8 \+ Vv& k

  3、支持系统每天自动创建图片存储目录,方便管理;- G4 A0 T1【!P:P# [

  4、支持采集/导库间隔设置,避免被目标站识别为流量攻击而拒绝响应;

  7 E$ `0 B4 t2 k6 |, p5、 支持自定义内容写入,实现简单的反挖矿功能;

  , t6 h+ Lm0 y) M4 @) \, o* L6、 支持html标签过滤,几乎完美展现你想要的效果采集;

  ; 吨!\2 D. P4 |# \# G$ e6 I, M7、完美的内容存储解决方案,不受目标编程语言和数据库类型的限制。+ T: F$ s( E, d/ w" F" T' A: P) d

  * nJ- T6 l) y( `6 K) l 以上许多强大的功能供您免费使用,您可以轻松高效地安装和使用信息采集。

  8 h% y7 e2 L9 e/ X/ Y" f! C) D

  ; {4 h4 b) q+ I-----------------, N' J3 R/ U0 m- A5 f0 n, F8 ○

  选择小蜜蜂采集器的好处:

  4 Y( t]' r+ P1、小蜜蜂程序是用PHP开发的,支持跨平台运行,可以在Windows和类Unix操作系统上运行,是一个高效的采集@ >、完美的在线申请软件。9 Nj?%c,]* E(O7 p:_j4 k

  2、Little Bee不受安装位置限制,在家、工作电脑、网站服务器均可使用;建议直接安装在网站服务器上运行,这样可以更好的体验Little Bee place的超强功能和便利。

  , h+ e9 g& @6 A" b) I+ O3、安装在服务器上,采集的图片/Flash可以直接抓到本机使用;无需使用其他采集器采集到个人电脑,需要通过FTP上传数据到服务器,试想如果你的采集图片和Flash当天超过100M,上传是什么概念时间。

  0 B/ e( H8 S7 p4、采用服务器安装,可快速进行采集内容导入cms文章系统或BBS论坛系统;如果离线使用< @采集器,远程存储或将 SQL 文件上传到存储会浪费时间。

  2 W8 T9 R" T/ M+ ]9 L6 C5、Beebee独有的断点连续挖掘和重复采集过滤功能可以为您节省更多的内容制作时间。

  " |. W' M' ?# \" V3 I-----------------------------

  # x/ s1 l0 U1 w$ V7 ?5 }: X9 R; a 下载地址:j+z+e&y。j" B, X8 r$ J

  Windows支持环境(集成Apache/php/mysql,推荐本地测试):

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线