网页文章采集器(PHPWIND的初衷.X和PHPArticle2.01的区别)
优采云 发布时间: 2021-12-18 07:23网页文章采集器(PHPWIND的初衷.X和PHPArticle2.01的区别)
写这个采集器的初衷是为我的网站添加内容,但经过群里几个朋友的反复要求,变成了通用类型。虽然功能不是很强大,但是现在应该还是可以用的。好了,不怕笑话,今天贴出来。如果效果好,我会继续开发。
安装环境:
这个采集器是用Visual C#编写的,可以在Windows 2003下运行,如果在Windows 2000、XP下运行,请从微软官网下载.net framework1.1或更高版本的环境组件:
附:.net框架1.1个下载链接:
.net框架2.0下载地址:
功能介绍:
1、多系统支持,现在支持PHPWIND、DISCUZ、DEDEcms2.X和PHPArticle2.01采集支持,如果你的系统现在是软件尚未添加,请联系我们,网民要求最高的系统将在下个版本中添加。
2、 模拟用户登录,就像操作浏览器一样,但程序只处理核心数据,运行速度更快。
3、 可以设置是否下载远程图片和Flash到本地(Flash文件一般比较大,建议不要下载,程序会自动获取其绝对地址)。
4、多线程,时间间隔可以根据你的机器性能和网速或者系统允许的文章发布时间设置
5、更强大的URL采集功能,有了采集页面区域的定义,手动生成URL和采集二级页面功能基本可以采集到达你 任何你想要的 URL 集合。
6、内容规则定义了多个内容过滤规则,彻底过滤掉内容中的广告等无用内容。
7、网站采集,内容规则导入导出功能,方便网友分享采集到的内容。
8、论坛支持Html和UBB两种发帖方式。
9、,如果你想到了,请告诉我。
内容存储功能还没有添加,以后再完善。. .
好好享受!