网站文章采集(风讯4.0sp4、PHP168、网易博客用户可以自行制作接口)
优采云 发布时间: 2021-09-07 23:00网站文章采集(风讯4.0sp4、PHP168、网易博客用户可以自行制作接口)
特殊接口已发布:dvbbs8.0、dvbbs7.1sp1、discuz5.5、phpwind5.3、bbsxp6.0sp1、bbsxp7. 0、kingcms3.0、dedecms3.1-4.0rc, wordpress2.1、wordpress2.2、风讯4.0sp4、 PHP168 v4.0、新云3.0
已测试模拟支持:SS5.5、百度空间、Empire Ecms、网易博客
用户可以自己制作界面,也可以不带界面直接使用模拟版
----------------------------------------------- -----------------------------------------
Editortools(ET)是一款可以无人值守、自动工作的独立软件,将个人站长从繁重的编辑工作中解放出来,每个月为网站中小型网站节省数万元的工资开支。 ;
ET 不要求您对现有论坛或网站 进行任何更改;
ET适用于任何网站或论坛;
功能介绍:
自动采集信息,发布到指定网站(非广告群发帖),适用于网站站长或管理员。
软件功能:
您可以采集发布任何文件,包括图片、FLASH、mp3、RAR文件;
可建立多个采集方案,自动添加各种信息到网站;
可以建立多个发布计划,可以同时管理多个网站,或者论坛的不同版块;
安装简单,运行稳定,可以运行在服务器上,也可以运行在站长的工作机上;
独立软件,无需修改网站,不消耗宝贵的服务器资源;
无人值守,24小时自动工作,相当于9个以上的更新编辑(三班倒,每班三到五人)。
运行环境:
windows系统,windowsXP,windows2000、windows2003目前已经测试过了。
发布网站服务器类型不限,WINDOWS、LINUX、FREEBSD均可。
v1.3 版本新特性介绍:
一、模拟发布
使用网站release页面模拟手动登录网站release文章;使用这个函数,你不需要创建网站接口;目前ss5.5信息,帝国Ecms新闻提供系统发布规则示例。
二、自动列表改进
采集规则的自动列表可以设置增量步长,方便网站在列表页面上的URL编号间隔大于1的自动列表采集。
三、多级转采集
一些网站文章页面使用JS脚本重定向URL或多次打开新窗口来访问正确的文章。这个功能可以支持采集这样的网站。
四、其他细节调整
不再需要1、列表规则中的title变量,适用于网站列表中没有title的一些情况;
2、FLASH的下载和上传不再单独列出,而是合并到文件下载和上传;
3、工作区增加“自动关闭”选项;
4、release配置中附加参数项的填写方式改为以行分隔;
5、发布配置增加当前文章URL和文件列表参数,提高界面制作的灵活性;
6、Publishing 规则可导出导入,方便分享模拟发布规则;
v1.2 版本新特性介绍:
1、支持COOKIES,需要登录的可以采集网站;
2、文章校验网址可以为空,方便部分不需要校验的用户加快发布速度。
3、修改复制规则时,省略了部分数据项。
4、 支持对 userAgent 的自修改,以便访问一些有特殊限制的网站;
5、修复部分图片解析无结果的问题;
6、支持命令行操作,参数如下:
/pall 或 /p1,2,3 自动运行所有计划或自动运行1、2、3 计划(按顺序)
/c 运行结束后关闭ET(每个方案列出采集一次,如果启用自动列表,则运行将在所有自动列表执行完毕后结束)
7、间隔时间可以保存以备下次使用;
8、自定义项可以任意扩展和添加,并有自己独立的过滤规则,以适应各种网站程序;
9、提供扩展下载,支持任意文件格式下载,支持动态链接下载,支持FTP协议URL下载;
10、 提供强制发布。图片等文件下载或上传失败时,当前文章仍可发布;
ET基本特性说明:
1、防盗链无害:无障碍下载使用防盗链的文件。动态防盗链接,如在asp、php、jsp等文件中显示图片,或静态防盗链接,如网易相册。
2、support文章分页采集;
3、图片水印:在过滤器配置中添加水印设置,根据方案为下载的图片添加水印;
4、Autolist:列表的URL自动增减;
5、多个text采集:适用于采集论坛回复或类似网页内容;
6、最小化到托盘:静默工作,不影响桌面应用;
7、文章整理:浏览和管理历史文章,错误文章;
8、code 监控窗口:适合高级用户,分析采集code;