站群自动采集器(优采云采集器(www.ucaiyun.com)数据入库导出的支持(组图))
优采云 发布时间: 2021-10-28 06:11站群自动采集器(优采云采集器(www.ucaiyun.com)数据入库导出的支持(组图))
优采云采集器() 是一个多线程的内容采集发布程序,适用于各大主流文章系统、论坛系统等。使用优采云@ >采集器,您可以立即创建一个内容丰富的网站。系统支持远程图片下载、图片批量水印、Flash下载、下载文件地址检测、自制发布cms模块参数、自定义发布内容等。此外,丰富的规则制定、内容替换功能,支持对于Access、Mysql、MSsql数据的存储和导出,可以让你采集的内容得心应手。现在您可以放弃过去重复繁琐的手动添加。工作,请开始体验即时建站的乐趣!
优采云采集器()是一款功能强大且易于使用的专业采集软件,强大的内容采集和数据导入功能可以帮助您<任何@采集的网页数据发布到远程服务器,自定义用户cms系统模块。不管你的网站是什么系统,都可以使用优采云采集器,系统自带的模块文件支持:风迅文章、东夷文章@ >、东网论坛、PHPWIND论坛、Discuz论坛、phpcms文章、phparticle文章、LeadBBS论坛、魔术论坛、德德cms文章、Xydw< @文章、景云文章等模块文件。更多cms模块请参考制作修改,或到官方网站与大家交流。
软件特点
分布式高速采集
将任务分配给多个客户端,同时运行采集,效率翻倍。
多重识别系统
搭载文字识别、中文分词识别、任意码识别等多重识别系统,智能识别操作更轻松。
可选验证方法
您可以随时选择是否使用加密狗以确保数据安全。
全自动操作
无需人工操作,任务完成后自动关机。
更换功能
同义词,同义词替换,参数替换,伪原创必备技能。
下载任何文件格式
可以轻松下载任何格式的文件,例如图片、压缩文件、视频等。
采集监控系统
实时监控采集,保证数据的准确性。
支持多个数据库
支持Access/MySQL/MsSQL/Sqlite/Oracle 多种类型的数据库存储和发布。
无限多页采集
支持无限级别的多页面信息,包括ajax请求数据采集。
支持扩展
支持接口和插件扩展,满足各种理发需求。
更新日志
3. SP4更新第二版主要内容 [2008-01-18]
1、 给任务添加了【任务参数1】和【任务参数2】标签,可以在任务右键菜单中修改,在WEB发布和数据库发布模块中可以直接使用
2、修改在线发布时固定编码格式为任意编码的可选设置
3、为采集网址、采集内容、发送内容的分步操作添加进度条显示
4、 增加了一种新的标签格式:自增随机数可以生成以某个数字开头,每次增加一个随机数的数字,比如生成一个增量时间戳
5、更新下载文件类别,进一步解决了对来源页面检测和登录验证检测检测文件下载的支持,并增加了当前下载文件的查看功能
6、扩大了全局case的范围,采集分页需要case支持的例子 ///lw/newsfile/2007/2/10/2007210_lwcool_10350.html
7、使用全新的SOCKET类解决服务端提交的协议冲突。Section=ResponseHeader Detail=CR后面必须跟LF,测试地址://news/news/show.php?id=56773
8、修改数据库发布设置时,测试标签没有加载到测试窗口
9、 增加了自动检测升级版本和获取自动更新软件列表的功能,以及自动下载最新文件的功能
10、 增加自动上报bug和建议功能
11、在标签规则的排除和替换中增加记录上下移动功能
12、修复发布时源页面地址标签内容未解析的问题
13、在自己的采集页面中除了默认页面(采集页面地址)之外,增加了这个页面(采集页面地址),可以提取变量在地址
14、 修改大文件界面导入URL时响应慢的问题
15、 修改自动插入(*)等字符时自动替换选中字符串的功能
16、 替换了自动汇总中多余的空格和换行符
17、导入导出任务去除多个确认框
18、 新增任务运行时突然关闭程序的弹出确认框
19、 增加了对整个站点的URL、内容、内容状态的编辑
20、 更改了配置文件的编码,增强了对繁体中文版系统的支持
21、增加了采集URL达到重复次数后是否继续判断或跳过URL的设置采集
22、 取消文件是否在html项的设置,改为自动判断是下载单个还是多个
23、修复下载图片的同时下载文件的功能
2 4、全局关键词替换添加了title标签的替换-sp3只支持内容标签
25、修复保存为多内容换行的csv文件并保存缩略图下一行时格式错误的问题
26、修复了Unix等系统的URL区分大小写服务器无法使采集地址后的页面小写的问题。参考://WS01/CL0051/index.html
27、全面启用log4net,日志异常记录更全面
28、增加了是否完成缩略图URL的设置,可以使用缩略图标签根据自定义规则采集列表页的内容
29、在内容替换中加入支持参数替换的功能,实现内容格式的任意组合
30、 增加了任务停止后是否自动注销任务显示界面的设置,有利于资源回收
31、获取拼音增加了只获取首字母的设置
32、 可以设置中文URL地址的编码,支持更广泛的非ASCII URL格式支持,如hello、"address".html