免费采集器( 更新日志二级代理服务器新增Socks代理任务运行过程中可修改线程数等参数)

优采云 发布时间: 2021-10-05 23:12

  免费采集器(

更新日志二级代理服务器新增Socks代理任务运行过程中可修改线程数等参数)

  

  优采云采集器免费版()是一款专业强大的网络数据/信息挖掘软件。优采云采集器免费版()让您通过灵活的配置,轻松抓取网页中的文字、图片、文件等资源。

  更新日志

  辅助代理服务器的新 Socks 代理

  在任务运行过程中,可以修改线程数等参数,实时调整运行速度,增加查看当前任务运行速度和整体运行速度的功能

  支持SSH(SFTP文件)上传

  内容提取增加JSON提取方式,提取JSON数据更容易

  插件编辑器增加了C#源代码文件插件,与PHP源代码插件类似,编辑后直接生效,但比PHP源代码插件支持更多的插件接口

  软件崩溃,支持保存未完成任务的进度

  新消息机制

  V9 将合并采集 URL 和内容的方式。列表采集和内容采集使用不同的队列,优化采集的流程,将数据内容从Update更新到insert,大大提高了采集和存储速度;

  任务操作合并为统一界面,新增“实时数据”查看和“任务详情”统计;

  修改了原有的无限级列表页面URL获取方式,使无限级配置操作更简单;

  现场重复性比较功能不再使用数据库独有的方法,改为内存Md5_16比较,更加准确;

  标签数据来源更详细,可设置为从源代码中提取,URL地址和返回页头信息的默认页面、分页和多页面。

  软件特点

  分布式高速采集

  将任务分配给多个客户端,同时运行采集,效率翻倍。

  多重识别系统

  搭载文字识别、中文分词识别、任意码识别等多重识别系统,智能识别操作更轻松。

  可选验证方法

  您可以随时选择是否使用加密狗以确保数据安全。

  全自动操作

  无需人工操作,任务完成后自动关机。

  更换功能

  同义词,同义词替换,参数替换,伪原创必备技能。

  下载任何文件格式

  可以轻松下载任何格式的文件,例如图片、压缩文件、视频等。

  采集监控系统

  实时监控采集,保证数据的准确性。

  支持多个数据库

  支持Access/MySQL/MsSQL/Sqlite/Oracle等各类数据库的存储和发布。

  无限多页采集

  支持无限级别的多页面信息,包括ajax请求数据采集。

  支持扩展

  支持接口和插件扩展,满足各种理发需求。

  特征

  真正通用

  采集 无限网页,无限内容,支持多种扩展,突破操作限制。您决定选择什么以及如何选择它!

  高效稳定

  分布式高速采集系统,多台大型服务器同时稳定运行,快速分解任务,最大化效率。

  性价比高

  高性能的产品,实惠的价格,“为客户节约成本,提升价值”是优采云采集器的服务理念。

  数据准确

  内置采集监控系统,错误实时上报,及时修复;采集保证发布时数据零遗漏,为用户呈现最准确的数据。

  常问问题

  登录信息设置:对于一些需要登录的网站,需要设置此项。

  

  点击设置按钮跳转到第四步其他设置-Http请求设置

  

  点击使用浏览器获取网页登录信息按钮,登录网址,输入账号密码,然后关闭窗口

  

  这样,登录信息就已经记录在了采集器中,也就是我们常说的Cookie和User-Agent。

  安装步骤

  一、在本站下载最新版本的优采云采集器,双击运行即可。

  

  

  二、如下图所示,可以点击【浏览】设置软件的安装位置。

  

  三、设置好后点击【安装】,耐心等待。

  

  技能

  启动网址设置。

  采集 第一步规则制定,点击向导添加,①➯②,出现如图界面。

  有3种方式:普通URL、批量URL、文本导入。

  

  一种。普通网址:直接以一行一行的形式添加网址,不做任何分析。

  湾 Batch URLs:批量生成带有通用表达式的 URL。

  C。文本导入:文本导入的形式,文本为每行一个URL。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线