WPContentCrawler可以使用什么主要功能特点保存(组图)
优采云 发布时间: 2021-04-27 06:22
WPContentCrawler可以使用什么主要功能特点保存(组图)
WP Content Crawler v 1. 1 0. 0完美的取消授权-WordPress数据采集插件一个比wp-autopost pro更好的数据采集插件
WP Content Crawler允许您自动将网站上的几乎所有内容发布到WordPress上的站点,博客或在线商店!设置完参数后,插件将找到消息的URL并在后台自动扫描它们。详细的工具栏-查看后台会发生什么。活动站点,查看的消息数,更新的消息数,最近查看和更新的消息数,最后添加的URL,触发的上一个和下一个CRON事件,当前保存的消息和URL ...
支持WordPress 5. 3. x +和PHP 7. 4+最新版本
演示测试地址
[button class =“ demo” size =“ lg” href =“%3A%2F %% 2Fwp-admin%2F&reauth = 1” title =“”]测试地址背景
[/ button]
WP Content Crawler可以使用的主要功能
保存每个帖子的详细信息
标题,摘录,内容,标签,类别,项目符号,日期,自定义元,分类法,元关键字,元描述,特*敏*感*词*片,帖子图片,状态...一切。
视觉选择器(视觉检查器)
只需单击一个元素即可找到其CSS选择器。您还可以获取其他可能感兴趣的CSS选择器。无需离开管理面板。
获取(获取,获取,保存)帖子
配置设置后,插件将找到帖子的URL并自动在后台对其进行爬网。
重新抓取(更新)帖子
自动重新爬网帖子,以使其始终保持最新状态。您可以限制帖子的更新次数,设置更新间隔并忽略旧帖子。
删除帖子
您要删除旧的已爬网帖子吗?该插件可以自动将其删除。
控制计划
您可以设置网站每次应执行URL采集和爬网事件的次数。例如,您每分钟可以保存3个帖子,或者每2分钟运行5次URL采集。
保存类别
您的网站中没有目标类别?没问题。该插件可以为您创建目标类别。只需定义用于查找类别名称的CSS选择器即可。它们甚至可以创建为子类别。
保存块(永久链接)
您可以定义帖子的永久链接。您可以从目标站点获得永久链接,输入自定义文本,甚至可以使用简码为块创建模板。
保存类别
The
方法通过从目标站点检索分类值或手动输入分类值来保存分类值。保存自定义帖子类型的详细信息比以往任何时候都容易。
将帖子保存在自定义类别中
自定义帖子类型是否具有自定义类别?没问题。您可以定义自定义帖子类型使用的自定义类别分类法,并在定义帖子的类别时选择这些类别。该插件还可以为您创建自定义类别。
自定义帖子元
将所有内容另存为自定义帖子元。您可以使用CSS选择器,也可以只输入值。
内容模板
使用简码准备帖子内容,标题,摘录,列表项和画廊项模板。另外,您可以使用选项框为每个CSS选择器值定义一个模板。
替代选项
即使目标站点的设计彼此不同,您也可以编写替代选择器来获取数据。
查找并替换所有内容
您可以使用纯文本或正则表达式来查找和替换任何内容。您甚至可以修改页面的HTML,创建自己的HTML元素并编写选择器以使用它们。您甚至可以更改图像URL。你有力量。
分页帖子
目标帖子有一页以上?不用担心。您还可以保存分页的帖子。
列出类型的帖子
网站创建的某些帖子中收录列表。您可以从帖子中提取列表,创建应应用于每个列表项的模板,甚至反转列表。
删除不必要的元素
有时候,您需要去除一些元素,例如广告,评论,然后对其进行命名。只需编写其CSS选择器即可将其删除。
自动插入类别网址
目标网站上有数百个类别?一块蛋糕。只需编写CSS选择器,插件就会为您插入它们。
帖子类型
设置帖子类型。它可以是您的WordPress安装中可用的帖子,页面,产品或任何其他帖子类型。
删除链接
您可以从帖子中删除链接。只需选中复选框,链接就会消失。很简单
密码保护
您可以为帖子设置密码,以仅向具有密码的用户显示该帖子。
注释
您可以自己添加注释,以提醒您有关该网站的信息。 CSS选择器,TODO列表等。
实时测试所有内容,实时测试
搜寻,URL采集,CSS选择器,正则表达式,即时查找和替换选项以及代理。您还可以启用缓存以更快地执行测试并减少发送到目标站点的请求。
一次
测试站点的所有设置。使用测试仪,您可以测试网站设置中配置的所有选项,以确保在启用自动爬网之前一切都按需运行。
工具
使用这些工具,您可以使用帖子的URL手动保存帖子,使用ID重新抓取或删除保存的URL。
每个站点的自定义常规设置
您可以为每个帖子提供自定义常规设置,以覆盖它们并使它们适合某个网站。
发布状态
您可以直接发布已保存的帖子,也可以将其保留为草稿,以在发布前对其进行审核。
将所有图像保存在帖子内容中
就像选择一个复选框一样简单。
将图片另存为画廊
您可以将目标页面中的图像另存为图库,并为每个图像提供一个模板,使其适合您在前端使用的图库。您也可以仅通过选中复选框将图像另存为WooCommerce画廊。
任何数据作为简码
从目标页面获取任何内容作为简码,然后在插件模板中使用简码将任何数据放置在所需的位置。
代理
使用一个或多个代理从IP无法访问的站点获取内容。
饼干
向每个请求附加一个cookie(例如会话cookie)。例如,通过这种方式,您可以像登录时一样对目标站点进行爬网。
抓取尽可能多的帖子
您可以设置帖子搜寻或URL采集CRON事件应运行的次数。这样,例如,您可以每分钟保存100个帖子。请小心并考虑服务器的容量。
电子邮件通知
设置CSS选择器,其类别和帖子页面的值不应为空。使用这些选择器找到空值时,您将收到一封电子邮件通知。
从JSON获取数据
为CSS选择器启用JSON解析后,您可以轻松地从JSON获取值。
高级HTML操作
在响应HTML中查找内容,在元素属性中查找和替换,交换元素属性,删除元素属性,操纵元素的HTML,删除HTML元素...
自动翻译
使用Google Cloud Translation API,Microsoft Translator Text API,Yandex Translate API或Amazon Translate API的人工智能来自动翻译帖子。请注意,这些服务是付费服务,但Yandex Translate API除外。付费用户还可以在有限的时间内免费提供该服务。您可以查看其定价页面以获取更多信息。
自动伪原创
使用轮播功能自动重写已爬网帖子的内容,以改善搜索引擎的优化。该插件当前实现了收费的Spin Rewriter API和Turkce Spin API。您可以访问他们的网站了解价格详情。
重复核对邮件
通过URL,帖子标题和/或帖子内容检查重复的帖子。如果您使用的是WooCommerce,则已经存在SKU的产品将被视为重复产品,并且不会添加到您的网站中。
预定帖子
您可以添加/删除发布日期的分钟数。这样,您可以安排发布时间。
保存WooCommerce产品
保存价格,库存,运输,属性和高级选项。您可以将产品另存为简单产品或外部产品。您还可以设置可下载的文件选项,并将产品定义为虚拟产品。这些选项可用于大于或等于3. 3的WooCommerce版本。
选项框
您有控制权!为CSS选择器找到的值定义许多选项。选项包括搜索和替换,计算,模板和JSON解析设置。您也可以轻松导入/导出在选项框中定义的选项。
像专业人员一样处理
文件可以轻松地重命名,复制和移动保存的文件。您也可以使用模板定义已保存媒体文件的标题,描述,标题和备用文本,在其中可以使用任何短代码。您还可以为保存的文件分配一个随机名称。
专业
WordPress处理iframe和脚本的方式与WordPress不允许显示iframe和脚本的方式相同,因为它们会带来安全风险。您只需选中一个复选框即可将iframe和HTML脚本元素转换为短代码。简码将在您定义的允许的源域中显示iframe和脚本。
快速保存
使用快速保存按钮可以更快地保存设置。无需等待页面重新加载。
正则表达式在find-replace选项中定义一个正则表达式以查找任何内容。您还可以使用定界符和修饰符进行更精确的匹配。
保存“ srcset”属性
当其他尺寸的已保存图像可用时,插件会将它们分配给img元素的srcset属性,以便您的页面在不同屏幕尺寸下的加载速度更快。
保存“ alt”和“ title”属性
保存图像时,它们的“ alt”和“ title”属性会自动从目标站点中检索并分配给保存的媒体。您还可以为其定义模板以应用您的SEO策略。
警告
了解问题发生的时间。该插件将向您显示错误的详细信息,以便您可以立即修复。
处理字符编码问题
即使目标站点收录混合编码,该插件也可以处理不同的字符编码。您可以通过选中一个复选框来切换编码。
在设置之间轻松
导航会将导航固定在顶部!插件会在切换到新标签页之前存储您的位置,并在您再次激活标签页时恢复以前的位置。设置之间不再迷路了。
手动抓取工具
使用手动抓取工具通过输入其网址来保存多个帖子。您还可以输入类别URL,以便该工具可以从那里获取帖子URL。此外,您可以将其设置为同时抓取多个帖子。
将URL添加到数据库
该插件自动采集URL。但是,如果希望它仅对某些URL进行爬网,则可以使用手动爬网工具将其手动添加到数据库中。这样,将使用您的计划选项自动搜索指定的URL。
启用/禁用特定网站的自动爬网
您可以分别启用或禁用每个网站的自动爬网。
导入/导出
您可以轻松导入和导出网站设置。只需复制并粘贴由插件创建的代码即可。
无限
添加无限的站点,并根据需要激活任意数量的站点。
详细的仪表板
了解背景。活动站点,已爬网的帖子数,已更新的帖子数,上次爬网和更新的帖子,上次添加的URL,CRON事件的上一次和下一次运行,当前保存的帖子和URL ...
从管理面板获取更新
只要您准备好更新,就可以一键更新插件。只需转到管理面板中的更新页面即可。
使用最安全的PHP
该插件支持最新版本的PHP。
使用最新的浏览器
该插件支持Chrome,Firefox,Safari,Opera和Edge。
互动指南
交互式指南显示了如何逐步配置设置以实现某些功能,例如实时文档。您可以随时激活这些指南。您甚至可以从特定步骤开始。
在线文档
您可以在需要时查看在线文档。
设置旁边
中的每个设置
快速指南插件提供了一个快速指南,可帮助您了解每个设置的作用。
视频教程
观看视频教程,轻松学习如何使用该插件。
要求
PHP> = 7. 2,json,mbstring,curl,dom,WP-Cron。这些在大多数主机中已经可用。即使扩展名尚未激活,大多数托管站点也允许您从其控制面板启用这些扩展名。有关更多信息,请参见文档。
通过WP版本进行测试
5. 3、 5. 2、 5. 1、 5. 0、 4. 9
通过WooCommerce版本测试
3. 9、 3. 8、 3. 7、 3. 6、 3. 5
预览本地测量的屏幕截图