实用文章:文章处理插件
优采云 发布时间: 2022-11-03 00:59实用文章:文章处理插件
------------------------------------------------
采集时,许多网站喜欢将采集内容本地保存为 TXT 文件。如果本地 TXT 文件太多,则很难在网站上发布它们。
该插件可以批量导入本地TXT文件,可以通过一些个性化设置实现更*敏*感*词*!
由于该插件将来会添加更多文章处理功能,因此已从原来的“文章导入控件”重命名为“文章处理插件”!
插件主要功能介绍:
1.批量导入本地TXT文件,一次可批量处理1000多个文件
2. 用于导入 TXT 文件内容标签的个性化设置
3.导入的TXT文本文件可以自定义是否转换为富文本
4.标签可以通过百度AI人工智能自动获取
5.导入时,可以设置导入后的文章状态、分类和发布时间
6.文章可以批量删除
7、TXT导入随机发布时间方便定期发布
8. 标签文章批处理
9. 批量手动添加标签
10.借助伪原创借口,批量文章伪原创
11. 文章 定期发布
12. 批量修改文章状态
13.批量修改文章的分类
14. 批量导出文章
15. 在文章列表页面上显示查看次数
插件背景截图:
TXT 导入设置
批处理设置
计时工具
TXT文件导入说明:
1.即使导入的TXT文件的文件名文章标题,也易于在本地管理
2.根据后台自定义设置,可在TXT文件内容中设置文章的标签
(1)可以在TXT文件内容的第一行或最后一行设置标签,导入时会自动处理
(2) 使用 {标签} {/标签} 以包装标签的形式设置标签
(3)无需设置标签即可添加标签,插件会通过百度AI界面添加标签或随机选择本地标签
3. 设置导入的 TXT 文件的内容
(1) 使用 HTML 标记导入内容
如果导入的内容具有 HTML 标记,则可以选择直接导入内容,文章导入过程中不进行处理。
(2) 导入纯文本内容
如果导入的 TXT 内容没有 HTML 标记,则导入时内容将转换为富文本(带有一些 HTML 标记)
导入功能及文章批处理介绍:
1.多个TXT文件可以同时
选择导入,可同时处理1000多个TXT文件
2.您可以设置导入的分类
3.导入时可以设置文章的状态,例如直接发布或另存为草稿
4.设置导入的TXT文章的发布时间,为将来的定时功能做准备
版本更新:
v1.7.94 优化批量手动添加标签的功能
v1.7.93 批量标签处理,新增腾讯 NLP 标签获取功能(百度 AI 和腾讯 NLP 可选)。
v1.7.92 后台文章列表,新增多条件搜索功能
v1.7.91 优化导入逻辑
v1.7.9 优化了导入逻辑,为接下来几个版本中的新功能做好准备
v1.7.8 优化导入逻辑,空内容下拒绝导入器
v1.7.7 优化了新 API 版本计划发布后调用文章提交接口的问题文章成功发布的问题
v1.7.6 优化时推,返回推送结果信息。连接文章显示具有TXT导出功能的列表页面文章查看次数
只
v1.7.5 优化ZB1.7支持多选后台文章列表,优化导入文件时的时间设置
v1.7.4 修改新 API 推送时,文章发布时间为当前时间!
v1.7.3 修复了推送 API 时不使用算法分类的问题
v1.7.2 推出新版 API 定时发布功能,旧版本接口将在后续版本中下线
v1.7.1 修复ZB 1.6下模板选择问题,优化背景
v1.7.0 导入时增加模板选择,优化导入时作者选择功能
v1.6.9 优化百度推送逻辑,增加重复头文章导入控制功能
v1.6.8 优化支持ZB1.7版本,优化文章批量删除功能!
v1.6.7 优化导入过程中内容的处理逻辑,优化对ZB1.7beta版本的支持
v1.6.6 优化文章自动发布代码,优化个性设置提示
v1.6.5 添加导入文章选择随机分类优化百度推送代码
v1.6.4 新增导入TXT文件时选择作者的功能,新增文章导出为TXT文件的功能,新增定时发布推送到百度的功能
V1.6.3 修改导入时文章摘要的处理方式!(吐出来,有神明写题目,叫总结的时候,能不能先判断有没有文章总结!
V1.6.2 修复标签提取错误
V1.6.1 修改导入文章功能
V1.6 新增文章批量转移分类功能
V1.5 定期触发API密钥添加功能
批量伪原创上线V1.4,定期发布逻辑
V1.3 新增标签批处理功能
V1.2 以 {tag}{/tag} 包标签的形式添加文章导入,设置导入后文章的状态,添加 TXT 导入时的发布时间
操作方法:QQ空间爬虫使用方法
QQ空间爬虫的使用方法
QQ空间(Qzone)是腾讯于2005年开发的具有个人空间和博客功能的QQ附属产品,自问世以来就受到了很多人的喜爱,大部分用户都会在空间中分享生活。状态。今天给大家讲讲如何使用优采云采集器去爬虫QQ空间。
采集网站:
本文仅以上述QQ空间网址为例。如果您对采集其他QQ空间有其他需求,可以将QQ空间网址改为采集。
采集的内容包括:QQ聊
使用功能点:
●Cookie登录
●阿贾克斯点击
●修改Xpath
第一步:创建一个QQ聊采集任务
1)进入主界面,选择“自定义采集”
QQ谈采集第一步
2) 将你想要采集的网站的URL复制粘贴到输入框中,点击“保存URL”
QQ谈采集第二步
第 2 步:Cookie 登录
1)打开网页后,需要先登录。手机登录QQ时可以点击登录按钮采集,然后扫码登录成功。
QQ谈采集第三步
3)登录后,在高级选项中选择自定义cookies,勾选打开网页时使用固定cookies,然后点击获取当前页面cookie,最后点击“确定”,这样就不需要登录了以后你采集时再QQ。(cookie的有效期视具体情况而定)
QQ谈采集第四步
第 3 步:提取数据
1)登录成功后,可以打开空间主页,鼠标选择“谈论”,在提示框中选择“点击链接”
谈谈采集第五步
2)这一步涉及到Ajax技术。Ajax加载需要设置,打开“高级选项”,勾选“Ajax加载数据”,时间设置为“3秒”。因为据说打开页面后需要向下滑动才能显示更多内容,所以还需要设置页面滚动,滚动次数选择3。
次,每次间隔3秒,完成后点击“确定”。
谈谈 采集 步骤
6
3)将鼠标滑到页面底部,然后选择“下一页”,在提示框中选择“循环点击下一页”
谈谈采集第7步
用鼠标选中第一个“谈话”,提示框中“全选”
QQ谈采集第8步
然后选择“采集下面的元素文本”
QQ聊采集第九步
4)同上,点击页面这一步需要设置ajax,选择鼠标点击翻页,设置ajax点击加载和页面滚动,如果这一步的规则流程错误,你需要手动调整到整个规则的末尾
谈谈采集第十步
第 4 步:修改 Xpath
1)手动执行规则,发现并非所有元素都位于循环列表中,所以需要修改xpath,在火狐中查看源码发现网页涉及IFRAME
,在高级选项中勾选IFRAME中的元素,并填写对应的xpath“//IFRAME[@id='app_canvas_frame']”。
谈谈采集第11步
2)同上,循环的步骤也需要设置xpath,选择循环步骤,在高级选项中勾选IFRAME中的元素,填写对应的xpath
”//iframe[@id='app_canvas_frame']
,
说说采集第12步
3)当采集数据出现时,可以发现在采集中一直重复到最后一页。这时候就需要回到规则流来调整翻页周期的xpath了,如下图,单个元素的xpath修改为"//a[@class='c_tx'] /SPAN[text()='下一页']"
QQ聊采集第13步
第五步:QQ谈数据采集并导出
设置完成后,选择保存并启动采集,然后启动本地采集,
说说采集第14步
采集完成后会弹出提示,选择
“导出数据”选择“合适的导出方式”,导出采集好的数据。这里我们选择excel作为导出格式,导出数据如下图
谈谈采集第15步
相关 采集 教程:
1. 采集教程:
2. 说 采集:
3.群成员号采集:
4.
电子邮件采集:
5.腾讯地图数据采集:
6.腾讯新闻采集:
6.网易自媒体文章:
7. 微博图片采集:
8.微博粉丝信息采集:
9.新浪博客文章采集:
优采云——90万用户选择的网页数据采集器。
1.操作简单,任何人都可以使用:不需要技术背景,只要能上网采集即可。完成流程可视化,点击鼠标完成操作,2分钟快速上手。
2、功能强大,任意网站可选:对于点击、登录、翻页、身份验证码、瀑布流、Ajax脚本异步加载数据,所有页面都可以通过简单设置采集。
3.云采集,也可以关机。配置采集任务后,可以将其关闭,并可以在云端执行任务。庞大的云采集集群24*7不间断运行,无需担心IP阻塞和网络中断。
4、免费功能+增值服务,按需选择。免费版具有满足用户基本采集需求的所有功能。同时设置一些增值服务(如私有云),满足高端付费企业用户的需求。