火车头按作者采集今日头条全部文章的方式
优采云 发布时间: 2020-05-22 08:03
填写内容页采集规则。
在浏览器打开一篇文章,右键选择“查看源代码”。火车头采集器切换到“采集内容”选项卡,根据源代码填写标题、正文、等规则。
需要注意的是填写“内容”采集规则时,需要勾选“下载图片选项”并设置好图片保存的文件夹路径和文件名。
填写发布规则,这步须要事先下载“WordPress免登录发布模块”并装入火车头采集器目录Module文件夹中。火车头采集器切换到“发布内容设置”选项卡,勾选“启用方法一:web在线发布到网站”,点击“web发布配置”文章采集规则,在弹出对话框中选择“WordPress4.X免登录”,编码模式设为“UTF-8”,网站根地址填写你博客的首页地址,然后保存并选择该发布配置。
将免登录发布模块般配套的文件“past.php”上传到网站根目录。
回到火车头采集器,勾选采集网址、采集内容和发布三个复选框,点击工具栏“开始按键”,稍等几分钟,所有文章均被采集并发布到自建WordPress网站上,所有图片均下载到设置的文件夹内。
最后通过FTP工具把所有图片上传到对应目录,至此,今日头条发布的所有文章均被同步到自建网站上。
文章所需工具以及根据本教程生成的采集规则均已打包上传百度网盘(平台不容许填写链接)文章采集规则,如有须要可以留下联系方法或去9SiR博客下载,本文教程及软件仅供交流学习使用,请勿用于恶意用途,否则后果自负。如果有这方面问题的,欢迎到评论市留言。
文/九哥9SiR,未经许可,转载必究。如果你有疑问请留言,如果认为本文有用,请转发或收藏吧!