讲解一下如何把一个网站的文章采集到自己的网站
优采云 发布时间: 2021-08-11 04:21讲解一下如何把一个网站的文章采集到自己的网站
以飘柔博客网站()为例,说明如何将一个网站文章采集转给自己的网站,同时下载链接网盘地址为也是你自己的(文件批量传输到你自己的网盘)。
其实采集和发布文章很简单。难点是如何批量转储或下载对方的文件到你的网站/SkyDrive,可以对应文章和网盘下载链接。
需要准备:
飘柔博客网站优采云采集rule VIP账号,发布模块批量传输工具,城市通网盘VIP账号(对方网站使用城市通网盘存储文件,如果你要转,只能转到城通网盘,其他网盘不能直接转)
目前本站所有中文电子书的文件都在800G左右。不买城市通行证VIP就下载这么多文件到本地是不现实的。我的城市通行证VIP大概一千元,我已经从下载中赚回来了(每次下载2到5美分,超过100M的文件1美分)。
看到这个,有些同学可以关掉网页离开了。
第一步:
把所有文件都dump到自己的网盘上,5万多个文件,当然不是手动的。所以我写了一个转储工具,可以批量转储,重命名城市通行证文件。
问题是,为什么要重命名?重命名是非常重要的一步,因为它可以:
避免因名称问题统一导致下载链接失败,发布文章时,可以关联网盘文件下载链接
传输文件时,将文件重命名为目标网站文章的ID。比如这个文章中的电子书转移到自己的网盘后,文件名应该是96233.epub。为什么?看第二步。
33%
第二步:
批量转储文件重命名后,使用优采云来采集城通网盘下载链接和文件名生成html文件,以文件名命名。比如上面提到的96233.epub,采集生成96233.html,文件收录从城通网盘下载文件的链接。
你可以直接在你的网站文章中链接这个html,用户在html页面点击网盘链接下载文件,或者在后面的第三步,你可以使用采集的这个页面@法里采集 用户会直接打开网盘页面下载;链接html的好处是可以展示广告位获得收益,看下面的demo(顺便点击广告有惊喜):
html 文件演示:
此方法适用于免费下载资源。如果是收费的,当然最好直接采集到网盘地址,避免别人根据html文件名获取其他文件下载地址。
66%
第 3 步:
既然你已经有了从网盘下载文件的所有链接,并且html文件名对应目标站的文件名,你只需要将生成的html上传到网站space,就可以了使用目标站的优采云@k0 采集文章,文件下载地址为采集上传的html中的网盘地址。
100%
明白了吗?不知道怎么下拉。
上述城市通行证文件及采集规则的转让请联系站长咨询购买,采集Other网站可查询。