百度这样搜索site:windows2008的文章分类也不同
优采云 发布时间: 2021-07-07 19:46百度这样搜索site:windows2008的文章分类也不同
这一步教程值得文章单独写。每个网站都有不同的设计,他们的文章类别也不同。这是最常见的结构。
我们首先需要确定你想要采集什么内容,然后根据不同的内容找到目标网站。
比如我想要采集IT资讯,云服务器内容。
以静安的文章为例,我第一次发现他的文章在哪个网站。
在百度上搜索这样的网站:windows2008
site:表示只搜索该域名下的内容,包括www域名和其他二级域名的内容
空格后面是关键词for windows2008,所以我在Jingan网站下找到了所有关于windows2008的相关内容。
从搜索结果可以看出,主要有两个域名。我选择这个网站是因为它收录了很多内容!
网站上有很多文章,我们需要找到我们想要的文章采集。我选择了与服务器教程相关的文章
点击这个分类查看,有33页的列表,数量还行
现在在列表的第一页,他的地址是
然后我们翻页看第二页,发现地址变成了
第三页变成
这个有更好的列表页面规则,非常适合我们采集。
选择它!
下面我们开优采云采集器,剩下的必须用采集器操作。
请看后续教程