网站程序自带的采集器采集文章(网站程序自带的采集器采集文章的时候数据库是有的)

优采云发布时间: 2021-09-17 18:08

　　网站程序自带的采集器采集文章的时候数据库是有的...app的话,你已经知道的这个采集器是无法判断文章是属于知乎.还是本站.不过个人猜测.是不是微信也是属于本站的.也就是说,如果出现了别的站点的链接.知乎搜索引擎是无法判断的.

　　原因就在于知乎数据库本身是有文章的，但是app的话就是出于app自己方面的解释方式，搜索引擎是无法判断的。所以只能推荐其他的文章了。

　　你得看是哪些站

　　这个问题我觉得是不是，

　　我这里写的爬虫都是从各大站点抓取，从不从其他站点采集。

　　因为知乎本身就是一个独立站点。

　　主要是知乎文章质量很高。

　　因为有些东西本身不在知乎数据库里要看的话需要再定义一个站点(垂直)

　　一开始也以为是爬虫的爬了

　　爬虫是用requests框架写的，爬虫可以模拟，这个正常。

　　知乎本身也是一个独立站点啊

　　我猜不可能会有爬虫爬全部的吧，如果真的全部的爬，那么不可能这么方便便捷的抓取全部的了，不然爬虫也太傻了，

　　因为知乎app是一个独立app啊！除了自己，

　　因为知乎app也是独立于知乎搜索的一个网站，从而实现数据共享。

0

2021-09-17

网站程序自带的采集器采集文章

0 个评论

要回复文章请先登录或注册