网站程序自带的采集器采集文章(网站程序自带的采集器采集文章的时候数据库是有的)

优采云 发布时间: 2021-09-17 18:08

  网站程序自带的采集器采集文章(网站程序自带的采集器采集文章的时候数据库是有的)

  网站程序自带的采集器采集文章的时候数据库是有的...app的话,你已经知道的这个采集器是无法判断文章是属于知乎.还是本站.不过个人猜测.是不是微信也是属于本站的.也就是说,如果出现了别的站点的链接.知乎搜索引擎是无法判断的.

  原因就在于知乎数据库本身是有文章的,但是app的话就是出于app自己方面的解释方式,搜索引擎是无法判断的。所以只能推荐其他的文章了。

  你得看是哪些站

  这个问题我觉得是不是,

  我这里写的爬虫都是从各大站点抓取,从不从其他站点采集。

  因为知乎本身就是一个独立站点。

  主要是知乎文章质量很高。

  因为有些东西本身不在知乎数据库里要看的话需要再定义一个站点(垂直)

  一开始也以为是爬虫的爬了

  爬虫是用requests框架写的,爬虫可以模拟,这个正常。

  知乎本身也是一个独立站点啊

  我猜不可能会有爬虫爬全部的吧,如果真的全部的爬,那么不可能这么方便便捷的抓取全部的了,不然爬虫也太傻了,

  因为知乎app是一个独立app啊!除了自己,

  因为知乎app也是独立于知乎搜索的一个网站,从而实现数据共享。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线