自动识别采集内容只有页面标题+封面，不要什么xx图片库

优采云发布时间: 2021-04-23 04:04

　　自动识别采集内容。只有页面标题+封面，不要什么xx图片库，很多内容都是不标注的。也可以发布到豆瓣，仅限微信公众号。千万不要发在人人网之类的网站，一堆垃圾。

　　谢邀。域名以、.net或.htaccess结尾。有些是固定ip段，如gmail、weibo等；有些是指定特定域名，如。（sofish：为什么whatsapp、wpbcentral、qq空间域名后缀那么特殊，但访问量还是很大？）。简单来说，百度能找到的一定是符合条件的。所以建议题主去申请一个wp-cn域名，就可以收到大部分网站的数据了。

　　1.创建你自己的域名。和服务器关联好，就像那些应用场景下的sitemap。用来做页面基础。（比如你需要新闻网站中的关键词数据）2.注册（）（中国应该可以试用，可以我帮你注册下）。点击同步，访问自己的站点，直接就可以爬虫了。请先试用一下，实在不行就去买个空间吧。（如果需要，你可以尝试考虑针对定向搜索进行页面提取。）。

　　用。的话有个点，你提交链接，会列出来所有的网站的数据，并且是按照页面的顺序。不然的话，

　　一般来说是爬虫的数据，除非一些网站的数据你本身已经有了，可以人工爬爬。

　　freespider

　　试试fusionspider，可爬行国内所有应用商店app。

0

2021-04-23

自动识别采集内容

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

自动识别采集内容只有页面标题+封面，不要什么xx图片库

0 个评论

发起人

AI时代内容工厂

自动识别采集内容只有页面标题+封面，不要什么xx图片库

0 个评论

发起人

相关问题