[03]基础: 将采集规则应用于相同的网页结构

优采云 发布时间: 2020-08-08 01:37

  

  添加单个条目

  点击“添加潜在客户”,输入潜在客户网址并保存.

  

  批量添加

  使用Excel存储潜在客户网址

  

  单击“批量导入线索”添加附件,单击“批量导入”成功添加!

  

  添加了六个,加上原创示例URL,总共有七个线索,现在它们都处于“待抓取”状态.

  在此页面上,除了添加线索以外,您还可以激活,停用和删除线索.

  如何运行线索?

  运行采集规则是运行规则中的线索.

  从上图可以看出,“ weibo_blog主主页”规则中现在有7条线索,所有这些线索都处于“ Pending crawl”状态. 要运行这些线索,请从DS计数器开始.

  打开DS计数机,搜索要运行的规则,然后单击“单一搜索”或“集合”以启动DS计数机以捕获数据.

  单次搜索: 在当前DS窗口中采集;采集搜索: 弹出一个新窗口进行采集.

  

  单击“采集”后,输入一些要爬网的线索,然后单击“确定”.

  

  我们看到DS计数机正在运行并立即获取.

  

  如果您不知道要抓取多少线索,请右键单击DS计数器上的计数线索.

  

  如何激活销售线索?

  我刚刚运行了“ weibo_bloglor主页”采集规则,并且在会员中心看到这7条线索全部处于“抓取完成”状态.

  

  如果您按照上述步骤在DS计数器中再次运行该规则,则此时将提示您没有任何线索,因为这7条线索刚刚被运行.

  

  要再次捕获这些线索,只需重新激活这些线索即可. 激活后,这些线索的状态将变为“待抓取”.

  有两种激活方式-

  规则管理激活

  在规则管理中选择要激活的线索后,单击“激活”按钮.

  

  DS窗口激活

  

  在这里,看看刚才运行的采集规则“ weibo_blog master homepage”的结果文件〜

  

  在下一期中,结果文件将转换为Excel. 学习下一个问题之后,您将开始. 只要它不是复杂的网页,就可以采集它. 立于不败之地,令人兴奋吗?

  转载于:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线