[03]基础: 将采集规则应用于相同的网页结构
优采云 发布时间: 2020-08-08 01:37
添加单个条目
点击“添加潜在客户”,输入潜在客户网址并保存.
批量添加
使用Excel存储潜在客户网址
单击“批量导入线索”添加附件,单击“批量导入”成功添加!
添加了六个,加上原创示例URL,总共有七个线索,现在它们都处于“待抓取”状态.
在此页面上,除了添加线索以外,您还可以激活,停用和删除线索.
如何运行线索?
运行采集规则是运行规则中的线索.
从上图可以看出,“ weibo_blog主主页”规则中现在有7条线索,所有这些线索都处于“ Pending crawl”状态. 要运行这些线索,请从DS计数器开始.
打开DS计数机,搜索要运行的规则,然后单击“单一搜索”或“集合”以启动DS计数机以捕获数据.
单次搜索: 在当前DS窗口中采集;采集搜索: 弹出一个新窗口进行采集.
单击“采集”后,输入一些要爬网的线索,然后单击“确定”.
我们看到DS计数机正在运行并立即获取.
如果您不知道要抓取多少线索,请右键单击DS计数器上的计数线索.
如何激活销售线索?
我刚刚运行了“ weibo_bloglor主页”采集规则,并且在会员中心看到这7条线索全部处于“抓取完成”状态.
如果您按照上述步骤在DS计数器中再次运行该规则,则此时将提示您没有任何线索,因为这7条线索刚刚被运行.
要再次捕获这些线索,只需重新激活这些线索即可. 激活后,这些线索的状态将变为“待抓取”.
有两种激活方式-
规则管理激活
在规则管理中选择要激活的线索后,单击“激活”按钮.
DS窗口激活
在这里,看看刚才运行的采集规则“ weibo_blog master homepage”的结果文件〜
在下一期中,结果文件将转换为Excel. 学习下一个问题之后,您将开始. 只要它不是复杂的网页,就可以采集它. 立于不败之地,令人兴奋吗?
转载于: