复制后在第二篇新闻页面源文件中搜的应用
优采云 发布时间: 2021-06-13 21:00复制后在第二篇新闻页面源文件中搜的应用
复制后,在第二个新闻页面的源文件中搜索,看看有没有,如果有,就可以使用了;同理,找到新闻的最后一句,找到最近页面中唯一的一段代码。复制后,在第二个新闻页面的源文件中搜索,看看有没有,如果有,就可以使用了;数据处理:因为采集是其他网站信息,里面可能还有其他网站信息,比如公司名称、*敏*感*词*、品牌等信息,也可能有其他网站超链接等信息这时候需要对信息进行过滤;数据处理-添加-以下对应参数HTML标签过滤:滚动轴水平拉到最后,在所有标签前打勾,点击确定;内容替换:把这条网站信息替换成自己的,原则是先整改后拆,用公司名称、电话号码(拆分)、手机号码(拆分)、邮箱地址、公司地址(拆分)、品牌名称,网址(拆分);其中split就是对这些数据进行拆解替换。这时候就需要进行以下更换:因为在新闻中,这是拆机更换的时候,才能更换干净。你可以多看看他的新闻,可能用什么格式;
注意:数据处理还有很多技巧,需要在使用的过程中思考,也是采集的核心。如果处理不好,可能是别人的嫁衣,所以一定要仔细观察考虑综合,处理好的话,从采集下来的文章甚至可以直接发布(不是你自己的)企业网站)
Notes()1、右击组:出现如下菜单,可以正常使用;
新建任务:在这个组上新建一个任务;运行该组下的所有任务:顾名思义;新任务:在该组下重新创建一个组;编辑/删除组:编辑/删除当前组;导入/导出组规则:是导出当前组下的所有任务并导入到同一版本优采云;导入本组任务:导入本组下导出的单个任务;粘贴本组下的任务:复制任务后的此项只要出现,可以粘贴多个相同的任务,粘贴后再编辑任务;
开始任务:与菜单栏上的开始相同;编辑任务:编辑已写入的任务;导出任务:可以将当前规则导出,并在同版本的其他工具上导入,但在导入数据时需要重复以上部分。第六步-发布内容设置,必须重新选择/填写;复制任务到粘贴板:复制后,选择一个任务组,点击右键,可以将不同数量的任务粘贴到该组中,避免同一个任务被多次写入;任务的采集data全部清空:new 如果采集过任务要重新采集,需要先清空;
3、其他设置:点击顶部菜单栏中的工具—选项,配置全局选项和默认选项;全局选项:可以调整同时运行的最大任务数。通常,它是 5,但您可以不理会它;默认选项:是否忽略 case point is;
本文链接: