解读:快速按关键词做新闻泛采集的方法
优采云 发布时间: 2020-10-13 08:01使用优采云采集平台,按关键词平移采集以支持新闻信息,涵盖中国大多数主流新闻信息网站和APP,实时捕获最新信息,并且使用方法非常简单。您需要输入相应的关键词。步骤如下:
1.任务创建和配置:I.任务创建有两个入口:
data:image/svg+xml;utf8,
II。任务配置:网站分类:无限(默认),新闻网站,政府网站,报纸和期刊网站和APP;指定网站:仅采集某些网站数据,暂时仅支持微信公众号,今日头条,亿点信息和百家帐号;
data:image/svg+xml;utf8,
2.数据处理配置(可选)
如果您不需要数据处理,则可以跳过此步骤
I。数据处理入口
单击[配置数据替换,填充,删除等]按钮以输入数据处理配置;
注意:要使用此功能,必须首先采集将数据存入数据库,此功能是根据已保存的采集数据进行设置的!
data:image/svg+xml;utf8,
II,数据处理配置
此功能类似于详细信息提取器的配置,可以将其设置为删除,填充,替换和过滤功能;
data:image/svg+xml;utf8,
data:image/svg+xml;utf8,
III。图片下载配置
新闻窗格采集 采集的原创图片可能无法正常显示(防盗链接)。如果需要图片,请选择临时存储优采云或阿里云OSS或奇牛存储;
3.采集结果:
默认采集字段:
标题,内容,发布时间,标签,描述,关键词,网站名称(x_name),网站域名(x_id),第一张图片链接等;
data:image/svg+xml;utf8,