抓取网页新闻(世界十大报纸之一《人民日报》采集任务分析配置思路分析)
优采云 发布时间: 2022-03-13 01:07抓取网页新闻(世界十大报纸之一《人民日报》采集任务分析配置思路分析)
l 采集网站
【场景描述】采集人民日报新闻资讯。
【来源介绍网站】
人民网是世界十大报纸之一、互联网上最大的中文、多语种新闻之一《人民日报》打造的大型新闻在线信息发布平台网站。人民网作为国家重点新闻网站,具有新闻报道的权威性、及时性、多样性和评论性等特点,在网民中树立了“权威媒体、大众网站”的形象。
【使用工具】嗅探ForeSpider数据前采集系统,免费下载:/view/forespider/view/download.html
【入口网址】/rmrb/html/2021-09/07/nbs.D110000renmrb_01.htm
【采集内容】
采集人民日报新闻的标题、发布时间、文章正文等。
【采集效果】如下图:
l 思想分析
配置思路概述:
l 配置步骤
1. 新 采集 任务
<p>选择【采集配置】,点击任务列表右上方的【+】号新建采集任务,在【