文章网址采集器( 网站实时监控自动采集文章内容的操作页:同理)
优采云 发布时间: 2021-12-13 09:24文章网址采集器(
网站实时监控自动采集文章内容的操作页:同理)
网站实时监控和自动更新采集文章内容
该任务的目的是实时监控网站更新,发现更新后立即自动将采集文章内容保存到数据库中。1、首先打开网站信息监控工具,添加监控网页,设置关键词监控,点击保存按钮。
2、添加监控目标URL,按关键词设置监控。
3、 然后点击监控报警选择卡,链接发送到外网口。这里的8888端口是木浏览器设置的接收端口。
4、 然后在木头浏览器的自动控制中打开外部界面,在弹出的对话框中点击开始。里面的端口号是信息监控工具中的外网端口,两个端口必须一致。然后点击信息监控工具的开始监控
5、打开项目管理器,新建一个网页,点击添加按钮,然后在URL上右键选择外部变量中的@link,点击添加添加成功
6、新建一个抓取元素,随便打开一个百度新闻获取,先获取标题,最后获取文章的内容,点击确定添加成功,给元素一个标题,点击添加按钮,元素被添加。同理,添加文章内容
7、 在项目管理中新建一个执行sql,将监控到的数据保存到数据库中。在这种情况下,使用本地数据库。1.选择本地使用的数据库,我这里使用的mysql 5.0版本数据库,然后填写数据库的相应信息,填写后点击测试按钮,如果
8、 然后点击左上角项目中的保存,保存在一个目录下,然后关闭并重新打开外部界面,在运行的项目中点击浏览,选择刚刚保存的项目,然后点击开始查看信息监控工具将监控到的数据保存到数据库中。
9、 然后在信息监控工具中清除信息列表数据,重新开启监控,当相关文章被监控时,数据会发送到木业软件进行处理。
10、 最终运行结果存入数据库
以上就是网站实时监控和自动采集文章使用信息监控工具和木头浏览器结合的操作
页: [1]