js 爬虫抓取网页数据(Node学习之cheerio网络爬虫好了,啊哈哈哈~昨天的抓取博文)
优采云 发布时间: 2021-12-27 20:30js 爬虫抓取网页数据(Node学习之cheerio网络爬虫好了,啊哈哈哈~昨天的抓取博文)
书上次连上了,哈哈,昨天发表了,如何使用Node的cheerio模块抓取网页信息,那一定有我们自己使用的数据。
我昨天抓到的是一些超级诱人的糕点的照片,今天我给他们看了。大家都贪心了,哈哈哈哈~
获取昨天的博文,如果需要,请点击此链接:Cheerio Web Crawler for Node Learning
好,开始今天的表演,添加代码:
<p>var http = require("http");
var cheerio = require("cheerio");
//准备抓取的网站链接
var dataUrl = "http://www.mcake.com/shop/110/index.html#mainer_top";
http.get(dataUrl,function(res){
var str = "";
//绑定方法,获取网页数据
res.on("data",function(chunk){
str += chunk;
})
//数据获取完毕
res.on("end",function(){
//调用下方的函数,得到返回值,即是我们想要的img的src
var data = getData(str);
//console.log(data);
----------
//新添加的部分
//用node搭建服务器,将内容展示在页面上
var server = http.createServer(function(req,res){
//定义空的字符串
var html = "";
//循环得到的数据,拼接在html上
for(var i = 0;i