js 爬虫抓取网页数据(Node学习之cheerio网络爬虫好了，啊哈哈哈~昨天的抓取博文)

优采云发布时间: 2021-12-27 20:30

　　书上次连上了，哈哈，昨天发表了，如何使用Node的cheerio模块抓取网页信息，那一定有我们自己使用的数据。

　　我昨天抓到的是一些超级诱人的糕点的照片，今天我给他们看了。大家都贪心了，哈哈哈哈~

　　获取昨天的博文，如果需要，请点击此链接：Cheerio Web Crawler for Node Learning

　　好，开始今天的表演，添加代码：

<p>var http = require("http");

var cheerio = require("cheerio");

//准备抓取的网站链接

var dataUrl = "http://www.mcake.com/shop/110/index.html#mainer_top";

http.get(dataUrl,function(res){

var str = "";

//绑定方法，获取网页数据

res.on("data",function(chunk){

str += chunk;

})

//数据获取完毕

res.on("end",function(){

//调用下方的函数，得到返回值，即是我们想要的img的src

var data = getData(str);

//console.log(data);

----------

//新添加的部分

//用node搭建服务器，将内容展示在页面上

var server = http.createServer(function(req,res){

//定义空的字符串

var html = "";

//循环得到的数据，拼接在html上

for(var i = 0;i

0

2021-12-27

js 爬虫抓取网页数据

0 个评论

要回复文章请先登录或注册