nodejs抓取动态网页(一个网页的内容.write()介绍)
优采云 发布时间: 2022-03-20 00:19nodejs抓取动态网页(一个网页的内容.write()介绍)
网页的内容其实是一个字符串,response.write()可以接受一个字符串作为参数,所以显然你只需要将网页的内容作为参数传递给response.write()。例如:
var http = require('http');
http.createServer(function(req, res){
var html = ''
+''
+'nodejs'
+''
+''
+ 'hello world! 1234'
+''
+'';
res.writeHead(200,{'Content-Type' : 'text/html'});
res.write(html);
res.end();
}).listen(8888);
在浏览器地址栏输入127.0.0.1:8888查看结果,打开控制台,可以发现网页的所有内容都已经收录了在浏览器中。
一个网页一般收录css样式文件和javascript脚本文件,上例中没有两个文件。现在你可以添加简单的css和javascript文件来看看效果:
var http = require('http');
http.createServer(function(req, res){
var html = ''
+''
+'nodejs'
+''
+''
+''
+''
+ 'hello world!hello world! 1234'
+''
+'';
res.writeHead(200,{'Content-Type' : 'text/html'});
res.write(html);
res.end();
}).listen(8888);
你会发现css文件和javascript文件都没有正确下载。这是因为这段代码中指定的'Content-Type'都是'text/html'类型,而且所有的响应内容都是一样的,当然看不到想要的效果。
我们知道有很多不同的方式来引入 CSS 样式和 javascript 脚本。CSS 样式可以使用外部样式、内部样式和内联样式,而 JavaScript 可以同时使用外部和内部样式。由于无法正确显示外线,您可以尝试其他方法。通过测试可以发现,在网页上无论是css内部样式还是内联样式都可以看到,javascript也是如此。
可以看到浏览器中的文字显示为红色。
但是现代 Web 开发并不提倡这两种方法。现代 Web 开发提倡使用 css 样式和 javascript 来使用 outreach 来方便管理和重用。css文件和javascript文件都是静态文件,我们可以尝试搭建一个简单的静态文件服务,这样就可以在网页中正确使用出站文件。