js 抓取网页内容(微信小程序解析网页内容一种变通方法-乐题库)

优采云 发布时间: 2021-11-14 10:02

  js 抓取网页内容(微信小程序解析网页内容一种变通方法-乐题库)

  本文文章主要介绍微信小程序解析网页内容的详细讲解和实例。这里我们使用爬虫来爬取复杂的网页。如果您遇到一些问题,请在这里整理并解决。有需要的朋友可以参考。下

  微信小程序解析网页内容详解

  最近在写爬虫,需要解析网页供微信小程序使用。文字和图片分析都好说,小程序也有对应的文字和图片标签可以显示。更复杂的,如表格,更棘手。无论是服务端解析还是小程序呈现都非常费力,难以涵盖所有情况。所以我认为将表格对应的HTML代码转换为图片将是一种解决方法。

  这里我们使用 node-webshot 模块,它对 PhantomJS 进行了轻量的封装,可以方便的以截图的形式保存网页。

  首先安装Node.js和PhantomJS,然后新建一个js文件,加载node-webshot模块:

   const webshot = require('webshot');

  定义选项:

   const options = { // 浏览器窗口 screenSize: { width: 755, height: 25 }, // 要截图的页面文档区域 shotSize: { height: 'all' }, // 网页类型 siteType: 'html' };

  这里要根据网页的情况合理设置浏览器窗口的宽度,高度可以设置一个很小的值,然后页面文档区域的高度必须设置为all,宽度默认为窗口宽度,以便表格可以设置为最小的全尺寸截图。

  接下来,定义 html 字符串:

  注意里面的HTML代码一定要去掉换行符,用单引号代替双引号。

  最后,截图:

   webshot(html, 'demo.png-600', options, (err) => { if (err) console.log(`Webshot error: ${err.message}`); });

  这样就实现了HTML代码到本地图片的转换,后期可以上传到七牛云等。无论是服务器的分析,还是小程序的呈现,都没有难度……

  感谢您的阅读,希望对您有所帮助,感谢您对本站的支持!

  以上就是微信小程序解析网页内容的详细内容和例子的详细内容。更多详情请关注其他相关html中文网站文章!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线