技巧篇——如何抓取网页中的图片
优采云 发布时间: 2022-05-08 20:46技巧篇——如何抓取网页中的图片
今天教大家爬虫必备技能——抓取网页中的图片。
首先用到的核心函数——webread
此函数的作用是获取网页源码
语法
str =webread(URL)
%%将 HTML 网页内容从指定的 URL 下载到字符向量 str 中。urlread 不检索超链接目标和图像。
str =webread(URL,Name,Value)
%%使用一个或多个 Name,Value 对组参数指定的其他选项。
例如去网易首页()抓取所有图片,并存为本地图片代码如下:
str=webread('')
pics=regexp(str,'http://[\w/.-]+\.((gif)|(png)|(bmp))','match')
for m=1:length(pics)
urlwrite(pics{m},['网易首页图片',num2str(m),pics{m}(end-3:end)])
end
由此可以看到抓取的图片都保存至本地电脑。