技巧篇——如何抓取网页中的图片

优采云发布时间: 2022-05-08 20:46

　　技巧篇——如何抓取网页中的图片

　　今天教大家爬虫必备技能——抓取网页中的图片。

　　首先用到的核心函数——webread

　　此函数的作用是获取网页源码

　　语法

　　str =webread(URL)

　　%%将 HTML 网页内容从指定的 URL 下载到字符向量 str 中。urlread 不检索超链接目标和图像。

　　str =webread(URL,Name,Value)

　　%%使用一个或多个 Name,Value 对组参数指定的其他选项。

　　例如去网易首页（）抓取所有图片，并存为本地图片代码如下：

　　str=webread('')

　　pics=regexp(str,'http://[\w/.-]+\.((gif)|(png)|(bmp))','match')

　　for m=1:length(pics)

　　urlwrite(pics{m},['网易首页图片',num2str(m),pics{m}(end-3:end)])

　　end

　　由此可以看到抓取的图片都保存至本地电脑。

0

2022-05-08

网站内容抓取

0 个评论

要回复文章请先登录或注册