网页源代码抓取工具( 将一个本地网页中的URL筛选出来并保存在新的网页文件中)

优采云 发布时间: 2021-11-08 09:02

  网页源代码抓取工具(

将一个本地网页中的URL筛选出来并保存在新的网页文件中)

  URL 过滤小部件提取网页中的超链接地址

  更新时间:2021年4月20日23:24:38投稿:mdxy-dxy

  该VBS用于过滤掉本地网页中的URL,并将其保存在一个新的网页文件中。当然,只要改变里面的正则表达式,就可以用于其他目的。

  使用方法:将以下代码另存为jb51.vbs

  然后拖拽你本地保存的htm页面,拖拽这个vbs

  

'备注:URL筛选小工具

'防止出现错误

On Error Resume Next

'vbs代码开始----------------------------------------------

Dim p,s,re

If Wscript.Arguments.Count=0 Then

Msgbox "请把网页拖到本程序的图标上!",,"提示"

Wscript.Quit

End If

For i= 0 to Wscript.Arguments.Count - 1

p=Wscript.Arguments(i)

With CreateObject("Adodb.Stream")

.Type=2

.Charset="GB2312"

.Open

.LoadFromFile=p

s=.ReadText

Set re =New RegExp

re.Pattern= "[A-z]+://[^""()\s']+"

re.Global = True

If Not re.Test(s) Then

Msgbox "该网页文件中未出现网址!",,"提示"

Wscript.Quit

End If

Set Matches = re.Execute(s)

s=""

For Each Match In Matches

s=s & "<a href=""" & Match.Value & """>" & Match.Value & "<p>"

Next

re.Pattern= "&\w+;?|\W{5,}"

s=re.Replace(s,"")

.Position=0

.setEOS

.WriteText s

.SaveToFile p & "'s URLs.html",2

.Close

End With

Next

Msgbox "网址列表已经生成!",,"成功"

'vbs代码结束----------------------------------------------

  文章关于URL过滤小部件提取网页链接地址的介绍到此结束。关于提取网页链接地址的更多信息,请搜索前面的文章或继续浏览下面的相关文章,希望大家以后多多支持脚本之家!

  相关文章

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线