php网页抓取工具(URL筛选小工具提取网页中的链接地址使用方法(图))
优采云 发布时间: 2022-03-17 23:14php网页抓取工具(URL筛选小工具提取网页中的链接地址使用方法(图))
URL 过滤器小部件从网页中提取 URL
使用方法:将以下代码另存为phpstudy.vbs
然后把你本地保存的htm页面拖拽下来,拖拽到这个vbs上
复制代码代码如下:
'注意:URL 过滤器小部件
'防止错误
出错后继续下一步
'vbs代码开始--------------------------- ---
调暗 p,s,re
如果 Wscript.Arguments.Count=0 那么
Msgbox "请将网页拖到本程序的图标上!",,"Tips"
Wscript.退出
如果结束
对于 i= 0 到 Wscript.Arguments.Count - 1
p=Wscript.Arguments(i)
使用 CreateObject("Adodb.Stream")
.Type=2
.Charset="GB2312"
.打开
.LoadFromFile=p
s=.ReadText
设置 re =New RegExp
re.Pattern= "[A-z]+://[^""()\s']+"
re.Global = True
If Not re.Test(s) Then
Msgbox "URL 没有出现在这个页面文件中!",,"Prompt"
Wscript.退出
如果结束
设置匹配 = re.Execute(s)
s=""
对于匹配中的每个匹配
s=s & "" & Match.Value & "
"
下一个
re.Pattern="&\w+;?|\W{5,}"
s=re.Replace(s,"")
.Position=0
.setEOS
.WriteText s
.SaveToFile p & "'s URLs.html",2
.关闭
结束
下一个
Msgbox "网址列表已生成!",,"成功"
'vbs代码结束------------------相关阅读:
FreeBSD 安装和配置
Win2003服务器权限设置问题及解决方法
JS调用服务器时间方法
Php Image Resize 图片大小调整函数代码
大大减少了安装 Windows 7 所需的时间
juqery 学习三个选择器级别基础
CSS优化2-(常用CSS缩写总结)
php数组函数序列的array_splice()——在数组任意位置插入元素
Sql Server 2005默认端口修改方法
PHP数据库操作面向对象的优点
在jQuery中使用延迟对象的代码1.5(翻译)
运行多个 MYSQL 服务器
IIS中ASP.NET连接SQL Server报错的解决方法
介绍性 CSS 教程:计算 CSS 框模型的宽度和高度