php网页抓取工具(URL筛选小工具提取网页中的链接地址使用方法(图))

优采云 发布时间: 2022-03-17 23:14

  php网页抓取工具(URL筛选小工具提取网页中的链接地址使用方法(图))

  URL 过滤器小部件从网页中提取 URL

  使用方法:将以下代码另存为phpstudy.vbs

  然后把你本地保存的htm页面拖拽下来,拖拽到这个vbs上

  复制代码代码如下:

  '注意:URL 过滤器小部件

  '防止错误

  出错后继续下一步

  'vbs代码开始--------------------------- ---

  调暗 p,s,re

  如果 Wscript.Arguments.Count=0 那么

  Msgbox "请将网页拖到本程序的图标上!",,"Tips"

  Wscript.退出

  如果结束

  对于 i= 0 到 Wscript.Arguments.Count - 1

  p=Wscript.Arguments(i)

  使用 CreateObject("Adod​​b.Stream")

  .Type=2

  .Charset="GB2312"

  .打开

  .LoadFromFile=p

  s=.ReadText

  设置 re =New RegExp

  re.Pattern= "[A-z]+://[^""()\s']+"

  re.Global = True

  If Not re.Test(s) Then

  Msgbox "URL 没有出现在这个页面文件中!",,"Prompt"

  Wscript.退出

  如果结束

  设置匹配 = re.Execute(s)

  s=""

  对于匹配中的每个匹配

  s=s & "" & Match.Value & "

  "

  下一个

  re.Pattern="&\w+;?|\W{5,}"

  s=re.Replace(s,"")

  .Position=0

  .setEOS

  .WriteText s

  .SaveToFile p & "'s URLs.html",2

  .关闭

  结束

  下一个

  Msgbox "网址列表已生成!",,"成功"

  'vbs代码结束------------------相关阅读:

  FreeBSD 安装和配置

  Win2003服务器权限设置问题及解决方法

  JS调用服务器时间方法

  Php Image Resize 图片大小调整函数代码

  大大减少了安装 Windows 7 所需的时间

  juqery 学习三个选择器级别基础

  CSS优化2-(常用CSS缩写总结)

  php数组函数序列的array_splice()——在数组任意位置插入元素

  Sql Server 2005默认端口修改方法

  PHP数据库操作面向对象的优点

  在jQuery中使用延迟对象的代码1.5(翻译)

  运行多个 MYSQL 服务器

  IIS中ASP.NET连接SQL Server报错的解决方法

  介绍性 CSS 教程:计算 CSS 框模型的宽度和高度

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线