htmlunit 抓取网页(()软件介绍支持RSS的定制功能(组图))

优采云 发布时间: 2021-09-16 17:21

  htmlunit 抓取网页(()软件介绍支持RSS的定制功能(组图))

  网络爬虫是一种具有强大定制功能的新闻阅读工具。它可以抓取任何链接中的网站,极大地方便了需要获取每个站点信息的工作人员,提高了效率,节省了时间

  软件介绍

  支持RSS,包括RSS0.9/1.0 /2.0、原子、OPML等

  支持在任何站点抓取任何链接

  多站点同步更新(多线程)

  您可以自定义对指定链接的捕获或排除

  支持IE cookie的自动调用,适合需要登录的论坛

  如果没有提示MSVCR71.DLL文件,请下载并放在webclawer的同级目录下

  绿色软件,无需安装,可存储在U盘上执行

  点击下载软件

  软件使用

  软件不需要安装。解压缩后,双击将其打开。界面如图所示

  <IMG title=001 alt=001 src="//img2.pconline.com.cn/pconline/0804/22/1275786_001.jpg" border=0>

  图1软件界面

  让我们以太平洋软件信息和应用程序专栏为例,了解如何使用webclawer

  打开软件,展开相应列,右键点击,在菜单中选择“新建频道”,如图所示

  <IMG title=002 alt=002 src="//img2.pconline.com.cn/pconline/0804/22/1275786_002.jpg" border=0>

  图2添加通道

  在新频道中,依次输入频道名称、评论、分类和URL地址,选择文件类型-选择RSS模式,完成后保存。如图所示

  <IMG title=003 alt=003 src="//img2.pconline.com.cn/pconline/0804/22/1275786_003.jpg" border=0>

  图3添加通道接口

  <IMG title=004 alt=004 src="//img2.pconline.com.cn/pconline/0804/22/1275786_004.jpg" border=0>

  图4填写频道信息

  添加栏目后,只需选择相应的标题,每次右键点击“更新”,软件即可自动捕获更新后的页面

  虽然软件很小,但对于每天需要查看大量信息的朋友来说,这可以批量更新每个站点的每个栏目,节省大量重复性工作,达到提高工作效率的目的。我希望这个软件能给你带来方便

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线