htmlunit 抓取网页(编程之家为你收集整理的全部内容解决方法())

优采云 发布时间: 2022-02-13 21:25

  htmlunit 抓取网页(编程之家为你收集整理的全部内容解决方法())

  概述 当使用 htmlunit 抓取网页时,我偶尔会注意到这些警告充斥着控制台输出。 2011 年 7 月 24 日 5:12:59 PM

  在使用 htmlunit 抓取网页时,我偶尔会注意到这些警告淹没了控制台输出。

  Jul 24,2011 5:12:59 PM com.gargoylesoftware.htmlunit.javascript.StrictErrorReporter warning

WARNING: warning: message=[Calling eval() with anything other than a primitive string value

will simply return the value. Is this what you intended?] sourceName=[http://ad.doubleclick.net/adj/N5762.morningstar.com/B5553006.25;sz=728x90;click0=http://ads.morningstar.com/RealMedia/ads/click_lx.ads/www.morningstar.com/quicktake/fund/L34/648978540/TopLeft/Morningstar/JPM_FRpt_728x90_Jul_3827448/Fund_Reports_728x90_content.html/656d5477595534723465554144664a2b?;ord=648978540?] line=[356] lineSource=[null] lineOffset=[0]

  有没有办法让htmlunit忽略javascript

  > .*

  > .*

  就算了

  >

  >

  同样,有没有办法让 htmlunit 只解释收录特定子字符串或匹配正则表达式的网页上的 javascript?

  解决方案

  您可以通过实现自己的 javascript 来删除不需要的 JavaScript

  .您的 ScriptPreProcessor 可以检测到您不想执行的 jsvascript,而不是将其从 网站 中删除。

  我还没有尝试过,但它可能会起作用。

  总结

  以上是编程之家为您采集的全部内容。希望文章可以帮助你解决你遇到的程序开发问题。

  如果你觉得编程之家网站的内容还不错,欢迎你把编程之家网站推荐给你的程序员朋友。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线