java抓取网页内容( 2017年09月26日08:45投稿:lqh这篇文章)
优采云 发布时间: 2022-01-09 00:02java抓取网页内容(
2017年09月26日08:45投稿:lqh这篇文章)
java读取网页内容的详细例子
更新时间:2017-09-26 08:34:45 投稿:lqh
本文章主要介绍java读取网页内容示例的相关信息。希望这篇文章能对大家有所帮助,让大家学习和理解这部分内容。有需要的朋友可以参考以下
java读取网页内容的详细例子
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.*;
public class loadurl {
public static void main(String args[]) {
String a = null;
try {
String url = "(这里替换成任意网页的网址)";
BufferedReader in = new BufferedReader(new InputStreamReader(
new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根据需要替换成要读取网页的编码
while ((a = in.readLine()) != null) {
System.out.println(a);
}
} catch (MalformedURLException e) {
} catch (IOException e) {
}
}
}
上面的代码程序是将网页的源代码,包括HTML和XML,读成JAVA中的字符串String a。
Java中的String类型空间很大,基本可以容纳一个网页源代码的内容。
从网页读取内容也是对输入流的操作。
与标准输入源不同,在:
BufferedReader in = new BufferedReader(new InputStreamReader(...))
在 InputStreamReader 中输入 System.in。
这里的输入源应该是:
(new URL(url).openConnection().getInputStream(), "GB2312")
后续操作和处理与加载标准输入源相同。
BufferedReader需要在JAVA中捕获IOException,而使用URL源不仅要引入.*包,还要捕获MalformedURLException。
如有任何问题,请留言或到本站社区交流讨论,感谢您的阅读,希望对大家有所帮助,感谢您对本站的支持!