java抓取网页内容( 2017年09月26日08:45投稿：lqh这篇文章)

优采云发布时间: 2022-01-09 00:02

　　java抓取网页内容(

2017年09月26日08:45投稿：lqh这篇文章)

　　java读取网页内容的详细例子

　　更新时间：2017-09-26 08:34:45 投稿：lqh

　　本文章主要介绍java读取网页内容示例的相关信息。希望这篇文章能对大家有所帮助，让大家学习和理解这部分内容。有需要的朋友可以参考以下

　　java读取网页内容的详细例子

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.*;

public class loadurl {

public static void main(String args[]) {

String a = null;

try {

String url = "（这里替换成任意网页的网址）";

BufferedReader in = new BufferedReader(new InputStreamReader(

new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根据需要替换成要读取网页的编码

while ((a = in.readLine()) != null) {

System.out.println(a);

}

} catch (MalformedURLException e) {

} catch (IOException e) {

}

　　上面的代码程序是将网页的源代码，包括HTML和XML，读成JAVA中的字符串String a。

　　Java中的String类型空间很大，基本可以容纳一个网页源代码的内容。

　　从网页读取内容也是对输入流的操作。

　　与标准输入源不同，在：

BufferedReader in = new BufferedReader(new InputStreamReader(...))

　　在 InputStreamReader 中输入 System.in。

　　这里的输入源应该是：

(new URL(url).openConnection().getInputStream(), "GB2312")

　　后续操作和处理与加载标准输入源相同。

　　BufferedReader需要在JAVA中捕获IOException，而使用URL源不仅要引入.*包，还要捕获MalformedURLException。

　　如有任何问题，请留言或到本站社区交流讨论，感谢您的阅读，希望对大家有所帮助，感谢您对本站的支持！

0

2022-01-09

java抓取网页内容

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

java抓取网页内容( 2017年09月26日08:45投稿：lqh这篇文章)

0 个评论

发起人

AI时代内容工厂

java抓取网页内容( 2017年09月26日08:45投稿：lqh这篇文章)

0 个评论

发起人

相关问题