java抓取网页内容(Java中字符串String类型的输入源程序是怎样的？)

优采云发布时间: 2021-11-01 08:26

　　在互联网行业，页面内容应该是分类或聚合数据。我们需要及时分析行业数据。这将有助于很好地比较公司未来的发展。那么今天的爱站技术频道就为大家带来java阅读网页内容的详细例子，有需要的朋友可以参考以下。

　　java阅读网页内容的详细例子

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.*;

public class loadurl {

public static void main(String args[]) {

String a = null;

try {

String url = "（这里替换成任意网页的网址）";

BufferedReader in = new BufferedReader(new InputStreamReader(

new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根据需要替换成要读取网页的编码

while ((a = in.readLine()) != null) {

System.out.println(a);

}

} catch (MalformedURLException e) {

} catch (IOException e) {

}

　　上面的代码程序将一个网页的源代码，包括 HTML 和 XML，读取到 JAVA 中的字符串 String a 中。

　　Java中的String类型空间很大，基本可以容纳一个网页源码的内容。

　　从网页中读取内容也是对输入流的操作。

　　与标准输入源不同，在：

BufferedReader in = new BufferedReader(new InputStreamReader(...))

　　只需在 InputStreamReader 中输入 System.in。

　　这里的输入源应该是：

(new URL(url).openConnection().getInputStream(), "GB2312")

　　后续的操作和处理与加载标准输入源完全一样。

　　BufferedReader 要求JAVA 必须捕获IOException，使用URL source 不仅要导入.* 包，还要捕获MalformedURLException。

　　java读取网页内容的例子的详细说明与其他操作不同。如果我们在操作过程中怕麻烦，建议您咨询爱站技术频道编辑，我们可以为您提供周到的服务。

0

2021-11-01

java抓取网页内容

0 个评论

要回复文章请先登录或注册