java抓取网页内容(前几天女友在网上看了一本电子书怎么可以重复的复制粘贴呢?)

优采云 发布时间: 2022-02-06 04:23

  java抓取网页内容(前几天女友在网上看了一本电子书怎么可以重复的复制粘贴呢?)

  前几天,我女朋友在网上看了一本电子书,想下载,但是那个网站只能支持在线阅读,不能下载,还好可以复制粘贴。

  于是复制粘贴的任务就交给了我。我查看了 网站 网址。单个文章的html源码非常简单。作为程序员,如何反复复制粘贴? ?

  所以有了这段代码,还是比较简单的:

<p>

package WEB;

import java.io.BufferedReader;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.io.OutputStreamWriter;

import java.io.UnsupportedEncodingException;

import java.net.HttpURLConnection;

import java.net.MalformedURLException;

import java.net.URL;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

* 网页抓取

* @author 胡阳

* @blog http://www.the5fire.com

*

*/

public class WebGet {

private String myUrl;

private HttpURLConnection con;

private StringBuilder contextAll = new StringBuilder("");

private int pageCount = 0;

private String pageType = "";

public WebGet() {

}

public WebGet(String url) {

this.myUrl = url;

}

public WebGet(String url,int pageCount,String pageType) {

this.myUrl = url;

this.pageCount = pageCount;

this.pageType = pageType;

}

/**

* 正则表达式

* */

public String regex() {

String googleRegex = "

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线