java抓取网页内容(前几天女友在网上看了一本电子书怎么可以重复的复制粘贴呢?)
优采云 发布时间: 2022-02-06 04:23java抓取网页内容(前几天女友在网上看了一本电子书怎么可以重复的复制粘贴呢?)
前几天,我女朋友在网上看了一本电子书,想下载,但是那个网站只能支持在线阅读,不能下载,还好可以复制粘贴。
于是复制粘贴的任务就交给了我。我查看了 网站 网址。单个文章的html源码非常简单。作为程序员,如何反复复制粘贴? ?
所以有了这段代码,还是比较简单的:
<p>
package WEB;
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 网页抓取
* @author 胡阳
* @blog http://www.the5fire.com
*
*/
public class WebGet {
private String myUrl;
private HttpURLConnection con;
private StringBuilder contextAll = new StringBuilder("");
private int pageCount = 0;
private String pageType = "";
public WebGet() {
}
public WebGet(String url) {
this.myUrl = url;
}
public WebGet(String url,int pageCount,String pageType) {
this.myUrl = url;
this.pageCount = pageCount;
this.pageType = pageType;
}
/**
* 正则表达式
* */
public String regex() {
String googleRegex = "