java抓取网页数据( Excel教程Excel函数Excel表格制作Excel2010Excel实用技巧Excel视频教程)

优采云 发布时间: 2022-04-18 13:17

  java抓取网页数据(

Excel教程Excel函数Excel表格制作Excel2010Excel实用技巧Excel视频教程)

  java从网页或文件中获取电子邮件号码

  更新时间:2017-03-28 16:05:05 作者:java大渣

  这篇文章主要详细介绍java如何爬取网页或文件中的邮箱号,有一定的参考价值。有兴趣的朋友可以参考一下。

  本文中的例子分享了java抓取邮箱号的具体代码,供大家参考。具体内容如下

  java抓取文件中邮箱号的具体代码

  

package reg;

import java.io.BufferedReader;

import java.io.FileNotFoundException;

import java.io.FileReader;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class TestEmail {

public static void main(String[] args) {

// TODO Auto-generated method stub

BufferedReader br=null;

try {

br=new BufferedReader(new FileReader("D:/1.htm"));

String str=null;

StringBuilder sb=new StringBuilder();

while((str=br.readLine())!=null){

sb.append(str);

}

List es=getEmail(sb.toString());

for(String e:es){

System.out.println(e);

}

} catch (FileNotFoundException e) {

// TODO: handle exception

e.printStackTrace();

}catch (IOException e) {

// TODO: handle exception

e.printStackTrace();

}finally {

try {

if(br!=null) br.close();

} catch (IOException e) {

// TODO: handle exception

e.printStackTrace();

}

}

}

public static List getEmail(String str){

List es=new ArrayList();

Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}");

// Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");

Matcher m=p.matcher(str);

while(m.find()){

es.add(m.group());

}

return es;

}

}

  

  Java爬取网页中邮箱号码的具体代码

  

package reg;

import java.io.BufferedReader;

import java.io.InputStreamReader;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class Testemail01

{

public static String getWebCon(String domain)

{

System.out.println("开始抓取邮件地址..("+domain+")");

StringBuffer sb=new StringBuffer();

try

{

java.net.URL url=new java.net.URL(domain);

BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream()));

String line;

while((line=in.readLine())!=null)

{

parse(line);

}

in.close();

}

catch(Exception e)

{

sb.append(e.toString());

System.err.println(e);

}

return sb.toString();

}

public static void main(String[] args)

{

String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784");

}

private static void parse(String line)

{

Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//邮箱的正则表达式

Matcher m=p.matcher(line);

while(m.find())

{

System.out.println(m.group());

}

}

}

  

  以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持Scripting Home。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线