java爬虫抓取动态网页(Java_爬虫，如何抓取Js动态生成数据的页面？)

优采云发布时间: 2021-10-09 00:18

　　Java_爬虫，如何抓取Js生成的动态数据的页面？

　　很多网站使用js或者jquery来生成数据。后台获取数据后，使用 document.write() 或 ("#id").html="" 写入页面。这时候用浏览器看源码是看不到数据的。

　　HttpClient 不起作用。看网上的HtmlUnit，说后台js加载后可以得到完整的页面，但是我按照文章上写的，但是不行。

　　对于答案，典型的是此链接的页面。 java程序中如何获取数据？

　　------解决思路--------------

　　试试

String s= "http://xinjinqiao.tprtc.com/admin/main/pro!lrprolist.do";

URL url = new URL(s);

HttpURLConnection http = (HttpURLConnection) url.openConnection();

http.setDoOutput(true);

http.setDoInput(true);

http.setRequestMethod("POST");

http.connect();

OutputStreamWriter out = new OutputStreamWriter(http.getOutputStream(), "UTF-8");

String input = "name=flr&nowpage=1&pagesize=10";

out.append(input);

out.flush();

out.close();

int length = (int) http.getContentLength();

System.out.println(length);

BufferedReader reader = new BufferedReader(new InputStreamReader(http.getInputStream()));

String line;

StringBuffer buffer = new StringBuffer();

while ((line = reader.readLine()) != null) {

buffer.append(line);

}

reader.close();

http.disconnect();

System.out.println(buffer.toString());

　　------解决思路--------------

　　可以看代码，也可以抓包看看。

0

2021-10-09

java爬虫抓取动态网页

0 个评论

要回复文章请先登录或注册