使用新浪微博开放平台api同步微博内容至自己网站(想做个简单的实验的内容不对的地方欢迎拍砖)
优采云 发布时间: 2022-03-24 11:05使用新浪微博开放平台api同步微博内容至自己网站(想做个简单的实验的内容不对的地方欢迎拍砖)
本文来自:转载请注明出处
额,我只是想做一个简单的实验。如果内容有误,请补砖...
只是在这里使用 JSOUP 给出一些想法
我只爬自己的主页和别人的微博主页,没有尝试过其他爬取(抱歉懒...)
第一种是使用JSOUP登录页面
于是我偷懒,用IE的开发者工具来获取cookie。获取的cookie应该写成map的形式,然后使用代码:
Response res=Jsoup.connect("http://weibo.com").cookies(map).method(Method.POST).execute();
String s=res.body();
有很多发现:
您可以编写自己的脚本来打印 map.put(xxx,xxx)
我这里用scala写了一段,用java写没关系:
s.split("; ").foreach(s => {val x=s.split("=");println(s"""map.put("${x(0)}","${x(1)}");""")});
最后的body 嗯……是一堆脚本标签。顶部是微博固定顶栏的内容(导航栏的内容)
lz试了一下,发现我需要的是