使用新浪微博开放平台api同步微博内容至自己网站(这是移动端微博信息_selenium_sina__)

优采云 发布时间: 2022-01-02 12:05

  使用新浪微博开放平台api同步微博内容至自己网站(这是移动端微博信息_selenium_sina__)

  这是一个新浪微博爬虫,使用python+selenium实现。免费资源,希望对你有帮助,虽然是傻瓜式爬虫,但至少能跑。同时在rar中收录了源代码和爬取示例。参考我的文章:【python爬虫】Selenium爬取新浪微博内容和用户信息【python爬虫】Selenium爬取新浪微博客户端用户信息、热点话题和评论(上) 主要爬取内容包括:新浪微博手机用户信息和微博信息。用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。 微博信息:包括转发或原创、点赞、转发、评论、发布时间、微博内容等。安装过程:1.先安装Python环境,作者是Python2.7.82.然后安装PIP或者easy_install3.通过安装selenium命令pip install selenium,是一个自动测试爬取的工具4.然后在代码中修改用户名和密码,填写自己的用户名和密码5.运行程序,并自动调用火狐浏览器登录微博。注:手机信息更精致简洁,动态加载没有限制,只是显示微博或粉丝id等20个页面,这是它的缺点;虽然客户端可能有动态加载,比如评论和微博,但它的信息更完整。 [源码] 爬取手机微博信息spider_selenium_sina_content.py 输入:明星用户id列表,使用URL+用户id访问(这些id可以从用户的关注列表中获取) SinaWeibo_List_best_1.txt 输出:微博信息和基本信息用户信息 SinaWeibo_Info_best_1.txtMegry_Result_Best.py 用户使用该文件整理某一天的用户微博信息,例如2016年4月23日【源代码】爬取客户端微博信息抓取客户端信息,但是评论是动态的已加载,还在研究中 weibo_spider2.pyBy:Eastmount 2016-04-24

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线