官方数据:Python数据采集案例(2):Selenium实现的猫眼网播热度采集
优采云 发布时间: 2022-09-29 23:15官方数据:Python数据采集案例(2):Selenium实现的猫眼网播热度采集
目标
本例通过图文详细介绍使用Selenium请求和解析网页的方法。目标要求是通过Selenium获取猫眼实时网播热度数据,并打印到控制台。
案例应用技巧:
硒安装方法
通过pip安装selenium模块,安装命令:pip install selenium;
下载与Chrome浏览器版本匹配的chromedriver可执行文件,下载地址:.
实施过程
使用Selenium设计爬虫,不再解析Url,模拟真实请求;相反,您可以直接通过 Selenium 模拟浏览器操作,打开网页,解析数据。具体实施过程如下:
首先,我们用浏览器看一下我们的目标页面,对它有个初步的认识。我们发现网页上的数据每3秒左右自动刷新一次,也就是说网页源代码中不存在数据,而是通过Ajax加载的。
接下来,使用 Selenium 启动一个浏览器(不建议在无头模式下进行测试),并使用该浏览器打开 URL:
from selenium import webdriver
browser = webdriver.Chrome(executable_path=r"D:\Python38_64\chromedriver_81_0_4044_69.exe") # ChromeDriver可执行文件的路径
<p>
browser.get("http://piaofang.maoyan.com/dashboard/web-heat")</p>
(测试时可以使用IDLE或者使用PyCharm的Python Console模式进行测试,否则代码运行后打开的浏览器也会关闭)
使用 Selenium 控制的 Chrome 浏览器打开的页面
接下来,我们开始解析网页中的数据。使用浏览器控制台先定位每部电视剧/网剧的标签,再定位排名、名称、信息(名称下的文字)、实时热度、实时播放量所在的标签这些标签,并解析出来的数据。
Selenium中常用的定位方式如下:
Selenium 常用标签定位方法
for movie_label in browser.find_elements_by_css_selector(
"#app > div > div > div.dashboard-content > div.dashboard-list.dashboard-left.bg > div.movielist-container > div > table > tbody > tr"):
print("排名:", movie_label.find_element_by_class_name("moviename-index").text)
print("名称:", movie_label.find_element_by_class_name("moviename-name").text)
print("信息:", movie_label.find_element_by_class_name("moviename-info").text)
<p>
print("信息:", movie_label.find_element_by_class_name("heat-text").text)
print("信息:", movie_label.find_element_by_class_name("last-col").text)</p>
(find_element_by_class_name方法是定位标签;text属性是返回标签中的文字)
操作结果已经可以将前 30 名的网络直播人气打印到控制台,满足了当前的需求。
排名: 01
名称: 幸福,触手可及!
信息: 多平台播放 上线8天
信息: 4701.99
信息: 3565.2万
......
本系列案例采集所有数据仅供学习研究之用!
完整源码:扩展链接中的“猫眼网播人气采集.py”
最佳实践:SEO自动化营销:营销推广迅速覆盖全网
品牌官网的高效曝光离不开搜索引擎优化。而做SEO优化也不是一件简单的事情。企业不仅需要组建专业的运营团队,保证源源不断的输出内容,还要持续跟踪营销效果。对大多数中小外贸企业来说,难以坚持,消耗精力。
借助AI技术,小鱼夫SEO自动化营销为企业提供自动SEO优化、智能内容生成、数据诊断分析、营销工具加持等一体化功能。快速覆盖全网,全面提升品牌曝光度。
SEO自动优化:获取精准搜索流量
依托AI技术,SEO自动化营销可以自动规范外贸SEO基本设置网站:自动生成贴合页面内容的Title标签、KeyWords标签、Description标签和URL,帮助用户部署尽可能多的有效关键词。
用户可以分别部署AI智能生成的首页、栏目、产品、文章和内容页面。填写关键词时,可以在系统词库中选择,也可以手动填写。如果需要调整,也可以一键重新生成。推广关键词快速霸屏,让每个页面都能获得精准的搜索流量。
智能内容生成:量产优质内容
智能内容生成是 SEO 自动化营销工具的一大亮点。系统可以生成三种类型的网站内容:产品、文章和聚合页面。帮助用户利用内容的力量提升网站的质量和整体营销力,快速提升网站的排名,推广收录。
AI产品用户只需填写产品基本信息,系统即可智能生成匹配关键词的产品描述,并可根据发布需求自由设置发布时间。
人工智能文章
系统自带数亿素材辅助内容创作,可生成品牌问答、新品发布、客户回访等多种文章类型,满足不同使用场景。
AI聚合页面可以聚合产品、文章、问答、知识等内容,根据主题内容生成单独的页面。用户只需输入关键词即可批量生成,丰富内容的同时让网站更有条理。
数据诊断分析:衡量 SEO 营销效果
SEO自动化营销工具提供数据诊断和分析功能,便于及时跟踪营销效果。用户只需授权谷歌站长账号并完成谷歌分析跟踪代码的安装,即可无缝对接谷歌营销数据,实时准确跟踪营销推广。
该工具提供两种可视化营销数据,内容转化漏斗和询价转化漏斗。从内容转化和询盘转化的角度,分析营销每一步的流失率,帮助用户及时调整运营策略,促进业务增长。
该工具还附带 100 多个营销指标。用户可以一键诊断网站营销分数,根据优化建议调整策略,让推广优化更有针对性。
营销利器加持:全面提升网站曝光度
此外,系统为用户提供AI外链、句子库、内容检测三大营销工具的加持,让功能覆盖更全面,助力网站增加曝光。
AI外链
系统提供630+优质外链平台资源。用户可以选择手动发布或一键自动发布,管理外链建设报告和实时发布,新增网站引流渠道。
语句库
通过强大的AI语义分析,系统可以自动将句子放入用户的网站内容中,使产品卖点更加突出,内容更具企业特色,让页面更有利于被搜索引擎搜索到收录.
内容检测
系统为用户提供的内容检测包括关键词密度检测和页面相似度查询,方便用户更高效地布局关键词,优化内容质量,提升网站整体排名@>。
结合以上四大功能,SEO自动化营销可以帮助用户实现高效的营销推广,简化SEO优化工作流程,提高网站曝光率和排名,让客户主动*敏*感*词*,带来高转化流量和订单.
结尾