网站内容更新监控(Python开发区文件教程资料!(1))

优采云 发布时间: 2022-01-15 14:06

  网站内容更新监控(Python开发区文件教程资料!(1))

  直接进入主题

  需要:

  (1) 获取你的对象chrome前一天浏览历史中的所有URL和访问时间,并保存在txt文件中

  (2)将此txt文件发送到指定的邮箱地址(你的邮箱)

  (3)每天创建例行任务并自动完成这些操作,你可以通过邮件查看你的对象每天看到的内容

  

  在此注意:无论你是刚刚学习 Python 还是在寻找 Python 中的高薪工作,请记住:实际项目始终是核心。如果没有python入门到高级实战的视频教程,可以关注我,后台私信我“py”,自动获取最新的python教程资料!老司机回答了!

  背景:

  (1)mac下chrome的浏览记录在哪里?怎么获取url和访问时间?

  答案:路径:/Users/username/Library/Application\ Support/Google/Chrome/Default/History

  History:是一个SQLite数据库,其实就是一个文件,可以使用DB Browser for SQLite

  要查看所有信息,我们想要的信息在 urls 表中

  获取方法:使用python自带的sqlite3库连接History,通过sql获取我们想要的信息

  (2)如何发送带有附件的电子邮件?

  答:使用python内置的email和smtplib模块来构造和发送邮件

  (3)如何自动化这些过程?

  A:使用shell脚本连接这些进程,然后使用crontab命令定时运行

  要求:

  macOS 塞拉利昂

  蟒蛇3.6

  铬合金

  发送邮件的QQ邮箱

  QQ邮箱授权码

  SMTP 服务器地址:

  接收邮件的电子邮件地址

  代码:

  1. get_history.py

  2. send_email.py

  3. 开始.sh

  4. crontab -e

  链接:密码​​:fspx

  实施:

  (1)首先我们用DB Browser for SQLite查看History中urls表的数据构成

  从表中可以看出,我们想要的URL和访问时间在urls.url和urls.last_visit_time中

  

  (2) get_history.py: 通过这个脚本,我们可以提取url和访问时间,并存储在

  在result.txt中,下图是我得到的部分结果

  

  (3) send_email.py:通过这个脚本,我们可以将result.txt作为附件发送到指定的email地址

  地址,下图是我得到的部分结果

  

  (4) ./start.sh : 其实前面的脚本已经完成了我们的任务,但是每次都执行了这么多脚本

  本,太麻烦了,我们可以把这些脚本的执行语句组织成一个shell脚本。

  cp /Users/Marcel/Library/Application\ Support/Google/Chrome/Default/History /Users/Marcel/Desktop/tmp/code/chrome_history/

python /Users/Marcel/Desktop/tmp/code/chrome_history/get_history.py

python /Users/Marcel/Desktop/tmp/code/chrome_history/send_mail.py /Users/Marcel/Desktop/tmp/code/chrome_history/result.txt

  这样,我们在终端执行./start.sh,系统会帮我们依次执行这三个语句

  注意:由于crontab命令需要绝对路径,所以这里的路径都是绝对路径

  (5) crontab : 如果你使用这个命令,当电脑开机并连接到互联网时,系统会自动执行它,然后将结果发送到你的邮箱

  使用方法:在终端输入crontab -e,使用vim输入以下代码行。

  20 14 * * * /Users/Marcel/Desktop/tmp/code/chrome_history/start.sh

  说明:前两个数字是您每天执行此脚本的时间。我在这里设置为 14:20。

  重要的再说一遍,一定要写绝对路径!!!

  问题:

  1.server.login(from_addr, password) 函数中的密码不是邮箱密码。在qq邮箱中,是指授权码

  A:QQ邮箱授权码:什么是授权码,如何设置?_QQ邮箱帮助中心

  2.访问历史数据库时,数据库被锁定!

  答:当我们打开浏览器并同时访问历史记录时会发生这种情况。有两种解决方案:

  (1)关闭浏览器再次访问

  (2)将History复制到另一个文件夹,然后访问该文件夹下的History

  3.如何转换时间戳

  答:last_visit_time 是微秒,所以除以 10^6;

  last_visit_time 的起始值为 1601 年 1 月 1 日 0:00:00 秒,所以需要减去;

  过滤昨天的数据:当前日期与last_visit_time之差小于1的数据为距当前时间的距离

  不到 1 天的数据

  4.crontab 错误

  答:crontab中的所有路径都必须写绝对路径,包括py脚本中的路径,绝对路径也必须写!

  5.路王问题

  A:转载的时候要注意把路劲换成自己的电脑,同时把那个邮箱相关的信息也换成自己的。

  总结:

  注意:无论你是刚刚学习 Python 还是在寻找 Python 中的高薪工作,请记住:实际项目始终是核心。如果没有python入门到高级实战的视频教程,可以关注我,后台私信我“py”,自动获取最新的python教程素材!老司机回答了!

  1.使用python连接SQLite数据库,进行sql操作

  2.使用python发送邮件

  3.使用 shell 和 crontab 创建自动化例程

  4.看别人隐私是不对的,这个文章只是我自己玩的,实际可行性不强本文文字和图片来自网络加上我自己的想法,仅供参考仅供学习交流使用,不具有任何商业用途,版权归原作者所有,如有任何问题,请联系我们处理。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线