使用Python构建基本WEB漏洞扫描器(二) 爬虫插件系统的开发—E

优采云发布时间: 2020-08-17 21:52

　　一、实验介绍1.1 实验内容

　　基于上节的爬虫，在爬虫的基础上降低一个插件系统，通过爬虫爬取网页链接后调用这个插件系统中的插件进行各类操作，本节也会写个简单的email搜集插件作为列子，后面也会提到怎样写各类基于爬虫的插件。

　　1.2 实验知识点1.3 实验环境二、实验原理

　　利用python的__import__函数动态引入脚本，只须要规定脚本怎么编撰，便可以进行调用，email搜集是基于爬虫得到的源码进行正则匹配。上节我们创造了script这个目录，这个目录上面储存我们编撰的python插件。

　　三、实验步骤3.1 __import__函数

　　我们都晓得import是导出模块的，但是毕竟import实际上是使用builtin函数import来工作的。在一些程序中，我们可以动态去调用函数，如果我们晓得模块的名称(字符串)的时侯，我们可以很方便的使用动态调用。一个简单的代码：

　　def getfunctionbyname(module_name,function_name):

module = __import__(module_name)

return getattr(module,function_name)

　　通过这段代码，我们就可以简单调用一个模块的函数了。

　　3.2 插件系统开发流程

　　一个插件系统运转工作，主要进行以下几个方面的操作

　　获取插件，通过对一个目录里的以.py的文件扫描得到将插件目录加入到环境变量sys.path爬虫将扫描好的url和网页源码传递给插件插件工作，工作完毕后主动权还给扫描器3.3 插件系统代码

　　在lib/core/plugin.py中创建一个spiderplus类，实现满足我们要求的代码。

　　#!/usr/bin/env python

# __author__= 'wanggangdan'

import os

import sys

class spiderplus(object):

def __init__(self,plugin,disallow=[]):

self.dir_exploit = []

self.disallow = ['__init__']

self.disallow.extend(disallow)

self.plugin = os.getcwd()+'/' +plugin

sys.path.append(plugin)

def list_plusg(self):

def filter_func(file):

if not file.endswith(".py"):

return False

for disfile in self.disallow:

if disfile in file:

return False

return True

dir_exploit = filter(filter_func, os.listdir(self.plugin))

return list(dir_exploit)

def work(self,url,html):

for _plugin in self.list_plusg():

try:

m = __import__(_plugin.split('.')[0])

spider = getattr(m, 'spider')

p = spider()

s =p.run(url,html)

except Exception,e:

print e

　　work函数中须要传递url,html，这个就是我们扫描器传给插件系统的，通过代码

　　spider = getattr(m, 'spider')

p = spider()

s =p.run(url,html)

　　我们定义插件必须使用 class spider中的run方式调用。

　　3.4 扫描器中调用插件

　　这里我们主要是爬虫调用插件，因为插件须要传递url和网页源码这两个参数，所以我们在爬虫获取到这两个的地方加入插件系统的代码即可。

　　首先打开 Spider.py

　　在 Spider.py 文件开头加上

　　import plugin

　　然后在文件的末尾加上：

　　disallow = ["sqlcheck"]

_plugin = plugin.spiderplus("script",disallow)

_plugin.work(_str["url"],_str["html"])

　　disallow是不容许的插件列表，为了便捷测试，我们可以把sqlcheck填上，当然，也可以不要了。因为我们接下来就更改下我们上节的sql注入检查工具，使他可以融入插件系统。

　　3.5 sql注入融入插件系统

　　其实十分简单，大家更改下script/sqlcheck.py为下边即可：

　　P.S. 关于 Download 模块，其实就是 Downloader 模块(写的时侯不留神写混了)，大家把 Downloader.py 复制一份命名为 Download.py 就行。

　　import re,random

import lib.core import Download

class spider:

def run(self,url,html):

if(not url.find("?")):

return False

Downloader = Download.Downloader()

BOOLEAN_TESTS = (" AND %d=%d", " OR NOT (%d=%d)")

DBMS_ERRORS = {# regular expressions used for DBMS recognition based on error message response

"MySQL": (r"SQL syntax.*MySQL", r"Warning.*mysql_.*", r"valid MySQL result", r"MySqlClient\."),

"PostgreSQL": (r"PostgreSQL.*ERROR", r"Warning.*\Wpg_.*", r"valid PostgreSQL result", r"Npgsql\."),

"Microsoft SQL Server": (r"Driver.* SQL[\-\_\ ]*Server", r"OLE DB.* SQL Server", r"(\W|\A)SQL Server.*Driver", r"Warning.*mssql_.*", r"(\W|\A)SQL Server.*[0-9a-fA-F]{8}", r"(?s)Exception.*\WSystem\.Data\.SqlClient\.", r"(?s)Exception.*\WRoadhouse\.Cms\."),

"Microsoft Access": (r"Microsoft Access Driver", r"JET Database Engine", r"Access Database Engine"),

"Oracle": (r"\bORA-[0-9][0-9][0-9][0-9]", r"Oracle error", r"Oracle.*Driver", r"Warning.*\Woci_.*", r"Warning.*\Wora_.*"),

"IBM DB2": (r"CLI Driver.*DB2", r"DB2 SQL error", r"\bdb2_\w+\("),

"SQLite": (r"SQLite/JDBCDriver", r"SQLite.Exception", r"System.Data.SQLite.SQLiteException", r"Warning.*sqlite_.*", r"Warning.*SQLite3::", r"\[SQLITE_ERROR\]"),

"Sybase": (r"(?i)Warning.*sybase.*", r"Sybase message", r"Sybase.*Server message.*"),

}

_url = url + "%29%28%22%27"

_content = Downloader.get(_url)

for (dbms, regex) in ((dbms, regex) for dbms in DBMS_ERRORS for regex in DBMS_ERRORS[dbms]):

if(re.search(regex,_content)):

return True

content = {}

content["origin"] = Downloader.get(_url)

for test_payload in BOOLEAN_TESTS:

RANDINT = random.randint(1, 255)

_url = url + test_payload%(RANDINT,RANDINT)

content["true"] = Downloader.get(_url)

_url = url + test_payload%(RANDINT,RANDINT+1)

content["false"] = Downloader.get(_url)

if content["origin"]==content["true"]!=content["false"]:

return "sql fonud: %"%url

　　从源码可以看出，只须要我们实现了class spider和 def run(self,url,html)就可以让扫描器工作了，然后为了便捷，去掉了先前的requests模块，引用我们自己写的下载模块.然后注释掉我们原先在扫描器中调用sql注入的部份就可以了。

　　3.6 E-Mail搜索插件

　　然后我们在编撰一个简单的列子，搜索网页中的e-mail 因为插件系统会传递网页源码，我们用一个正则表达式([\w-]+@[\w-]+\.[\w-]+)+搜索出所有的电邮。创建script/email_check.py文件

　　#!/usr/bin/env python

# __author__= 'wanggangdan'

import re

class spider():

def run(self,url,html):

#print(html)

pattern = re.compile(r'([\w-]+@[\w-]+\.[\w-]+)+')

email_list = re.findall(pattern, html)

if(email_list):

print(email_list)

return True

return False

　　效果演示：

　　所有搜集到的邮箱都被采集了。

　　四、关于插件系统踩过的坑

　　有一次写插件系统的时侯，出现mothod no arrtibute “xxxx” 大概是这些情况，检查了很久，都找不到缘由，后来找到了，是自己插件命名成email,而python有个泛型就是email,所以并没有先调用我们的文件，而是先在python环境中搜救，所以告诉我们，插件的命名最好复杂一些不要和环境中已有的冲突。

　　五、总结

　　这节我们简单实现了基于爬虫的插件系统，我们可以借助这个系统结合爬虫编撰好多有趣的插件，来帮助我们进行扫描。

　　GitHub源码地址:（二）基于爬虫开发E-mail搜集插件/wgdscan

　　实验来自实验楼提供

0

2020-08-17

内容采集系统

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

使用Python构建基本WEB漏洞扫描器(二) 爬虫插件系统的开发—E

0 个评论

发起人

AI时代内容工厂

使用Python构建基本WEB漏洞扫描器(二) 爬虫插件系统的开发—E

0 个评论

发起人

相关问题