【PyHacker编写指南】打造网站后台扫描器

2023年6月12日上午5:27 • Python • 阅读 53

这节课是巡安似海PyHacker编写指南的《打造网站后台扫描器》

包括如何处理假的200页面/404智能判断等

喜欢用Python写脚本的小伙伴可以跟着一起写一写呀。

编写环境：Python2.x

00×1：

需要用到的模块如下：

import request

00×2：

先将请求的基本代码写出来：

python;gutter:true; import requests def dir(url): headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3314.0 Safari/537.36 SE 2.X MetaSr 1.0'} req = requests.get(url=url,headers=headers) print req.status_code dir('http://www.hackxc.cc') <pre><code> **00x3：** 设置超时时间，以及忽略不信任证书 > </code></pre> import urllib3urllib3.disable_warnings()req = requests.get(url=url,headers=headers,timeout=3,verify=False) <pre><code> </code></pre> 再加个异常处理 <pre><code> 调试一下再进行改进，如果为200则输出;gutter:true;
if req.status_code==200:
print "[*]",req.url

00×4：

难免会碰到假的200页面，我们再处理一下

处理思路：

首先访问hackxchackxchackxc.php和xxxxxxxxxx记录下返回的页面的内容长度，然后在后来的扫描中，返回长度等于这个长度的判定为404

def dirsearch(u,dir):
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3314.0 Safari/537.36 SE 2.X MetaSr 1.0'}
        #假的200页面进行处理
        hackxchackxchackxc = '/hackxchackxchackxc.php'
        hackxchackxchackxc_404 =requests.get(url=u+hackxchackxchackxc,headers=headers)
        # print len(hackxchackxchackxc_404.content)
        xxxxxxxxxxxx = '/xxxxxxxxxxxx'
        xxxxxxxxxxxx_404 = requests.get(url=u + xxxxxxxxxxxx, headers=headers)
        # print len(xxxxxxxxxxxx_404.content)

        #正常扫描
        req = requests.get(url=u+dir,headers=headers,timeout=3,verify=False)
        # print len(req.content)
        if req.status_code==200:
            if len(req.content)!=len(hackxchackxchackxc_404.content)and len(req.content)!= len(xxxxxxxxxxxx_404.content):
                print "[+]",req.url
            else:
                print u+dir,404
    except:
        pass

很nice

00×5：

再让结果自动保存

0x06：

完整代码：

python;gutter:true; <h1>!/usr/bin/python</h1> <h1>-- coding:utf-8 --</h1> import requests import urllib3 urllib3.disable_warnings() urls = [] def dirsearch(u,dir): try: headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3314.0 Safari/537.36 SE 2.X MetaSr 1.0'} #假的200页面进行处理 hackxchackxchackxc = '/hackxchackxchackxc.php' hackxchackxchackxc_404 =requests.get(url=u+hackxchackxchackxc,headers=headers) # print len(hackxchackxchackxc_404.content) xxxxxxxxxxxx = '/xxxxxxxxxxxx' xxxxxxxxxxxx_404 = requests.get(url=u + xxxxxxxxxxxx, headers=headers) # print len(xxxxxxxxxxxx_404.content) <pre><code> #正常扫描 req = requests.get(url=u+dir,headers=headers,timeout=3,verify=False) # print len(req.content) if req.status_code==200: if len(req.content)!=len(hackxchackxchackxc_404.content)and len(req.content)!= len(xxxxxxxxxxxx_404.content): print "[+]",req.url with open('success_dir.txt','a+')as f: f.write(req.url+"\n") else: print u+dir,404 else: print u + dir, 404 except: pass </code></pre> if name == 'main': url = raw_input('\nurl:') print "" if 'http' not in url: url = 'http://'+url dirpath = open('rar.txt','r') for dir in dirpath.readlines(): dir = dir.strip() dirsearch(url,dir)

喜欢的朋友们点个关注叭~

Original: https://www.cnblogs.com/XunanSec/p/pyhacker_houtai.html
Author: 巡安似海
Title: 【PyHacker编写指南】打造网站后台扫描器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/603123/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python实现自动化域名批量解析

Python实现自动化域名批量解析精选原创爱搞网络的皮卡丘2022-07-29 17:57:29博主文章分类：编程技术 ©著作权文章标签域名解析文章分类 Python 后…

Python 2023年5月24日
0080
Python数据可视化（第八节使用matplotlib绘制高级图表）

8.1 绘制等高线图（1）在matplotlib中，pyplot可以使用contour()、contour()、函数分别绘制和填充等高线图。contour()函数的语法格式如下图…

Python 2023年8月30日
0059
Java实战-用Java mail实现Exchange发邮件给你喜欢的人

目录 1. 官方指导文章 2. 需要用到com.microsoft.ews-java-api * 2.1 maven中添加 2.2 gradle中添加 3. 完整代码：新建一个Ma…

Python 2023年9月27日
0058
【Python】实现自动扫雷，挑战世界纪录

前言大家好，欢迎来到 Crossin的编程教室！今天给大家分享的这个案例是用 Python+OpenCV 实现了自动扫雷，并突破了人类的世界记录。（当然这不算哈）咱们废话…

Python 2023年11月2日
0048
静态资源

静态资源定义:就是网页中的css、js、图片等属于静态文件使用： 1.在项目的根目录下创建存放静态资源的文件夹static,在static文件夹中创建img存放图片 2.在se…

Python 2023年6月12日
0066
爬虫之selenium

selenium介绍基本使用 selenium用法元素操作等待元素被加载元素各项属性执行js代码切换选项卡浏览器前进后退无界面浏览器 xpath的使用简单介绍 s…

Python 2023年11月1日
0047
疫情在家用Python搞副业，也能月入10000+

下班副业实现经济自由的时候，你还在床上躺着，天天摆烂吗？这样的生活真的是你想要的吗？疫情在家接一些Python相关的小单子，既能给自己练手，还能赚是真香从零基础开始真的一台电脑…

Python 2023年10月7日
0044
自我学习：Django 创建数据库

来源视频p42-48 1.操作表要求install pymysql mysqlclient1.连接设置：settings.py中前提：数据库已启动，已建database 注释掉…

Python 2023年8月4日
0070
最近opencv又报了啥错（一）

前言别骂了别骂了，太久没打python，手贼生，最近在搞opencv和一些ocr，报了一堆错，有些是python的原生错误，有的是opencv的，有的是我nt，就全部记录一下吧 …

Python 2023年10月9日
0060
TP、TN、FP、FN 含义

一、基础概念TP：被模型预测为正类的正样本TN：被模型预测为负类的负样本FP：被模型预测为正类的负样本FN：被模型预测为负类的正样本TP、TN、FP、FN超级详细解析二、通俗理解…

Python 2023年9月15日
0037
Python图像处理

今天，博主正式开始了Python图像处理的学习新征程，各位小伙伴们一起来学习吧！ Python利用图像处理库Pillow（PIL）对图片进行处理。安装与导入在Linux系统中，只…

Python 2023年9月18日
0039
分布式FastDFS文件系统——基于Django框架的天天生鲜电商网站项目系列博客（六）

好的，接下来我给你介绍一下使用Spring Boot 技术实现上传服务的步骤。首先，需要在Spring Boot 中添加的依赖： xml <p&gt…

Python 2023年8月6日
0056
数据分析（Numpy，Pandas，Matplotlib）常用API

Numpy Pandas Series DataFrame Matplotlib Series和Dataframe的画图 seaborn Scipy np.array…

Python 2023年9月4日
0032
『现学现忘』Git基础 — 19、在Git中进行忽略文件操作

🚀 优质资源分享 🚀 学习路线指引（点击解锁）知识定位人群定位进阶级本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。入…

Python 2023年8月12日
0041
python股票成交明细_Python股票成交价格-买卖额分布图（三）

在Python股票气泡图(一) – 知乎专栏介绍了股票成交by每天by每价格的画图，它能够给你一个直观的每天成交价格、成交量的分布。在Python股票成交价格分布图(…

Python 2023年8月8日
0062
django小项目 —– 创建错题集

整体思路通过API调用获取错题信息，将数据存入数据库（保证可长期查看），通过python+django将数据库数据在前端呈现。实施思路 1、通过抓包获取到小程序相对应的错题集A…

Python 2023年11月1日
0033

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【PyHacker编写指南】打造网站后台扫描器

大家都在看