Python教程

Python爬虫学以致用,嘿嘿

本文主要是介绍Python爬虫学以致用,嘿嘿,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

因为放假回到了老家,可能是在镇上的缘故,治安管的可能不是那么严,每天晚上都会有鬼火少年出来炸街,md,有时候半夜两三点突然炸一下街,声音贼大,但是吧,声音贼大,车速还没我跑的快

a4705de191e267485687c5f84ed3d112.gif

天菩萨,真的烦死人了,一声砰,一下抖,家人们就说连续几天烦死了

1cd3655a2e098a506cdd281b7a7ef804.gif

于是我就想写篇文章去我们当地的"情报网"(就是那种地方自己人吐槽或者互助的网),希望大家一起对这种行为控诉一波,也希望家里有鬼火少年的家长不要天天麻将馆007,多看看你孩子在街上放炮。

于是我就写了篇文章去控述,但是吧,担心浏览量低了,大家看不到,于是就想想能不能用python写个爬虫来长长浏览量,说干就干。

由于那个网址太low,也没啥反扒的,也不需要休眠啥的,就很简单的写了出来,就用了个多线程,轮换ip,欸嘿嘿。

下面是代码

import requests
import random
from concurrent.futures import ThreadPoolExecutor
"""发送请求到网址"""
def Requsts():
    # ip池
    proxies = [
        {'http': '183.230.106.87'},
        {'http': '183.64.239.19'},
        {'http': '36.92.159.181'},
        {'http': '202.142.126.6'},
        {'http': '67.229.29.109'},
        {'http': '36.95.15.149'}
    ]
    header={
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.9 Safari/537.36"
    }
    proxy = random.choice(proxies)# 随机选取一个ip
    url='https://www.qj023.com/forum.php?mod=viewthread&tid=1940772'
    resp=requests.get(url,headers=header,proxies=proxy)
"""多线程刷网址"""
def Multithreading():
     with ThreadPoolExecutor(100) as t:  # 创建线程池,有100个线程
            for i in range(1000000):
                t.submit(Requsts)
                print(i)
if __name__ == '__main__':
    Multithreading()

看看成果吧

8e0c660cf8f5465ba2b5beff8866ae91.png

欸嘿嘿,不敢长太多了,万一被逮到村口示众就蛋糕了。

代码因网址而已哈,有些网址有反扒机制的,可以自己去破破(比如添加cookie),刷太快怕被检测到的,可以每次休眠一会会儿。

这篇关于Python爬虫学以致用,嘿嘿的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!