Python刷CSDN阅读数（仅供娱乐）

fanhuasijin

2020-04-17

#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
@File:csdn_reads.py    
@E-mail:
@Time:2020/4/16 10:03 下午 
@Author:Nobita   
@Version:1.0   
@Desciption:None
"""

import re
import time
import random
import requests
import urllib.request
from bs4 import BeautifulSoup

user_agent_list = [
    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36",
    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36",
    "Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/61.0",
    "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36",
    "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36",
    "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
    "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)",
    "Mozilla/5.0 (Macintosh; U; PPC Mac OS X 10.5; en-US; rv:1.9.2.15) Gecko/20110303 Firefox/3.6.15",
]
firefoxHead = {"User-Agent": user_agent_list}
firefoxHead[‘User-Agent‘] = random.choice(user_agent_list)
IPRegular = r"(([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5]).){3}([1-9]?\d|1\d{2}|2[0-4]\d|25[0-5])"
host = "https://blog.csdn.net"
url = "https://blog.csdn.net/hz90s/article/details/{}"
code = ["105518260"]


def parseIPList(url="http://www.xicidaili.com/"):
    IPs = []
    request = urllib.request.Request(url, headers=firefoxHead)
    response = urllib.request.urlopen(request)
    soup = BeautifulSoup(response, "html.parser")
    tds = soup.find_all("td")
    for td in tds:
        string = str(td.string)
        if re.search(IPRegular, string):
            IPs.append(string)
    return IPs


def PV(code):
    s = requests.Session()
    s.headers = firefoxHead[‘User-Agent‘]
    count = 0
    while True:
        count += 1
        print("asking for {} times\t".format(count), end="\t")
        IPs = parseIPList()
        s.proxies = {"http": "{}:8080".format(IPs[random.randint(0, 40)])}
        s.get(host)
        r = s.get(url.format(code))
        html = r.text
        soup = BeautifulSoup(html, "html.parser")
        spans = soup.find_all("span")
        print(spans[2].string)
        time.sleep(random.randint(60, 75))


def main():
    PV(code[0])


if __name__ == "__main__":
    main()

mozilla python safari

fanhuasijin

0 关注 0 粉丝 0 动态

相关推荐

爬取素材库直接存入mysql数据库

直接存入mysql数据库。包含html源码直接存入数据库需要的转义函数。headers = {‘User-Agent‘: UA} ##构造成一个完整的User-Agent

liuweiq 2020-07-08

scrapy中间件和selenium在scrapy中的使用

注意点：不光在process_request方法中使用，在process_exception方法中也要使用

ZHANGRENXIANG00 2020-06-09

中间件

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 ". "(KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1&qu

88961137 2020-06-01

中间件

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 ". "(KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1&qu

marisafari 2020-05-29

http请求user_agent字段解析

浏览器的User Agent字段令人迷惑，例如：某一版本的Chrome访问网络时，User Agent字段如下：。其中既包含多个公司的浏览器标识，如：Mozilla、Chrome、Safari，也包含多个渲染引擎标识，如：AppleWebKit、KHTML

jiaguoquan00 2020-05-27

ua列表

FireFox 6.0=Mozilla/5.0 (Windows NT 5.1; rv:6.0.2) Gecko/20100101 Firefox/6.0.2IE8(Windows XP)=Mozilla/4.0 (compatible; MSIE 8.0

juanjuanwang 2020-03-23

浏览器 User-Agent 整理

Mozilla/5.0 AppleWebKit/534.3 Chrome/6.0.472.33 Safari/534.3 SE 2.X MetaSr 1.0

81224450 2020-01-24

UA池和代理池

- 作用：尽可能多的将scrapy工程中的请求伪装成不同类型的浏览器身份。

juanjuanwang 2020-01-18

判断浏览器内核/适配不同浏览器

// The order matters here, and this may report false positives for unlisted browsers.

程序员俱乐部 2020-01-11

设置随机请求头和使用代理

user_agent = json.loads['user-agent']#将返回的字符串loads为字典

86901835 2020-01-04

爬取xici代理

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1","Mozi

Safari浏览器 2019-12-14

常用的User-Agent

window.navigator.userAgent1) ChromeWin7:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.83

88961137 2019-12-09

CSDN刷阅读数

今天我们来盘一下csdn,做一个小程序，为什么做这个呢？今天小编看着我的博客的阅读数，唉，惨不忍睹，没办法，只能想一些........呃呃呃呃，你懂的。话不多说，分析一波csdn的阅读数，计数原理是每次进入页面记作一次，所以我们很简单的构建一个访问的小爬虫

marisafari 2019-10-26

Rust能不能做后端开发语言？

ProjectX只是现在我在做的一个项目的名称，我计划在整个项目的过程中做更多的尝试，并且尽可能的将过程记录下来。如果感兴趣可以关注我，非常欢迎给我或是ProjectX提提你的建议。目前计划尝试的后端语言有：PHP、JAVA、Node.js、Go、Rust

longzhiwen 2020-10-16

Rust 团队回应 Mozilla 裁员：Rust 项目没有危险

Mozilla 近期裁员的事，使得背后主要是 Mozilla 的 Rust 语言项目也急忙跑出来澄清。上周，Mozilla 公司宣布裁员约 250 人，在台北的办公室也将关闭，同时还有至少 60 人会进行岗位调动。这是 Mozilla 在本年度内的第二次

tkernel 2020-08-18

Rust 团队回应 Mozilla 裁员：Rust 项目没有危险

Mozilla 近期裁员的事，使得背后主要是 Mozilla 的 Rust 语言项目也急忙跑出来澄清。上周，Mozilla 公司宣布裁员约 250 人，在台北的办公室也将关闭，同时还有至少 60 人会进行岗位调动。这是 Mozilla 在本年度内的第二次大

lihn 2020-08-18

自从尝了 Rust，Java 突然不香了

相对而言，Rust 是软件行业中比较新的一门编程语言，如果从语法上来比较，该语言与 C++ 其实非常类似，但从另一方面而言，Rust 能更高效地提供许多功能来保证性能和安全。而且，Rust 还能在无需使用传统的垃圾收集系统的情况下保证内存的安全性。Rust

Colourful 2020-07-03

Python-爬虫-懒得写的部分

#!/usr/bin/env python3. hd = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:75.0) Gecko/20100101 Fir

sunzhihaofuture 2020-06-10

Python脚本-爬虫与多线程

要求1.使用threading函数；2.使用geturl模块。post=soup.find.text.strip()#找到我们需要的属性。这里的代码对自己博客当前网页的文章阅读数进行爬取，并写入date.txt文件，‘a+‘代表写入时不会覆盖原文件。fro

fangjack 2020-06-02

我最终还是从Chrome换到了Firefox

在过去 5 年，我一直和 Firefox 保持着断断续续的关系。每次我为 Firefox 新版更新而欣喜若狂，希望最终摆脱 Chrome 的霸主地位。但是，只要我像往常一样开始打开网页，我的希望就破灭了。Firefox 的性能会明显下降，很难跟上我的工作流

心得笔记 2020-05-11

fanhuasijin

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号