python,网络爬虫完整示例代码－－抓取中国最好大学排名网站信息，并进行输出显示

zluxingzhe

2020-01-17

import requests,bs4
from bs4 import BeautifulSoup
def getHTMLText(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("request failed")

def getObjectData(soup):
    li=[]
    for tr in soup.find(‘tbody‘).children:
        if isinstance(tr,bs4.element.Tag):
            tds=tr(‘td‘)
            li.append([tds[0].string,tds[1].string,tds[3].string])
    return li

def printUnivList(result,num):
    print("sequence"+"\t"+"UnivName"+"\t"+"Score")
    for i in range(num):
        print(result[i][0]+‘\t‘+result[i][1]+‘\t‘+result[i][2])


url="http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html"
demo = getHTMLText(url)
soup = BeautifulSoup(demo,"html.parser")
result = getObjectData(soup)
printUnivList(result,10)

上面的代码成功地实现了从＂中国最好大学２０１９网站（http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html）上抓取大学排名，大学名称，总成绩等内容，并进行显示．运行结果如下：

sequence   UnivName   Score
1   清华大学   94.6
2   北京大学   76.5
3   浙江大学   72.9
4   上海交通大学   72.1
5   复旦大学   65.6
6   中国科学技术大学   60.9
7   华中科技大学   58.9
7   南京大学   58.9
9   中山大学   58.2
10   哈尔滨工业大学   56.7

大学网络爬虫 python tds

安科网

python,网络爬虫完整示例代码－－抓取中国最好大学排名网站信息，并进行输出显示

zluxingzhe

zluxingzhe

相关推荐

以国家战略科学家身份，顶级AI学者朱松纯回国，筹建北京通用AI研究院

211大学本科，只因学了这八大项目，30岁入职腾讯，收获年薪60W+

哈工大、哈工程MATLAB被禁或严重影响高校科研，Python和Octave可替代

高校应拥抱开源，哈工大等国内高校被禁用 MATLAB

“新基建”呼唤AI人才缺口如何补上

大学C语言从入门到实战1

我们读了那么多年书，并不是为了找份好工作

华中科技大学2020年数学分析考研试题参考解答

兰州大学2020年数学分析考研试题参考解答

华南理工大学2020年数学分析考研试题参考解答

吉林大学2020年数学分析考研试题参考解答

南开大学2020年数学分析考研试题参考解答

清华开源Jittor：首个国内高校自研深度学习框架，一键转换PyTorch

180所高校获批新增人工智能专业，你建议报考吗？

重返学术！沈向洋将就任清华兼职教授，招收计算机视觉&图形学博士生

微软北大造出超逼真 AI 换脸框架，顺便搞了个伪人脸检测器

不敢轻易旷课！高校开发硬核APP：成绩打分公开，AI打电话催上课

张亚勤正式加盟清华大学，任「智能科学」讲席教授

python数据结构与算法(北大地空学院)

第三届京津冀健康医疗大数据高峰论坛暨清华校友三创对接会

zluxingzhe