Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

MiracleZhao

2018-10-30

关注关注

Python版本：3.6.4

相关模块：

scrapy模块；

pyecharts模块；

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

关注后私信小编 PDF领取十套电子文档书籍

原理简介

这依旧是scrapy爬虫框架的一个简单应用，然后加了点数据可视化分析。

首先还是先新建一个爬虫项目：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

我们需要爬的网站是：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

我选的上海，想爬的信息大概是这些：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

先定义一下要爬取的内容(items.py)：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

然后随便设置一下(settings.py)：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

最后写下我们的爬虫代码(spider.py)：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

好的，我们又很轻松地写完了我们的爬虫代码。完整爬虫项目详见相关文件。

数据分析

首先让我们来看看想租上海的房子，大概每个月需要多少钱：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

把房价除以面积可能更客观一点：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

再来看看这些房子的朝向吧：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

向南的挺多~挺好的~

还有住房类型：

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

算了，睡觉吧，反正租不起，不分析了。

源代码见相关文件。

使用说明

数据爬取：

cmd窗口切换到第一个anjukeSpider文件夹路径下，然后执行如下命令即可开始爬取数据并将数据保存在anjuke.json文件内了：

scrapy crawl anjuke -o anjuke.json -t json

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

数据分析：

在cmd窗口运行analysis.py文件即可。

租房 scrapy

MiracleZhao

0 关注 0 粉丝 0 动态

关注关注

你的房东可能正用AI筛查你的犯罪记录，决定要不要租房给你

好不容易找到了心仪的房子，前几次和房东的沟通都很顺畅，直到自己提交了申请资料后，忽然被斩钉截铁的拒绝了。百思不得其解的Mikhail辗转了解到，这都是因为一个名叫CoreLogic的租赁物业解决方案，或者一个“租客背景调查工具”。之后了解到，CoreLog

andyjiang 2020-11-12

一线城市的房租在工资中占比高吗？Python帮你分析

所以我用Python爬了自如上一线城市的房价，以及对应的拉钩网上各城市的工资。不过拉钩网上的职位大多数都是互联网行业的，而互联网行业的工资本来就较高，所以本文所分析的结论更符合互联网行业，其他行业仅供参考。拉钩网包括，城市，城市区域，职位名称，公司名称，公

千慧 2020-05-16

想在阿里巴巴菜鸟园区上稳赚一笔的二房东，为什么赔惨了

杭州一位二房东最近悔青了肠子。冲着阿里巴巴菜鸟网络的名气，他在菜鸟网络海宁园区对面一口气盘下5套房子打算做群租，本以为13个足球场大的园区会带来旺盛的租房需求，哪晓得招租广告挂出去后却乏人问津，眼看着20多万投入要打水漂。失策：机器人打破如意算盘据《都市快

piforange 2019-04-03

Dubbo + Zookeeper入门初探

Monitor：监控中心，相当于房产局，它可以统计服务提供者和服务使用者的一些信息，及他们之间的关系，我使用dubbo admin实现。Consumer：服务消费者，想当于租户，使用服务。下面我通俗的解释下dubbo的整个流程，我将服务比喻成房子：。sta

gaoyongstone 2018-12-13

利用Python预测租房租金走势，用数据说话让房东立减房租

前言又是一年年底啦，租房的小伙伴也有合同到期的吧，想要知道周边的房租究竟是涨呢还是将呢，咱们可以用Python分析预测一下，如果会涨房租的话，咱们可以早点看好下一个地点，如果是将房租的话，也好和房东好好说一下。首先使用pandas加载数据，使用pandas

Xiongchao 2018-12-12

如何租到靠谱的房子？Scrapy爬虫帮你一网打尽各平台租房信息！

又是一年n度的找房高峰期，各种租赁信息眼花缭乱，如何快速、高效的找到靠谱的房子呢？不堪忍受各个租房网站缭乱的信息，一位技术咖小哥哥最近开发了一个基于 Scrapy 的爬虫项目，聚合了来自豆瓣，链家，58 同城等上百个城市的租房信息，统一集中搜索感兴趣的租房

xsg 2018-05-31

马云的支付宝又做了一件好事，以后租房即不用交租金又有租房合同

如今支付宝已经覆盖我们的衣食住行的方方面面，只有你不敢想的服务，没有他们不敢上的业务。3月29日，支付宝就再次更新业务，蘑菇租房正式入驻支付宝新上线的租房服务平台，芝麻信用超过650分，在支付宝平台审核通过后可享受免押金租房的服务。要注意的是，目前该服务地

szrongxi 2017-03-30

Python爬虫教程：爬取深圳租房信息

考虑到以后可能会在深圳工作，所以写了这个爬虫，希望对自己的找房过程提供一些便捷。信息来源是豆瓣的深圳租房小组。你们一定会说这么麻烦干什么，租房APP不是直接看么？但是租房APP上中介比较多，豆瓣上多是个人房源，中介少，比较可靠。但豆瓣APP没有筛选功能，只

albertjone 2018-10-10

因会编程房东才同意程序员不涨房租，知道真相后网友直呼心酸！

最近就有一名程序员网友，发出了这样的感慨，他说，在北京这地方会编程是多么的重要啊，为什么会有这样的感慨呢？大家好，我是“上世是朵花”。

dingtan0 2018-09-17

我用Python爬取了租房网站的信息，再也不怕租不到舒适的房啦

学习一些抓包知识，有些网站防爬，需要人工浏览一些页面，抓取数据包分析防爬机制，然后做出应对措施。比如解决cookie问题，或者模拟设备等。不过对前端也要比较熟悉，比如说html和简单的js和web框架什么的。现在我们用Python爬取租房网站信息，来学习p

jeffreyfeng0 2018-05-02

人民日报谈贷款租房：加快金融产品从购房向租房铺开

有规范统一的长租房房源、能为租房提供优惠贷款、闲置住房也能放心“托存”……近日，本报记者来到广东深圳和佛山，对住房租赁贷款市场进行了走访。截至目前，在建行平台使用按居贷的客户占平台签约租赁客户的40%，按居贷金额约1200万元。今年上半年，建行广东分行在广

菠萝斑马居住指南 2018-07-06

富士康工人公开信质疑万科城中村改造：谁来关心我们

清湖村，是深圳1317个城中村之一。在富士康工人们看来，改造只关乎生意。6月14日下午4点，廖明义（化名）轻轻带上房门，下楼。廖明义夫妻都是深圳富士康龙华工厂的工人，此时距离他们上晚班的时间还有4个小时。此时，距离他们搬离这套房子的最晚时间，还剩36天零8

深圳湾 2018-06-23

自如网杭州市租房数据分析(1)

杭州租房数据清洗由于上篇文章中爬取下来的数据不能直接用来分析，比如一个属性包含多个信息、数值型属性包含单位等，因此首先要对数据做一定的清洗，处理成需要的格式。apartment:公寓名称及房间数area:公寓所处地区，包括城区、街道或某个范围、靠近地铁几

BitTigerio 2018-05-17

爱上租品牌合租公寓：原来母亲节最好的礼物在这里

有人说，最丰富的母亲节祝福和礼物，都在朋友圈了。然后有人说，“少气你妈，比啥都强”。但其实给母亲节最好的礼物，就是“我在异乡挺好的”！上面说的每一点爱上租都会悉心考量，从美观度到实用性到居住体验，爱上租在公寓产品化的路上才刚起步。请读者使用之前核实真实性，

BeSmartampChic 2018-05-15

爱上租品牌合租公寓，让你毕业就“回家”

毕业，一个伤感而充满希望的话题，是一种生活方式的终结同时又开启另一种全新的人生旅程。但我相信，很多人的这段全新的旅程会被租房而打击到。别说刚毕业，就是在职场打拼了几年的小白领们，在租房这道坎面前也没那么容易迈过去。网上关于租房的吐槽那么多，但只会大致相似，

JOIN创业实战笔记 2018-05-08

未来10年租金4万亿巴乐兔用“好房东”切蛋糕

随着多地加速建设培育住房租赁市场，以往“重购轻租”的房地产行业正在逐渐转变。一个时代的终结必然会催生一个新时代的开始，在房地产领域，住房租赁市场或许就会进入一个全新的黄金时代。在供应方面，到2027年全国城镇将形成66亿平方米的可租赁房源，此类房源由既有存

心理学哲学批判性思维 2018-04-18

Airbnb的反击：动刀预订费示好房客

面对Booking宣布非标房源超过500万套，非标住宿领域大佬Airbnb坐不住了。对此，有业内人士分析，Airbnb此次试点的目的显然是为了与Booking等主要对手竞争。但取消预订费可能导致客人随意取消预订而造成租金损失，能否承受成本压力以及如何与客人

改造宅 2018-04-12

区块链公司Lucia宣布获得千万元融资，探索长租领域新方案

Lucia租住平台是基于区块链技术进行开发的，通过公信宝接入的用户信用数据，为用户建立信用数字身份。近日，初创公司Lucia宣布获得千万元融资。Lucia团队CEO玉龙透露，此次融资将用于打造基于公信宝的诚信租住社区。Lucia团队在短租领域已有 6 年的

扑克投资家 2018-03-28

从撮合人到撮合房子：百合佳缘推“合租派”布局租房市场

房产成为百合佳缘新的业务布局。2017 年 9 月，百合网和世纪佳缘在正式完成合并后，成立了新的集团公司——百合佳缘网络集团股份有限公司，同时进行了业务线的五大划分，包括婚恋、情感、金融、婚礼与房产。同年 10 月，百合佳缘房产团队负责人车林便开始筹划房产

扑克投资家 2018-03-20

尴尬的长租公寓：看似“情怀”满满，实际“套路”多多

“我们的长租公寓，即将布置完毕，租客将于近期入伙。”经过两年的洗牌，许多中小型的长租公寓平台已经黯然离场，而部分背靠房地产、互联网巨头的品牌却风头正盛。如今，在一、二线城市住房租赁市场不断升温的背景下，大量投资机构和互联网巨头将目光投向长租公寓市场，这也激

大故事家 2018-03-13

安科网

Scrapy爬取并简单分析安居客租房信息，打工真的一辈子都买不起

MiracleZhao

原理简介

数据分析

MiracleZhao

相关推荐

你的房东可能正用AI筛查你的犯罪记录，决定要不要租房给你

一线城市的房租在工资中占比高吗？Python帮你分析

想在阿里巴巴菜鸟园区上稳赚一笔的二房东，为什么赔惨了

Dubbo + Zookeeper入门初探

利用Python预测租房租金走势，用数据说话让房东立减房租

如何租到靠谱的房子？Scrapy爬虫帮你一网打尽各平台租房信息！

马云的支付宝又做了一件好事，以后租房即不用交租金又有租房合同

Python爬虫教程：爬取深圳租房信息

因会编程房东才同意程序员不涨房租，知道真相后网友直呼心酸！

我用Python爬取了租房网站的信息，再也不怕租不到舒适的房啦

人民日报谈贷款租房：加快金融产品从购房向租房铺开

富士康工人公开信质疑万科城中村改造：谁来关心我们

自如网杭州市租房数据分析(1)

爱上租品牌合租公寓：原来母亲节最好的礼物在这里

爱上租品牌合租公寓，让你毕业就“回家”

未来10年租金4万亿巴乐兔用“好房东”切蛋糕

Airbnb的反击：动刀预订费示好房客

区块链公司Lucia宣布获得千万元融资，探索长租领域新方案

从撮合人到撮合房子：百合佳缘推“合租派”布局租房市场

尴尬的长租公寓：看似“情怀”满满，实际“套路”多多

MiracleZhao