【干货】千万级用户的大型网站，应该如何设计其高并发架构？

taoshengyang

2019-05-06

原文链接：https://mp.weixin.qq.com/s?__biz=MzU2Njg3OTU1Mg==&amp;mid=2247483877&amp;idx=1&amp;sn=aab24cdbe42e24546d661a9d9b90657f&amp;utm_source=tuicool&amp;utm_medium=referral

作者简介： 原子弹大侠，阿里 P8 高级技术专家

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

目录

（1）单块架构

（2）初步的高可用架构

（3）千万级用户量的压力预估

（4）服务器压力预估

（5）业务垂直拆分

（6）用分布式缓存抗下读请求

（7）基于数据库主从架构做读写分离

（8）总结

本文将会从一个大型的网站发展历程出发，一步一步的探索这个网站的架构是如何从单体架构，演化到分布式架构，然后演化到高并发架构的。

（1）单块架构

一般一个网站刚开始建立的时候，用户量是很少的，大概可能就几万或者几十万的用户量，每天活跃的用户可能就几百或者几千个。

这个时候一般网站架构都是采用单体架构来设计的，总共就部署3台服务器，1台应用服务器，1台数据库服务器，1台图片服务器。

研发团队通常都在10人以内，就是在一个单块应用里写代码，然后写好之后合并代码，接着就是直接在线上的应用服务器上发布。很可能就是手动把应用服务器上的Tomcat给关掉，然后替换系统的代码war包，接着重新启动Tomcat。

数据库一般就部署在一台独立的服务器上，存放网站的全部核心数据。

然后在另外一台独立的服务器上部署NFS作为图片服务器，存放网站的全部图片。应用服务器上的代码会连接以及操作数据库以及图片服务器。如下图所示：

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

（2）初步的高可用架构

但是这种纯单块系统架构下，有高可用问题存在，最大的问题就是应用服务器可能会故障，或者是数据库可能会故障

所以在这个时期，一般稍微预算充足一点的公司，都会做一个初步的高可用架构出来。

对于应用服务器而言，一般会集群化部署。当然所谓的集群化部署，在初期用户量很少的情况下，其实一般也就是部署两台应用服务器而已，然后前面会放一台服务器部署负载均衡设备，比如说LVS，均匀的把用户请求打到两台应用服务器上去。

如果此时某台应用服务器故障了，还有另外一台应用服务器是可以使用的，这样就避免了单点故障问题。如下图所示：

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

对于数据库服务器而言，此时一般也会使用主从架构，部署一台从库来从主库同步数据，这样一旦主库出现问题，可以迅速使用从库继续提供数据库服务，避免数据库故障导致整个系统都彻底故障不可用。如下图：

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

（3）千万级用户量的压力预估

这个假设这个网站预估的用户数是1000万，那么根据28法则，每天会来访问这个网站的用户占到20%，也就是200万用户每天会过来访问。

通常假设平均每个用户每次过来会有30次的点击，那么总共就有6000万的点击（PV）。

每天24小时，根据28法则，每天大部分用户最活跃的时间集中在（24小时 * 0.2）≈ 5小时内，而大部分用户指的是（6000万点击 * 0.8 ≈ 5000万点击）

也就是说，在5小时内会有5000万点击进来。

换算下来，在那5小时的活跃访问期内，大概每秒钟会有3000左右的请求量，然后这5小时中可能又会出现大量用户集中访问的高峰时间段。

比如在集中半个小时内大量用户涌入形成高峰访问。根据线上经验，一般高峰访问是活跃访问的2~3倍。假设我们按照3倍来计算，那么5小时内可能有短暂的峰值会出现每秒有10000左右的请求。

（4）服务器压力预估

大概知道了高峰期每秒钟可能会有1万左右的请求量之后，来看一下系统中各个服务器的压力预估。

一般来说一台虚拟机部署的应用服务器，上面放一个Tomcat，也就支撑最多每秒几百的请求。

按每秒支撑500的请求来计算，那么支撑高峰期的每秒1万访问量，需要部署20台应用服务。

而且应用服务器对数据库的访问量又是要翻几倍的，因为假设一秒钟应用服务器接收到1万个请求，但是应用服务器为了处理每个请求可能要涉及到平均3~5次数据库的访问。

按照3次数据库访问来算，那么每秒会对数据库形成3万次的请求。

按照一台数据库服务器最高支撑每秒5000左右的请求量，此时需要通过6台数据库服务器才能支撑每秒3万左右的请求。

图片服务器的压力同样会很大，因为需要大量的读取图片展示页面，这个不太好估算，但是大致可以推算出来每秒至少也会有几千次请求，因此也需要多台图片服务器来支撑图片访问的请求。

（5）业务垂直拆分

一般来说在这个阶段要做的第一件事儿就是业务的垂直拆分

因为如果所有业务代码都混合在一起部署，会导致多人协作开发时难以维护。在网站到了千万级用户的时候，研发团队一般都有几十人甚至上百人。

所以这时如果还是在一个单块系统里做开发，是一件非常痛苦的事情，此时需要做的就是进行业务的垂直拆分，把一个单块系统拆分为多个业务系统，然后一个小团队10个人左右就专门负责维护一个业务系统。如下图

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

（6）分布式缓存扛下读请求

这个时候应用服务器层面一般没什么大问题，因为无非就是加机器就可以抗住更高的并发请求。

现在估算出来每秒钟是1万左右的请求，部署个二三十台机器就没问题了。

但是目前上述系统架构中压力最大的，其实是 数据库层面 ，因为估算出来可能高峰期对数据库的读写并发会有3万左右的请求。

此时就需要引入 分布式缓存 来抗下对数据库的读请求压力了，也就是引入Redis集群。

一般来说对数据库的读写请求也大致遵循28法则，所以每秒3万的读写请求中，大概有2.4万左右是读请求

这些读请求基本上90%都可以通过分布式缓存集群来抗下来，也就是大概2万左右的读请求可以通过 Redis集群来抗住。

我们完全可以把热点的、常见的数据都在Redis集群里放一份作为缓存，然后对外提供缓存服务。

在读数据的时候优先从缓存里读，如果缓存里没有，再从数据库里读取。这样2万读请求就落到Redis上了，1万读写请求继续落在数据库上。

Redis一般单台服务器抗每秒几万请求是没问题的，所以Redis集群一般就部署3台机器，抗下每秒2万读请求是绝对没问题的。如下图所示：

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

（7）基于数据库主从架构做读写分离

此时数据库服务器还是存在每秒1万的请求，对于单台服务器来说压力还是过大。

但是数据库一般都支持主从架构，也就是有一个从库一直从主库同步数据过去。此时可以基于主从架构做 读写分离 。

也就是说，每秒大概6000写请求是进入主库，大概还有4000个读请求是在从库上去读，这样就可以把1万读写请求压力分摊到两台服务器上去。

这么分摊过后，主库每秒最多6000写请求，从库每秒最多4000读请求，基本上可以勉强把压力给抗住。如下图：

【干货】千万级用户的大型网站，应该如何设计其高并发架构？

（8）总结

本文主要是探讨在千万级用户场景下的大型网站的高并发架构设计，也就是预估出了千万级用户的访问压力以及对应的后台系统为了要抗住高并发，在业务系统、缓存、数据库几个层面的架构设计以及抗高并发的分析。

但是要记住，大型网站架构中共涉及的技术远远不止这些，还包括了MQ、CDN、静态化、分库分表、NoSQL、搜索、分布式文件系统、反向代理，等等很多话题，但是本文不能一一涉及，主要是在 高并发 这个角度分析一下系统如何抗下每秒上万的请求。

感谢你耐心看完了文章...

关注作者，我会不定期在微头条分享Java，Spring，MyBatis，Netty源码分析，高并发、高性能、分布式、微服务架构的原理，JVM性能优化、分布式架构，BATJ面试等资料...

网站架构架构高可用数据库

taoshengyang

0 关注 0 粉丝 0 动态

相关推荐

假如说我们现在要做一个千万级用户量网站，你怎么设计高并发架构？

之前的时候，阿粉一直在看同事面试，但是呢，阿粉并没有自己去面试，而无意间打开Boss的时候，发现一家公司私聊了我，我回复了一下之后，竟然说我可以去面试，不曾想，面试一个问题，让我的薪资瞬间被砍掉了5K，你如果不想自己出去要的薪资被砍，那么你要会设计这个。

ltmailsharpeyes 2020-07-28

读《大型网站技术架构》的一些总结-（3）伸缩性设计

伸缩大白话就是给网站增添服务器，强如谷歌创立之初也是一台服务器，而现在已经有百万级的服务器了。任何网站随着业务的变化服务器的数量也会跟着变化，往往是慢慢增长，当然也有因为脉冲网站并发量一段时间内猛增然后回归正常的如淘宝双十一，回归正常后则需要减少服务器实现

windzoone 2020-06-01

网站架构变迁

从最早的 html 的学习到现在从单体应用迁移到微服务架构，所经历的网站架构也一直在变化，于是想写一篇关于网站架构变迁的文章。这个阶段的服务器上除了 Web Server，还会装一个数据库服务器，网站文件一般是放在网站目录下保存的。Kubernetes 让

ithzhang 2020-05-06

亿级流量网站架构核心技术-高并发

Cache Aside：同一个数据写竞争比较激烈，对数据一致性要求很高时适合，以上参数nginx都可以配置，对于静态资源以上参数还是非常有必要的，有业务也会根据需要在web工程内部设置。对于消费Bin log的情况，mysql bin log 要配置成 r

故纸堆 2020-03-21

亿级流量网站架构核心技术

guava提供了令牌桶算法的实现，RateLimiter，有阻塞和非阻塞限流方式，阻塞限流适用于异步场景比如kafka消费或离线跑任务；非阻塞限流适用于同步场景快速失败返回。预案：大型活动需要提供预案文档，写好各种情况的处理流程，一旦执行，需要2人以上re

ColinOrg 2020-03-21

网站群架构

>网站群的定义是通过统一标准、统一规范、统一规划，建立在统一技术架构基础之上的若干个能互相共享信息、按照一定的隶属关系组织在一起，既可以统一管理，也可以独立管理自成体系的网站集合。利用网站群内容管理系统，统一规划、统一实施或分步实施，以解决第三代网站

ithzhang 2020-03-01

云计算视频教程：Linux大型网站高并发架构及自动化运维

随着互联网技术的不断进步和发展，对运维人员提出了更高的要求和挑战，如何才能将运维工作自动化，提升工作的效率？让大家学完后可以具备企业真正的大型网站搭建能力以及自动化运维的实战能力。在企业中运用zabbix监控企业数据，第一时间了解服务的运行状态，通过ngi

byourb 2020-02-12

大型网站架构演变

大型网站架构的演进最开始都是由小及大慢慢演变过来的，任何一个好的架构都不是设计出来了，是经过业务发展迭代而来的，这个观点我是赞同的。对于网站架构技术非常有兴趣，一直持续关注学习架构技术，本次想通过大型网站技术发展历程，剖析大型网站技术架构模式，深入分析大型

范群松 2020-02-02

ASP.NET Core搭建多层网站架构【8-使用AOP动态拦截器进行服务层日志记录】

摘要：基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构。本章节介绍了编写最简单的增删改查业务，涉及到DI依赖注入的使用、AutoMapper的使用、工作单元与仓储的使用

IT小小鸟 2020-01-30

ASP.NET Core搭建多层网站架构【6.1-使用AOP动态拦截器进行服务层日志记录】

摘要：基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构

草原孤狼 2020-01-29

ASP.NET Core搭建多层网站架构【5.2-添加NLog日志记录器】

摘要：基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构

quguang 2020-01-29

ASP.NET Core搭建多层网站架构【5.1-WebCore网站核心配置】

摘要：基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构

ithzhang 2020-01-29

ASP.NET Core搭建多层网站架构【3-使用xUnit编写单元测试之简单方法测试】

摘要：基于ASP.NET Core 3.1 WebApi搭建后端多层网站架构。上一章节已经建立了Common公共类库，本章节介绍编写简单的单元测试，对上一章节的公共类库中EnumExtension方法编写单元测试，同时也是介绍上一章节中公共类库EnumEx

quguang 2020-01-28

《亿级流量网站架构核心技术》---高并发

　　　　　　　　　　让数据更接近使用者；　　　　　　　　　　目的让访问速度更快；　　　　　　　　　　工作机制：从缓存读取数据，如果没有，再从慢速设备读取实际数据并同步到缓存；　　　　　　　　　　　　　　maven：本地仓--->中央仓-

IT小小鸟 2020-01-21

大型网站架构step by step

　　2、原有的一些状态信息同步、文件共享等方案可能会出现瓶颈，需要进行改进，也许这个时候会根据情况编写符合网站业务需求的分布式文件系统等；　　在做完这些工作后，开始进入一个看似完美的无限伸缩的时代，当网站流量增加时，应对的解决方案就是不断的添加webser

红雪中国 2014-07-07

冰冻三尺非一日之寒——大型网站架构演进

当下载了《大型网站系统与Java中间件实践》试读章节，看到其中唯一的一章第2章的标题，并简略地扫了一遍小节标题之后，我立马就想到——这绝对又是某位淘宝牛人写的书。而在那场系列讲座中，一条重要的主线正是以淘宝网站发展历程为蓝本的“大型网站架构演变和知识体系”

刘晓飞 2014-06-19

小型网站架构

低可用稳定性要在50%，每年宕机时间不可以超过3个月。无海量数据一个月存储500条数据记录用户分布不广泛、网络情况不复杂只有铁通一家网络运营商，无防火墙安全环境良好需求一劳永逸，发布不频繁渐进式发展慢慢更新。业务拆分采用MVC架构模型就足够

enginetanmary 2014-06-17

互联网网站架构升级----消息中间件的实现方案

所以目前业界有几种不同的设计方式来满足不同的需求。那么有没有一种更高效的方式呢？答案是肯定的，但那可能要进一步降低可靠性！目前我们的监控日志收集系统使用的是和②中类似的方案，消息系统使用的是3方案，后期可能会将可靠性要求高的向1方案过度，可靠性要求不高的向

LinuxAndroidAI 2014-05-14

NFS——网站架构后台仓库的搭建

1.nfs共享存储1.1存储服务的作用将数据进行统一共享存储，节省磁盘存储空间1.2.存储服务部署过程1.2.1.服务端部署第一个历程：安装软件程序Yum install -y nfs-utils第二个历程：编写配置文件Vim /etc/exports/d

架构技术交流 2019-12-22

《大型网站技术架构》笔记－架构篇

性能测试是性能优化的前提和基础，也是性能优化结果的检查和度量标准。性能测试的指标有：响应时间、并发数、吞吐量、性能计数器。网站性能优化的目的，除了改善用户体验的响应时间，还要尽量提升系统吞吐量，最大限度利用服务器资源。主要手段有优化浏览器访问、使用反向代理

fibanaci 2019-11-26

taoshengyang

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号