DevOps - DevOps初解

1 - DevOps的含义

DevOps涉及领域广泛,其含义因人而异,在不同的理解和需求场景下,有着不同的实践形式。
DevOps可以理解为是一个职位、一种组织形式、一套工具集合、一组过程与方法。
但从商业价值角度来说,DevOps是指通过Dev(开发)和Ops(运维)的紧密合作来实现和提高商业价值的工作方式和文化。
不仅包括了新技术和新工具的使用,还包括相关的团队组织建设和文化,实现持续改善的运维结构,以及开发流程设计等。
通过开发与运维之间的协作,能够消除对个人的依赖、减轻团队之间的损耗,提高质量和开发速度,并通过互相理解来增强变更的灵活性,快速满足商业需求。

各种支撑DevOps的思想、改善对策和工具共同组成了DevOps,难以在广泛的场景中明确地指出DevOps实践的准确定义。
但通常都会包括实现“基础设施即代码”和组建适合DevOps的体制这两部分。

“基础设施即代码”是在DevOps实践中支持开发和运维紧密合作的一个非常有效的方法。
“基础设施即代码”,可以简单理解为:

  • 将服务器、网络设备等基础设施的设置和架构代码化、信息化,把软件开发的开发模式应用到基础设施运维中。
  • 所有基础设施的构建、变更都根据其配置信息来进行,所有成员都可以访问配置信息,对配置信息的更改也都如实地反应在基础设置环境中。
  • 按照定义文件的要求来编写和更改配置信息,使用测试工具对其进行测试,并将配置信息和代码一样进行版本管理。

组建适合DevOps的体制,运维团队和开发团队共享信息,在变更时互相审查,深入了解对方的工作内容,进而理解并达成共识。
拥有共同的目的意识,双方通过自主行动来不断接近共同目标。

此外,DevOps是融合在业务中的持续性的改善和实践,而不是为了一次性完成所有的改善。

2 - DevOps的诞生与要素

2.1 两个关键因素

理解传统开发模式和敏捷开发模式的不同,以及各自的问题。

以敏捷开发为代表的持续开发方式的出现

瀑布模型明确划分了开发阶段和各阶段的产出物,无法有效应对新增需求。
敏捷开发以小规模团队为前提,每次只发布最低限度的功能集,然后听取反馈,进行持续改善。

持续开发带来的运维问题

开发和运维之间的产生“混乱”:运维产生技术负债、抵触变更和基础设施不足,开发忽略非功能性需求,运维和开发逐渐“割裂和对立”。

2.2 应对变化

开发部门确保需求的实现,运维部门确保系统稳定、快速地运行,但最重要的根本任务是确保商业的有效性,商业价值的实现
通过工具和文化来支持开发和运维紧密合作,消除专业性和复杂性,减少工作量,同时使信息可视化,以此来降低变更带来的风险。
团队中任何成员都可以基于相同的信息迅速开展工作,同时通过自动化和持续集成来大幅缩短应对变更所需要的时间,高效满足商业需求。

工具所具备的要素

  • 抽象化:通过“标准化”或“虚拟化”来抽象化所有资源,消除不同平台之间的差异,降低专业难度和复杂度
  • 自动化:通过自动化方式使用抽象化的资源,降低专业难度,减少开发、运维人员的工作压力
  • 统一管理:通过统一的版本管理系统和沟通工具使信息可视化,构建开发和运维之间的紧密联系,进行有效的信息传播和沟通
  • 即时沟通:通过互联网通讯工具和聊天机器人,加强点对点的联系和减少对敏感信息的反应时间
  • 持续集成与部署:统一开发部门和运维部门的开发及构建方法,一步式构建和部署,大幅提升系统改善的速度
  • 监控:对资源等信息进行集中管理和可视化,构建开发和运维的紧密合作关系

文化所具备的要素

文化的含义:尊重(Respect)、信任(Trust)、正确认识失败(Healthy attitude about failure)和避免指责(Avoiding Blame)。

  • 目的意识:相同的目标,共同创造服务、迅速满足商业需求,更容易实现紧密合作。
  • 同理心:互相考虑对方的感受,接受对方,建立紧密的关系
  • 自主思考:不互相依赖,能自主开展工作,以此来不断接近共同目标

3 - DevOps的工具应用

3.1 抽象化

  • 操作系统:使用LXC(Linux Containers)实现的容器技术Docker
  • 物理服务器:虚拟机,在虚拟机上混合型部署和运行容器
  • 存储:根据SDS(Software Defined Storage)思想用软件和API来对虚拟化存储进行控制
  • 网络:VLAN(Virtual Local Area Network)、SDN(Software Defined Network)

3.2 自动化

基于REST API可以根据指定的参数来进行自动化配置。
REST API可以用URL表示资源,通过HTTP协议来获取资源的状态或者变更资源的配置。

3.3 统一管理

在设计上支持和外部系统进行集成,可以将更新信息发送到外部沟通工具,也可以直接共享URL来访问指定的信息。

  • 问题跟踪系统(Issue Tracking System, ITS):也被称为Ticket管理工具,例如JIRA、Redmine等
  • Wiki:保存设计文档和会议记录,例如Confluence和Redmine的Wiki

3.4 即时沟通

例如通用的WeChat、Skype等,面向企业的Cisco Jabber、Chatwork等。
将聊天机器人与聊天工具、业务系统集成,可以代替部分的人工作业,提升反应速度。

3.5 持续集成与部署

除了开源的持续集成和部署工具Jenkins,还有云的持续集成工具服务,例如Circle CI和Travis CI。
在持续交付阶段,可采用蓝绿部署方法来确保部署的安全性。

3.6 监控

主流的监控工具主要是指Zabbix。

  • 实时把握资源的使用状态和业务的运行状态
  • 获取和分析商业活动所需的数据,进行持续改善
  • 指标监控,对关键指标进行定量分析和优化

3.7 日志分析

通过组合不同的中间件,可以将日志作为监控信息来进行分析处理。

  • 用于日志收集:Logstas
  • 从收集的日志中检索过滤信息:Elasticsearch
  • 将结果可视化:Kibana
    以上三个中间件统称为ELK栈,是被广泛使用的主流组合。

相关推荐