机器不学习: 机器学习导图系列(1):数据处理

机器学习导图系列教程旨在帮助引导开发者对机器学习知识网络有一个系统的概念,其中具体释义并未完善,需要开发者自己探索才能对具体知识有深入的掌握。本项目灵感来自Daniel Formoso的github开源项目。本文作者对其项目进行翻译、整理、批注等二次创作,其中不乏生僻的数学名词,对于没有留过学的作者来说费了很多功夫。我又将导图整理成了知识卡片,方便大家查看。由于机器学习的知识网络很大,导致完整的导图过大,文章中的图片可能经过压缩,如需完整图片可查看github项目machine-learning-mindmap-cn下载高清原图。本系列还在持续创作中,你的点赞、留言、star都会成为我持续创作的动力。

Daniel Formoso:https://github.com/dformoso/machine-learning-mindmap

machine-learning-mindmap-cn: https://github.com/caiyongji/machine-learning-mindmap-cn机器学习导图系列分为五大模块。

  1. 机器学习数据处理
  2. 机器学习概念
  3. 机器学习过程
  4. 机器学习算法
  5. 机器学习模型及神经网络模型

机器不学习: 机器学习导图系列(1):数据处理

数据类型

机器不学习: 机器学习导图系列(1):数据处理

数据探索

机器不学习: 机器学习导图系列(1):数据处理

数据清洗

机器不学习: 机器学习导图系列(1):数据处理

特征插补

机器不学习: 机器学习导图系列(1):数据处理

特征工程

机器不学习: 机器学习导图系列(1):数据处理

特征选择

机器不学习: 机器学习导图系列(1):数据处理

特征编码

机器不学习: 机器学习导图系列(1):数据处理

特征归一化(Normalisation)或缩放(Scaling)

机器不学习: 机器学习导图系列(1):数据处理

构造数据集

机器不学习: 机器学习导图系列(1):数据处理

作者:caiyongji

链接:https://juejin.im/post/5ca8cdea51882544097e2ad2

相关推荐