MachineLearning入门-1

机器学习的算法分为两大类:监督学习和无监督学习。

监督学习即在机器学习的过程中提供对错指示。一般是在数据组中包含最终结果(0,1),通过算法让机器减少误差。这一类学习主要应用于分类与预测(Regression & Classify)。监督学习从给定的训练数据集中学习出一个目标函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出,也可以说包括特征和目标,训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

非监督学习又称归纳性学习(clustering),利用K方式(K Mean)建立中心(Centriole),通过循环和递减运算(Iteration & Descent)来减少误差,达到分类的目的。


利用机器学习的预测模型来解决问题共有六个基本步骤:

定义问题:研究和提炼问题的特征,以帮助我们更好的理解项目的目标

数据理解:通过描述性统计和可视化来分析现有的数据

数据准备:对数据进行格式化,以便于构建一个预测模型

评估算法:通过一定的方法分离一部分数据,用来评估算法模型,并选取一部分代表数据进行分析,以改善模型

优化模型:通过调参和集成算法提升预测结果的准确度

结果部署:完成模型,并执行模型来预测结果展示