MachineLearning入门-1

PeterHuang0

2020-02-01

机器学习的算法分为两大类：监督学习和无监督学习。

监督学习即在机器学习的过程中提供对错指示。一般是在数据组中包含最终结果（0,1），通过算法让机器减少误差。这一类学习主要应用于分类与预测（Regression & Classify)。监督学习从给定的训练数据集中学习出一个目标函数，当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入和输出，也可以说包括特征和目标，训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。

非监督学习又称归纳性学习（clustering），利用K方式（K Mean）建立中心（Centriole），通过循环和递减运算（Iteration & Descent）来减少误差，达到分类的目的。

利用机器学习的预测模型来解决问题共有六个基本步骤：

定义问题：研究和提炼问题的特征，以帮助我们更好的理解项目的目标

数据理解：通过描述性统计和可视化来分析现有的数据

数据准备：对数据进行格式化，以便于构建一个预测模型

评估算法：通过一定的方法分离一部分数据，用来评估算法模型，并选取一部分代表数据进行分析，以改善模型

优化模型：通过调参和集成算法提升预测结果的准确度

结果部署：完成模型，并执行模型来预测结果展示

PeterHuang0

0 关注 0 粉丝 0 动态

关注关注

安科网

MachineLearning入门-1

PeterHuang0

PeterHuang0

PeterHuang0