k均值算法

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

实验总牌数为30,分三类进行三轮迭代。

第一轮:抽取聚类中心为:3、4、7.

k均值算法

 聚类结果为:

k均值算法

 第二轮:经过求平均后,重新确定聚类中心为:2、4、10

k均值算法

 第三轮:对上类再进行求平均,选定聚类中心为2、5、10

k均值算法

最终聚类中心稳定在2、5、10,以此为小中大划分。

2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

代码:

k均值算法

散点图显示为:

 k均值算法

4). 鸢尾花完整数据做聚类并用散点图显示.

代码:(经上代码修改来的,稍有瑕疵)

k均值算法

 散点图:

k均值算法

5).想想k均值算法中可以用来做什么?

最主要的就是进行机器学习啊,再加上如今是大数据时代,数据足够训练模型简直如虎添翼,

应用到生活中的比如,手机上会自动帮你标记哪些是骚扰电话,就是通过许多用户的数据进行机器学习得到的,比如说童话时常,对用户接起来一秒挂断的电话进行记录,被很多用户一秒挂断,就标记是骚扰电话