吴恩达机器学习笔记之无监督学习-程序员宅基地

技术标签: 机器学习笔记  

无监督学习:

和监督学习相比,无监督学习的数据集是没有标签的。所谓没有标签的意识就是我们对数据一无所知,但是要借助一些算法试着帮我们寻找到数据的某些结构特性。聚类(CLustering)算法是我们要学习的第一个无监督学习的算法,将我们的数据分成不同的簇。

K-means算法:

假设我们有下图所示的数据集:

           

K-means算法是一个迭代算法。K-means算法的流程是这样的,首先随机选择K个初始点,K代表你想将数据分为几类,如图所示,K=2;然后将数据集中的所有点分别计算与这两个初始点的距离,按照就近分配原则,分配给相应的簇,如下图所示。然后移动我们的初始点,也可以叫做聚类中心,将所有同一类的点相加之后取平均值,然后将我们的聚类中心移动到这个平均值上。如下图所示,如此循环直到收敛。

           

                                                                                  第一次循环的结果

          

                                                                                 第二次循环的结果

                                   收敛的结果

上面的步骤我们可以叫做第一:簇分配(cluster assignment);第二:移动聚类中心(move centroid step)。

计算距离,matlab有一个函数叫做pdist2:

X = [1, 2, 3; 4, 5, 6; 7, 8, 9; 10, 11, 12];
Y = [1, 2, 3];
pdist2(X,Y)计算的是欧式距离。
distance = pdist2(X, Y)  % X是a*m维的,Y是b*m维的,得出来的结果是a*b维的。

优化目标:

其中\mu _{c^{(i)}}表示与x^{(i)}最近的聚类中心点,在迭代的过程中,代价函数一定是慢慢下降的,否则就是出现了问题。

随机初始化:

我们应该怎么选择初始化的聚类中心呢,一种推荐的方法是从实例当中选取,比如K=3,则随机从实例当中选取3个点分别作为聚类中心。但是由于随机初始化的原因,K-means算法可能会陷入局部最优解。

避免局部最优解——初始化K-means算法若干次,返回代价函数最小的那个结果。在K较小的时候,比如小于10,多次随机初始化的效果是非常明显的,但是如果K很大的话,多次随机初始化的效果就不那么明显了。

选择聚类数量:

大多数情况下,我们还是人为的选择K值,还有一种叫做手肘法则:

如上图所示:我们可以画出我们的代价函数随着K的变化曲线,选择拐点那个K值,通常是比较好的选择;但是并不是所有的曲线都有拐点,我们碰到的大多数情况是右边的这种情况,那么这样我们的肘部法则就不在那么适用了。

其实大多数情况下,我们使用K-means算法进行聚类分析,和我们的目的都是相对应的,我们的目的能够为我们选择K值提供很好的指引。比如我们下图我们进行衣服的尺寸设计,我们即可以分成3类,也可以分成5类。

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/blue_coffeei/article/details/87892269

智能推荐

【YOLOv4探讨 之三】mosaic数据增强_yolo mosaic-程序员宅基地

文章浏览阅读1w次,点赞17次,收藏51次。最近太忙,久未更新,对不住大家。进入正题,我们聊一聊YOLOv4中使用的mosaic数据增强。关于mosaic数据增强相关文章不少,三个月前这个方面的学习开了个头,那时候各路诸侯都是以TensorFlow框架为主,我这里依然坚持分析研究darknet框架下的数据增强。mosaic数据增强原理YOLOv4中在载入图片数据时同步进行mosaic数据增强。mosaic数据增强基本原理就是在训练集中随机选择若干个(一般是4个)图像,经过裁剪拼接形成新的训练集元素,可以缓解训练集元素少或者增强识别能力,是cut_yolo mosaic

vue 实现主题换肤(element-ui)_--el-select-input-focus-border-color-程序员宅基地

文章浏览阅读1.4k次。vue 实现主题换肤(element-ui)一. 插件安装npm i webpack-theme-color-replacer -D二. 项目使用vue.config.jsconst webpack = require('webpack')const ThemeColorReplacer = require('webpack-theme-color-replacer')const forElementUI = require('webpack-theme-color-replacer/for_--el-select-input-focus-border-color

JVM-从熟悉到精通_jvm 精通 技术学习-程序员宅基地

文章浏览阅读600次。JVM、JMM、GC、三色标记、常见调优参数_jvm 精通 技术学习

低成本挖出电商API接口-程序员要注意那些事项-技术分享_pvwd-程序员宅基地

文章浏览阅读914次。通过了解API接口的相关信息后,您可以根据需求进行开发,从而获取天猫的购物车API接口数据,实现自己的电商平台的功能需求。在注册阿里云后,了解天猫购物车API接口的相关信息是必须的。参数校验:接口参数是影响接口调用结果的重要因素,我们需要在接口调用前对参数进行校验,确保参数合法、规范、完整。接口性能:电商业务接口需要承受巨大的访问量,所以我们需要保证接口的性能。总之,无论选择哪种方式,都需要您投入精力和时间,但是从长远考虑,低成本获取天猫购物车API接口可以为您的电商平台节约不少资金,提升您的竞争优势。_pvwd

rust被禁播还能玩吗_我steam上有个游戏被开发者禁封,移除那个游戏能消除被禁封的红字吗?...-程序员宅基地

文章浏览阅读2.9k次。展开全部不能,steam上有个游e69da5e887aa3231313335323631343130323136353331333431363537戏被开发者禁封,移除那个游戏不能消除被禁封的红字。导致Steam帐户被禁用的原因很多,比如非法或者开挂,大多数为你的游戏来源非法,较普遍的情况是黑卡,盗用他人信用卡进行消费。通常在1~3个月后持卡人收到账单后拒绝付款,导致帐号被禁,或者是伪造的假信用卡..._rust游戏开发者实施的封禁

【Grafana】【十二】基于Grafana的报警_grafana报警-程序员宅基地

文章浏览阅读688次。橘色线在这里开始判断(每一分钟做一次检测),红色线表示已经持续了5分钟了。_grafana报警

随便推点

(基础入门)web安全|渗透测试|网络安全------附带 子域名挖掘,exe后门程序生成之Quasar,抓包wsexplorerv,逆向工具漏了个大洞-程序员宅基地

文章浏览阅读2.7k次,点赞9次,收藏12次。(基础入门)web安全|渗透测试|网络安全------附带 子域名挖掘,exe后门程序生成之Quasar,抓包wsexplorerv,逆向工具漏了个大洞

typeAliases标签和package标签_type-aliases-package: com.hcr.account.model.entity-程序员宅基地

文章浏览阅读442次。https://blog.csdn.net/weixin_42727032/article/details/104327048?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonec_type-aliases-package: com.hcr.account.model.entity

php正则preg_match,PHP正则表达式preg_match的具体使用规则介绍-程序员宅基地

文章浏览阅读853次。PHP对于初学者来说,最难理解的内容要属于正则表达式的应用。今天我们就向大家具体介绍有关PHP正则表达式preg_match的使用规则,希望初学者们能通过本文介绍的内容对正则表达式有一个深刻的认识。PHP正则表达式preg_match的使用:利用 preg_match(),我们可以完成字符串的规则匹配。如果找到一个匹配,preg_match() 函数返回 1,否则返回 0。还有一个可选的第三参数可..._if(preg_match("/[a-za-z0-9]/",$var)){ die("nope,this is level 5"); }

Android教程-01 Android Studio创建第一个项目_android studio创建第一个项目,并写布局-程序员宅基地

文章浏览阅读2k次,点赞2次,收藏3次。最近一直使用Android Studio 简单把Android Studio介绍下1. 首先介绍下 Android Studio的快捷键映射到Eclipse_android studio创建第一个项目,并写布局

大学 经验_大学经验-程序员宅基地

文章浏览阅读118次。自己的学校玩旅游玩社团玩 谈一场恋爱_大学经验

王坚博士专访 | 揭开国家 AI 创新平台“城市大脑”的神秘面纱-程序员宅基地

文章浏览阅读691次。阿里妹导读:王坚博士,一手打造了阿里云。在过去两年,他几乎将所有的时间和精力都投入到“城市大脑”的打造上。近日,首批国家人工智能开放创新平台名单公布,阿里云ET城市大脑成功入选。王坚博士对城市大脑有着清楚的定位:它会是未来城市,乃至于整体人类社会的关键基础建设。互联网作为基础设施的城市大脑一向善于以深入浅出比喻说明新生概念的王坚,用“电”来说明城市大脑未来所扮演的角色。_城市大脑领域的应用和服务城市管理20年经验研发创新能力强加入我国信创体系与阿里